Qwen3-FineTuning-Playground:一个上手即用的Qwen3大模型微调代码库
Qwen3-FineTuning-Playground是一个开源项目,它提供了一套完整的代码库,专门用于对Qwen3系列大语言模型进行微调。这个项目的基础是提供清晰、专业且容易扩展的微调代码示例,让开发者和研究人员可以方便地实践...
Verifiers:用于训练大语言模型的强化学习环境工具库
Verifiers 是一个用于创建强化学习(RL)环境和训练大语言模型(LLM)代理的模块化组件库。 这个项目的目标是提供一套可靠的工具,让开发者可以方便地构建、训练和评估LLM代理。 Verifiers 包含一个基于 transfor.....
微调OpenAI GPT OSS模型的脚本和教程集合
gpt-oss-recipes 是由 Hugging Face 维护的一个 GitHub 仓库,专注于提供使用 OpenAI GPT OSS 模型的脚本和 Jupyter Notebook 教程。仓库包含了针对 OpenAI 最新开源模型 ...
Radal:快速微调和优化AI模型的低代码平台
Radal 是一个低代码平台,专注于帮助企业快速构建和优化人工智能模型。它通过直观的界面和AI辅助功能,让用户无需深入编程也能训练大型语言模型(LLM)。平台由行业专家和初创团队开发,强调高效、定制化的AI解决...
WhiteLightning:一键生成轻量级离线文本分类模型的开源工具
WhiteLightning 是一个开源命令行工具,旨在帮助开发者通过单行命令快速生成轻量级文本分类模型。工具利用大型语言模型生成合成数据,通过师生蒸馏技术训练出小于1MB的ONNX模型,支持完全离线运行,适合边缘设备...
KBLaM:为大模型嵌入外部知识的开源增强工具
KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的注意力层,让模型能直接使用这些知识回答问题或推理。...
LLaMA Factory:高效微调百余种开源大模型,轻松实现模型定制
LLaMA-Factory 是一个统一的高效微调框架,支持对100多种大型语言模型(LLMs)进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面,用户无需编写代码即可完成模型微调。该框架集成了多种先进的训练方法和...
Tune AI:企业级自然语言大模型资源调用平台,与主流大模型在线聊天或者微调/部署
Tune AI 是一个专为企业设计的生成式AI解决方案平台,提供自定义模型创建、数据加密和合规性保障等功能。平台支持多种开源模型,并提供灵活的基础设施,帮助企业快速部署和优化AI应用。Tune AI 致力于解决实际业...
RunPod:专为AI设计的GPU云服务,快速冷启动SD且按秒付费
RunPod是一个专为AI设计的云计算平台,旨在为开发者、研究人员和企业提供一站式的AI模型开发、训练和扩展解决方案。该平台集成了按需GPU资源、无服务器推理、自动扩展等功能,为AI项目的各个阶段提供强大的支持。...
无问芯穹:企业级AI开发,云端资源服务平台
无问芯穹是一个面向AI开发者的综合服务平台,提供能力强大的AI开发工具与大模型服务。该平台具有AIStudio, GenStudio等多种机器学习开发工具,同时还支持模型部署、数据存储和模型调优等服务,致力于为AI领域的开...
Forefront AI:机器学习模型调优平台|AI聊天助手
Forefront AI 是一个先进的人工智能平台,专注于开放源码模型的定制与部署。用户可以选择并微调各种强大的AI模型,如GPT-4、GPT-3.5等,以满足不同任务需求。平台支持上传PDF、Word、PPT等文件,与AI进行对话,还.....
回顶部