Qwen3-FineTuning-Playground是一个开源项目,它提供了一套完整的代码库,专门用于对Qwen3系列大语言模型进行微调。这个项目的基础是提供清晰、专业且容易扩展的微调代码示例,让开发者和研究人员可以方便地实践...
Verifiers 是一个用于创建强化学习(RL)环境和训练大语言模型(LLM)代理的模块化组件库。 这个项目的目标是提供一套可靠的工具,让开发者可以方便地构建、训练和评估LLM代理。 Verifiers 包含一个基于 transfor.....
Radal 是一个低代码平台,专注于帮助企业快速构建和优化人工智能模型。它通过直观的界面和AI辅助功能,让用户无需深入编程也能训练大型语言模型(LLM)。平台由行业专家和初创团队开发,强调高效、定制化的AI解决...
WhiteLightning 是一个开源命令行工具,旨在帮助开发者通过单行命令快速生成轻量级文本分类模型。工具利用大型语言模型生成合成数据,通过师生蒸馏技术训练出小于1MB的ONNX模型,支持完全离线运行,适合边缘设备...
FineTuningLLMs 是由作者 dvgodoy 创建的 GitHub 仓库,基于其书籍《A Hands-On Guide to Fine-Tuning LLMs with PyTorch and Hugging Face》。这个仓库...
ReCall 是一个开源框架,旨在通过强化学习训练大语言模型(LLM)进行工具调用和推理,无需依赖监督数据。它让模型能够自主使用和组合外部工具,如搜索、计算器等,解决复杂任务。ReCall 支持用户自定义工具,适合...
GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从源文本构建细粒度知识图谱,利用预期校准误差...
MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉编码器和特征投影模块,支持图像和文本联合处理。.....
DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Qwen-14B,通过分布式强化学习(RL)技术优化...
WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音克隆。最终,数...
Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会推理和调用搜索引擎解决问题。项目支持 Qwen2....
Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:ComputerGYM、AgentAI 和 Playwright...
Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器设计,线性层经过调整以支持三值权重。模型主要使用 ...
Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智能助手。它最大的特点是所有数据都留在...
Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合微调的结构化数据集。开发者 Cona...
MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心目标是提升模型在...
AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托管于GitHub,旨在为研究者和开发者提供灵活的模...
X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于构建一个易...
OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepseek-R1...
回顶部