海外访问：www.kdjingpai.com

Ctrl + D 收藏本站

大模型微调

 提交网站

LLaMA-Factory Online
LLaMA-Factory Online：无需代码，easy微调 1. 简介：（开箱即用、低代码、全链路功能覆盖的在线大模型训练与微调服务平台 LLaMA-Factory Online 是与明星开源项目 LLaMA-Factory 官方合作...
10-25 1.4 K0已赞
Qwen3-FineTuning-Playground：一个上手即用的Qwen3大模型微调代码库
Qwen3-FineTuning-Playground是一个开源项目，它提供了一套完整的代码库，专门用于对Qwen3系列大语言模型进行微调。这个项目的基础是提供清晰、专业且容易扩展的微调代码示例，让开发者和研究人员可以方便地实践各种主流的微...
08-28 2.3 K0已赞
Verifiers：用于训练大语言模型的强化学习环境工具库
Verifiers 是一个用于创建强化学习（RL）环境和训练大语言模型（LLM）代理的模块化组件库。这个项目的目标是提供一套可靠的工具，让开发者可以方便地构建、训练和评估LLM代理。 Verifiers 包含一个基于 transforme...
08-28 2.2 K0已赞
Radal：快速微调和优化AI模型的低代码平台
Radal 是一个低代码平台，专注于帮助企业快速构建和优化人工智能模型。它通过直观的界面和AI辅助功能，让用户无需深入编程也能训练大型语言模型（LLM）。平台由行业专家和初创团队开发，强调高效、定制化的AI解决方案，适用于医疗、金融、房地产...
08-04 1.5 K0已赞
WhiteLightning：一键生成轻量级离线文本分类模型的开源工具
WhiteLightning 是一个开源命令行工具，旨在帮助开发者通过单行命令快速生成轻量级文本分类模型。工具利用大型语言模型生成合成数据，通过师生蒸馏技术训练出小于1MB的ONNX模型，支持完全离线运行，适合边缘设备如树莓派、手机或低功耗...
08-04 1.6 K0已赞
FineTuningLLMs：单GPU高效微调大语言模型的实用指南
FineTuningLLMs 是由作者 dvgodoy 创建的 GitHub 仓库，基于其书籍《A Hands-On Guide to Fine-Tuning LLMs with PyTorch and Hugging Face》。这个仓库...
07-09 1.3 K0已赞
ReCall：通过强化学习训练大模型进行工具调用推理
ReCall 是一个开源框架，旨在通过强化学习训练大语言模型（LLM）进行工具调用和推理，无需依赖监督数据。它让模型能够自主使用和组合外部工具，如搜索、计算器等，解决复杂任务。ReCall 支持用户自定义工具，适合开发通用智能体。项目基于 ...
07-01 2.1 K0已赞
GraphGen：利用知识图谱生成合成数据微调语言模型
GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从源文本构建细粒度知识图谱，利用预期校准误差（ECE...
05-05 3.2 K0已赞
MiniMind-V：1小时训练26M参数视觉语言模型
MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉编码器和特征投影模块，支持图像和文本联合处理。项目...
04-14 3.5 K0已赞
DeepCoder-14B-Preview：擅长代码生成的的开源模型
DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Qwen-14B，通过分布式强化学习（RL）技术优化...
04-10 2.5 K0已赞
WeClone：用微信聊天记录和语音训练数字分身
WeClone 是一个开源项目，它通过微信聊天记录和语音消息，结合大语言模型和语音合成技术，让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型，还可以用少量语音样本生成逼真的声音克隆。最终，数字分身可以绑定到微信机器人，实现自动...
04-08 2.8 K0已赞
Search-R1：强化学习训练大模型搜索与推理的工具
Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会推理和调用搜索引擎解决问题。项目支持 Qwen2....
04-01 2.8 K0已赞
Optexity：用人类演示训练AI执行网页操作的开源项目
Optexity 是一个在 GitHub 上开源的项目，由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务，尤其是网页操作。项目包含三个代码库：ComputerGYM、AgentAI 和 Playwright...
04-01 2.5 K0已赞
Bonsai：适合边缘设备运行的三值权重语言模型
Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器设计，线性层经过调整以支持三值权重。模型主要使用 ...
03-26 2.5 K0已赞
Second Me：本地训练拥有个人记忆和习惯的AI分身
Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智能助手。它最大的特点是所有数据都留在本地，不用上传...
03-24 3.9 K0已赞
Easy Dataset：创建大模型微调数据集的简易工具
Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合微调的结构化数据集。开发者 Conard Li 创...
03-21 3.3 K0已赞
MM-EUREKA：探索视觉推理的多模态强化学习工具
MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心目标是提升模型在视觉和数学推理任务上的表现。它推出...
03-18 2.4 K0已赞
AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包
AI Toolkit by Ostris 是一个开源的AI工具集，专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护，托管于GitHub，旨在为研究者和开发者提供灵活的模...
03-12 8.2 K0已赞
X-R1：在普通设备中低成本训练0.5B模型
X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发，专注于构建一个易...
03-11 2.2 K0已赞