
LLaMA-Factoryオンライン:コードなし、簡単な微調整 1.はじめに:(オンライン大規模モデルトレーニングと微調整サービスプラットフォームLLaMA-Factoryオンラインのアウトオブボックス、ローコード、フルリンクの機能カバレッジは、スターオープンソースプロジェクトLLaMA-Factoryの公式協力です。

Qwen3-FineTuning-Playgroundは、大規模言語モデルのQwen3ファミリーのファインチューニングに特化した完全なコードベースを提供するオープンソースプロジェクトです。このプロジェクトの基本は、開発者や研究者が様々な主流のマイクロ言語モデルを簡単に実践できるように、明確で、専門的で、簡単に拡張できるファインチューニングのコード例を提供することです。.

Verifiersは、強化学習(RL)環境を構築し、大規模言語モデリング(LLM)エージェントを訓練するためのモジュラーコンポーネントのライブラリである。 このプロジェクトの目標は、開発者がLLMエージェントを簡単に構築、訓練、評価できる信頼性の高いツール群を提供することである。 Verifiersには変換ベースの...

Radalは、AIモデルの迅速な構築と最適化を支援するローコードプラットフォームです。直感的なインターフェースとAI支援機能により、深いプログラミングをすることなく大規模言語モデル(LLM)をトレーニングすることができる。業界の専門家と新興企業のチームによって開発されたこのプラットフォームは、ヘルスケア、金融、不動産...のための効率的でカスタマイズされたAIソリューションに重点を置いています。.

WhiteLightningはオープンソースのコマンドラインツールで、開発者が1行のコマンドで軽量なテキスト分類モデルを迅速に生成できるように設計されています。このツールは、大規模な言語モデルを使用して合成データを生成し、教授陣の蒸留技術によって1MB未満のONNXモデルを学習します。完全なオフライン操作をサポートし、Raspberry Pi、携帯電話、低電力...などのエッジデバイスに適しています。.

FineTuningLLMs は、著者の dvgodoy さんの著書 A Hands-On Guide to Fine-Tuning LLMs with PyTorch and Hugging Face に基づいて作成された GitHub リポジトリです。このリポジトリは...

ReCall 是一个开源框架,旨在通过强化学习训练大语言模型(LLM)进行工具调用和推理,无需依赖监督数据。它让模型能够自主使用和组合外部工具,如搜索、计算器等,解决复杂任务。ReCall 支持用户自定义工具,适合开发通用智能体。项目基于 ...

GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从源文本构建细粒度知识图谱,利用预期校准误差(ECE...

MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉编码器和特征投影模块,支持图像和文本联合处理。项目...

DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qwen-14Bをベースに、分散強化学習(RL)技術によって最適化されています。

WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音克隆。最终,数字分身可以绑定到微信机器人,实现自动...

Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトで、veRLフレームワーク上に構築されている。強化学習(RL)技術を使って大規模言語モデル(LLM)を学習することで、モデルが自律的に推論を学習し、問題を解決するために検索エンジンを呼び出します。プロジェクト・サポート Qwen2....

OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するAIを訓練することである。このプロジェクトは、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリで構成されている。

Bonsaiはdeepgrove-aiによって開発されたオープンソースの言語モデルで、パラメータサイズは5億、3項重みを使用する。LlamaアーキテクチャとMistral分類器設計をベースにしており、3項重みをサポートするように線形レイヤーが調整されています。このモデルでは、主に...

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作ることができ、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するインテリジェントなアシスタントになる。最大の特徴は、すべてのデータがローカルに保存されるため、アップロードする必要がないことだ。.

Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合微调的结构化数据集。开发者 Conard Li 创...

MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心目标是提升模型在视觉和数学推理任务上的表现。它推出...

AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに焦点を当てたオープンソースのAIツールキットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者に柔軟なモデリングを提供することを目的としています。

X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づくモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。DeepSeek-R1とopen-r1にインスパイアされたこのプロジェクトは、簡単な...
トップに戻る

