海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

大規模なモデルの微調整

 ウェブサイトを投稿する

Qwen3-FineTuning-Playground: Qwen3の大きなモデルを微調整するための、すぐに使えるコードベース。
Qwen3-FineTuning-Playgroundは、大規模言語モデルのQwen3ファミリーのファインチューニングに特化した完全なコードベースを提供するオープンソースプロジェクトです。このプロジェクトの基本は、開発者や研究者が簡単に実践できるように、明確で専門的、かつ簡単に拡張できるファインチューニングのコード例を提供することです...
08-28 7040表彰される
Verifiers：大規模言語モデルを学習するための強化学習環境ツールのライブラリ
Verifiersは、強化学習(RL)環境を構築し、大規模言語モデリング(LLM)エージェントを訓練するためのモジュラーコンポーネントのライブラリである。このプロジェクトの目標は、開発者がLLMエージェントを簡単に構築、訓練、評価できる信頼性の高いツール群を提供することである。 Verifiersは、強化学習(RL)環境と大規模言語モデリング(LLM)エージェントのトレーニングに基づくライブラリである。
08-28 7200表彰される
Radal：AIモデルの迅速な微調整と最適化のためのローコードプラットフォーム
Radalは、AIモデルの迅速な構築と最適化を支援するローコードプラットフォームです。直感的なインターフェースとAI支援機能により、深いプログラミングをすることなく大規模言語モデル（LLM）をトレーニングすることができます。業界の専門家と新興企業のチームによって開発されたこのプラットフォームは、効率的でカスタマイズされたAIソリューションを重視しています...
08-04 5630表彰される
WhiteLightning: 軽量なオフラインテキスト分類モデルをワンクリックで生成するオープンソースツール
WhiteLightningはオープンソースのコマンドラインツールで、開発者が1行のコマンドで軽量なテキスト分類モデルを素早く生成できるように設計されている。このツールは、大規模な言語モデルを使用して合成データを生成し、教授陣の蒸留技術によって1MB未満のONNXモデルを学習し、完全なオフライン操作をサポートし、エッジデバイスに適しています...
08-04 6600表彰される
FineTuningLLMs：単一のGPUで大規模言語モデルを効率的に微調整するための実践的ガイド
FineTuningLLMs は、著者の dvgodoy さんの著書 A Hands-On Guide to Fine-Tuning LLMs with PyTorch and Hugging Face に基づいて作成された GitHub リポジトリです。このリポジトリは...
07-09 6810表彰される
ReCall: 強化学習による道具の呼びかけ推論のための大規模モデルの学習
ReCallは、教師ありデータに頼らずに、強化学習によってツールの呼び出しと推論のための大規模言語モデル（LLM）を学習するために設計されたオープンソースのフレームワークです。ReCallは、複雑なタスクを解決するために、検索や計算機などの外部ツールを自律的に使用し、組み合わせることを可能にします。
07-01 1.0 K0表彰される
GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する
GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークで、GitHubでホストされている。知識グラフを通して合成データ生成をガイドすることで、大規模言語モデル（LLM）の教師ありファインチューニングを最適化することに焦点を当てている。予想されるキャリブレーション誤差を利用して、ソーステキストからきめ細かな知識グラフを構築する。
05-05 1.7 K0表彰される
MiniMind-V：26Mパラメトリック視覚言語モデルの1時間トレーニング
MiniMind-VはGitHubでホスティングされているオープンソースプロジェクトで、わずか2600万個のパラメータを持つ軽量な視覚言語モデル（VLM）を1時間以内に学習できるように設計されています。MiniMind言語モデル、新しい視覚コーダーと特徴投影モジュール、画像とテキストの共同処理のサポートに基づいています。
04-14 1.5 K0表彰される
DeepCoder-14B-Preview：コード生成に優れたオープンソースモデル
DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qwen-14Bをベースに、分散強化学習（RL）技術によって最適化されています。
04-10 1.5 K0表彰される
WeClone：WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成
WeCloneはオープンソースのプロジェクトで、WeChatのチャットログと音声メッセージを大規模な言語モデルと音声合成技術と組み合わせることで、パーソナライズされたデジタル・ドッペルゲンガーを作成することができる。このプロジェクトは、モデルを訓練するためにユーザーのチャット習慣を分析することができ、また、少数の音声サンプルでリアルな声クローンを生成することができます。最終的には、デジタル...
04-08 1.6 K0表彰される
Search-R1: 検索と推論のための大規模モデルを学習する強化学習
Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトで、veRLフレームワーク上に構築されている。強化学習（RL）技術を使って大規模言語モデル（LLM）を学習することで、モデルが自律的に推論を学習し、問題を解決するために検索エンジンを呼び出します。プロジェクト・サポート Qwen2....
04-01 1.5 K0表彰される
Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト
OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するAIを訓練することである。このプロジェクトは、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリで構成されている。
04-01 1.5 K0表彰される
Bonsai: エッジデバイスでの操作に適した3値重み付き言語モデル
Bonsaiはdeepgrove-aiによって開発されたオープンソースの言語モデルで、パラメータサイズは5億、3項重みを使用する。LlamaアーキテクチャとMistral分類器設計をベースにしており、3項重みをサポートするように線形レイヤーが調整されています。このモデルでは、主に...
03-26 1.6 K0表彰される
セカンド・ミー：個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー
Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作ることができ、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するインテリジェントなアシスタントになる。その最大の特徴は、すべてのデータが...
03-24 2.2 K0表彰される
Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール
Easy Datasetは、大規模モデル（LLM）の微調整のために特別に設計されたオープンソースツールで、GitHubでホストされています。ユーザーがファイルをアップロードし、コンテンツを自動的にセグメント化し、質問と回答を生成し、最終的にファインチューニングに適した構造化データセットを出力できる、使いやすいインターフェースを提供する。開発者のCona...
03-21 1.7 K0表彰される
MM-EUREKA：視覚的推論を探求するマルチモーダル強化学習ツール
MM-EUREKAは、上海交通大学上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルが画像とテキスト情報を処理できるようにする。このツールの主な目的は、画像やテキスト情報を処理するモデルを強化することである。
03-18 1.5 K0表彰される
オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散
AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに焦点を当てたオープンソースのAIツールキットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者に柔軟なモデリングを提供することを目的としています。
03-12 3.3 K0表彰される
X-R1：一般的なデバイスの0.5Bモデルを低コストでトレーニング
X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づくモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。DeepSeek-R1とopen-r1にインスパイアされたこのプロジェクトは、簡単な...
03-11 1.3 K0表彰される
OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化
OpenManus-RLは、UIUC-UlabとMetaGPTコミュニティのOpenManusチームによって共同開発されたオープンソースプロジェクトで、GitHubでホストされている。このプロジェクトは、Deepseek-R1に基づく強化学習（RL）技術によって、大規模言語モデル（LLM）インテリジェンスの推論および意思決定能力を強化する。
03-10 2.0 K0表彰される

日本語