大規模言語モデリング(LLM)技術は急速に変化しており、オープンソースコミュニティは貴重な学習リソースを豊富に生み出している。これらのプロジェクトは、LLMを体系的にマスターしたい開発者にとって、実践の宝庫である。この記事では、以下の9つのプロジェクトを詳しく紹介する。 GitHub
広く評価されているトップ・オープンソース・プロジェクトでは、理論から実践までの全プロセスをカバーするだけでなく、具体的なコード実装やエンジニアリングのガイダンスも提供されており、学習の道筋の確かな梯子となるに十分だ。
Datawhaleシリーズ:中国人開発者のための体系的チュートリアル
国内 Datawhale
オープンソース組織は、AIの知識普及の分野で重要な役割を果たしている。彼らは一連のLLMチュートリアルを立ち上げ、その体系的な内容、中国環境に対するフレンドリーなサポート、明確な学習経路により、国内の開発者に広く歓迎されている。
1.Happy-LLM:ゼロから始める原則と実践
Happy-LLM
(5k Stars) は、ラージ・モデルの原理と実践に関する完全無料の体系的なチュートリアルで、開発者が LLM の中核を深く理解できるように設計されています。このコースは、NLPの基本的な概念から始まり、LLMの基本的な機能を詳細に分析します。 Transformer
アーキテクチャーと注意のメカニズム、そして事前学習モデルの原理について明確な概要を提供する。
プログラムの核となるハイライトは、「実践的」アプローチである。このプログラムでは PyTorch
完全なゼロから実装する LLaMA2
モデルで、トレーニングもカバーする。 Tokenizer
また、モデルの事前トレーニングや、全体のプロセスの教師あり微調整も含まれます。また、このコースでは RAG
(サーチ・エンハンスト・ジェネレーション)と Agent
などの最先端技術に関する実践的な講義が行われる。
- オープンソースアドレス:
https://github.com/datawhalechina/happy-llm
2.LLM-Universe:初心者のための大規模モデルアプリケーション開発
LLM-Universe
(☆8.8k)は、ビッグモデルの応用に焦点を当てたプログラミング初心者向けの入門コースです。代表的なプロジェクトである「個人知識ベースに基づくインテリジェントなQ&Aアシスタント」を題材に、AliCloudサーバ上で演習を行います。
コースの内容は非常に実践的で、国内外の主なビッグモデルのコールをカバーしている。 API
(例 GPT
ウィズダムスペクトラム、ウェンシンイーイン GLM
)方式を採用している、Prompt
エンジニアリング・スキル、使用 LangChain
フレームワーク、ベクター・データベースの構築、そして最後に、ベクター・データベースの使用方法である。 Streamlit
アプリケーションをインタラクティブなフロントエンド・インターフェースにパッケージ化する。
- オープンソースアドレス:
https://github.com/datawhalechina/llm-universe
3.Self-LLM:オープンソースの大型モデルをローカライズするための食用ガイド
Self-LLM
(20kスター)は、"中国の赤ちゃんのために調整されたオープンソースのビッグモデルへの食べられるガイド "として知られており、その中心的な目標は、国内の環境におけるオープンソースモデルのプライベートな展開と微調整の問題を解決することである。このプロジェクトは、データのプライバシーとモデルのカスタマイズを重視する開発者にとって貴重なものである。
を使用する機能を提供する。 Linux
環境への影響 LLaMA
そしてChatGLM
そしてQwen
(何千もの質問)、InternLM
(Shusheng-Puyin)およびその他数十の国内および国際的な主流モデルのローカル展開、フルパラメーター微調整および LoRA
効率的な微調整のための徹底的なステップ。さらに、このチュートリアルは大規模なマルチモーダルモデルの展開にも及ぶ。
- オープンソースアドレス:
https://github.com/datawhalechina/self-llm
4.LLMクックブック:ウー・エンダ・コース実践中国語版
LLM Cookbook
(20.2k Stars)は、アーネスト・ン教授による一連のビッグ・モデル・コースに基づく実践的な中国語版である。オリジナルのコースの核となるアイデアを抽出し、ローカライズしたもので、以下の内容をカバーしています。 Prompt
エンジニアリングRAG
開発、モデルの微調整、その他の重要な側面。
このプログラムの特徴は、オリジナルのカリキュラムに中国語と英語のバイリンガルコースが用意されていることだ。 Jupyter Notebook
特に中国向けに最適化されている。 Prompt
デザインと API
呼び出し方法コースは「必修パート」と「選択パート」に分かれており、学習者の状況に応じて段階的に進められるようになっている。
- オープンソースアドレス:
https://github.com/datawhalechina/llm-cookbook
エンジニアリングとディープ・プラクティス
理論をマスターした後は、モデルを実際の生産に投入するのが近道だ。以下のプロジェクトは、大型モデルのライフサイクルにおける主要なエンジニアリング上の課題に焦点を当てている。
5.LLM-Action:大規模モデルのエンジニアリングと実装
LLM-Action
(19k Stars)は、ビッグ・モデルのエンジニアリングとアプリケーションの実装に焦点を当てた技術共有プロジェクトである。入門チュートリアルのような簡単なものではなく、モデルのトレーニング、推論、圧縮、セキュリティなど、具体的な技術的詳細に踏み込んでいます。
その内容は、技術的な知識を網羅した膨大なレポジトリと見ることができる:
- 電車::
LoRA
そしてQLoRA
そしてP-Tuning
アイソパラメータと分散トレーニングのための効率的な微調整技術。 - 推論の最適化詳細説明
TensorRT-LLM
そしてvLLM
など、業界で主流の推論フレームワークがある。 - モデル圧縮モデルの定量化、枝刈り、知識抽出などのテクニックを体系的に紹介。
- ローカライゼーションへの適応Huawei Risingのような国内ハードウェアプラットフォームへの適応経験を含む。
- オープンソースアドレス:
https://github.com/liguodongiot/llm-action
6.AIエンジニアリング・ハブ:実際のAIアプリケーションのリポジトリ
AI Engineering Hub
(13.2k星) は、「実世界指向」のコンセプトを中心に、詳細なチュートリアルと実践的な例を豊富に収録した。 AI
アプリケーション」。漠然とした理論を語る代わりに、このプロジェクトでは、外出先で直接変更して実行できるコードサンプルを数多く提供している。
を中心に展開される。 DeepSeek
そしてLlama
そしてGemma
など、人気のあるオープンソースのモデルを幅広く提供している。 RAG
幾つも Agent
コラボレーション、マルチモーダル・アプリケーション、その他多くのソリューション。このプロジェクトは、核となるチュートリアルを500ページを超える PDF
詳細な "取扱説明書 "のようなもので、コレクション性も高い。
- オープンソースアドレス:
https://github.com/patchy631/ai-engineering-hub
ゼロからのリファクタリング:モデルの基礎をより深く理解する
LLMがどのように機能するかを本当に理解するためには、ゼロからモデルを実装することに勝るものはない。
7.MiniMindの複製:MiniGPT専用の2時間のトレーニング。
MiniMind
(22.6k Stars)は驚異的なオープンソースプロジェクトであり、普通の開発者でもゼロから自分たちでトレーニングできることを証明している。 GPT
このプロジェクトの助けを借りてこのプロジェクトの助けを借りて、たった1枚の NVIDIA 3090
グラフィックカードのトレーニングにかかる時間は約2時間で、サイズはわずか26MBと超軽量です。 GPT
モデル
このプロジェクトはネイティブの PyTorch
再編 Transformer
デコーダ、回転位置エンコーディング(RoPE
),SwiGLU
活性化関数などのすべてのコア・アルゴリズムは、サードパーティのライブラリに依存しない高度にカプセル化されたインターフェースを持っている。事前学習から教師あり微調整(SFT
),LoRA
適応 DPO
(直接選好最適化)アライメントの工業化プロセスは、LLMの根本的な詳細を深く理解するための優れた教科書である。
- オープンソースアドレス:
https://github.com/jingyaogong/minimind
国際的視点:一流機関や専門家による権威あるプログラム
最後に、国際的なトップ研究者や技術大手によるオープンソースコースは、LLM学習に権威ある最先端の視点を提供する。
8.LLMコース:LLM科学者への道
任せる Maxime Labonne
作成 LLM Course
(56.5k Stars)は、上級学習者のためにデザインされた包括的なプログラムである。学習経路を次のように明確に分けています。 LLM
財団LLM
科学者と LLM
エンジニアの3つの主要部分。
このプログラムでは、次のような幅広いコースを提供しています。 Google Colab
ランニング Notebook
その内容は、次のようなものである。 QLoRA
/ DPO
モデルの微調整を行う、GGUF
/ GPTQ
定量化、そして mergekit
モデルのマージなどの高度なトピック。また、以下のような機能も備えています。 AutoQuant
そしてLazyMergekit
などの自動化ツールを使って、開発者が効率的にモデルの最適化を完了できるように支援する。
- オープンソースアドレス:
https://github.com/mlabonne/llm-course
9.初心者のためのジェネレーティブAI:マイクロソフトによる入門チュートリアルの決定版
Generative AI for Beginners
(87.5kスター)で構成されている。 Microsoft
ジェネレーティブAIの公式入門コースは非常に質が高く、予備知識のない開発者に最適です。このコースは21のレッスンで構成されています。 Prompt
エンジニアリングの基礎、ヴィンセンヌのアプリケーションの構築、統合 RAG
とともに Agent
などのコアとなる知識ポイント。
このコースでは Python
歌で応える TypeScript
特に「責任あるAI」に重点を置いたコードサンプル(Responsible AI
)を参照されたい。を使用する方法についても説明している。 Gradio
アプリケーション・プロトタイプの迅速な構築など、ローコード・ツールは学習の敷居を大幅に下げる。
- オープンソースアドレス:
https://github.com/microsoft/generative-ai-for-beginners