海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

オープンソース・ビッグモデル・ツールのローカル展開

 ウェブサイトを投稿する

LMCache：大規模言語モデルの推論を高速化するキーバリューキャッシュ最適化ツール
LMCacheは、大規模言語モデル（LLM）の推論の効率を改善するために設計されたオープンソースのキー値（KV）キャッシュ最適化ツールです。モデルの中間計算結果をキャッシュして再利用する（キーバリューキャッシュ）ことで、推論時間とGPUリソース消費を大幅に削減します。
08-04 1.7 K0表彰される
FastDeploy：AIモデルを迅速に展開するためのオープンソースツール
FastDeployは、PaddlePaddleチームによって開発されたオープンソースツールで、ディープラーニングモデルの迅速なデプロイに焦点を当てています。FastDeployは、画像、ビデオ、テキスト、音声など20以上のシナリオをカバーし、150以上の主流モデルを含み、幅広いハードウェアとフレームワークをサポートしています。
07-29 1.0 K0表彰される
Web - macOS AI Browser: macOSのネイティブAIブラウザ
Webはnuance-devによって開発され、GitHubでホストされているオープンソースのmacOSブラウザプロジェクトです。AppleのWebKitエンジンをベースに、SwiftUIとCombineフレームワークを使用し、MVVMアーキテクチャを採用している。
07-29 1.1 K0表彰される
Transformers: テキスト、画像、マルチモーダルタスクをサポートするオープンソースの機械学習モデリングフレームワーク
Transformersは、Hugging Faceによって開発されたオープンソースの機械学習フレームワークであり、テキスト、画像、音声、マルチモーダルタスクの推論と学習をサポートする高度なモデル定義を提供することに重点を置いている。モデルの使用プロセスを簡素化し、PyTorch、Tens ......などの多くの主流の深層学習フレームワークと互換性があります。
07-06 1.2 K0表彰される
ローカルLLMメモ帳：ローカル大規模言語モデルをオフラインで実行するポータブルツール
Local LLM Notepadは、オープンソースのオフラインアプリケーションで、インターネットに接続することなく、インストールすることなく、USBデバイスを介して、Windowsコンピュータ上でLocal Large Language Modelsを実行することができます。ユーザーは、単一の実行ファイル（EXE）とモデルファイル（GGUF形式など）をUSBスティックにコピーするだけです...
07-03 1.1 K0表彰される
llm.pdf：大規模言語モデルをPDFファイルで実行する実験的プロジェクト
llm.pdfはLarge Language Models (LLM)をPDFファイルで直接実行できるオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、Emscriptenを介してllama.cppをコンパイルするという革新的なアプローチを示しています。
05-05 1.8 K0表彰される
Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール
Aana SDKはMobius Labsによって開発されたオープンソースのフレームワークで、マラヤーラム語のആന（象）にちなんで名付けられました。Aana SDKは、Ray Distributed Computing Frameworkをベースにしています。
03-25 1.9 K0表彰される
BrowserAI：WebGPUを使ってブラウザ上でローカルにAIモデルを実行する
BrowserAIは、ユーザーがブラウザ上でネイティブAIモデルを直接実行できるオープンソースツールである。Cloud-Code-AIチームによって開発され、Llama、DeepSeek、Kokoroなどの言語モデルをサポートしている。ユーザーは、サーバーや複雑なセットアップなしで、ブラウザからテキスト生成を行うことができる。
03-16 2.2 K0表彰される
LitServe：エンタープライズグレードの汎用AIモデル推論サービスの迅速な展開
LitServeは、Lightning AIが提供するオープンソースのAIモデルサービスエンジンであり、FastAPI上に構築され、汎用AIモデル向けの推論サービスを迅速に展開することに重点を置いている。大規模言語モデル（LLM）、視覚モデル、音声モデルから古典的な機械学習モデルまで、幅広いシナリオをサポートし、バッチ...
03-10 1.8 K0表彰される
Nexa：ローカルで動作する小型マルチモーダルAIソリューション
Nexa AIは、ローカルで動作するマルチモーダルAIソリューションに特化したプラットフォームである。自然言語処理（NLP）、コンピュータ・ビジョン、音声認識・生成（ASRとTTS）を含む幅広いAIモデルを提供し、そのすべてをクラウド・サービスに依存することなくローカル・デバイス上で実行することができる。この ...
02-01 2.2 K0表彰される
vLLM: 効率的なメモリ利用のためのLLM推論とサービスエンジン
vLLMは、Large Language Modelling (LLM)のために設計された、高スループットでメモリ効率の良い推論・サービスエンジンである。vLLMの目的は、高速で簡単な推論を提供することである。
01-17 2.3 K0表彰される
ラマ3.2推論WebGPU：ブラウザでラマ3.2を動かす
Transformers.jsはHugging Faceが提供するJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行できるように設計されている。このライブラリはHugging FaceのPython版トランスフォーマーと互換性があります。
01-15 2.2 K0表彰される
Harbor: ローカルのLLM開発環境をワンクリックでデプロイし、AIサービスを簡単に管理・実行するためのコンテナ化されたツールセット。
Harborは、コンテナ化された革新的なLLMツールセットで、ローカルAI開発環境のデプロイと管理を簡素化することに重点を置いています。開発者は、クリーンなコマンドラインインターフェイス（CLI）とコンパニオンアプリケーションを使用して、ワンクリックでLLMバックエンド、APIインターフェイス、フロントエンドインターフェイスを含むすべてのAIサービスコンポーネントを起動し、管理することができます。
01-02 2.8 K0表彰される
Xinference: 簡単な分散AIモデルのデプロイとサービング
Xorbits Inference（略してXinference）は、言語モデル、音声認識モデル、マルチモーダルモデルの分散デプロイと配信に特化した、強力で汎用性の高いライブラリです。Xorbits Inferenceを使用すると、ユーザーは独自のモデルやビルトインの高度なモデルを簡単にデプロイして提供することができます。
01-02 2.1 K0表彰される
AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合
AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリ（現在パブリックプレビュー中）です。開発者がAI機能をWindowsアプリケーションに簡単に統合するための包括的なプラットフォームを提供する。このツールの最大の特長は、AI機能をWindowsアプリケーションに統合するための包括的なプラットフォームを提供することである。
12-30 2.5 K0表彰される
LightLLM：大規模言語モデルの推論と処理のための効率的な軽量フレームワーク
LightLLMはPythonベースのLarge Language Model（LLM）推論・サービスフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られている。このフレームワークは、FasterTransformer、TGI、vLLM、FlashAtten...などの有名なオープンソースの実装を活用しています。
12-17 2.3 K0表彰される
Transformers.js：ローカルウェブで動作する約700のAIマクロモデル
Transformers.jsは、Hugging Face社によって開発されたJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行することを可能にする。このライブラリはHugging FaceのPython Transformers.jsと互換性があります。
12-02 2.5 K0表彰される
GLMエッジ：Smart Spectrumがモバイル、自動車、PCプラットフォーム向けにエンドサイドビッグ言語モデルとマルチモーダル理解モデルをリリース
GLM-Edgeは、清華大学（Smart Spectrum Light Language）のエンドサイドデバイス用に設計された大規模言語モデルとマルチモーダル理解モデルのシリーズです。これらのモデルには、GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B、GLM-Edge-V-5...が含まれます。
12-01 2.4 K0表彰される
EXO：アイドル状態の家庭用デバイスを使用して分散AIクラスタを実行し、複数の推論エンジンとデバイスの自動検出をサポートする。
Exoは、身近なデバイス（iPhone、iPad、Android、Mac、Linuxなど）を使って独自のAIクラスターを実行することを目的としたオープンソースプロジェクトである。動的なモデル分割とデバイスの自動検出により、Exoは複数のデバイスを単一の強力なGPUに統合することができ、LLaMA、Mistral...などの複数のモデルをサポートしています。
11-28 3.4 K0表彰される