海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

オープンソース・ビッグモデル・ツールのローカル展開

 ウェブサイトを投稿する

LMCache：大規模言語モデルの推論を高速化するキーバリューキャッシュ最適化ツール
LMCacheは、大規模言語モデル(LLM)の推論の効率を改善するために設計されたオープンソースのキーバリュー(KV)キャッシュ最適化ツールです。LMCacheは、モデルの中間計算結果（キーバリューキャッシュ）をキャッシュして再利用することで、推論時間とGPUリソースの消費量を大幅に削減します。.
08-04 4.8 K0表彰される
FastDeploy：AIモデルを迅速に展開するためのオープンソースツール
FastDeployは、PaddlePaddleチームによって開発された、ディープラーニングモデルの迅速なデプロイに特化したオープンソースツールです。様々なハードウェアやフレームワークをサポートし、画像、ビデオ、テキスト、音声をカバーし、150以上の主流モデルを含む20以上のシナリオをサポートしています。.
07-29 3.2 K0表彰される
Web - macOS AI Browser: macOSのネイティブAIブラウザ
Webはnuance-devによって開発され、GitHubでホストされているオープンソースのmacOSブラウザプロジェクトです。AppleのWebKitエンジンをベースに、SwiftUIとCombineフレームワークを使用し、MVVMアーキテクチャを採用している。
07-29 2.6 K0表彰される
Transformers: テキスト、画像、マルチモーダルタスクをサポートするオープンソースの機械学習モデリングフレームワーク
Transformersは、Hugging Faceによって開発されたオープンソースの機械学習フレームワークで、テキスト、画像、音声、マルチモーダルなタスクの推論と学習をサポートする高度なモデル定義を提供することに重点を置いている。モデルの使用プロセスを簡素化し、PyTorch、Tensor...などの多くの主流の深層学習フレームワークと互換性があります。.
07-06 3.0 K0表彰される
ローカルLLMメモ帳：ローカル大規模言語モデルをオフラインで実行するポータブルツール
Local LLM Notepadは、インターネット接続やインストールなしに、USBデバイスを介してWindowsコンピュータ上でLLM（Local Large Language Models）を実行できるオープンソースのオフラインアプリケーションです。ユーザーは、単一の実行ファイル（EXE）とモデルファイル（GGUF形式など）をUSBスティックにコピーするだけで、...
07-03 3.1 K0表彰される
llm.pdf：大規模言語モデルをPDFファイルで実行する実験的プロジェクト
llm.pdfはLarge Language Models (LLM)をPDFファイルで直接実行できるオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、Emscriptenを介してllama.cppをコンパイルするという革新的なアプローチを示しています。
05-05 3.7 K0表彰される
Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール
Aana SDKはMobius Labsによって開発されたオープンソースのフレームワークで、マラヤーラム語のആന（象）にちなんで名付けられました。Aana SDKは、Ray Distributed Computing Frameworkをベースにしています。
03-25 3.5 K0表彰される
BrowserAI：WebGPUを使ってブラウザ上でローカルにAIモデルを実行する
BrowserAIは、ユーザーがブラウザ上でネイティブAIモデルを直接実行できるオープンソースツールである。Cloud-Code-AIチームによって開発され、Llama、DeepSeek、Kokoroなどの言語モデルをサポートしている。ユーザーは、サーバーや複雑なセットアップなしで、ブラウザからテキスト生成を行うことができる。
03-16 3.9 K0表彰される
LitServe：エンタープライズグレードの汎用AIモデル推論サービスの迅速な展開
LitServeは、Lightning AIが提供するオープンソースのAIモデルサービスエンジンであり、FastAPI上に構築され、汎用AIモデル向けの推論サービスを迅速に展開することに重点を置いている。大規模言語モデル（LLM）、視覚モデル、音声モデルから古典的な機械学習モデルまで、幅広いシナリオをサポートし、バッチ...
03-10 3.2 K0表彰される
Nexa：ローカルで動作する小型マルチモーダルAIソリューション
Nexa AIは、ローカルで動作するマルチモーダルAIソリューションに特化したプラットフォームである。自然言語処理（NLP）、コンピュータ・ビジョン、音声認識・生成（ASRとTTS）を含む幅広いAIモデルを提供し、そのすべてをクラウド・サービスに依存することなく、デバイス上でローカルに実行することができる。これにより、データのプライバシーとセキュリティが向上するだけでなく...
02-01 4.0 K0表彰される
vLLM: 効率的なメモリ利用のためのLLM推論とサービスエンジン
vLLMは、Large Language Modelling (LLM)のために設計された、高スループットでメモリ効率の良い推論エンジンおよびサービスエンジンである。vLLMは、高速で使いやすく、費用対効果の高いL...
01-17 3.5 K0表彰される
ラマ3.2推論WebGPU：ブラウザでラマ3.2を動かす
Transformers.jsはHugging Faceが提供するJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行できるように設計されている。このライブラリはHugging FaceのPython版トランスフォーマーと互換性があります。
01-15 3.0 K0表彰される
Harbor: ローカルのLLM開発環境をワンクリックでデプロイし、AIサービスを簡単に管理・実行するためのコンテナ化されたツールセット。
Harborは、ローカルAI開発環境のデプロイと管理を簡素化することに焦点を当てた、画期的なコンテナ化LLMツールセットです。開発者は、簡潔なコマンドラインインターフェイス（CLI）とサポートアプリケーションを使用して、ワンクリックでLLMバックエンド、APIインターフェイス、フロントエンドインターフェイスを含むすべてのAIサービスコンポーネントを起動し、管理することができます。オープンソースプロジェクトとして、H...
01-02 4.3 K0表彰される
Xinference: 簡単な分散AIモデルのデプロイとサービング
Xorbits Inference（略してXinference）は、言語モデル、音声認識モデル、マルチモーダルモデルの分散デプロイと配信に特化した、強力で汎用性の高いライブラリです。Xorbits Inferenceを使用すると、ユーザーは独自のモデルやビルトインの高度なモデルを簡単にデプロイして提供することができます。
01-02 3.0 K0表彰される
AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合
AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリ（現在パブリックプレビュー中）です。開発者がAI機能をWindowsアプリケーションに簡単に統合するための包括的なプラットフォームを提供する。このツールの最大の特徴は、25以上のAI機能を提供することだ。.
12-30 3.6 K0表彰される
LightLLM：大規模言語モデルの推論と処理のための効率的な軽量フレームワーク
LightLLMはPythonベースのLarge Language Model（LLM）推論・サービスフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られている。このフレームワークは、FasterTransformer、TGI、vLLM、FlashAtten...などの有名なオープンソースの実装を活用しています。
12-17 3.6 K0表彰される
Transformers.js：ローカルウェブで動作する約700のAIマクロモデル
Transformers.jsは、Hugging Face社によって開発されたJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行することを可能にする。このライブラリはHugging FaceのPython Transformers.jsと互換性があります。
12-02 3.5 K0表彰される
GLMエッジ：Smart Spectrumがモバイル、自動車、PCプラットフォーム向けにエンドサイドビッグ言語モデルとマルチモーダル理解モデルをリリース
GLM-Edgeは、清華大学（Smart Spectrum Light Language）のエンドサイドデバイス用に設計された大規模言語モデルとマルチモーダル理解モデルのシリーズです。これらのモデルには、GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B、GLM-Edge-V-5...が含まれます。
12-01 3.4 K0表彰される
EXO：アイドル状態の家庭用デバイスを使用して分散AIクラスタを実行し、複数の推論エンジンとデバイスの自動検出をサポートする。
Exoは、身近なデバイス（iPhone、iPad、Android、Mac、Linuxなど）を使って独自のAIクラスターを実行することを目的としたオープンソースプロジェクトである。動的なモデル分割とデバイスの自動検出により、Exoは複数のデバイスを単一の強力なGPUに統合することができ、LLaMA、Mistral...などの複数のモデルをサポートしています。
11-28 5.0 K0表彰される