LMCacheは、Linuxオペレーティングシステム、Pythonバージョン3.10以上を必要とし、NVIDIA CUDA 12.1以上の開発環境で構成されている必要があります。依存関係を管理するために、隔離されたPython仮想環境を作成するためにMinicondaを使用することが公式に推奨されています。インストールは柔軟です:PyPI経由で安定版を直接インストールすることもできますし(pip install lmcache)、最新の機能を得るためにソースからコンパイルしてインストールすることもできます。LMCacheはvLLM推論エンジンと組み合わせて使用する必要があるため、vLLMコンポーネントの追加インストールが必要です。コンテナによるデプロイシナリオのために、プロジェクトはデプロイプロセスを簡素化するために、vLLMと関連する依存関係を統合したビルド済みのDockerイメージも提供している。
この答えは記事から得たものである。LMCache:大規模言語モデルの推論を高速化するキーバリューキャッシュ最適化ツールについて































