Die Schritte zur Installation von LMCache sind wie folgt:
- Vorbereiten der UmgebungStellen Sie sicher, dass das System Linux, Python ≥ 3.10, CUDA ≥ 12.1 und Conda ist empfohlen, um eine virtuelle Umgebung zu erstellen.
- Klon-LagerKlonen Sie das offizielle LMCache-Repository über Git.
- Installieren von LMCacheStabile Versionen oder Vorabversionen können über PyPI oder aus dem Quellcode installiert werden.
- Installation von vLLMLMCache muss mit vLLM verwendet werden, und vLLM muss separat installiert werden.
Um die Installation zu überprüfen, führen Sie den folgenden Python-Code aus, um die Versionsnummer zu prüfen:
import lmcache
from importlib.metadata import version
print(version("lmcache"))
Wenn die Versionsnummer ausgegeben wird (z.B. 0.2.2.dev57), ist die Installation erfolgreich. Darüber hinaus bietet LMCache Docker-Images, die direkt gezogen und bereitgestellt werden können.
Diese Antwort stammt aus dem ArtikelLMCache: Ein Key-Value-Cache-Optimierungswerkzeug zur Beschleunigung von Schlussfolgerungen auf großen SprachmodellenDie