安装LMCache的步骤如下:
- 准备环境:确保系统为Linux,Python≥3.10,CUDA≥12.1,推荐使用Conda创建虚拟环境。
- 克隆仓库:通过Git克隆LMCache官方仓库。
- 安装LMCache:可通过PyPI安装稳定版或预发布版,或从源码安装。
- 安装vLLM:LMCache需与vLLM配合使用,需单独安装vLLM。
验证安装时,可执行以下Python代码检查版本号:
import lmcache
from importlib.metadata import version
print(version("lmcache"))
若输出版本号(如0.2.2.dev57),则安装成功。此外,LMCache还提供Docker镜像,可直接拉取部署。
本答案来源于文章《LMCache:加速大语言模型推理的键值缓存优化工具》