海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

LMCache在多模态模型支持方面有哪些特殊设计?

2025-08-19 207

针对视觉-语言混合模型,LMCache实现了两项创新设计:

  • 跨模态哈希机制:对图像token生成唯一哈希值(mm_hashes),与文本token的键值缓存建立映射关系,确保视觉特征可被精准复用。例如在图像描述生成任务中,相同图像的视觉特征只需计算一次。
  • 混合存储策略:根据图像特征的大小特点,自动选择存储介质——高频小特征存GPU显存,低频大特征转存CPU或磁盘,典型场景下可降低40%的显存占用。

该功能需要配合多模态版vLLM使用,具体配置参考官方LMCache-Examples仓库中的视觉问答(VQA)示例。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文