这两个系列模型的主要区别体现在:
dimensão de comparação | BGE-VL-CLIP | BGE-VL-MLLM |
---|---|---|
模型基础 | 基于CLIP架构 | 融合视觉-语言大模型 |
版本类型 | base/large | S1/S2 |
processamento de entrada | 分别编码图像/文本 | 联合编码跨模态输入 |
检索精度 | 基础水平 | CIRCO提升8.1% |
使用复杂度 | 简单直接 | 需要任务指令 |
选择建议:若需要快速验证基础功能可选CLIP版本;追求SOTA性能且能接受稍复杂配置时,应选择MLLM系列。
Essa resposta foi extraída do artigoMegaPairs: um novo modelo de incorporação de vetor multimodal do BGEO