MegaPairs数据集具有以下三大核心特征:
- 规模庞大: 包含2600万个异构KNN三元组(查询图像+文本描述+目标图像)
- データの質: 源自Recap-Datacomp(CC BY 4.0许可),经过严格清洗和增强
- 任务适配: 特别优化用于图像-文本到图像的检索任务
获取方式:
- 当前模型和代码已开源在GitHub/Hugging Face
- 完整数据集计划后续发布,需关注官方更新
- 现有示例数据可通过Hugging Face空间体验
注意:使用数据集需遵守原始CC BY 4.0许可,商业用途需确认合规性。
この答えは記事から得たものである。メガペア:BGEによる新しいマルチモーダルベクトル埋め込みモデルについて