Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

DREAM-1K基准为视频描述任务提供标准化评估体系

2025-08-25 1.1 K

评估体系的技术价值

Tarsier项目组开发的DREAM-1K基准包含1000个经过严格标注的视频片段,覆盖20个主要场景类别,每个视频配套:

  • 3组专家级人工描述文本
  • 时序对齐的动作标注
  • 物体检测边界框信息

该基准的创新性在于:

  • 引入AutoDQ评估方法,通过GPT-4自动分析描述质量
  • 设计细粒度评价指标:包括动作完整性、物体准确性、场景贴合度三个维度
  • 支持跨模型对比测试,已集成到HuggingFace的评估套件中

实验数据显示,基于DREAM-1K的评测中,Tarsier2-7B在描述流畅度指标上较基线模型提高32%,在细节准确率指标上领先25个百分点。这套体系已成为视频-语言研究领域的新标准。

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch