Acesso no exterior: www.kdjingpai.com

Ctrl + D Marcar este site como favorito

Posição atual:fig. início " Respostas da IA

什么是Ovis，它的核心功能有哪些？

2025-08-30

Respostas da IA

1.6 K

Ovis（Open VISion）是由阿里巴巴国际数字商业集团AIDC-AI团队开发的开源多模态大语言模型（MLLM），致力于视觉与文本数据的深度融合。其核心功能包括：

Capacidade de processamento multimodal：支持图像、文本、视频的输入与内容生成
精准的对齐技术：通过结构嵌入实现视觉内容与文本描述的高度匹配
高分辨率优化：最高支持9分区处理，保留图像细节
多语言OCR：可识别混合语言的图像文字
增强推理：通过指令调优和DPO训练提升逻辑分析能力

目前提供1B至34B参数的模型系列，并推出量化版本降低硬件门槛。

Essa resposta foi extraída do artigoOvis: um modelo de alinhamento visual e textual para retropropagação precisa de palavras-chave de imagemO

Artigos relacionados

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA " 什么是Ovis，它的核心功能有哪些？

Recomendado

Português do Brasil