Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Qual é o desempenho da estrutura do MiroFlow no conjunto de validação do GAIA? Quais são suas implicações?

2025-08-14 88

O MiroFlow alcançou uma taxa de pontuação pass@1 de 72,2% (média de três execuções) no conjunto de validação GAIA usando o Claude Sonnet 3.7 como o principal modelo de linguagem grande. Esse desempenho está na vanguarda das estruturas de corpo inteligente de código aberto, demonstrando sua capacidade de lidar com tarefas complexas de várias ferramentas.

A importância dessa conquista está no seguinte: em primeiro lugar, ela verifica a estabilidade e a reprodutibilidade da estrutura, o que falta em muitos projetos de código aberto; em segundo lugar, o fornecimento oficial de scripts de avaliação e arquivos de configuração totalmente abertos e a liberação de dados de várias execuções independentes no HuggingFace garantem a transparência dos resultados; e, por último, esse benchmark fornece aos desenvolvedores uma referência objetiva de desempenho para escolher uma estrutura.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil