Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

O Hunyuan-A13B é um modelo de linguagem grande e eficiente, de código aberto pela equipe híbrida da Tencent

2025-08-23 941

Histórico de código aberto e principais recursos do Hunyuan-A13B

O Hunyuan-A13B é um modelo de linguagem grande com código aberto oficialmente pela equipe Mixed Meta da Tencent em 27 de junho de 2025, projetado usando a arquitetura Mixed Expert (MoE). O modelo tem um total de 8 bilhões de parâmetros, dos quais 1,3 bilhão estão ativos, um projeto que reduz significativamente os custos de computação e garante um bom desempenho. O modelo é de código aberto no GitHub e no Hugging Face como um modelo pré-treinado, um modelo de comando ajustado e versões otimizadas e quantificadas (incluindo as versões FP8 e GPTQ-Int4) para implantação em diferentes ambientes de hardware. O conteúdo de código aberto também inclui código de treinamento detalhado, relatórios técnicos e manuais de operação, refletindo o espírito de contribuição da Tencent para a comunidade de compartilhamento de tecnologia de IA.

Em termos de realização técnica, o Hunyuan-A13B é particularmente enfático:

  • Equilíbrio entre alto desempenho e baixo custo: ativação de apenas alguns parâmetros por meio da arquitetura MoE
  • Opções abrangentes de implementação: várias versões quantitativas disponíveis para acomodar diferentes hardwares
  • Suporte completo ao desenvolvedor: abertura total, desde os pesos do modelo até o código de treinamento

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil