Posição atual:fig. início " Respostas da IA

O Hunyuan-A13B é um modelo de linguagem grande e eficiente, de código aberto pela equipe híbrida da Tencent

2025-08-23

1.2 K

Link diretoVisualização móvel

Histórico de código aberto e principais recursos do Hunyuan-A13B

O Hunyuan-A13B é um modelo de linguagem grande com código aberto oficialmente pela equipe Mixed Meta da Tencent em 27 de junho de 2025, projetado usando a arquitetura Mixed Expert (MoE). O modelo tem um total de 8 bilhões de parâmetros, dos quais 1,3 bilhão estão ativos, um projeto que reduz significativamente os custos de computação e garante um bom desempenho. O modelo é de código aberto no GitHub e no Hugging Face como um modelo pré-treinado, um modelo de comando ajustado e versões otimizadas e quantificadas (incluindo as versões FP8 e GPTQ-Int4) para implantação em diferentes ambientes de hardware. O conteúdo de código aberto também inclui código de treinamento detalhado, relatórios técnicos e manuais de operação, refletindo o espírito de contribuição da Tencent para a comunidade de compartilhamento de tecnologia de IA.

Em termos de realização técnica, o Hunyuan-A13B é particularmente enfático:

Equilíbrio entre alto desempenho e baixo custo: ativação de apenas alguns parâmetros por meio da arquitetura MoE
Opções abrangentes de implementação: várias versões quantitativas disponíveis para acomodar diferentes hardwares
Suporte completo ao desenvolvedor: abertura total, desde os pesos do modelo até o código de treinamento

Essa resposta foi extraída do artigoHunyuan-A13B: modelos eficientes de linguagem grande de código aberto para contextos ultralongos e raciocínio inteligenteO

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA " O Hunyuan-A13B é um modelo de linguagem grande e eficiente, de código aberto pela equipe híbrida da Tencent

O Hunyuan-A13B é um modelo de linguagem grande e eficiente, de código aberto pela equipe híbrida da Tencent

Histórico de código aberto e principais recursos do Hunyuan-A13B

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

O Hunyuan-A13B é um modelo de linguagem grande e eficiente, de código aberto pela equipe híbrida da Tencent

Histórico de código aberto e principais recursos do Hunyuan-A13B

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida