
SpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!
O SpatialLM é um modelo de linguagem grande projetado especificamente para processar dados de nuvem de pontos tridimensionais (3D). Sua principal função é entender dados geométricos 3D não estruturados e transformá-los em representações de cenas 3D estruturadas. Esses resultados estruturados contêm elementos arquitetônicos (por exemplo, paredes, portas, janelas), bem como objetos com orientação...

Baichuan-M2: um modelo de linguagem grande para raciocínio aumentado na área de saúde
O Baichuan-M2 é um modelo de linguagem grande de código aberto com 32 bilhões (32B) de parâmetros da Baichuan Intelligence. O modelo se concentra no domínio médico e foi projetado para lidar com tarefas de raciocínio médico do mundo real. Ele se baseia no modelo Qwen2.5-32B, que foi desenvolvido com a introdução de um inovador "Large Validator System" (L...

Genie 3: Geração de mundos virtuais que podem ser interagidos em tempo real
O Genie 3 é um modelo de mundo de uso geral (modelo de mundo) lançado pelo Google DeepMind, que representa o mais recente avanço em IA para simular e criar ambientes virtuais. O principal recurso do modelo é que ele pode gerar um mundo diversificado e dinâmico que suporta interação em tempo real com base apenas em uma descrição textual...

HRM: modelos de raciocínio hierárquico para raciocínio complexo
O HRM (Hierarchical Reasoning Model) é um modelo de raciocínio hierárquico com apenas 27 milhões de parâmetros projetado para resolver tarefas de raciocínio complexas no campo da inteligência artificial. O design do modelo é inspirado no processamento de informações hierárquico e em várias escalas de tempo do cérebro humano. Ele é modelado por meio de um módulo de alto nível (negativo .....

Difusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geração
O Seed Diffusion é um modelo de linguagem experimental, lançado pela equipe do ByteDance Seed em conjunto com a Academy of Intelligent Industry Research (AIR) da Universidade de Tsinghua. Este site é uma plataforma de demonstração de tecnologia para o modelo. O modelo baseia-se na técnica de difusão discreta, e o principal objetivo é explorar a estrutura subjacente do modelo de linguagem de próxima geração que pode ser...

HunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagens
O HunyuanWorld-1.0 é um projeto de código aberto desenvolvido pela equipe Hunyuan da Tencent, com o objetivo de gerar mundos 3D 360° interativos por meio de descrições de texto ou imagens únicas. Ele usa técnicas de geração de agentes panorâmicos, camadas semânticas e reconstrução hierárquica em 3D para gerar cenas em 3D exploráveis e de alta qualidade. O projeto é baseado na estrutura Flux...

Qwen3-MT: uma ferramenta de tradução inteligente para 92 idiomas
O Qwen3-MT é uma ferramenta de tradução inteligente desenvolvida pela equipe do Alibaba Cloud Qwen, com base no poderoso Qwen3 Big Language Model. Ela suporta a tradução de 92 idiomas e dialetos principais, cobrindo mais de 95% da população global. Os usuários podem experimentar sua tradução eficiente por meio da API do Qwen ou da página de demonstração on-line ....

OpenMed: uma plataforma de código aberto para modelos de IA gratuitos na área da saúde
O OpenMed é uma plataforma de modelagem de IA de código aberto dedicada à área de saúde e ciências da vida, hospedada no Hugging Face, que oferece mais de 380 modelos gratuitos de reconhecimento de entidades nomeadas (NER) com foco na extração de informações importantes, como medicamentos, doenças, genes e estruturas anatômicas de textos clínicos e literatura de pesquisa....

Seed-X-7B: um grande modelo para tradução multilíngue eficiente
O Seed-X-7B é um modelo de idioma grande de tradução multilíngue de código aberto desenvolvido pela equipe Seed da ByteDance, com foco no fornecimento de funções de tradução eficientes e precisas. Ele se baseia na arquitetura Mistral com parâmetros 7B e oferece suporte à tradução em 28 idiomas, abrangendo uma ampla gama de campos, como Internet, tecnologia, comércio eletrônico e biomedicina....

Qwen3-Coder: geração de código-fonte aberto e assistente de programação inteligente
O Qwen3-Coder é uma família de modelos de linguagem em larga escala de código aberto desenvolvida pela equipe do Alibaba Cloud Qwen, com foco na geração de código e programação inteligente. Seu principal produto é o Qwen3-Coder-480B-A35B-Instruct, um modelo híbrido de especialização (MoE) com 48 bilhões de parâmetros, ativado...

EduChat: um modelo de diálogo educacional de código aberto
O EduChat é um modelo de diálogo educacional de código aberto desenvolvido pela equipe do ICALK na East China Normal University. Ele se concentra em cenários educacionais, suporta diálogos em chinês e inglês e tem como objetivo fornecer ferramentas de diálogo inteligentes para alunos, professores e pesquisadores. O modelo é baseado em estruturas de código aberto, como LLaMA, Qwen, etc., e em um grande número de dados de domínio educacional...

MedGemma: uma coleção de modelos de IA de código aberto para compreensão de textos e imagens médicas
O MedGemma é um conjunto de modelos de IA de código aberto lançado pelo Google na plataforma Hugging Face, com foco na compreensão de textos e imagens na área médica. Ele se baseia no modelo Gemma 3 e foi projetado para ajudar os desenvolvedores a criar aplicativos de IA relacionados à saúde. O MedGemma oferece diversas variações de modelos...

Jan-nano: um modelo leve e eficiente para geração de texto
O Jan-nano é um modelo de linguagem de 4 bilhões de parâmetros otimizado na arquitetura Qwen3, desenvolvido pela Menlo Research e hospedado na plataforma Hugging Face. Ele foi projetado para geração eficiente de texto, combinando tamanho pequeno e recursos de processamento de contexto longo para ambientes locais ou incorporados. O modelo é compatível com...

Zerank-1: um modelo de reordenação para melhorar a precisão dos resultados de pesquisa
O Zerank-1 é um modelo avançado de reranker desenvolvido pela ZeroEntropy. Ele desempenha um papel fundamental como um "segundo filtro" em sistemas de recuperação de informações ou de pesquisa semântica. Em primeiro lugar, um sistema de recuperação preliminar (por exemplo, pesquisa vetorial) encontrará rapidamente um grande número de documentos de um ...

Windsurf SWE-1
SWE-1: uma nova geração de modelos de ponta para engenharia de software Recentemente, foi lançada a tão esperada família de modelos SWE-1. Projetada para otimizar todo o processo de engenharia de software, essa família de modelos vai muito além da tarefa tradicional de escrever código. Atualmente, a família SWE-1 consiste em três modelos bem posicionados:...

LaWGPT
O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa em Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele amplia as listas de palavras proprietárias no domínio jurídico com base em modelos genéricos chineses (por exemplo, Chinese-LLaMA e ChatGLM) e por meio de...

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original
O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente dos tradutores off-line tradicionais, o Hibiki é capaz de gerar traduções de fala naturais no idioma de destino e fornecer traduções de texto em tempo real enquanto o usuário fala. O modelo adota uma arquitetura de vários fluxos e é capaz de processar simultaneamente o idioma de entrada...
voltar ao topo