
SpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!
O SpatialLM é um modelo de linguagem grande projetado especificamente para processar dados de nuvem de pontos tridimensionais (3D). Sua função principal é compreender dados geométricos 3D não estruturados e transformá-los em representações de cenas 3D estruturadas. Esses resultados estruturados contêm elementos arquitetônicos (por exemplo, paredes, portas, janelas), bem como caixas delimitadoras de objetos com orientação e suas categorias semânticas. Em contraste com as muitas necessidades ...

Baichuan-M2: um modelo de linguagem grande para raciocínio aumentado na área de saúde
O Baichuan-M2 é um modelo de linguagem grande de código aberto com 32 bilhões (32B) de parâmetros da Baichuan Intelligence. O modelo se concentra no domínio médico e foi projetado para lidar com tarefas de raciocínio médico do mundo real. Ele se baseia no modelo Qwen2.5-32B, que foi desenvolvido com a introdução de um inovador “Large ...

Genie 3: Geração de mundos virtuais que podem ser interagidos em tempo real
O Genie 3 é um modelo de mundo genérico (modelo de mundo) lançado pelo Google DeepMind, que representa o mais recente avanço em IA na simulação e criação de ambientes virtuais. O principal recurso desse modelo é que ele pode gerar um mundo diversificado e dinâmico que suporta interações em tempo real com base apenas em uma descrição textual. Os usuários podem usar esse...

HRM: modelos de raciocínio hierárquico para raciocínio complexo
O HRM (Hierarchical Reasoning Model) é um modelo de raciocínio hierárquico com apenas 27 milhões de parâmetros projetado para resolver tarefas de raciocínio complexas no campo da inteligência artificial. O design do modelo é inspirado no processamento de informações hierárquico e em várias escalas de tempo do cérebro humano. Ele faz isso por meio de um módulo de alto nível (responsável por facilitar...

Difusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geração
O Seed Diffusion é um modelo de linguagem experimental, lançado pela equipe do ByteDance Seed em conjunto com a Academy of Intelligent Industry Research (AIR) da Universidade de Tsinghua. Este site é uma plataforma de demonstração de tecnologia para o modelo. O modelo é baseado na técnica de difusão discreta e seu principal objetivo é explorar a viabilidade da estrutura de infraestrutura de modelagem de linguagem de última geração. É na geração de código que este ...

HunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagens
O HunyuanWorld-1.0 é um projeto de código aberto desenvolvido pela equipe Hunyuan da Tencent, com o objetivo de gerar mundos 3D 360° interativos por meio de descrições de texto ou imagens únicas. Ele usa técnicas de geração de agentes panorâmicos, camadas semânticas e reconstrução hierárquica em 3D para gerar cenas em 3D exploráveis e de alta qualidade. O projeto é baseado na estrutura Flux e oferece suporte à interação com ...

Qwen3-MT: uma ferramenta de tradução inteligente para 92 idiomas
O Qwen3-MT é uma ferramenta de tradução inteligente desenvolvida pela equipe do Alibaba Cloud Qwen, com base no poderoso Qwen3 Big Language Model. Ele suporta a tradução de 92 idiomas e dialetos principais, cobrindo mais de 95% da população global. Os usuários podem experimentar seus eficientes recursos de tradução por meio da API do Qwen ou da página de demonstração on-line...

OpenMed: uma plataforma de código aberto para modelos de IA gratuitos na área da saúde
O OpenMed é uma plataforma de modelagem de IA de código aberto dedicada à área de saúde e ciências biológicas, hospedada no Hugging Face. Ele oferece mais de 380 modelos gratuitos de Reconhecimento de Entidades Nomeadas (NER) focados na extração de informações importantes, como medicamentos, doenças, genes e estruturas anatômicas de textos clínicos e literatura de pesquisa. Esses modelos são todos baseados...

Seed-X-7B: um grande modelo para tradução multilíngue eficiente
O Seed-X-7B é um modelo de idioma grande de tradução multilíngue de código aberto desenvolvido pela equipe Seed da ByteDance, com foco no fornecimento de funções de tradução eficientes e precisas. Ele se baseia na arquitetura Mistral com parâmetros 7B e oferece suporte à tradução em 28 idiomas, abrangendo uma ampla gama de domínios, como Internet, tecnologia, comércio eletrônico e biomedicina. O modelo funciona pre...

Qwen3-Coder: geração de código-fonte aberto e assistente de programação inteligente
O Qwen3-Coder é uma família de modelos de linguagem em larga escala de código aberto desenvolvida pela equipe do Alibaba Cloud Qwen, com foco na geração de código e programação inteligente. Seu principal produto é o Qwen3-Coder-480B-A35B-Instruct, um modelo híbrido de especialização (MoE) com 48 bilhões de parâmetros, ativado...

EduChat: um modelo de diálogo educacional de código aberto
O EduChat é um modelo de diálogo educacional de código aberto desenvolvido pela equipe do ICALK na East China Normal University. Ele se concentra em cenários educacionais, suporta diálogos em inglês e chinês e tem como objetivo fornecer ferramentas de diálogo inteligentes para alunos, professores e pesquisadores. O modelo é baseado em estruturas de código aberto, como LLaMA e Qwen, ajustado por uma grande quantidade de dados no domínio da educação, e tem a capacidade de lidar com...

MedGemma: uma coleção de modelos de IA de código aberto para compreensão de textos e imagens médicas
O MedGemma é um conjunto de modelos de IA de código aberto lançado pelo Google na plataforma Hugging Face, com foco na compreensão de textos e imagens na área médica. Ele se baseia no modelo Gemma 3 e foi projetado para ajudar os desenvolvedores a criar aplicativos de IA relacionados à saúde. O MedGemma oferece diversas variações de modelos...

Jan-nano: um modelo leve e eficiente para geração de texto
O Jan-nano é um modelo de linguagem de 4 bilhões de parâmetros otimizado na arquitetura Qwen3, desenvolvido pela Menlo Research e hospedado na plataforma Hugging Face. Ele foi projetado para geração eficiente de texto, combinando tamanho pequeno e recursos de processamento de contexto longo para ambientes locais ou incorporados. O modelo é compatível com...

Zerank-1: um modelo de reordenação para melhorar a precisão dos resultados de pesquisa
O Zerank-1 é um modelo avançado de reranker desenvolvido pela ZeroEntropy. Ele desempenha um papel fundamental como um “segundo filtro” nos sistemas de recuperação de informações ou de busca semântica. Primeiro, um sistema de recuperação inicial (por exemplo, pesquisa vetorial) identificará rapidamente um conjunto de possíveis...

Windsurf SWE-1
SWE-1: uma nova geração de modelos de ponta para engenharia de software Recentemente, foi lançada a tão esperada família de modelos SWE-1. Projetada para otimizar todo o processo de engenharia de software, essa família de modelos vai muito além da tarefa tradicional de escrever código. Atualmente, a família SWE-1 consiste em três modelos bem posicionados: SWE-1: Esse modelo principal...

LaWGPT
O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa de Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele amplia as listas de palavras proprietárias no domínio jurídico com base em modelos genéricos chineses (por exemplo, Chinese-LLaMA e ChatGLM) e os pré-treina com um corpus jurídico de grande escala...

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original
O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente da tradução off-line tradicional, o Hibiki é capaz de gerar uma tradução de fala natural do idioma de destino em tempo real enquanto o usuário fala, além de fornecer tradução de texto. O modelo usa uma arquitetura de vários fluxos para processar simultaneamente o fluxo de entrada da fala e gerar o idioma de destino...
voltar ao topo