SpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!
SpatialLM是一个专门为处理三维(3D)点云数据而设计的大语言模型。它的核心功能是理解非结构化的3D几何数据,并将其转化为结构化的3D场景表示。这些结构化输出包含了建筑元素(如墙壁、门、窗)以及带方向的物体...
Baichuan-M2: um modelo de linguagem grande para raciocínio aumentado na área de saúde
Baichuan-M2 是百川智能公司推出的一个参数量为320亿(32B)的开源大语言模型。 该模型专注于医疗领域,旨在处理真实世界的医疗推理任务。它基于Qwen2.5-32B模型进行二次开发,通过引入创新的“大型验证器系统”(L...
Genie 3: Geração de mundos virtuais que podem ser interagidos em tempo real
O Genie 3 é um modelo de mundo de uso geral (modelo de mundo) lançado pelo Google DeepMind, que representa o mais recente avanço em IA para simular e criar ambientes virtuais. O principal recurso do modelo é que ele pode gerar um mundo diversificado e dinâmico que suporta interação em tempo real com base apenas em uma descrição textual...
HRM: modelos de raciocínio hierárquico para raciocínio complexo
O HRM (Hierarchical Reasoning Model) é um modelo de raciocínio hierárquico com apenas 27 milhões de parâmetros projetado para resolver tarefas de raciocínio complexas no campo da inteligência artificial. O design do modelo é inspirado no processamento de informações hierárquico e em várias escalas de tempo do cérebro humano. Ele é modelado por meio de um módulo de alto nível (negativo .....
Difusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geração
O Seed Diffusion é um modelo de linguagem experimental, lançado pela equipe do ByteDance Seed em conjunto com a Academy of Intelligent Industry Research (AIR) da Universidade de Tsinghua. Este site é uma plataforma de demonstração de tecnologia para o modelo. O modelo baseia-se na técnica de difusão discreta, e o principal objetivo é explorar a estrutura subjacente do modelo de linguagem de próxima geração que pode ser...
HunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagens
O HunyuanWorld-1.0 é um projeto de código aberto desenvolvido pela equipe Hunyuan da Tencent, com o objetivo de gerar mundos 3D 360° interativos por meio de descrições de texto ou imagens únicas. Ele usa técnicas de geração de agentes panorâmicos, camadas semânticas e reconstrução hierárquica em 3D para gerar cenas em 3D exploráveis e de alta qualidade. O projeto é baseado na estrutura Flux...
Qwen3-MT: uma ferramenta de tradução inteligente para 92 idiomas
O Qwen3-MT é uma ferramenta de tradução inteligente desenvolvida pela equipe do Alibaba Cloud Qwen, com base no poderoso Qwen3 Big Language Model. Ela suporta a tradução de 92 idiomas e dialetos principais, cobrindo mais de 95% da população global. Os usuários podem experimentar sua tradução eficiente por meio da API do Qwen ou da página de demonstração on-line ....
OpenMed: uma plataforma de código aberto para modelos de IA gratuitos na área da saúde
O OpenMed é uma plataforma de modelagem de IA de código aberto dedicada à área de saúde e ciências da vida, hospedada no Hugging Face, que oferece mais de 380 modelos gratuitos de reconhecimento de entidades nomeadas (NER) com foco na extração de informações importantes, como medicamentos, doenças, genes e estruturas anatômicas de textos clínicos e literatura de pesquisa....
Seed-X-7B: um grande modelo para tradução multilíngue eficiente
O Seed-X-7B é um modelo de idioma grande de tradução multilíngue de código aberto desenvolvido pela equipe Seed da ByteDance, com foco no fornecimento de funções de tradução eficientes e precisas. Ele se baseia na arquitetura Mistral com parâmetros 7B e oferece suporte à tradução em 28 idiomas, abrangendo uma ampla gama de campos, como Internet, tecnologia, comércio eletrônico e biomedicina....
Qwen3-Coder: geração de código-fonte aberto e assistente de programação inteligente
O Qwen3-Coder é uma família de modelos de linguagem em larga escala de código aberto desenvolvida pela equipe do Alibaba Cloud Qwen, com foco na geração de código e programação inteligente. Seu principal produto é o Qwen3-Coder-480B-A35B-Instruct, um modelo híbrido de especialização (MoE) com 48 bilhões de parâmetros, ativado...
EduChat: um modelo de diálogo educacional de código aberto
O EduChat é um modelo de diálogo educacional de código aberto desenvolvido pela equipe do ICALK na East China Normal University. Ele se concentra em cenários educacionais, suporta diálogos em chinês e inglês e tem como objetivo fornecer ferramentas de diálogo inteligentes para alunos, professores e pesquisadores. O modelo é baseado em estruturas de código aberto, como LLaMA, Qwen, etc., e em um grande número de dados de domínio educacional...
MedGemma: uma coleção de modelos de IA de código aberto para compreensão de textos e imagens médicas
O MedGemma é um conjunto de modelos de IA de código aberto lançado pelo Google na plataforma Hugging Face, com foco na compreensão de textos e imagens na área médica. Ele se baseia no modelo Gemma 3 e foi projetado para ajudar os desenvolvedores a criar aplicativos de IA relacionados à saúde. O MedGemma oferece diversas variações de modelos...
Jan-nano: um modelo leve e eficiente para geração de texto
O Jan-nano é um modelo de linguagem de 4 bilhões de parâmetros otimizado na arquitetura Qwen3, desenvolvido pela Menlo Research e hospedado na plataforma Hugging Face. Ele foi projetado para geração eficiente de texto, combinando tamanho pequeno e recursos de processamento de contexto longo para ambientes locais ou incorporados. O modelo é compatível com...
Zerank-1: um modelo de reordenação para melhorar a precisão dos resultados de pesquisa
O Zerank-1 é um modelo avançado de reranker desenvolvido pela ZeroEntropy. Ele desempenha um papel fundamental como um "segundo filtro" em sistemas de recuperação de informações ou de pesquisa semântica. Em primeiro lugar, um sistema de recuperação preliminar (por exemplo, pesquisa vetorial) encontrará rapidamente um grande número de documentos de um ...
Windsurf SWE-1
SWE-1: uma nova geração de modelos de ponta para engenharia de software Recentemente, foi lançada a tão esperada família de modelos SWE-1. Projetada para otimizar todo o processo de engenharia de software, essa família de modelos vai muito além da tarefa tradicional de escrever código. Atualmente, a família SWE-1 consiste em três modelos bem posicionados:...
LaWGPT
O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa em Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele amplia as listas de palavras proprietárias no domínio jurídico com base em modelos genéricos chineses (por exemplo, Chinese-LLaMA e ChatGLM) e por meio de...
Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original
O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente dos tradutores off-line tradicionais, o Hibiki é capaz de gerar traduções de fala naturais no idioma de destino e fornecer traduções de texto em tempo real enquanto o usuário fala. O modelo adota uma arquitetura de vários fluxos e é capaz de processar simultaneamente o idioma de entrada...
voltar ao topo