
SpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!
O SpatialLM é um modelo de linguagem grande projetado especificamente para processar dados de nuvem de pontos tridimensionais (3D). Sua função principal é compreender dados geométricos 3D não estruturados e transformá-los em representações de cenas 3D estruturadas. Esses resultados estruturados contêm elementos arquitetônicos (por exemplo, paredes, portas, janelas), bem como caixas delimitadoras de objetos com orientação e suas categorias semânticas. Em contraste com as muitas necessidades ...

Baichuan-M2: um modelo de linguagem grande para raciocínio aumentado na área de saúde
O Baichuan-M2 é um modelo de linguagem grande de código aberto com 32 bilhões (32B) de parâmetros da Baichuan Intelligence. O modelo se concentra no domínio médico e foi projetado para lidar com tarefas de raciocínio médico do mundo real. Ele se baseia no modelo Qwen2.5-32B, que foi desenvolvido com a introdução de um inovador “Large ...

Genie 3: Geração de mundos virtuais que podem ser interagidos em tempo real
O Genie 3 é um modelo de mundo genérico (modelo de mundo) lançado pelo Google DeepMind, que representa o mais recente avanço em IA na simulação e criação de ambientes virtuais. O principal recurso desse modelo é que ele pode gerar um mundo diversificado e dinâmico que suporta interações em tempo real com base apenas em uma descrição textual. Os usuários podem usar esse...

HRM: modelos de raciocínio hierárquico para raciocínio complexo
O HRM (Hierarchical Reasoning Model) é um modelo de raciocínio hierárquico com apenas 27 milhões de parâmetros projetado para resolver tarefas de raciocínio complexas no campo da inteligência artificial. O design do modelo é inspirado no processamento de informações hierárquico e em várias escalas de tempo do cérebro humano. Ele faz isso por meio de um módulo de alto nível (responsável por facilitar...

Difusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geração
Seed Diffusion 是一个实验性的语言模型,由字节跳动Seed团队联合清华大学智能产业研究院(AIR)共同推出。这个网站是该模型的技术演示平台。该模型基于离散扩散技术,主要目标是探索下一代语言模型基础框架的可行性。它在代码生成这个...

HunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagens
HunyuanWorld-1.0 是腾讯混元团队开发的一个开源项目,旨在通过文字描述或单张图像生成可交互的360° 3D世界。它采用全景代理生成、语义分层和层次化3D重建技术,生成高质量、可探索的3D场景。项目基于 Flux 框架,支持与 ...

Qwen3-MT: uma ferramenta de tradução inteligente para 92 idiomas
O Qwen3-MT é uma ferramenta de tradução inteligente desenvolvida pela equipe do Alibaba Cloud Qwen, com base no poderoso Qwen3 Big Language Model. Ele suporta a tradução de 92 idiomas e dialetos principais, cobrindo mais de 95% da população global. Os usuários podem experimentar seus eficientes recursos de tradução por meio da API do Qwen ou da página de demonstração on-line...

OpenMed: uma plataforma de código aberto para modelos de IA gratuitos na área da saúde
OpenMed 是一个致力于医疗和生命科学领域的开源AI模型平台,托管于 Hugging Face。它提供超过380个免费的命名实体识别(NER)模型,专注于从临床文本和研究文献中提取关键信息,如药物、疾病、基因和解剖结构等。这些模型全部基...

Seed-X-7B: um grande modelo para tradução multilíngue eficiente
O Seed-X-7B é um modelo de idioma grande de tradução multilíngue de código aberto desenvolvido pela equipe Seed da ByteDance, com foco no fornecimento de funções de tradução eficientes e precisas. Ele se baseia na arquitetura Mistral com parâmetros 7B e oferece suporte à tradução em 28 idiomas, abrangendo uma ampla gama de domínios, como Internet, tecnologia, comércio eletrônico e biomedicina. O modelo funciona pre...

Qwen3-Coder: geração de código-fonte aberto e assistente de programação inteligente
O Qwen3-Coder é uma família de modelos de linguagem em larga escala de código aberto desenvolvida pela equipe do Alibaba Cloud Qwen, com foco na geração de código e programação inteligente. Seu principal produto é o Qwen3-Coder-480B-A35B-Instruct, um modelo híbrido de especialização (MoE) com 48 bilhões de parâmetros, ativado...

EduChat: um modelo de diálogo educacional de código aberto
EduChat 是由华东师范大学 ICALK 团队开发的一个开源教育对话模型。它专注于教育场景,支持中英文对话,旨在为学生、教师和研究人员提供智能化的对话工具。模型基于 LLaMA、Qwen 等开源框架,通过大量教育领域数据进行微调,具备处...

MedGemma: uma coleção de modelos de IA de código aberto para compreensão de textos e imagens médicas
O MedGemma é um conjunto de modelos de IA de código aberto lançado pelo Google na plataforma Hugging Face, com foco na compreensão de textos e imagens na área médica. Ele se baseia no modelo Gemma 3 e foi projetado para ajudar os desenvolvedores a criar aplicativos de IA relacionados à saúde. O MedGemma oferece diversas variações de modelos...

Jan-nano: um modelo leve e eficiente para geração de texto
O Jan-nano é um modelo de linguagem de 4 bilhões de parâmetros otimizado na arquitetura Qwen3, desenvolvido pela Menlo Research e hospedado na plataforma Hugging Face. Ele foi projetado para geração eficiente de texto, combinando tamanho pequeno e recursos de processamento de contexto longo para ambientes locais ou incorporados. O modelo é compatível com...

Zerank-1: um modelo de reordenação para melhorar a precisão dos resultados de pesquisa
Zerank-1 是由 ZeroEntropy 公司开发的一款先进的重排序(reranker)模型。 在信息检索或语义搜索系统中,它扮演着“第二道筛选器”的关键角色。 首先,一个初步的检索系统(如向量搜索)会从海量的文档库中快速找出一批可能...

Windsurf SWE-1
SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主...

LaWGPT
LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上,扩展了法律领域专有词表,并通过大规模法律语料预训练...

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语音流并生成目标语...
voltar ao topo