
SpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!
SpatialLM是一个专门为处理三维(3D)点云数据而设计的大语言模型。它的核心功能是理解非结构化的3D几何数据,并将其转化为结构化的3D场景表示。这些结构化输出包含了建筑元素(如墙壁、门、窗)以及带方向的物体边界框及其语义类别。与许多需...

Baichuan-M2: um modelo de linguagem grande para raciocínio aumentado na área de saúde
Baichuan-M2 是百川智能公司推出的一个参数量为320亿(32B)的开源大语言模型。 该模型专注于医疗领域,旨在处理真实世界的医疗推理任务。它基于Qwen2.5-32B模型进行二次开发,通过引入创新的“大型验证器系统”(Large ...

Genie 3: Geração de mundos virtuais que podem ser interagidos em tempo real
Genie 3是谷歌DeepMind发布的一款通用世界模型(world model),它代表了AI在模拟和创建虚拟环境方面的最新进展。这款模型最核心的特点是,它可以仅仅根据一段文字描述,生成一个多样化且支持实时交互的动态世界。用户可以在这个...

HRM: modelos de raciocínio hierárquico para raciocínio complexo
HRM (Hierarchical Reasoning Model) 是一个仅有2700万参数的层级式推理模型,旨在解决人工智能领域中复杂的推理任务。该模型的设计灵感来源于人脑的层级式、多时间尺度的信息处理方式。 它通过一个高层模块(负责缓...

Difusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geração
Seed Diffusion 是一个实验性的语言模型,由字节跳动Seed团队联合清华大学智能产业研究院(AIR)共同推出。这个网站是该模型的技术演示平台。该模型基于离散扩散技术,主要目标是探索下一代语言模型基础框架的可行性。它在代码生成这个...

HunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagens
HunyuanWorld-1.0 是腾讯混元团队开发的一个开源项目,旨在通过文字描述或单张图像生成可交互的360° 3D世界。它采用全景代理生成、语义分层和层次化3D重建技术,生成高质量、可探索的3D场景。项目基于 Flux 框架,支持与 ...

Qwen3-MT: uma ferramenta de tradução inteligente para 92 idiomas
Qwen3-MT 是由阿里巴巴云 Qwen 团队开发的一款智能翻译工具,基于强大的 Qwen3 大语言模型。它支持 92 种语言和主要方言的翻译,覆盖全球 95% 以上的人口。用户可以通过 Qwen API 或在线演示页面体验其高效的翻译功...

OpenMed: uma plataforma de código aberto para modelos de IA gratuitos na área da saúde
OpenMed 是一个致力于医疗和生命科学领域的开源AI模型平台,托管于 Hugging Face。它提供超过380个免费的命名实体识别(NER)模型,专注于从临床文本和研究文献中提取关键信息,如药物、疾病、基因和解剖结构等。这些模型全部基...

Seed-X-7B: um grande modelo para tradução multilíngue eficiente
Seed-X-7B 是由字节跳动 Seed 团队开发的一款开源多语言翻译大语言模型,专注于提供高效、准确的翻译功能。它基于 7B 参数的 Mistral 架构,支持 28 种语言的翻译,覆盖互联网、科技、电商、生物医学等多个领域。模型通过预...

Qwen3-Coder: geração de código-fonte aberto e assistente de programação inteligente
O Qwen3-Coder é uma família de modelos de linguagem em larga escala de código aberto desenvolvida pela equipe do Alibaba Cloud Qwen, com foco na geração de código e programação inteligente. Seu principal produto é o Qwen3-Coder-480B-A35B-Instruct, um modelo híbrido de especialização (MoE) com 48 bilhões de parâmetros, ativado...

EduChat: um modelo de diálogo educacional de código aberto
EduChat 是由华东师范大学 ICALK 团队开发的一个开源教育对话模型。它专注于教育场景,支持中英文对话,旨在为学生、教师和研究人员提供智能化的对话工具。模型基于 LLaMA、Qwen 等开源框架,通过大量教育领域数据进行微调,具备处...

MedGemma: uma coleção de modelos de IA de código aberto para compreensão de textos e imagens médicas
O MedGemma é um conjunto de modelos de IA de código aberto lançado pelo Google na plataforma Hugging Face, com foco na compreensão de textos e imagens na área médica. Ele se baseia no modelo Gemma 3 e foi projetado para ajudar os desenvolvedores a criar aplicativos de IA relacionados à saúde. O MedGemma oferece diversas variações de modelos...

Jan-nano: um modelo leve e eficiente para geração de texto
O Jan-nano é um modelo de linguagem de 4 bilhões de parâmetros otimizado na arquitetura Qwen3, desenvolvido pela Menlo Research e hospedado na plataforma Hugging Face. Ele foi projetado para geração eficiente de texto, combinando tamanho pequeno e recursos de processamento de contexto longo para ambientes locais ou incorporados. O modelo é compatível com...

Zerank-1: um modelo de reordenação para melhorar a precisão dos resultados de pesquisa
Zerank-1 是由 ZeroEntropy 公司开发的一款先进的重排序(reranker)模型。 在信息检索或语义搜索系统中,它扮演着“第二道筛选器”的关键角色。 首先,一个初步的检索系统(如向量搜索)会从海量的文档库中快速找出一批可能...

Windsurf SWE-1
SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主...

LaWGPT
LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上,扩展了法律领域专有词表,并通过大规模法律语料预训练...

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语音流并生成目标语...
voltar ao topo