SpatialLM:扫一下房间,AI自动帮你画出3D模型
SpatialLM是一个专门为处理三维(3D)点云数据而设计的大语言模型。它的核心功能是理解非结构化的3D几何数据,并将其转化为结构化的3D场景表示。这些结构化输出包含了建筑元素(如墙壁、门、窗)以及带方向的物体...
Baichuan-M2:医疗领域增强推理的大语言模型
Baichuan-M2 是百川智能公司推出的一个参数量为320亿(32B)的开源大语言模型。 该模型专注于医疗领域,旨在处理真实世界的医疗推理任务。它基于Qwen2.5-32B模型进行二次开发,通过引入创新的“大型验证器系统”(L...
Genie 3:生成可实时交互的虚拟世界
Genie 3是谷歌DeepMind发布的一款通用世界模型(world model),它代表了AI在模拟和创建虚拟环境方面的最新进展。这款模型最核心的特点是,它可以仅仅根据一段文字描述,生成一个多样化且支持实时交互的动态世界...
HRM:用于复杂推理的分层推理模型
HRM (Hierarchical Reasoning Model) 是一个仅有2700万参数的层级式推理模型,旨在解决人工智能领域中复杂的推理任务。该模型的设计灵感来源于人脑的层级式、多时间尺度的信息处理方式。 它通过一个高层模块(负.....
Seed Diffusion:验证新一代架构的高速语言模型
Seed Diffusion 是一个实验性的语言模型,由字节跳动Seed团队联合清华大学智能产业研究院(AIR)共同推出。这个网站是该模型的技术演示平台。该模型基于离散扩散技术,主要目标是探索下一代语言模型基础框架的可...
HunyuanWorld-1.0:从文字或图像生成可交互的360° 3D世界
HunyuanWorld-1.0 是腾讯混元团队开发的一个开源项目,旨在通过文字描述或单张图像生成可交互的360° 3D世界。它采用全景代理生成、语义分层和层次化3D重建技术,生成高质量、可探索的3D场景。项目基于 Flux 框架...
Qwen3-MT:支持92种语言的智能翻译工具
Qwen3-MT 是由阿里巴巴云 Qwen 团队开发的一款智能翻译工具,基于强大的 Qwen3 大语言模型。它支持 92 种语言和主要方言的翻译,覆盖全球 95% 以上的人口。用户可以通过 Qwen API 或在线演示页面体验其高效的翻译....
OpenMed:免费提供医疗领域AI模型的开源平台
OpenMed 是一个致力于医疗和生命科学领域的开源AI模型平台,托管于 Hugging Face。它提供超过380个免费的命名实体识别(NER)模型,专注于从临床文本和研究文献中提取关键信息,如药物、疾病、基因和解剖结构等。...
Seed-X-7B:高效的多语言翻译大模型
Seed-X-7B 是由字节跳动 Seed 团队开发的一款开源多语言翻译大语言模型,专注于提供高效、准确的翻译功能。它基于 7B 参数的 Mistral 架构,支持 28 种语言的翻译,覆盖互联网、科技、电商、生物医学等多个领域。...
Qwen3-Coder:开源代码生成与智能编程助手
Qwen3-Coder 是由阿里巴巴云 Qwen 团队开发的一个开源大型语言模型系列,专注于代码生成与智能编程。它的核心产品是 Qwen3-Coder-480B-A35B-Instruct,一个拥有480亿参数的混合专家模型(MoE),激活...
EduChat:开源教育对话模型
EduChat 是由华东师范大学 ICALK 团队开发的一个开源教育对话模型。它专注于教育场景,支持中英文对话,旨在为学生、教师和研究人员提供智能化的对话工具。模型基于 LLaMA、Qwen 等开源框架,通过大量教育领域数...
MedGemma:医疗文本与图像理解的开源AI模型集合
MedGemma 是 Google 在 Hugging Face 平台上发布的一组开源 AI 模型,专注于医疗领域的文本和图像理解。它基于 Gemma 3 模型开发,旨在帮助开发者构建医疗相关的 AI 应用。MedGemma 提供多种模型变...
Jan-nano:轻量高效的文本生成模型
Jan-nano 是一个基于 Qwen3 架构优化的 40 亿参数语言模型,由 Menlo Research 开发,托管在 Hugging Face 平台。它专为高效文本生成设计,兼顾小体积和长上下文处理能力,适合本地或嵌入式环境。模型支持...
Zerank-1: 用于提升搜索结果精度的重排序模型
Zerank-1 是由 ZeroEntropy 公司开发的一款先进的重排序(reranker)模型。 在信息检索或语义搜索系统中,它扮演着“第二道筛选器”的关键角色。 首先,一个初步的检索系统(如向量搜索)会从海量的文档库中快速找...
Windsurf SWE-1
SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型:...
LaWGPT
LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上,扩展了法律领域专有词表,并通过大规模...
Hibiki:实时语音翻译模型,保留原声特点的流式翻译
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语...
回顶部