
SpatialLM:部屋を掃引すると、AIが自動的に3Dモデルを描画します!
SpatialLM是一个专门为处理三维(3D)点云数据而设计的大语言模型。它的核心功能是理解非结构化的3D几何数据,并将其转化为结构化的3D场景表示。这些结构化输出包含了建筑元素(如墙壁、门、窗)以及带方向的物体边界框及其语义类别。与许多需...

Baichuan-M2:ヘルスケアにおける拡張推論のための大規模言語モデル
Baichuan-M2 是百川智能公司推出的一个参数量为320亿(32B)的开源大语言模型。 该模型专注于医疗领域,旨在处理真实世界的医疗推理任务。它基于Qwen2.5-32B模型进行二次开发,通过引入创新的“大型验证器系统”(Large ...

Genie 3: リアルタイムで相互作用できる仮想世界の生成
Genie 3是谷歌DeepMind发布的一款通用世界模型(world model),它代表了AI在模拟和创建虚拟环境方面的最新进展。这款模型最核心的特点是,它可以仅仅根据一段文字描述,生成一个多样化且支持实时交互的动态世界。用户可以在这个...

HRM:複雑な推論のための階層的推論モデル
HRM (Hierarchical Reasoning Model) 是一个仅有2700万参数的层级式推理模型,旨在解决人工智能领域中复杂的推理任务。该模型的设计灵感来源于人脑的层级式、多时间尺度的信息处理方式。 它通过一个高层模块(负责缓...

シードの拡散:次世代アーキテクチャのための高速言語モデルの検証
Seed Diffusion 是一个实验性的语言模型,由字节跳动Seed团队联合清华大学智能产业研究院(AIR)共同推出。这个网站是该模型的技术演示平台。该模型基于离散扩散技术,主要目标是探索下一代语言模型基础框架的可行性。它在代码生成这个...

HunyuanWorld-1.0: テキストや画像からインタラクティブな360°3D世界を生成
HunyuanWorld-1.0 是腾讯混元团队开发的一个开源项目,旨在通过文字描述或单张图像生成可交互的360° 3D世界。它采用全景代理生成、语义分层和层次化3D重建技术,生成高质量、可探索的3D场景。项目基于 Flux 框架,支持与 ...

Qwen3-MT:92言語に対応した知的翻訳ツール
Qwen3-MT 是由阿里巴巴云 Qwen 团队开发的一款智能翻译工具,基于强大的 Qwen3 大语言模型。它支持 92 种语言和主要方言的翻译,覆盖全球 95% 以上的人口。用户可以通过 Qwen API 或在线演示页面体验其高效的翻译功...

OpenMed:ヘルスケアにおける無料のAIモデルのためのオープンソースプラットフォーム
OpenMed 是一个致力于医疗和生命科学领域的开源AI模型平台,托管于 Hugging Face。它提供超过380个免费的命名实体识别(NER)模型,专注于从临床文本和研究文献中提取关键信息,如药物、疾病、基因和解剖结构等。这些模型全部基...

Seed-X-7B:効率的な多言語翻訳のための大規模モデル
Seed-X-7B 是由字节跳动 Seed 团队开发的一款开源多语言翻译大语言模型,专注于提供高效、准确的翻译功能。它基于 7B 参数的 Mistral 架构,支持 28 种语言的翻译,覆盖互联网、科技、电商、生物医学等多个领域。模型通过预...

Qwen3-Coder: オープンソースコード生成とインテリジェントプログラミングアシスタント
Qwen3-Coderは、Alibaba Cloud Qwenチームによって開発されたオープンソースの大規模言語モデルファミリーで、コード生成とインテリジェントプログラミングに焦点を当てています。コア製品はQwen3-Coder-480B-A35B-Instructで、480億のパラメータを持つハイブリッド専門家モデル(MoE)です。

EduChat:オープンソースの教育対話モデル
EduChat 是由华东师范大学 ICALK 团队开发的一个开源教育对话模型。它专注于教育场景,支持中英文对话,旨在为学生、教师和研究人员提供智能化的对话工具。模型基于 LLaMA、Qwen 等开源框架,通过大量教育领域数据进行微调,具备处...

MedGemma: 医療テキストと画像理解のためのオープンソースAIモデル集
MedGemmaは、GoogleがHugging Faceプラットフォーム上で公開しているオープンソースのAIモデル群で、医療分野におけるテキストと画像の理解に焦点を当てている。Gemma 3モデルをベースにしており、開発者が医療関連のAIアプリケーションを構築するのを助けるように設計されている。MedGemmaは様々なモデルのバリエーションを提供している。

Jan-nano:軽量で効率的なテキスト生成モデル
Jan-nanoはQwen3アーキテクチャ上で最適化された40億パラメータの言語モデルであり、Menlo Research社によって開発され、Hugging Faceプラットフォーム上でホストされている。効率的なテキスト生成のために設計されており、ローカル環境や組み込み環境向けに、小さなサイズと長いコンテキスト処理能力を兼ね備えています。このモデルは...

Zerank-1: 検索結果の精度を向上させる並べ替えモデル
Zerank-1 是由 ZeroEntropy 公司开发的一款先进的重排序(reranker)模型。 在信息检索或语义搜索系统中,它扮演着“第二道筛选器”的关键角色。 首先,一个初步的检索系统(如向量搜索)会从海量的文档库中快速找出一批可能...

ウインドサーフ SWE-1
SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主...

ラワゴット
LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上,扩展了法律领域专有词表,并通过大规模法律语料预训练...

Hibiki:リアルタイム音声翻訳モデル、元の音声の特徴を保持したストリーミング翻訳
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语音流并生成目标语...
トップに戻る