海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI新闻

国产AI音乐模型Mureka V7发布:技术升级与功能实测

2025-07-23 25

随着人工智能技术的不断演进,AI 音乐的生成品质与普及度正在迅速提升。早期 AI 音乐在音质保真度和人声自然度方面存在的明显不足,正随着模型的快速迭代而得到改善。

2025年7月23日,昆仑万维正式发布了其新一代音乐大模型 Mureka V7。据官方资料显示,该模型在平均表现评分、混音质量、人声真实感及整体音质等多个关键指标上,表现优于海外同类产品 Suno 的 V4.5 版本。与前代 V6 相比,Mureka V7 在旋律动机的丰富性和编曲质量上实现了显著提升,同时增强了人声与乐器的真实度。

国产AI音乐模型Mureka V7发布:技术升级与功能实测-1

Mureka V7 已在其官方网站全面上线,供用户体验。

国产AI音乐模型Mureka V7发布:技术升级与功能实测-1

功能实测:从音色模仿到风格参考

Mureka V7 的一个核心功能是“自定义歌手”。该功能允许用户通过上传音频或提供视频链接,让 AI 模型学习并模仿特定音色来演唱全新的歌曲。

以歌手王菲的音色为例,其声线具有独特的空灵感和气声处理技巧。在使用 Mureka V7 对其音色进行模仿并重新演绎《清平调》时,生成结果在很大程度上再现了原唱的声线特质,尤其在尾音处理上体现了相似的慵懒感。

 

此外,“音乐参考”是另一项实用功能。模型通过分析用户上传的音乐,识别其曲风、节奏、配器和情绪,并生成风格相似的原创作品。例如,将近期在社交媒体流行的,由印度歌曲《Tunak Tunak Tun》改编的《刚买的飞机被打啦》作为参考,Mureka V7 能够生成旋律和节奏相似的曲目,并自动配以风格化的视觉MV。

常规功能方面,模型支持通过文本描述直接生成不同风格的音乐。输入李白的诗歌《将进酒》并指定“说唱金属”风格,模型可以生成一首融合了诗词与摇滚元素的歌曲。对于背景音乐 (BGM) 的创作,用户可通过简单的提示词(如“回忆童年的温暖钢琴旋律”)生成免版权的纯音乐片段,或上传参考音频(如《Summer》、《权力的游戏》主题曲)来创作风格相近的乐曲。

对于生成结果不满意的情况,Mureka V7 提供了基础的音频编辑工具,支持局部修改、歌曲延长、乐器分轨和音频裁剪,并兼容十种语言的音乐创作。

技术核心:进化的MusiCoT思维链

Mureka V7 的性能提升,得益于其自研的音乐生成专用思维链 MusiCoT (Analyzable Chain-of-Musical-Thought Prompting) 的持续优化。

在大型语言模型领域,思维链 (Chain-of-Thought, CoT) 是一种引导模型在回答问题前先进行一步步推理的提示方法,以提升复杂任务的准确性。昆仑万维将此概念应用于音乐创作,其核心逻辑是“先想结构后生成”,模拟人类音乐家的创作过程。在输出具体的音频 Token 之前,模型会预先规划好音乐的整体结构,包括段落、情绪递进和编排布局。

MusiCoT 的另一个特点是生成结构的可解释与可控性。借助 CLAP (对比式语言-音频预训练模型),AI 生成音乐的思维链变得明确可读。这使得用户可以通过输入任意长度的参考音频作为风格提示,更精确地控制生成结果。相较于 Suno 等模型在音乐结构和可控性方面的探索,Mureka 的 MusiCoT 提供了一条更具可解释性的技术路径。

语音合成新模型:Mureka TTS V1

除音乐生成外,昆仑万维此次还发布了一款新的音频模型 Mureka TTS V1,专注于通用语音合成。

国产AI音乐模型Mureka V7发布:技术升级与功能实测-1

与强调旋律、和声的音乐模型不同,TTS (Text-to-Speech) 模型更关注对各类声音的通用表达。Mureka TTS V1 的主要创新在于引入了 Voice Design 能力,允许用户通过自然语言文本描述来定义所需音色的特征,而非局限于在预设音色库中进行选择。用户可以描述声音的性别、年龄、情感、语气风格和语速,实现高度个性化的语音合成。

根据官方公布的对比数据,在与行业主流竞品 ElevenLabs TTS V2 的比较中,Mureka TTS V1 在语音质量、分词与语句节奏的自然度以及整体听感上具备优势,但在发音准确性上略有不足。这表明,Mureka TTS V1 在声音的“创造性”和“可定义性”方面形成了差异化,尤其适用于影视、游戏、广告等需要高度定制化配音的场景。

国产AI音乐模型Mureka V7发布:技术升级与功能实测-1

例如,输入“童音女声,12岁左右,声音清脆悦耳,热情洋溢”或“男性新闻播音员,语音清晰稳定,语气冷静理性”,模型均能生成符合描述的音频片段,实现了从创意描述到声音输出的全流程生成。

在大型模型 Scaling laws 的边际效益减弱的背景下,AI 行业的焦点正逐步转向垂直领域的应用落地。昆仑万维通过在音乐、音频等 AIGC 创作领域的持续投入,旨在打通从底层技术到应用产品的转化路径,抢占内容创作场景的生态位。自2024年4月首次亮相以来,Mureka 模型通过快速迭代,已吸引了大量用户,显示出其产品在市场中的受欢迎程度。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文