昆仑万维:中国首个音乐SOTA模型天工SkyMusic音乐大模型开启公测

首页 > 科技

昆仑万维:中国首个音乐SOTA模型天工SkyMusic音乐大模型开启公测

来源:变废为宝 发布时间:2024-04-19 08:36

IT之家 4 月 17 日消息,昆仑万维本日宣布,天工 3.0 大模型性能提升显著,旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。

天工 3.0 拥有 4000 亿参数,超越了 3140 亿参数的 Grok-1,是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著,数学 / 推理 / 代码 / 文创能力提升超过 30%。天工 3.0 新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项 AI 能力。

▲ 天工 3.0 模型参数超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手,综合性能超越 Suno V3,取得音乐大模型 SOTA(State of the art model,即在当前研究中表现最好的模型)。

天工 SkyMusic 采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性,Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使其能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲

▲ 天工 SkyMusic AI 音乐大模型技术架构

据介绍,天工 SkyMusic 具备以下特点:

IT之家从公开资料获悉,昆仑万维是中国互联网平台出海企业,深耕海外市场十余载,业务覆盖包括信息分发、社交、 娱乐、元宇宙、游戏及 AIGC 等多个领域,旗下包括 AGI 与 AIGC 、海外信息分发与元宇宙、投资等三大业务板块,市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。截至目前,全球平均月活跃用户近 4 亿,海外收入占比达 84%。

IT之家 4 月 17 日消息,昆仑万维本日宣布,天工 3.0 大模型性能提升显著,旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。

天工 3.0 拥有 4000 亿参数,超越了 3140 亿参数的 Grok-1,是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著,数学 / 推理 / 代码 / 文创能力提升超过 30%。天工 3.0 新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项 AI 能力。

▲ 天工 3.0 模型参数超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手,综合性能超越 Suno V3,取得音乐大模型 SOTA(State of the art model,即在当前研究中表现最好的模型)。

IT之家 4 月 17 日消息,昆仑万维本日宣布,天工 3.0 大模型性能提升显著,旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。

天工 3.0 拥有 4000 亿参数,超越了 3140 亿参数的 Grok-1,是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著,数学 / 推理 / 代码 / 文创能力提升超过 30%。天工 3.0 新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项 AI 能力。

▲ 天工 3.0 模型参数超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手,综合性能超越 Suno V3,取得音乐大模型 SOTA(State of the art model,即在当前研究中表现最好的模型)。

上一篇:小米集团副董... 下一篇:首销破纪录,...
猜你喜欢
热门阅读
同类推荐