找回密码
 立即注册
查看: 562|回复: 1

一曲封神!“音乐界Sora”Udio发布,效果直逼人类唱歌

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-4-12 08:00:21 | 显示全部楼层 |阅读模式

本周一,媒体发布了“比Suno好10倍的 AI 音乐应用”消息,引发关注,甚至当时名字都还没得到正式确认。

如今,这款 AI 音乐产品终于被官宣了。


北京时间4月11日凌晨,全新的音乐生成应用Udio正式亮相,输出效果超越热门的Suno,尤其是中文歌曲甚至直逼人类唱歌水平,堪称“录音室”级别,成为Suno劲敌,引发广泛关注。

目前,Udio已经开始公测,用户可免费体验,每月可生成1200首作品。

体验地址:https://www.udio.com/


Udio目前发布的是免费测试版,注册账号之后,每个人每月最多可以生成 1200 首歌曲,按照理想情况,40 秒内就能生成一首。
看着比 Suno 每天 50 个积分大气多了,然而官网挤爆了,服务器又不稳定,我的第一首歌三个多小时都没生成完毕,再登上去查看居然原地消失,只能重新输入提示词,之后的节奏倒是很快,基本在 2 分钟内就能生成。
而且,Udio 创作的片段,默认为 30 多秒,相比 Suno 的 2 分钟,算是大打折扣。
这些是基础设施和基本设定的问题,Udio 也有做得优秀的地方。
和 Suno 类似,Udio 的创作界面非常直观,输入提示词,点击生成,等待 AI 创作完毕。也与 Suno 一样,Udio 通过 API 调用 ChatGPT 编写歌词。

除了让 AI 自由发挥,Udio 也可以更加定制化,让你输入自己的歌词,添加具体的流派标签,选择生成纯音乐,或者包含歌词和人声的歌曲。


据了解,Udio采用先进的AI技术,通过简单的文字输入,就能生成各类风格的原创音乐作品。从抒情的福音音乐,到沧桑的蓝调,再到梦幻的流行电音,应有尽有。同时,Udio还支持多种语言,用户可以创作出日语流行、俄罗斯流行、拉丁节奏等多元化的音乐作品。


就目前体验来看,Udio的优势和特点包括两部分:体验比Suno好,更好的可扩展性。


其中,Udio生成的音乐效果比前段时间大火的Suno有了质的提升;同时,可扩展性方面,用户不仅可以指定音乐的引子和尾声,还能以此为基础向前向后延伸,生成更长的音乐作品。完成创作后,只需点击"发布",作品就能与Udio社区的其他创作者们分享交流。


注册 Udio 帐户后,任何人都可以通过输入文本提示来创建曲目,其中可以包括歌词、故事方向和音乐流派标签。然后,Udio 分两个阶段处理该任务。首先,它利用类似于 ChatGPT 的大型语言模型 (LLM) 根据提供的提示生成歌词(如果需要)。接下来,它使用 Udio 没有公开的方法合成音乐,但这很可能是一种扩散模型,类似于 Stability AI 的Stable Audio。


根据给定的提示,Udio 的 AI 模型会生成两个不同的歌曲片段供您选择。然后,您可以将歌曲发布到 Udio 社区,下载音频或视频文件以在其他平台上共享,或直接在社交媒体上共享。其他 Udio 用户也可以重新混音或在现有歌曲的基础上进行创作。Udio 的服务条款规定,该公司对音乐世代不享有任何权利,并且它们可以用于商业目的。


企业层面,公开消息显示,Udio的创始团队来自谷歌DeepMind等顶尖AI机构,团队在音乐和技术领域均有深厚积淀。他们的目标是让Udio成为一款真正改变游戏规则的音乐创作工具,不仅面向专业音乐人,也希望让广大非音乐人也能轻松参与到音乐创作当中。


尽管 Udio 团队尚未透露其模型或训练数据的具体细节(其中可能充满了受版权保护的材料),但它告诉《tom指南》,该系统具有内置措施来识别和阻止与特定的艺术家,确保生成的音乐保持原创。


当前,Suno、Udio 也让一些人类音乐家感到害怕。上周,超过 200 名音乐艺术家签署了一封公开抗议信,批评Udio这种由 AI 驱动的音乐生成服务,影响音乐者创作。一位 Reddit 评论者在有关 Udio 的帖子中写道:“说实话,这太令人沮丧了。” “我仍然普遍乐观地认为,从长远来看,音乐在某种程度上会很好。但是,为什么要这样做?为什么要自动化艺术?”


也有分析称,就像Sora一样,Udio生成的音乐和 Spotify 上听到的歌曲几乎没有任何区别。而且根据他的感受,“要比Suno好10倍。”


早前钛媒体注意到相关报道,Udio称为xgboost技术,后来被证实后者是一种数据集技术,它采用开源数据集Medley-solos-DB,最初发布时间为2019年9月29日。该研究参与方包括纽约大学、加州大学伯克利分校、Spotify等机构人员。另据论文显示,山东理工大学工程与信息技术系Yijie Liu,Yanfang Yin,Qigang Zhu,Wenzhuo Cui等人采用利用XGBoost结合特征融合进行乐器识别。


据报道,Udio团队正在快速迭代优化,计划未来陆续推出更长音频、更高音质,以及更强大的可控性等众多新功能。


针对 AI 音乐生成生态,Suno首席执行官Mikey Shulman在红杉资本活动上表示,这是一个非常酷的工具,它正在扩大用户,从而让我们对倾听创造性音乐的品味能够引起更多人的共鸣。未来suno会有大量的玩家,占比或超过80%。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

103

回帖

130

积分

无名之辈

积分
130
发表于 2024-5-10 07:31:57 | 显示全部楼层
现在的科技真是难以想象
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-20 01:32 , Processed in 0.077142 second(s), 3 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表