AI 挑战周杰伦?Suno 全新功能面世,即兴哼几句就能创作成歌,还能模仿声音!...

作者 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

2016 年,周杰伦根据女儿 Hathaway 在玩具钢琴上随意弹出的几个音符,激发出创作的灵感,谱写了一首温馨而深情的歌曲——《前世情人》。8 年过去,音乐创作逐步进入了 AI 时代,先前爆火出圈的音乐创作 AI 平台「Suno」在近日预热,未来将发布一项新功能:Sound-to-Song。意思是:用任何声音创作新歌曲(make a new song from any sound)。

即使你不像周杰伦一样拥有“绝对音感”,也不懂什么乐理与和弦,只需要哼唱一小段,Suno AI 就可以在你哼唱的基础上创作出完整的歌曲。下面便是 Suno 日前发布的第一波预热演示视频:《用喷壶演奏“迷幻摇滚”》。

某种意义上,这和 ChatGPT 推出的“语音输入”交互方式有异曲同工之妙,声音识别和语音识别如今已是各大 AI 产品的必备技术,比如说,我们基本可以在国产 AI App 使用聊天框旁边的说话功能:

e78cf415c5fcd5f773920d23823c12ff.png

但在音乐的世界,我们不需要像制作人一样苦口婆心地用对话的交互方式来教导 AI 怎么作曲,而是采用更简单的交互:直接唱出来。

这种创新的作曲方式将使用户能够把“声音采样”与“文字提示”结合起来,创作出独一无二的音乐作品。以前使用 Suno 作曲,可能还需要构思一下怎么写 Prompt 才能让 AI 明白你脑内的灵感;但现在,任何日常的声音,如 Suno 官方演示中喷壶敲击金属管的声音,都能转换成迷人的迷幻摇滚乐曲。

除了“喷壶摇滚”以外,Suno 还派出自家的工程师 Anessa 亲自演奏钢琴,并让 Suno AI 转化为完整的一首歌:

Suno 不仅将 Anessa 弹的这段钢琴准确无误地变成了手风琴演奏,还进行了“续写”。这意味着 Suno 在捕捉旋律的同时,它或许还能解析出潜在的和声结构,识别出和弦进行,并基于这些和声关系生成新的和声进展

在下面这段由 Suno 产品经理 Rebecca 进行的官方演示中,我们可以看到类似的情况:

发现问题了吗?没错,Suno 现在不止能识别和弦,还能识别演唱者的音色

如今,AI 克隆声音已经不再是什么新鲜事,我们经常可以在各大视频网站看到有人利用各种游戏动漫中的人物声音训练 AI 翻唱歌曲,但 Suno 所做的不仅是分析演唱者的独特音色特征以及演唱习惯,它还能使用合成的个性化音色,将新创作的旋律以接近原演唱者的声音表现出来,从而实现不仅旋律上的延续,还有音色上的连贯性和一致性

这一技术的推出,预示着音乐创作的门槛将进一步降低,每个人都可以成为自己生活的“周杰伦”。接下来,让我们进一步解析 Suno 的这次重磅更新,看看还有哪些遗漏的发布内容。

b70531bf31c69c5b7986bd18b53539a9.png

歌曲长度延长至 4 分钟!

d3b3cb4cc0e0747fff1e953b44995344.png

此前,Suno 团队官宣表示 v4 版本还在“酝酿”当中,与此同时推出 v3.5 的抢先体验版本,供专业版和高级版会员使用。如今,免费用户也可以正式使用该功能,以下便是我作为免费账户点开模型列表时可选的选项:

84cab1da8ac4a66e55a1ac44042eff46.png

Suno v3.5 最显著的改进之一是歌曲长度和结构的扩展。用户现在可以生成长达 4 分钟的音频片段,比以前的版本有了很大的提升。许多流行歌曲的时长设计在 3 到 5 分钟之间,而 4 分钟则是这个区间内的一个典型时长,这意味着我们现在可以用 Suno 创作更复杂、更多样化的作品,无需将多个剪辑拼接在一起。此外,现有的已创作歌曲还可以最多延长 2 分钟。

此外,Suno 现在拥有更连贯的旋律、和声和节奏,也就是说除了长度,在质量方面也提升了不少。Suno v3.5 改进了算法,可产生更连贯的旋律、和声和节奏。

作为测试,我让 Suno 尝试创作了一些电子游戏里经典的“Boss 战音乐”,但是要配上古典管弦乐作为点缀:

虽然我听不出作曲质量的提升究竟有多大,但可以直观感受到 4 分钟的长度大幅提升了一首歌的完整度,无论是 1 分钟和 2 分钟左右的变奏或是 3 分半的收尾都很精彩 —— 问题出在 3 分半之后,为了凑够 4 分钟的长度,Suno 强行再弹了半分钟钢琴,“画蛇添足”,显得十分突兀

这种情况经常出现在大语言模型创作文章的时候:如果我们让 ChatGPT 写一段刚好 50 字的短讯,一字不多一字不少,那它就会为了凑字数或删字数创作出一些非常拗口的句子。这可能是因为大模型的训练目标在于最大化训练目标在于最大化预测下一个词(predict next-word )的概率,确保生成文本的统计学合理性,而非始终保证文本的自然流畅或最优创意表达。

纯音乐效果还算不错,那既然文章开头提到了周杰伦的《前世情人》,我们就让 Suno v3.5 也来挑战一下周董。

a378dcf9158f5dd8dac7fe634fcdf194.png

打开定制模式,输入《前世情人》的歌词,曲风选择这首歌“巴洛克式的华丽古典风格,加上电子迷幻嘻哈”的元素,使用最新的 v3.5 版本,成果如下:

效果不尽人意。v3.5 抢先体验时期,Reddit 网友便曾指出该版本存在的一大缺陷:无论输入什么提示词,都会生成一首毫无特色的流行歌曲。目前看来,这个问题仍旧存在,老版本的 Suno v3 在模仿各种小众歌曲风格方面反倒表现得更加出色。

7fea9691dba7c7b60fb751d0eb2b209f.png

c575c7f013a0c94123d50108a59065da.png

完美的“音色拷贝者”?

v3.5 的基本更新显然是一次 0.5 级别的升级,并没有达到广大用户心目中的 v4 水平。相比之下,前文所述的 Sound-to-Song 确实更让人耳目一新。事实上,有许多拿到了 Suno 内测资格的 AI 音乐家已经在 X 上晒出了自己用 Sound-to-Song 进行的创作成果:

AI 艺术家 Michael Carychao 拿到了 Sound-to-Song 的内测资格,这是他用创作的 AI 歌曲:《困惑》(Perplexed)。Michael 的吉他弹唱被 Suno 转化成了一首流行歌曲,所以他接下来上升了难度:

乐器换成口风琴之后,Suno 的表现事实上还比吉他流行乐好了不少。所以 Michael “变本加厉”,拿出了十根铅笔:

十根铅笔相互摩擦,模拟出了沙球(一种打击乐器)的效果,进而创作出了一首古巴音乐。

下一个例子由 Google 艺术文化实验室的常驻艺术家 Mario Klingemann 分享,Klingemann 从互联网档案馆 (Internet Archive) 获取了一段视频剪辑,这段视频特别含有对话或旁白,所以他打算通过这段视频来评估和展示 Suno 在处理自然语言语音方面的表现和创意潜力:

Suno 完美还原了视频中这位“Grumpy Old Man”(暴躁老头)的低沉音色,底下的评论区则称其为“经典老电影与现代节奏的绝妙融合”。Klingemann 还表示,将口语内容转化为“带有人声演唱的电子乐”的指令似乎主要来自于他向 Suno 提供的 Prompt,比如“口语”和“电子乐”。

正如 ChatGPT 让自然语言处理技术变得触手可及,Suno 的 AI 音乐扩展功能同样降低了音乐创作的技术门槛,可谓是“音乐的 ChatGPT 时刻”。但从某种意义上来说,AI 让音乐创作又回归到了最原始的冲动:质朴的鼓点、孤独的吟唱、悠扬的哼鸣 —— 表达自我,触动人心。

b5b73c5aa87fc47ba22f3004d6e08be5.gif

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料(案例)的内容原则,将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题:大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉:http://sdcon.com.cn/

961727511c905cd31355ba149b65ff3e.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/28503.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【每日随笔】摩托车控车 ① ( 油离配合 | 落脚油离配合 - 不给油 | 落脚油离配合 - 给油 | 正式油离配合 | 骑行姿态注意事项 )

文章目录 一、找 " 离合结合点 "二、落脚油离配合 ( 不给油 )1、该科目练习目的2、起步姿态3、开始练习 三、落脚油离配合 ( 给油 )1、练习目的2、熟悉油门转速3、练习步骤 四、正式油离配合1、练习目的2、练习步骤3、练习效果 五、骑行姿态注意事项1、基本骑行姿态2…

Cisco Packet Tracer实验(四)

生成树协议(Spanning Tree Protocol) 交换机在目的地址未知或接收到广播帧时是要进行广播的。如果交换机之间存在回路/环路,那么就会产生广播循环风暴,从而严重影响网络性能。 而交换机中运行的STP协议能避免交换机之间发生广播…

解决Qt的multimedia库在clion中依赖库补全的问题

解决Qt的multimedia库在clion中使用报错的问题 在clion中,使用Qt的multimedia库时会报如下错误: defaultServiceProvider::requestService(): no service found for - "org.qt-project.qt.mediaplayer" 我猜测出现这个错误的原因很可能是因为…

迅狐短视频矩阵管理系统核心功能

一、多平台管理:连接多个主流自媒体平台,满足多平台、多账号、多角色的协调需求 在现如今的多元化媒体环境中,一个优秀的内容创作者需要同时管理多个自媒体平台,并以不同的身份角色展现自己。迅狐短视频矩阵管理系统强大的多平台…

数据结构重要知识总结

数组 数组(Array) 是一种很常见的数据结构。它由相同类型的元素(element)组成,并且是使用一块连续的内存来存储。 我们直接可以利用元素的索引(index)可以计算出该元素对应的存储地址。 数组…

如何充分利用 Postgres 的内存设置

为了充分利用 PostgreSQL 的内存设置,你需要调整多个参数以优化数据库性能。这些参数包括共享缓冲区(shared_buffers)、工作内存(work_mem)、维护工作内存(maintenance_work_mem)、有效缓存大小…

仅凭一图,即刻定位,AI图像定位技术

AI图像定位技术,解锁空间密码!仅凭一图,即刻定位,精准至经纬度坐标,让世界无处不晓。 试试看能否猜中这张自拍照的背景所在?可别低估了A的眼力,答案说不定会让你大吃一惊呢。 近期,…

JWT令牌、过滤器Filter、拦截器Interceptor

目录 JWT令牌 简介 JWT生成 解析JWT 登陆后下发令牌 过滤器(Filter) Filter快速入门 Filter拦截路径 过滤器链 登录校验Filter-流程 拦截器(Interceptor) Interceptor 快速入门 拦截路径 登录校验流程 JWT令牌 简介 全称:JSON Web Token(https://iwt.io/) …

React 中的事件处理

React 中是如何处理事件的&#xff0c;现在下面简单的一段代码&#xff1a; export default function App() {const AList lazy(()>import(./List.js))const r useRef(null) const [show, setShow] useState(false);return (<><button onFocus{()>{setShow…

【StructueEngineering】Wind Load Combination Patterns风荷载组合模式

文章目录 Combination PatternsBasic Rules of Combinations组合的基本规律Specific Combination Patterns1. First 8 Combinations (1 to 8)2. Middle 8 Combinations (9 to 16)3. Last 8 Combinations (17 to 24) Summary of CombinationsKey Variables and Parameters with …

Postgre 调优工具pgBadger部署

一&#xff0c;简介&#xff1a; pgBadger&#xff08;日志分析器&#xff09;类似于oracle的AWR报告&#xff08;基于1小时&#xff0c;一天&#xff0c;一周&#xff0c;一月的报告&#xff09;&#xff0c;以图形化的方式帮助DBA更方便的找到隐含问题。 pgbadger是为了提高…

轻松上手MYSQL:探索MySQL索引数据结构的奥秘-让数据库飞起来

​&#x1f308; 个人主页&#xff1a;danci_&#x1f525; 系列专栏&#xff1a;《设计模式》《MYSQL》&#x1f4aa;&#x1f3fb; 制定明确可量化的目标&#xff0c;坚持默默的做事。 ✨欢迎加入探索MYSQL索引数据结构之旅✨ &#x1f44b; 大家好&#xff01;文本学习研…

代理IP协议有何区别?深入了解 SOCKS5、HTTP 代理

在数字通信领域&#xff0c;数据安全和匿名性都是非常重要的指标。互联网的不断发展催生了几种协议&#xff0c;每种协议都有独特的优势和挑战。其中&#xff0c;SOCKS5 代理、HTTP代理最为广泛使用&#xff0c;下面给大家一起讨论&#xff0c;HTTP代理与 SOCKS5代理&#xff0…

基于python深度学习的CNN图像识别鲜花-含数据集+pyqt界面

代码下载&#xff1a; https://download.csdn.net/download/qq_34904125/89383615 本代码是基于python pytorch环境安装的。 下载本代码后&#xff0c;有个requirement.txt文本&#xff0c;里面介绍了如何安装环境&#xff0c;环境需要自行配置。 或可直接参考下面博文进行…

Linux:基础IO(二.缓冲区、模拟一下缓冲区、详细讲解文件系统)

上次介绍了&#xff1a;Linux&#xff1a;基础IO&#xff08;一.C语言文件接口与系统调用、默认打开的文件流、详解文件描述符与dup2系统调用&#xff09; 文章目录 1.缓冲区1.1概念1.2作用与意义 2.语言级别的缓冲区2.1刷新策略2.2具体在哪里2.3支持格式化 3.自己来模拟一下缓…

FFMpeg解复用流程

文章目录 解复用流程图复用器与解复用器小结 解复用流程图 流程图&#xff0c;如上图所示。 复用器与解复用器 复用器&#xff0c;就是视频流&#xff0c;音频流&#xff0c;字幕流&#xff0c;其他成分&#xff0c;按照一定规则组合成视频文件&#xff0c;视频文件可以是mp4…

实现贪吃蛇小游戏【简单版】

1. 贪吃蛇游戏设计与分析 1.1 地图 我们最终的贪吃蛇大纲要是这个样子&#xff0c;那我们的地图如何布置呢&#xff1f; 这里不得不讲⼀下控制台窗口的⼀些知识&#xff0c;如果想在控制台的窗口中指定位置输出信息&#xff0c;我们得知道该位置的坐标&#xff0c;所以首先介…

CPN Tools学习——从平面网构建分层 PN

1.先创建平面petri网 创建如下petri网&#xff1a; CPN ide创建petri网真的舒服很多&#xff0c;但是教程又是CPN Tools的&#xff0c;我的想法是看两个版本能不能互通&#xff0c;在前者创建&#xff0c;在后者运行学习。 新增定义&#xff1a; colset E unit with e; 但…

nginx全解

一、Nginx配置文件 1.1 主配置文件 主配置文件位置&#xff1a;nginx.conf tip&#xff1a;安装方式不同&#xff0c;路径不同 #主配置文件格式 ​ main block&#xff1a;主配置段&#xff0c;即全局配置段&#xff0c;对http,mail都有效 ​ #配置Nginx服务器的事件模块相…