第二十九期:全球首部AI交响变奏曲问世,AI技术应用再拓边界

人工智能技术,史上第一次升级到了复杂音乐的创作领域:交响曲。

全球首部 AI 交响变奏曲《我和我的祖国》,昨晚已由深圳交响乐团全球首演,它的出品方是中国平安人工智能研究院。

 

  此前,你可能了解过 Google 的 Magenta、OpenAI 的 MuseNet 这些音乐创作 AI,它们主要是在有限的声部范围内,模仿莫扎特、Lady Gaga 这些音乐家或歌手的风格,创作出简短的音乐 Demo。

  但这次,平安将 AI 创作音乐的能力,从单旋律的流行乐,突破到了交响曲的范围,原先只能写一小段 Demo 旋律,这次一下子能写 7 个乐章了,而且是可以直接拿来演出的成熟作品。

  整部交响曲时长 12 分钟,你可以听到风琴、小提琴等多种音色,还有主旋律、伴奏、鼓点节拍多个不同的声部,整体非常丰富,一般人根本听不出来是 AI 作的曲,就好像专业的人类音乐家作品一样。

  深圳交响乐团音乐总监兼首席指挥林大叶在音乐会演出前,激昂地表示,将为现场观众带来一首特殊的作品作为本季音乐会的开场,该首管弦乐作品《我和我的祖国》由 AI 编曲创作,并于今日世界首演。中国平安开拓了一个完全崭新的领域,开创了一个时代。

  “过去 10 年甚至 20 年前的时候,3D 动画刚刚进入人们的视野,或许存在多样缺点。但是经过短暂的发展,如今 3D 动画已经非常超前和逼真。”林大叶进一步表示,由人工智能技术进行编曲的音乐,今天也是一个起点。“期待未来5—10 年,AI 可以创作出传世的交响乐作品。”

  在这部交响曲面世前,平安已经在 AI 音乐方面探索了两年,早已熟悉了流行音乐的创作,这次选择了交响乐这个复杂的音乐流域,也是 AI 在艺术创作方面的技术突破。

  而除了音乐之外,在绘画、作诗等各个艺术领域,平安的人工智能技术也有不少积累。

  相比重在产业落地的 AI 公司们,平安这家金融科技公司倒是与众不同,偏爱在人类的精神世界下功夫。

  一、AI 叙述:交响变奏曲讲述中国百年近现代史

  作为变奏曲,这部曲子是在《我和我的祖国》原本的曲调上,加以变幻演绎而创作的。

  或许对乐章乐理不熟悉,你不太能感受到 AI 应用厉害之处。

  先说说内容吧。

  开头是《我和我的祖国》旋律,以此引出从近代到我们现在的辉煌历史。

  第一段变奏带我们回到了百余年前,从鸦片战争开始,中华民族进入了一段艰难岁月,旋律变得缓慢悲怆,让你觉得仿佛那些在压迫下艰难谋生老百姓们就在眼前,日复一日地重复着艰苦的岁月。

 

  不久之后,曲调变得昂扬向上、充满希望,仿佛星星之火燎原,被压迫的先辈们团结起来,谋求翻身做主人。

  第二段变奏伊始,一段唢呐声划破天际,音乐也变成了信天游的味道。

  这里是延安的故事。一阵富有节奏感的欢快音乐,展示出男女老师齐上阵,一同劳作奋斗的景象。

  之后的节奏忽然变得雄壮激昂,军鼓点密集的敲响,胜利来临了,新中国成立了。

  转入第三段变奏,是低沉的进行曲,配合坚韧的步伐,吹响了抗战的号角。

  当一系列风风雨雨终于过去,改革开放的春天到来,交响曲也走入了第四段变奏。悠扬的提琴声如春风拂面,多个声部一唱一和,迸发出希望和生机。

  随后便是第五段变奏,节奏铿锵有力,曲调逐渐高昂,呼应着中华民族伟大复兴的脚步。

  五段变奏曲,讲述了中华民族的百年大国崛起历史。之后回顾过往,当《我和我的祖国》旋律再次响起,整部交响曲也取得了圆满。

  整体听下来,仿佛看了一部革命史诗,让人不由得感叹奋斗的艰辛和成就的喜悦。如果不是音乐专家,一般人根本听不出来这是由 AI 谱写的曲子,和音乐家凭借经验和专业能力创作的乐曲内容相似度极高。

  二、AI 创作:八个维度自研模型,比生成语言更难

  那么,这样一首曲子,是怎么由 AI 创造出来的呢?

  据 AI 交响变奏曲《我和我的祖国》曲目团队技术负责人介绍,AI 作曲技术背后是平安首创的 AVM 自动变奏模型,其中用到了 VAE,Transformer,GPT-2 等语言模型。

  首先在节奏、和声、织体、配器等方面构建专家变奏规则库进行基础模型的训练。而后采用深度学习和强化学习联合方案,根据音乐创作理论描述规则进行基础模型训练,利用深度学习技术对音乐作品实现多维度的特征学习与提取,再结合强化学习技术让机器初步掌握人类作曲的思考逻辑,学习乐曲变奏手法。

  不过,虽然用到的都是语言模型,但生成音乐和生成语言还是大不相同的。

  团队负责人说:“说话都是我一个人在说,但音乐尤其交响乐就像一群人在说,大家七嘴八舌,谁先谁后,你是什么声域,我出什么音色,这是非常复杂的一件事。”

  而且,AI 创作交响曲,和创作简单的一段旋律不同,需要考虑音乐的主题、发展手法、和声、曲式等八个维度,技术难度更上一级。

  而在数据方面,技术团队介绍,平安 AI 积累了六大数据库,有囊括百万首歌曲的乐曲库,包含歌词、诗词、散文等各种文学作品的歌词素材数据库,包含各种作曲要素和元素的专家规则库,乐器声、人声两大声源库,以及用户消费行为跟踪数据库,用于分析用户听到音乐后的情绪反馈。而本首 AI 交响变奏曲的创作,运用了其中 70 万余首乐曲进行结构化训练。

  有了这些做基础,AI 系统就可以按照你的需求自动生成相应的乐曲了。

  整个生成过程的开始,需要输入《我和我的祖国》原曲调,之后结合每个变奏部分需要表达的历史事件,输入相应的情感表达需求,比如“悲愤”、“欢快”等,之后 AI 就可以自动输出可以直接听的成品的变奏曲音乐。

  由于 AI 生成的曲谱中有一些旋律是人类无法演奏的,比如人类的一只手无法同时按下钢琴上离得很远的两个按键,小号上有一些键不能同时按下,因此后期为了能够实现乐曲的实地演奏,平安人工智能研究院在创作的过程中,辅以部分专家规则,避免乐曲创作过度自由和无序。例如,融入了和声约束、对位约束、曲式结构约束等,让 AI 作曲无限靠近原本体裁,让乐曲具备可演奏性和传承性。

  三、AI 探索:从 AI 作曲到商业化落地

  其实,在 AI 音乐方面,平安已经有两年的积累,此前曾用 AI 创造流行音乐作品《青春记忆》,拿到了清华大学主办的全球 AI 艺术大赛一等奖;还研究过爵士乐,在瑞士联邦理工学院举办的国际 AI 作曲大奖赛上荣膺桂冠。

  成绩背后,是平安巨大的 AI 人才团队。

  技术团队负责人介绍说,直接参与到交响曲创作的算法工程师就达到了三十多位,还有两三百人的支持团队,其中大量主创团队成员既懂算法,也懂音乐。要知道,中央音乐学院的 AI 博士也是今年才刚刚开招,懂 AI 也懂音乐的人可以说少之又少,平安的人才储备实属难得。

  任何竞争最后都是人才的竞争,人才的储备、技术的积淀,为人工智能技术边界在传统认知中大量应用于产业制造领域之外,实现了多角度突围,率先迈入人类意识形态领域,利用人工智能无形之手,实现精神世界的精彩纷呈。

  巨大的人才团队,也在创造切实可用的商业价值。

  最近,平安就将 AI 作曲技术应用到了刚刚结束“平安 920”金融生活消费节的获客层面,提供包括 AI 作曲在内的各种互动项目,通过趣味活动丰富用户的体验感,吸引用户注意力,降低获客门槛,强化获客场景,从而提升核心主业的业务价值。

  获客仅仅是 AI 音乐辅助平安主业发展的角度之一。此外,在 AI 辅助音乐领域发展,突围行业边界层面未来或将落地于音乐创作、音乐教育等范畴,全面打开了对于音乐这一情感语言表达方式的想象空间。

  而下一步,技术团队介绍说,除了人类的音乐,平安还在考虑将将 AI 音乐延展到鲸鱼、鸟类等生物音乐学方面,创作更丰富的成果。

  而除了作曲之外,平安还将 AI 落地在了写诗、绘画等多个领域。比如借助“神笔小安”小程序,通过对于用户上传图片的识别进行情绪的判断,结合背后海量的诗句数据库,可自行生成现代诗和古代诗两种符合图片风格的诗句。

  比如这张夜晚路灯下的树木,平安 AI 就赋诗一句:

  “杨柳夹城东,金峰一径通。”

  四、AI 突围:从内部赋能到外部输出

  需要刷新印象的,或许不止是 AI 最新技能的认知。

  也是时候重新认知前沿 AI 技术开拓方,无论是全球科技巨头,还是新晋的互联网后期之秀,已越来越多的将触角和目光聚焦在这一领域,人工智能+音乐已经成为全球范围内不可逆的发展趋势之一。

  比如中国平安,是创办于 1988 年的中国第一家股份制保险公司,如今是全球金融领域市值最大的综合金融服务集团。

  但传统金融主业之外,此次贺新中国成立 70 周年专项打造的 AI 交响变奏曲,是其 AI 实力的冰山一角。

  过去 10 年,平安在 AI 领域的投资可谓大手笔,不仅成立了 AI 研究院,而且在 AI 创新和研究方面已持续拓展也已持续拓展多年。,并且在不久前的世界人工智能大会上,中国平安被科技部授予普惠金融新一代人工智能开放创新平台建设资质,人工智能技术获得了国家的认可,成功晋级 AI 国家队。

  在底层技术研究方面,平安在语音语义、图像识别、结构化数据建模、知识图谱技术上都有均有深厚积淀,目前已拥有各类科技专利累计达 18050 项,未来还将持续将营收的1% 投入科技研发。

  在海量数据积累层面,平安构建了多领域知识图谱,例如,金融知识图谱层面,纳合了超过 9.1 亿的关系总数,1.21 亿+人物实体,2.3 亿+关系节点,还有超过 3000 万的企业数据;而医疗知识图谱包含了超过 50 万的医学术语、超过 500 万的医学关系,以及 1000 万+的医学证据。

  这些丰富的技术基础和资源,都为平安的业务提供了助力。

  现在,平安已经将 AI 应用到了医疗健康、金融风控、投资、宏观经济分析等具体的业务层面。

  一方面对于内部业务推进全方位赋能。

  例如在科技赋能寿险业务层面,在筛选保险代理人时,起到辅助作用的 AI 面谈官面试覆盖率达 100%,高仿真对话机器人“AskBob”对代理人咨询的疑问解答准确率高达 95%,任务查询和智能办理功能覆盖代理人 90% 常用需求。

  平安产险则运用自主研发的 AI 图片定损技术和精准客户画像技术,针对安全驾驶行为良好的车主推出“信任赔”服务,开创性实现后台零人工作业模式,案均赔付完成时间缩短至 168 秒。

  平安银行则建立了覆盖贷前、贷中、贷后全流程的智慧风控平台,实现了智能决策、智能控制、智能预警、智慧管理、智能放款五大智能应用。

  最新数据显示,平安银行的 AI 语音客服替代率已达到 80% 以上,大幅提升了客服效率。

  另一方面对外生态赋能输出层面,也将 AI 技术全方位融入多领域端到端一体智能解决方案之中,依托这一形式将技术输出给了中小银行、中小保险公司、金融机构、医保局和医院等机构,也借助智慧城市业务,为政府在优政、兴业、惠民三大领域提供智慧化服务。

  智能营销、智能贷款、智能风控、智能客服、智能闪赔等海量智能解决方案受到中小金融机构的广泛青睐。财报数据显示,平安旗下金融壹账通对外赋能企业已达到 3707 家,其中包括 615 家银行、81 家保险公司、3011 家其他非银金融机构。

  而在落地之外,这家金融科技公司也有拓展人类技术边界的情怀一面,AI 创作交响曲,正是如此。

  当然,这家综合金融巨头,也快速融入 AI 技术公司的“传统”:

  据技术团队透露,AI 作曲运用的平安首创 AVM 自动变奏模型,将会在明年初开源。

  感兴趣的你,到时候也能站在前辈的肩膀上打造专属于自己的 AI 交响乐曲了。


阅读目录(置顶)(长期更新计算机领域知识)https://blog.csdn.net/weixin_43392489/article/details/102380691

阅读目录(置顶)(长期更新计算机领域知识)https://blog.csdn.net/weixin_43392489/article/details/102380882

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/425104.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第三十期:BAT 为什么都看上了重庆?

一个城市朝向智能化创新的方向发展,一把手的重视是非常重要的。 文:I/O 重庆,作为我国中西部地区唯一的直辖市和国家中心城市,正在新一轮科技发展浪潮中扮演着越来越亮眼的角色。 尤其是近两个月来,重庆在推动科技创新…

第三十一期:世界上有四类人永远不可能成为编程界牛人(个人见解,欢迎补充)

本人歌谣,出来工作也有两年了。大学挂科无数,出来想搞技术。平时也就是以工作学习的知识为主,无聊的时候就会学习一些关于科技的知识。 在这本人给大家传授一些学习编程的心得体会,供大家分享交流: 1.没有专注力和恒心…

[Java]==和equals()的区别(按照数据类型区分)

背景知识 【引用类型】 复合数据类型是引用类型 **1.基本数据类型,也称原始数据类型。**byte,short,char,int,long,float,double,boolean 他们之间的比较,应用双等号(),比较的是他们的值。 基本数据类型比较, 和 …

第三十二期:如何摆脱「技术思维」的惯性?

虽然从标题上看,这篇文章是写给“技术人”的,但 从广义上来说,只要你是一位以理性见长的人,那么这篇文章要讲的东西可能会与你有关。 虽然从标题上看,这篇文章是写给“技术人”的,但 从广义上来说&#xff…

[Leetcode][第207题][JAVA][课程表][拓扑排序][DFS]

【问题描述】[中等] 【解答思路】 1. 拓扑排序 复杂度分析 HashSet[] 数组 import java.util.HashSet; import java.util.LinkedList; import java.util.Queue;public class Solution {public boolean canFinish(int numCourses, int[][] prerequisites) {if (numCourses &l…

RabbitMQ(1) - win+rabbitMQ

rabbitMQ是一个在AMQP协议标准基础上完整的,可服用的企业消息系统。它遵循Mozilla Public License开源协议,采用 Erlang 实现的工业级的消息队列(MQ)服务器,Rabbit MQ 是建立在Erlang OTP平台上。 1.安装Erlang 所以在安装rabbitMQ之前&…

[周赛][Leetcode][第5457题][JAVA][动态规划][和为奇数的子数组数目]

【问题描述】5457. 和为奇数的子数组数目[中等] 【解答思路】 1. 动态规划 第 1 步&#xff1a;设计状态 dp[i][0] 记录以arr[i]结尾的和为奇数数量 dp[i][1] 记录以arr[i]结尾的和为偶数数量 第 2 步&#xff1a;状态转移方程 for(int i1;i<n;i){if(arr[i]%20){dp[i][0]…

第九期: 阿里巴巴程序员常用的15款开发者工具

阿里巴巴将自身在各类业务场景下的技术积淀&#xff0c;通过开源、云上实现或工具等形式对外开放&#xff0c;本文将精选了一些阿里巴巴的开发者工具&#xff0c;希望能帮助开发者们提高开发效率、更优雅的写代码。 从人工到自动化&#xff0c;从重复到创新&#xff0c;技术演进…

第三十三期:对于人工智能的恐惧及其5个解决方法

实施人工智能技术的IT领导人可能会感到一些恐惧&#xff0c;这有着充分的理由。人工智能在拥有数十年发展和应用历史的同时却有着奇怪的定位&#xff0c;但对于许多人来说&#xff0c;人工智能仍然是一种未来主义的感觉。 实施人工智能技术的IT领导人可能会感到一些恐惧&#x…

[Leetcode][第392题][JAVA][判断子序列][动态规划][双指针]

【问题描述】[简单] 【解答思路】 1. 双指针 时间复杂度&#xff1a;O(NM) 空间复杂度&#xff1a;O(1) class Solution { public:bool isSubsequence(string s, string t) {int n s.length(), m t.length();int i 0, j 0;while (i < n && j < m) {if (s[…

权限分配之权限的展示

最后就是权限的展示了&#xff1a;对前面的 总结&#xff1a;  1. 一级菜单列表&#xff0c;是我对 menu表的&#xff0c;增删改查。  2. 二级菜单列表&#xff0c;是我对Permission表中&#xff0c; 可以作为二级菜单存在&#xff0c;如 客户列表、账单列表的 增删改查  …

优先队列----堆

问题 打印机打印作业一般是放在队列中的。如果按照先来先打印的顺序&#xff0c;有一个100页的打印任务&#xff0c;那么会让后面短小的任务等待很长时间。更合理的做法也许是最后处理最耗时的打印任务&#xff0c;不管它是不是最后提交上来的。 在多用户操作系统中&#xff…

第三十四期:游戏开发中常见的10种编程语言

游戏开发是非常有经验和熟练的程序员的工作。 它可能花费数亿美元。 这是一项非常有创意的工作&#xff0c;也需要技术水平。 他们需要具有特定需求的编程语言。 游戏开发是非常有经验和熟练的程序员的工作。 它可能花费数亿美元。 这是一项非常有创意的工作&#xff0c;也需要…

[Leetcode][第5458题][JAVA][字符串的好分割数目][双指针][HashSet]

【问题描述】5458. 字符串的好分割数目[中等] 【解答思路】 1. 双指针 前面的搜索前面的个数和&#xff0c;后面的搜索后面的个数和 时间复杂度&#xff1a;O(N^2) 空间复杂度&#xff1a;O(1) class Solution {/*双指针做法&#xff0c;前面的搜索前面的个数和&#xff0c;…

第三十五期:AI核心难点之一:情感分析的常见类型与挑战

情感分析或情感人工智能&#xff0c;在商业应用中通常被称为意见挖掘&#xff0c;是自然语言处理(NLP)的一个非常流行的应用。文本处理是该技术最大的分支&#xff0c;但并不是唯一的分支。情绪AI有三种类型及其组合。 情感分析或情感人工智能&#xff0c;在商业应用中通常被称…

[Leetcode][第104题][JAVA][二叉树的最大深度][递归][BFS]

【问题描述】[简单] 【解答思路】 1. 递归 终止条件/基本情况 root null 递推关系 max(l,r)1 时间复杂度&#xff1a;O(N) 空间复杂度&#xff1a;O(height) class Solution {public int maxDepth(TreeNode root) {if (root null) {return 0;} else {int leftHeight ma…

第三十六期:人工智能统计调查:86%的消费者更喜欢人工客服

美国消费者越来越不愿意与聊天机器人聊天&#xff0c;人们对人工智能作为关键业务组成部分的期望越来越高&#xff0c;由于部署这项新技术导致员工技能差距越来越大。 最近一些人工智能的健康和进展状况相关调查、研究、预测和其他定量评估突显出以下几点&#xff1a;美国消费者…

[Leetcode][第111题][JAVA][BFS][二叉树的最小深度][BFS][递归]

【问题描述】[简单] 【解答思路】 1. 递归 自下而上 基本情况/结束条件 &#xff1a; 叶子节点的定义是左孩子和右孩子都为 null 时叫做叶子节点 当 root 节点左右孩子都为空时&#xff0c;返回 1 当 root 节点左右孩子有一个为空时&#xff0c;返回不为空的孩子节点的深度 当…

75 jsp基础语法汇总

JSP语法 脚本程序 脚本程序可以包含任意量量的Java语句句、变量量、⽅方法或表达式&#xff0c;只要它们在脚本语⾔言 中是有效的。 脚本程序的语法格式&#xff1a; <% 代码⽚片段 %>或者&#xff0c;您也可以编写与其等价的XML语句句&#xff0c;就像下⾯面这样&#…