昇思学习打卡-15-热门LLM及其他AI应用/基于MindNLP+MusicGen生成自己的个性化音乐

文章目录

  • MusicGen
  • 权重选择
  • 生成音乐
    • 采样模式(Sampling)
    • 贪心模式(Greedy Search)
    • 使用

学习使用MindNLP+MusicGen生成自己的个性化音乐的流程

MusicGen

MusicGen模型基于Transformer结构,可以分解为三个不同的阶段:

  • 用户输入的文本描述作为输入传递给一个固定的文本编码器模型,以获得一系列隐形状态表示。
  • 训练MusicGen解码器来预测离散的隐形状态音频token。
  • 对这些音频token使用音频压缩模型(如EnCodec)进行解码,以恢复音频波形。

权重选择

使用预训练方式,选择谷歌的t5-base及其权重作为文本编码器模型,使用EnCodec 32kHz及其权重作为音频压缩模型。选择权重时,选择small规格的预训练权重

生成音乐

MusicGen支持两种生成模式:贪心(greedy)和采样(sampling)。

采样模式(Sampling)

  • 特点:
    采样模式是基于概率分布随机选择词作为输出。这种方法能够增加输出的多样性,使得生成的文本更加自然和富有变化。
    在大语言模型中,采样模式通常涉及从模型预测的概率分布中随机选择一个词作为下一个词,然后根据这个选择继续生成后续的文本。
  • 优势:
    多样性:采样模式能够生成多样化的文本,避免重复和单调。
    自然性:生成的文本在连贯性和自然性方面通常优于贪心模式,因为它考虑了概率分布中的多个候选词。

采样模式更适用于需要生成多样化、自然文本的场景。

贪心模式(Greedy Search)

  • 特点:
    贪心模式在每一步都选择概率最高的词作为输出,直到生成结束符。这种方法追求局部最优解,但在整体上可能不是最优的。
    在大语言模型中,贪心模式通常涉及在每一步都选择模型预测概率最高的词,并基于这个选择继续生成后续的文本。
  • 优势:
    效率:贪心模式实现简单,计算效率高,因为它不需要考虑多个候选词。
    确定性:生成的文本是确定的,因为每一步都选择了概率最高的词。
  • 缺点:
    多样性不足:由于每一步都选择概率最高的词,生成的文本可能缺乏多样性。
    可能陷入局部最优:贪心模式可能无法找到全局最优解,因为它只关注当前步骤的最优选择。

贪心模式则更适用于对计算资源有严格限制且对输出多样性要求不高的场景。

使用

在实际执行过程中,采样模式得到的结果要显著优于贪心模式。因此我们默认启用采样模式。
例如,在生成音乐时,调用MusicgenForConditionalGeneration.generate,设置do_sample=True来显式指定使用采样模式。

audio_values = model.generate(**unconditional_inputs, do_sample=True, max_new_tokens=256)

在这里插入图片描述
此章节学习到此结束,感谢昇思平台。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/45467.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文心快码——百度研发编码助手

介绍 刚从中国互联网大会中回来,感受颇深吧。百度的展商亮相了文心快码,展商人员细致的讲解让我们一行了解到该模型的一些优点。首先,先来简单介绍一下文心快码吧。 文心快码(ERNIE Code)是百度公司推出的一个预训练…

AGI 之 【Hugging Face】 的【问答系统】的 [Haystack构建问答Pipeline] 的简单整理

AGI 之 【Hugging Face】 的【问答系统】的 [Haystack构建问答Pipeline] 的简单整理 目录 AGI 之 【Hugging Face】 的【问答系统】的 [Haystack构建问答Pipeline] 的简单整理 一、简单介绍 二、构建问答系统 三、用Haystack构建问答pipeline 1、检索器 2、阅读器 3、初…

24暑假计划

暑假计划: 1.从明天起开始将C语言的部分补充完整,这部分的预计在7月24日前完成 2.由于之前的文章内容冗余,接下来进行C语言数据结构的重新编写和后面内容的补充预计8月10号前完成 3.后续开始C的初级学习

使用C++编写TCP服务端程序

要使用Boost.Asio库来开发一个TCP服务端程序,你需要遵循以下步骤。下面的示例代码将演示如何创建一个简单的异步TCP服务器,它能够接收客户端连接,并异步处理请求和响应。 首先,确保你已经安装了Boost库,并在你的项目中…

普通打工人,如何应对AI的滚滚巨轮:智对AI巨轮,行稳致远——普通打工人的智慧修行

智对AI巨轮,行稳致远——普通打工人的智慧修行 阿弥陀佛,善哉善哉。在这科技日新月异的时代,AI之巨轮滚滚向前,势不可挡,令世间万物皆为之变。作为普通打工人,身处其间,我们虽非那掌舵之人&…

YOLOv5改进 | 注意力机制| 对小目标友好的BiFormer【CVPR2023】

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录: 《YOLOv5入门 改…

从新手到进阶:高效设计 Tableau 可视化的 5 种技巧 | 数据可视化分析

让我们一起跟着大神学习五个超实用的技巧,加速你的可视化分析之旅! 在日常分析中,人人都想实现可视化最佳实践。然而,对于很多初学者来说,在还未熟练掌握 Tableau 的情况下,这种愿望貌似不太符合实际。 为…

【HarmonyOS】获取通讯录信息

【HarmonyOS】获取通讯录信息 一、问题背景: 在Android和IOS中,获取手机通讯录信息的方式,一般是申请通讯录权限后,获得手机所有的通讯录列表信息。 在鸿蒙中,因为权限方式安全性提高的变更:将用户权限限…

【八股系列】CSS盒模型:掌握网页布局的核心

🎉 博客主页:【剑九 六千里-CSDN博客】 🎨 上一篇文章:【Vue中的<keep-alive>组件:深入解析与实践指南】 🎠 系列专栏:【面试题-八股系列】 💖 感谢大家点赞&…

爬虫管理解决方案:让数据收集变得高效且合规

一、为何数据收集的效率与合规性同等重要? 随着大数据技术的飞速发展,数据收集已成为企业决策与市场洞察的核心驱动力。然而,在信息海洋中精准捕捞的同时,如何确保这一过程既高效又不触碰法律的红线,是每个数据实践者…

深入探讨 Google 竞价:开启海外市场的神秘钥匙与潜在风险

在这个充满挑战与机遇的数字化时代,Google竞价犹如开启神秘宝藏的一把钥匙,引领众多企业走向海外市场的康庄大道。身为数字营销领域的资深人士,我对Google竞价的独特魅力及潜在风险有着深刻理解。今日,我将带领大家深入探讨这一既…

华为OJ平台

华为OJ是一个在线编程平台,用于支持**华为公司的软件开发岗位招聘流程,考察候选人在算法设计、编程和调试等方面的技能水平**。以下是有关它的介绍: 1. **平台功能** - **多语言支持**:华为OJ平台支持多种编程语言,包括…

[C++]封装

一、封装的定义 封装是面向对象编程(OOP)的三大基本特性之一(封装、继承、多态)。它指的是将数据(属性)和操作这些数据的方法(函数)结合成一个独立的单元(类&#xff09…

Perl 基础语法精讲:变量、操作符与控制结构

Perl 基础语法精讲:变量、操作符与控制结构 第1节:Perl 语法基础 1.1 Perl 语法的基本概念 Perl 是一种解释型的高级脚本语言,广泛用于文本处理、系统管理任务等。 1.2 语法结构和编码风格 使用 # 注释代码。遵循良好的编码风格&#xf…

使用嵌入式知识打造智能手环:nRF52蓝牙开发实战(C++/BLE/传感器)

项目概述 现代人越来越注重健康管理,智能穿戴设备应运而生。本项目旨在利用低功耗蓝牙芯片nRF52832,结合加速度计、心率传感器、陀螺仪等传感器,开发一款功能完善、性能稳定的智能运动手环。该手环能够实时采集用户的运动数据和生理指标&…

用MATLAB绘制三向应力圆

% 定义主应力值 sigma1 100; % MPa sigma2 50; % MPa sigma3 -33; % MPa sigma_m1(sigma1 sigma3)/2; sigma_m2(sigma1 sigma2)/2; sigma_m3(sigma2 sigma3)/2; % 计算半径 r1 (sigma1 - sigma3) / 2; r2 (sigma1 - sigma2) / 2; r3 (sigma2 - sigma3…

《mysql篇》--JDBC编程

JDBC是什么 JDBC就是Java DataBase Connectivity的缩写,翻译过来就很好理解了,就是java连接数据库。所以顾名思义,JDBC就是一种用于执行SQL语句的JavaApl,是Java中的数据库连接规范。为了可以方便的用Java连接各种数据库&#xff…

中国高端水果元宇宙

果蔬,即水果和蔬菜,是人类饮食中不可或缺的一部分。它们富含维生素、矿物质、膳食纤维以及抗氧化剂等对人体健康至关重要的营养素。果蔬的摄入被广泛认为是预防多种慢性疾病,如心血管疾病、糖尿病、肥胖和某些癌症的有效手段。 ###水果的特点…

【Python】从基础到进阶(三):深入了解Python中的运算符与表达式

🔥 个人主页:空白诗 文章目录 一、引言二、运算符1. 算术运算符2. 比较运算符3. 逻辑运算符4. 位运算符5. 赋值运算符6. 其他运算符 三、表达式1. 表达式的定义2. 运算符的优先级3. 使用括号提升可读性4. 组合运算符与复合表达式 四、案例:计…

使用Java和WebSocket设计大型聊天系统的理论探讨

随着互联网的快速发展,实时通信已成为各类应用的重要组成部分。聊天系统不仅应用于社交媒体,还广泛用于客户服务、在线教育、远程办公等领域。本文将从理论角度探讨如何使用Java和WebSocket设计一个高效、可扩展的大型聊天系统,详细介绍各个关…