跟着刘二大人学pytorch(第---12---节课之RNN基础篇)

文章目录

  • 0 前言
    • 0.1 课程视频链接:
    • 0.2 课件下载地址:
  • 1 Basic RNN
    • 1.1 复习DNN和CNN
    • 1.2 直观认识RNN
    • 1.3 RNN Cell的内部计算方式
  • 2 具体什么是一个RNN?
  • 3 使用pytorch构造一个RNN
    • 3.1 手动构造一个RNN Cell来实现RNN
    • 3.2 直接使用torch中现有的RNN模块来实现RNN
      • input维度
      • h0维度
      • output维度
      • hn维度
      • numLayers的解释
      • 代码注释
        • 参数配置
        • 模型构造
        • 输入序列的构造
        • 隐藏层的构造
        • 输出的解释
        • 最后一个隐藏层输出的解释
        • 执行代码的结果
  • 例子1:训练一个RNN 做seq2seq任务
    • 第1步 字符向量化
    • 参数配置
    • 准备数据
    • 设计模型
    • 构造损失函数和优化器
    • 设置训练Cycle
    • 改变数据
    • Embedding
  • 例12-3 使用embedding和线性层的RNN
  • 构造模型、损失函数、优化器
  • 训练
  • 练习1:LSTM
  • 联系2:GRU

0 前言

0.1 课程视频链接:

《PyTorch深度学习实践》完结合集
大佬的笔记:大佬的笔记
pytorch=0.4

0.2 课件下载地址:

链接:https://pan.baidu.com/s/1_J1f5VSyYl-Jj2qIuc1pXw
提取码:wyhu

1 Basic RNN

在这里插入图片描述

1.1 复习DNN和CNN

全连接网络也称为稠密网络,Dense Network,也称为Deep Neural Network
在这里插入图片描述
现在有一个表,里面的数据是每天每隔一个小时的天气数据,平均温度,气压,预测目标是是否下雨

根据某一时刻的温度和气压数据预测该时刻是否下雨,这件事情意义不太大,预测下雨这件事应提前进行预测。

我们需要若干天(如3天)的数据作为模型的输入,其中每一天的数据应该包含若干个(如3个)特征。
在这里插入图片描述
使用全连接进行预测。如果序列很长且x1,x2,x3的维度很高的话,这对网络的训练是一个很大的挑战,原因是全连接网络是稠密的网络,里面的权重是最多的。
CNN中输入通道是128,输出通道是64,使用的是5×5的卷积,权重为25×2^13=20w,
全连接层假设输入是4096,输出是1024,则全连接权重为4096*1024=420w,这样的比较CNN使用的参数要少得多
因此在使用神经网络时需要明确一点:全连接网络的参数在神经网络中所占的比例是最大的,所以之后计算存储、推理很大的瓶颈是来自全连接层
CNN中使用的参数为什么较少呢:有 权重共享的概念

假如在处理视频时,每一帧的图像如果都使用全连接网络去处理,那参数量将是天文数字,这种方法是不可行的
RNN是专门处理序列型的数据,也会使用权重共享的概念,减少需要训练的权重的数量

x1,x2,x3是一个序列,是有先后顺序,x2部分依赖x1,x3部分依赖x2,RNN来处理序列相关的数据,类似于语言、天气、股票

理解语言需要依赖文字的顺序
在这里插入图片描述

回顾一下CNN
在这里插入图片描述

1.2 直观认识RNN

例如输入xt的维度是3维的,经过RNN Cell之后输出的ht是5维的,那么RNN Cell本质上还是一个线性层,但是和普通的线性层的区别是RNN Cell这个线性层的权重是共享的。
h0是先验知识,如果有先验知识的话就需要将先验知识作为h0输入给RNN,如图生文本,CNN+FC处理图像,生成h0,再传给RNN,此时即可做“看图说话”
如果没有先验知识的话,直接将h0的维度设置为和ht的维度一样,然后设置成0向量即可。
在这里插入图片描述
上图中的RNN Cell是同一个
在这里插入图片描述
用代码来表示是上面这样的,x是需要从X中循环的

1.3 RNN Cell的内部计算方式

在这里插入图片描述
Whhht-1+bhh 和Wihxt+bih是两个线性层,他们可以合并成一个线性层,见上图的红色公式
在这里插入图片描述
即上式可以简写。

2 具体什么是一个RNN?

把RNN Cell以循环的方法,把序列送进去,依次算出隐层的过程称为一个循环神经网络。
在这里插入图片描述

3 使用pytorch构造一个RNN

两种方法:1、自己构造RNN Cell,然后写来处理序列的循环 2、直接使用RNN

3.1 手动构造一个RNN Cell来实现RNN

创建一个Cell的方式
创建一个RNN Cell需要的参数:输入的维度,隐藏层的维度
在这里插入图片描述
构造完cell之后,一个cell的输入是x和上一个隐藏状态,两者的维度要求见下图
在这里插入图片描述
例如一个RNNCell的配置为
在这里插入图片描述
因此输入的构造见下图
在这里插入图片描述
隐藏状态的构造见下图
在这里插入图片描述
序列数据的维度的构造应该如下
在这里插入图片描述
代码:
在这里插入图片描述
torch.randn用法:torch.randn()函数
示例代码:

import torch# 定义配置项
batch_size = 5
seq_len = 3
input_size = 4
hidden_size = 2# 构造一个RNN Cell
cell = torch.nn.RNNCell(input_size = input_size, hidden_size = hidden_size)print(cell)# 生成5个序列长度为3,每个token的为4的张量作为1个batch
dataset = torch.randn(seq_len, batch_size, input_size)
print(dataset)hidden = torch.zeros(batch_size, hidden_size)
print(hidden)for idx, input in enumerate(dataset):print("="*20, idx, "="*20)print("input size:", input.shape)hidden = cell(input, hidden)print("output size:", hidden.shape)print(hidden)

输出:

D:\Anaconda3\envs\env_pytorch04\python.exe "D:/000 简历/000 自己的项目/3 刘二教程/第12节课 手动定义一个RNN Cell.py"
RNNCell(4, 2)
tensor([[[ 0.4408, -0.7577,  0.9077, -0.0779],[ 0.5080, -0.1057,  0.5581, -0.4546],[ 0.8382,  1.3444,  1.1445, -2.0313],[ 0.4016,  1.0184,  0.0556,  0.6046],[ 1.9827,  0.6735, -0.6609, -0.0764]],[[-0.8133, -1.3837, -0.6933, -0.6390],[ 0.7617, -0.2478, -0.1682, -1.2478],[ 0.1389, -0.5334,  1.7906,  0.8992],[-0.7540,  0.0293, -0.5835,  1.0606],[-0.5817,  0.2823, -1.0507,  0.3087]],[[-0.5872,  0.1241, -0.2446, -0.5430],[-0.6749,  0.6816, -0.1754, -1.1233],[ 0.1708, -1.6483,  0.8012,  0.3567],[-0.1961, -1.0277, -0.2133, -0.7144],[-1.3309,  0.6177,  1.5205, -0.4169]]])
tensor([[0., 0.],[0., 0.],[0., 0.],[0., 0.],[0., 0.]])
==================== 0 ====================
input size: torch.Size([5, 4])
output size: torch.Size([5, 2])
tensor([[-0.2558, -0.4498],[-0.3951,  0.0840],[ 0.1652,  0.9352],[-0.8041, -0.1019],[-0.6620,  0.7436]], grad_fn=<TanhBackward0>)
==================== 1 ====================
input size: torch.Size([5, 4])
output size: torch.Size([5, 2])
tensor([[-0.8441, -0.6020],[-0.6114,  0.6291],[-0.3331, -0.8504],[-0.9706, -0.8207],[-0.9807, -0.4315]], grad_fn=<TanhBackward0>)
==================== 2 ====================
input size: torch.Size([5, 4])
output size: torch.Size([5, 2])
tensor([[-0.8825, -0.1003],[-0.9137,  0.3993],[-0.2900, -0.8324],[-0.7844, -0.2764],[-0.7202, -0.4915]], grad_fn=<TanhBackward0>)进程已结束,退出代码为 0

注意:输出中的下列张量,每一个块儿是一个batch,一个块儿是5个向量,表示1个batch是5个输入

tensor([[[ 0.4408, -0.7577,  0.9077, -0.0779],[ 0.5080, -0.1057,  0.5581, -0.4546],[ 0.8382,  1.3444,  1.1445, -2.0313],[ 0.4016,  1.0184,  0.0556,  0.6046],[ 1.9827,  0.6735, -0.6609, -0.0764]],[[-0.8133, -1.3837, -0.6933, -0.6390],[ 0.7617, -0.2478, -0.1682, -1.2478],[ 0.1389, -0.5334,  1.7906,  0.8992],[-0.7540,  0.0293, -0.5835,  1.0606],[-0.5817,  0.2823, -1.0507,  0.3087]],[[-0.5872,  0.1241, -0.2446, -0.5430],[-0.6749,  0.6816, -0.1754, -1.1233],[ 0.1708, -1.6483,  0.8012,  0.3567],[-0.1961, -1.0277, -0.2133, -0.7144],[-1.3309,  0.6177,  1.5205, -0.4169]]])

假如有数据集:
1、我爱你
2、我恨你
3、我吃了
4、我没吃
5、我饿了
。。。。还有其他数据
分词之后:
1、“我”,“爱”,“你”
2、“我”,“恨”,“你”
3、“我”,“吃”,“了”
4、“我”,“没”,“吃”
5、“我”,“饿”,“了”

每个词有各自的词向量
配置项中设置每个batch的大小是5,选择前5句话作为1个batch,每句话的序列长度都是3,其中每个词的维度都是4
则1个batch用数字表示就是

tensor([[[ 0.4408, -0.7577,  0.9077, -0.0779],   # 我 【1】[ 0.5080, -0.1057,  0.5581, -0.4546],   # 我         [ 0.8382,  1.3444,  1.1445, -2.0313],   # 我[ 0.4016,  1.0184,  0.0556,  0.6046],   # 我[ 1.9827,  0.6735, -0.6609, -0.0764]],  # 我[[-0.8133, -1.3837, -0.6933, -0.6390],   # 爱 【1】[ 0.7617, -0.2478, -0.1682, -1.2478],   # 恨[ 0.1389, -0.5334,  1.7906,  0.8992],   # 吃[-0.7540,  0.0293, -0.5835,  1.0606],   # 没[-0.5817,  0.2823, -1.0507,  0.3087]],  # 饿[[-0.5872,  0.1241, -0.2446, -0.5430],   # 你 【1】[-0.6749,  0.6816, -0.1754, -1.1233],   # 你[ 0.1708, -1.6483,  0.8012,  0.3567],   # 了[-0.1961, -1.0277, -0.2133, -0.7144],   # 吃 [-1.3309,  0.6177,  1.5205, -0.4169]]]) # 了

暂时忽略同一个词不同词向量这个问题,以上只示意

3.2 直接使用torch中现有的RNN模块来实现RNN

cell = torch.nn.RNN(input_size = inputsize, hidden_size = hidden_size, num_layers = num_layers)
num_layers可以设置RNN是多少层的,层数也不能选太多,因为比较耗时

out,hidden = cell(inputs,hidden)
inputs是包含整个输入序列,out就是输出的整个序列(h1,h2,…,hN),第1个hidden就是hN,第2个hidden就是h0,具体可以见下图
在这里插入图片描述
总结:上图中cell输入h0,x1,x2,…,xN,输出h1,h2,…,hN和hN

维度要求,见下图:
在这里插入图片描述
其中numLayers指的就是RNN是多少层的,这个确实有指明的必要,因为RNN有多少层,h就得有多少层

input维度

在这里插入图片描述

h0维度

在这里插入图片描述

output维度

在这里插入图片描述

hn维度

在这里插入图片描述

numLayers的解释

同一种颜色的cell是同一个cell,下面例子中的模型看着很复杂,实际就只是3个线性层
在这里插入图片描述

代码注释

参数配置

在这里插入图片描述

模型构造

在这里插入图片描述

输入序列的构造

在这里插入图片描述

隐藏层的构造

在这里插入图片描述

输出的解释

在这里插入图片描述

最后一个隐藏层输出的解释

在这里插入图片描述

执行代码的结果

在这里插入图片描述
batch_first设置为True的话,在构造数据时需要将batch_size和seq_len进行交换,为什么有这个选项,是因为有些时候这种方式更方便构造数据集(具体原因可再细查),见下图
在这里插入图片描述
将batch_first设置为True的情况,代码和代码执行结果见下图:
在这里插入图片描述
可以看出batch_size和seq_len交换了位置

例子1:训练一个RNN 做seq2seq任务

任务训练一个RNN模型,输入是hello,输出是ohlol
在这里插入图片描述

第1步 字符向量化

使用one-hot表示,每个字符使用词表大小的向量来表示
在这里插入图片描述
inputsize = 4
输入的向量维度为4,输出的应该是这4个字符的类别,因此可以令输出向量的维度也为4,这样通过一个softmax即可进行多分类,下图中的输出上写的数字是每个每个输出应该被分类的类别,如o应该被归为第3类,l应该被归类为第1类,等等
在这里插入图片描述
预测的向量与真实的向量做一个交叉熵损失值,如下图
在这里插入图片描述

参数配置

在这里插入图片描述

准备数据

idx2char是一个字典,值为字符,可使用索引作为键
lookup是一个查询表,例如:词表中e的索引为0,则e使用one-hot表示就是lookup中第0行的向量,o的索引为3,则o使用one-hot表示就是lookup中第3行的向量
x_one_hot是将x_data中每个索引对应的字符都表示为one-hot向量,它的维度应该是seq_len×inputsize,因为x_data的维度是seq_len,one-hot向量的维度是inputsize
在这里插入图片描述
下面这个图中所写的(seqLen,1)应该是写错了,没有写batchsize的大小,
在这里插入图片描述
实际上应该写成(seqLen,batchSize,hiddenSize),即(-1,1,4),为什么这么写的原因可以见下图:
在这里插入图片描述

设计模型

1、初始化参数
在这里插入图片描述
2、RNNCell的输入输出维度要求
在这里插入图片描述
3、初始化h0
在这里插入图片描述
这里面的参数有一个batch_size,只有在构造h0的时候才会需要用到,在初始化和forward的时候不会用到这个参数

构造损失函数和优化器

使用交叉熵作为损失函数,Adam作为优化器
在这里插入图片描述

设置训练Cycle

optimizer.zero_grad():优化器的梯度归零
每一个epoch开始之后先算一个h0,对于每一步的损失值都加到一起,loss.backup进行梯度的反向传播,参数更新
在这里插入图片描述
注意下列数据的维度大小
在这里插入图片描述
在这里插入图片描述
lable只要给出类别数字即可,不需要one-hot,原因在于交叉熵的过程,这个地方需要查一下CrossEntropyLoss()的操作
在这里插入图片描述
hidden.max()就是找hidden中的找最大值,hidden是4维的向量
在这里插入图片描述
在这里插入图片描述
例2 使用RNN Module
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

改变数据

在这里插入图片描述
训练结果如下:
在这里插入图片描述

Embedding

associate:v.联系;联合;联想;交往;表示同意;(尤指)混在一起;表明支持;
one-hot表示的缺点:
1、维度太高(字符级:字符集ASIIC 128维 单词级:几万维)
2、过于稀疏
3、硬编码的,这个词向量并不是学习出来的
在这里插入图片描述
Embedding层是将高维的稀疏的样本向量映射到低维的稠密的空间中,这就是降维
在这里插入图片描述
嵌入层降维的方式:输入一个索引,通过查表来找到对应的向量,找的方法是通过将lookup表与一个one-hot向量进行想乘,然后得出最后的嵌入向量
在这里插入图片描述

例12-3 使用embedding和线性层的RNN

有时候的输出的隐藏层h的维度与类别的维度o不一致,所以可以添加Linear Layer,将h的维度映射为o的维度
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下面的batch_first = True只要知道有这种用法即可
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
参数配置:
在这里插入图片描述
输入和输出:
在这里插入图片描述

构造模型、损失函数、优化器

在这里插入图片描述

训练

在这里插入图片描述
出现ohlol比以前更早了,是因为使用了更厉害的模型,学习能力更强
在这里插入图片描述

练习1:LSTM

LSTM中的这些个门儿,实际上这么多次专业名词总会使人感觉到这个模型很难学习,实际不难,只需看公式即可
在这里插入图片描述
在这里插入图片描述

为什么有用?
因为提供了下面这样的路径,有利于梯度传播,有了记忆单元所以减少梯度消失
在这里插入图片描述
在这里插入图片描述
LSTM比RNN效果好得多,因为计算复杂,时间复杂度高

联系2:GRU

GRU是一个折中的方法,比LSTM的计算速度快在这里插入图片描述
在这里插入图片描述
以上学习RNN需要重视的是
1、了解序列数据的维度情况
2、循环过程用到的权重共享机制

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/853948.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java项目之消息队列(手写java模拟实现mq)【七、⽹络通信协议设计、消息队列服务器端实现、客户端实现】✔ ★

⼗⼀. ⽹络通信协议设计 定义 Request / Response /** 表示一个网络通信中的请求对象. 按照自定义协议的格式来展开的*/ public class Request {private int type;private int length;private byte[] payload;public int getType() {return type;}public void setType(int typ…

简单谈谈云服务器私网IP的存在意义及优势

云服务器是基于虚拟化技术的计算资源&#xff0c;可以在云平台上灵活创建和管理。为了满足不同用户的需求&#xff0c;云服务提供商在云服务器上分配了两种类型的IP地址&#xff1a;公网IP和私网IP。其中&#xff0c;私网IP是指在局域网内使用的内部IP地址&#xff0c;无法通过…

机器学习(V)--无监督学习(二)主成分分析

当数据的维度很高时&#xff0c;很多机器学习问题变得相当困难&#xff0c;这种现象被称为维度灾难&#xff08;curse of dimensionality&#xff09;。 在很多实际的问题中&#xff0c;虽然训练数据是高维的&#xff0c;但是与学习任务相关也许仅仅是其中的一个低维子空间&am…

环形链表2证明

解法 快慢指针相遇后&#xff0c;其中一个指回头部&#xff0c;然后同步前进 代码 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode(int x) : val(x), next(NULL) {}* };*/ class Solution { public:ListNod…

【gitcode】idea 在本地拉取和push本地代码到gitcode仓库

【首次使用】 1、idea 拉取代码&#xff0c;很容易这里就不记录了。 2、push代码时&#xff0c;总是弹窗登录输入在gitcode.com登录能成功。但是在idea 怎么都不成功。控制台提示 remote: HTTP Basic: Access denied fatal: Authentication failed for ******* 认证失败 3…

3D ToF赋能小米CyberDog 2提升视觉灵敏度

随着科技的进步,智能机器人越来越多地融入我们的日常生活。其中,CyberDog 2作为一款前沿的四足机器人,凭借其出色的视觉灵敏度和多功能技术配备,受到了广泛的关注。本文将重点探讨CyberDog 2的视觉系统,尤其是其四种不同类型的摄像头如何共同提升其视觉灵敏度,以及激光传…

uniapp实现路由拦截——遇到问题(三)

uniapp路由拦截开发过程中遇到问题 文章目录 uniapp路由拦截开发过程中遇到问题App 无法退出应用监听返回数据结构解决方式模拟原生物理返回键提示不提示&#xff0c;直接退出应用 微信小程序 登录成功返回页面报错效果图不同平台来源页面数据结构解决方式 App 无法退出应用 安…

HP惠普暗影精灵10 OMEN Gaming Laptop 16-wf1xxx原厂Win11系统镜像下载

惠普hp暗影精灵10笔记本电脑16-wf1000TX原装出厂Windows11&#xff0c;恢复开箱状态oem预装系统安装包&#xff0c;带恢复重置还原 适用型号:16-wf1xxx 16-wf1000TX,16-wf1023TX,16-wf1024TX,16-wf1025TX, 16-wf1026TX,16-wf1027TX,16-wf1028TX,16-wf1029TX, 16-wf1030TX,16-…

Autosar诊断-FIM模块功能介绍

文章目录 前言一、FIM模块概述二、FID概念介绍Event ID和DTC之间的关系Event ID与FID之间的关系FIM数据结构三、FiM模块与SW-C模块交互关系四、FIM模块函数调用关系FiM功能模块作用过程前言 Autosar诊断的主体为UDS(Unified Diagnostic Services)协议,即统一的诊断服务,是…

python实战根据excel的文件名称这一列的内容,找到电脑D盘的下所对应的文件位置,要求用程序实现

今天客户需要 根据excel的文件名称这一列的内容&#xff0c;找到电脑D盘的下所对应的文件位置&#xff0c;要求用程序实现 数据样例&#xff1a;记录.xlsx 解决代码&#xff1a; 1、安装必要的库&#xff1a; pip install pandas openpyxl2、编写Python脚本&#xff1a; im…

Modbus为何要转成ProfiNET

Modbus与ProfiNET代表了工业通讯不同阶段的发展&#xff0c;各自具有优缺点。Modbus简单易用&#xff0c;适合小型系统&#xff1b;ProfiNET高效稳定&#xff0c;适用于大型复杂网络。转换Modbus为ProfiNET可提高系统性能和扩展性。实际场景下&#xff0c;升级生产线控制器为Pr…

分享一个 .NET Core 使用选项方式读取配置内容的详细例子

前言 在 .NET Core 中&#xff0c;可以使用选项模式&#xff08;Options Pattern&#xff09;来读取和管理应用程序的配置内容。 选项模式通过创建一个 POCO&#xff08;Plain Old CLR Object&#xff09;来表示配置选项&#xff0c;并将其注册到依赖注入容器中&#xff0c;方…

弗洛伊德算法——C语言

弗洛伊德算法&#xff0c;是一种用于解决所有顶点对之间最短路径问题的经典算法&#xff0c;该算法通过动态规划的方法计算出从每个顶点到其他所有顶点的最短路径。 弗洛伊德算法的基本思想是逐步考虑每一个顶点作为中间点&#xff0c;更新所有顶点对之间的最短路径。它通过以…

js 前端 Function.prototype.call.call(0[‘toString‘], *, 16)

这个函数将 数组转任意进制 Function.prototype.call.call(0[toString], *, 16)

Oracle--存储结构

总览 一、逻辑存储结构 二、物理存储结构 1.数据文件 2.控制文件 3.日志文件 4.服务器参数文件 5.密码文件 总览 一、逻辑存储结构 数据块是Oracle逻辑存储结构中的最小的逻辑单位&#xff0c;一个数据库块对应一个或者多个物理块&#xff0c;大小由参数DB_BLOCK_SIZE决…

Java语法和基本结构介绍

Java语法和基本结构是Java编程的基础&#xff0c;它决定了Java代码的书写方式和程序的结构。以下是Java语法和基本结构的一些关键点&#xff1a; 1.标识符和关键字&#xff1a;Java中的标识符是用来标识变量、函数、类或其他用户自定义元素的名称。关键字是预留的标识符&#x…

[C++ STL] vector 详解

标题&#xff1a;[C STL] vector 详解 水墨不写bug 目录 一、背景 二、vector简介 三、vector的接口介绍 &#xff08;1&#xff09;默认成员函数接口 i&#xff0c;构造函数&#xff08;constructor&#xff09; ii&#xff0c;析构函数&#xff08;destructor&#xff0…

Verilog综合出来的图

Verilog写代码时需要清楚自己综合出来的是组合逻辑、锁存器还是寄存器。 甚至&#xff0c;有时写的代码有误&#xff0c;vivado不能识别出来&#xff0c;这时打开综合后的schematic简单查看一下是否综合出想要的结果。 比如&#xff1a;误将一个always模块重复一遍&#xff0c;…

天翼云认证专家解决方案架构师(理论)

1.某大型互联网公司为了提升应用程序和基础设施的稳定性&#xff0c;计划引入自动化监控工具。以下哪些工具可以满足公司的需求? A.Grafana B.Nagios C.Prometheus D.Jenkins 2.天翼智能边缘云ECX是位于网络边缘位置的云&#xff0c;兼具云和CDN的特性&#xff0c;将计算、存…

使用百度的长文本转语音API时无法下载.MP3文件

今天是学生们交作业的时候&#xff0c;结果是我最忙碌的一天&#xff0c;各种改bug。 有个学生来问&#xff1a; 我在百度提供的API代码(长文本转语音)的基础上添加了下载生成的.MP3文件的代码&#xff0c;运行之后成功建成了.MP3文件&#xff0c;但是文件的内容确实以下的报错…