ROCm上运行情感分析：使用卷积神经网络

15.3. 情感分析：使用卷积神经网络 — 动手学深度学习 2.0.0 documentation (d2l.ai)

代码

import torch
from torch import nn
from d2l import torch as d2lbatch_size = 64
train_iter, test_iter, vocab = d2l.load_data_imdb(batch_size)def corr1d(X, K):w = K.shape[0]Y = torch.zeros((X.shape[0] - w + 1))for i in range(Y.shape[0]):Y[i] = (X[i: i + w] * K).sum()return YX, K = torch.tensor([0, 1, 2, 3, 4, 5, 6]), torch.tensor([1, 2])
corr1d(X, K)def corr1d_multi_in(X, K):# 首先，遍历'X'和'K'的第0维（通道维）。然后，把它们加在一起return sum(corr1d(x, k) for x, k in zip(X, K))X = torch.tensor([[0, 1, 2, 3, 4, 5, 6],[1, 2, 3, 4, 5, 6, 7],[2, 3, 4, 5, 6, 7, 8]])
K = torch.tensor([[1, 2], [3, 4], [-1, -3]])
corr1d_multi_in(X, K)class TextCNN(nn.Module):def __init__(self, vocab_size, embed_size, kernel_sizes, num_channels,**kwargs):super(TextCNN, self).__init__(**kwargs)self.embedding = nn.Embedding(vocab_size, embed_size)# 这个嵌入层不需要训练self.constant_embedding = nn.Embedding(vocab_size, embed_size)self.dropout = nn.Dropout(0.5)self.decoder = nn.Linear(sum(num_channels), 2)# 最大时间汇聚层没有参数，因此可以共享此实例self.pool = nn.AdaptiveAvgPool1d(1)self.relu = nn.ReLU()# 创建多个一维卷积层self.convs = nn.ModuleList()for c, k in zip(num_channels, kernel_sizes):self.convs.append(nn.Conv1d(2 * embed_size, c, k))def forward(self, inputs):# 沿着向量维度将两个嵌入层连结起来，# 每个嵌入层的输出形状都是（批量大小，词元数量，词元向量维度）连结起来embeddings = torch.cat((self.embedding(inputs), self.constant_embedding(inputs)), dim=2)# 根据一维卷积层的输入格式，重新排列张量，以便通道作为第2维embeddings = embeddings.permute(0, 2, 1)# 每个一维卷积层在最大时间汇聚层合并后，获得的张量形状是（批量大小，通道数，1）# 删除最后一个维度并沿通道维度连结encoding = torch.cat([torch.squeeze(self.relu(self.pool(conv(embeddings))), dim=-1)for conv in self.convs], dim=1)outputs = self.decoder(self.dropout(encoding))return outputsembed_size, kernel_sizes, nums_channels = 100, [3, 4, 5], [100, 100, 100]
devices = d2l.try_all_gpus()
net = TextCNN(len(vocab), embed_size, kernel_sizes, nums_channels)def init_weights(m):if type(m) in (nn.Linear, nn.Conv1d):nn.init.xavier_uniform_(m.weight)net.apply(init_weights);glove_embedding = d2l.TokenEmbedding('glove.6b.100d')
embeds = glove_embedding[vocab.idx_to_token]
net.embedding.weight.data.copy_(embeds)
net.constant_embedding.weight.data.copy_(embeds)
net.constant_embedding.weight.requires_grad = Falselr, num_epochs = 0.001, 5
trainer = torch.optim.Adam(net.parameters(), lr=lr)
loss = nn.CrossEntropyLoss(reduction="none")
d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)d2l.predict_sentiment(net, vocab, 'this movie is so great')d2l.predict_sentiment(net, vocab, 'this movie is so bad')

代码解析

这段代码实现了一个用于情感分析的文本分类模型。它使用了IMDb评论数据集，并应用了一种被称为TextCNN的卷积神经网络架构。下面依次对代码中的各个部分进行解释：
1. 导入相关库：

    import torchfrom torch import nnfrom d2l import torch as d2l

导入PyTorch库、神经网络模块和`d2l`工具箱，`d2l`工具箱是为了简化实现并提供了辅助函数。
2. 加载数据集：

    batch_size = 64train_iter, test_iter, vocab = d2l.load_data_imdb(batch_size)

加载IMDb电影评论数据集，并将数据分成小批量进行训练，`batch_size`是每批次训练的样本数量。
3. 实现一维互相关操作：

    def corr1d(X, K):# 函数实现

互相关运算在卷积神经网络中使用，它类似于一维卷积。
4. 实现多输入通道的一维互相关操作：

    def corr1d_multi_in(X, K):# 函数实现

当输入数据具有多个通道时，将每个通道的互相关运算结果相加起来，以得到最终结果。
5. 定义TextCNN模型：

    class TextCNN(nn.Module):def __init__(self, vocab_size, embed_size, kernel_sizes, num_channels):# 模型初始化def forward(self, inputs):# 模型前向传播

TextCNN模型通过嵌入层（`nn.Embedding`）将单词映射到低维空间，然后使用卷积层（`nn.Conv1d`）提取局部特征，最后通过一个全连接层（`nn.Linear`）进行分类。
6. 初始化模型权重：

    def init_weights(m):if type(m) in (nn.Linear, nn.Conv1d):nn.init.xavier_uniform_(m.weight)net.apply(init_weights)

通过`apply`函数将初始化操作`init_weights`应用到模型的每个子模块上。
7. 将预训练的词嵌入加载到模型中：

    glove_embedding = d2l.TokenEmbedding('glove.6b.100d')embeds = glove_embedding[vocab.idx_to_token]net.embedding.weight.data.copy_(embeds)net.constant_embedding.weight.data.copy_(embeds)net.constant_embedding.weight.requires_grad = False

使用GloVe预训练的100维词向量来初始化嵌入层，并固定其中一部分的权重（`constant_embedding`）以防止训练过程中被更新。
8. 训练模型：

    lr, num_epochs = 0.001, 5trainer = torch.optim.Adam(net.parameters(), lr=lr)loss = nn.CrossEntropyLoss(reduction="none")d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)

设置优化器、学习率和损失函数，并开始训练。`train_ch13`函数来自`d2l`工具箱，负责模型的训练过程。
9. 使用训练好的模型进行情感预测：

    d2l.predict_sentiment(net, vocab, 'this movie is so great')d2l.predict_sentiment(net, vocab, 'this movie is so bad')

调用预测函数`predict_sentiment`测试模型效果，传入模型、词汇表和待预测的句子，函数会输出句子的情感倾向（正面或负面）。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/13995.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

ROCm上运行情感分析：使用卷积神经网络

代码

代码解析

相关文章

分布式任务调度内的 MySQL 分页查询优化

C语言初阶——5操作符

Simplicity Studui V5 新安装后无法Product Updates

每日新闻掌握【2024年5月24日星期五】

瓦解信息茧房，IPWO打破“墙”的限制

Plant Simulation 双深位立库开发系列教程-出入口参数化

c# 基础 .net core、.net framework、c#、mono之间的关系

Docker配置国内镜像源

Java enum 枚举类

paligemma、Grounding-DINO-1.5简单无需标注无需训练直接可以使用的VLM图像到文本模型

ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+解决方案

HCIP-Datacom-ARST自选题库__MPLS判断【道题】

Java 9的模块化系统（JPMS）：探讨Java 9引入的模块化系统，并解释其对Java生态的影响

QT creator centralwidget前面有个禁止符号

AI商业化之路：开源大模型VS闭源大模型

【机器学习】—机器学习和NLP预训练模型探索之旅

线性回归 10 种图表上【建议收藏】

不是人人都懂的学习要点

高光谱成像技术简介，怎么选择成像方案？

海山数据库（He3DB）从方法到实践，构建以场景为中心的体验管理体系