pytorch之诗词生成6--eval

先上代码：


import tensorflow as tf
from dataset import tokenizer
import settings
import utils# 加载训练好的模型
model = tf.keras.models.load_model(r"E:\best_model.h5")
# 随机生成一首诗
print(utils.generate_random_poetry(tokenizer, model))
# 给出部分信息的情况下，随机生成剩余部分
print(utils.generate_random_poetry(tokenizer, model, s='深山夕照深秋雨'))
# 生成藏头诗
print(utils.generate_acrostic(tokenizer, model, head='深山夕照深秋雨'))

我们需要做的工作已经做完了，模型也已经训练好了，剩下的就是我们把我们的模型放到实际应用之中去了。

先看：

model = tf.keras.models.load_model(r"E:\best_model.h5")

这段代码使用了tensorflow中的tf.keras.models.load_model函数，加载一个预训练好的模型，这种加载预训练模型的例子很常见，在我们之前提到的风格迁移项目中，我们就加载预训练模型对我们的图片特征进行提取。

tf.keras.models是tensorflow中用于构建和训练神经网络模型的模块。
load_model是tf.keras.models模块中的一个函数，用于从磁盘中加载保存好的预训练模型。我们的参数是一个模型文件或文件名，使用r前缀表示字符串是一个原始字符串，可以包含反斜杠\而无需进行转义。

这段代码的作用是将预训练模型加载到变量model中，以便后续使用该模型进行古诗生成或其他任务，加载的模型可以是之前使用的TensorFlow训练得到的模型，也可以是由其他方法训练得到的模型，加载模型之后，可以使用model变量调用模型的方法和属性。（其余方法如我们在图像识别项目中使用的save_model方法，使用save_model.save函数来保存模型参数，使用save_model.load函数来加载模型参数）。

接下来就是进行古诗的生成了：

print(utils.generate_random_poetry(tokenizer, model))

只是传递分词器和我们的模型表示只进行随机的诗词生成。

print(utils.generate_random_poetry(tokenizer, model, s='深山夕照深秋雨'))

除上述传递的参数之外，额外传递s表示传递第一句，会跟着第一句往后进行诗词的生成，在这里，由于我们使用的是循环神经网络（RNN），所以我们后面生成的诗词与我们提供的第一句是有很强的关联性的。

print(utils.generate_acrostic(tokenizer, model, head='深山夕照深秋雨'))

最后我们传递的参数改成藏头诗，我们传递的head将被分成一个个词，并对每个词进行相应的生成，然后将得到的结果组合在一起，形成完整的诗词，当然，我们对每个词进行生成的时候不止简单的考虑到我们head所提供的第一个词，而是考虑到前面已经生成的词。这样使全文就有一定的关联性。

最后我们来演示我们的模型效果：

我们给定的第一句是“深山夕照深秋雨”，包括藏头也是“深山夕照深秋雨”。

总体来看效果还是不错的，我们继续生成一首：

有些同学可能会发愁找不到相关的诗词资源，在这里我已经将相关资源传上去了。分别是进行诗词训练的数据集，便于同学们更加直观的感受训练过程，理解数据对深度学习的重要作用，还有预训练权重，可以直接用于模型。

至于训练数据，请查看我的文章http://t.csdnimg.cn/mF4lm。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/747830.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

pytorch之诗词生成6--eval

相关文章

k8s admin 用户生成token

WRF模型教程（ububtu系统）-WPS（WRF Pre-Processing System）概述

paddle ocr识别文字

Spring Boot Actuator介绍

el-table按钮获取当前行元素

【Unity】详细介绍

C++高级面试题：什么是 C++ 中的多态指针（Polymorphic Pointers）？

Linux------JAVA项目发布

微信小程序--分享如何与ibeacon蓝牙信标建立联系

Laravel Class ‘Facade\Ignition\IgnitionServiceProvider‘ not found 解决

19113133262（微信同号）【征稿进行时|见刊、检索快速稳定】2024年区块链、物联网与复合材料与国际学术会议 (ICBITC 2024)

How to manage Python environment based on virtualenv in Ubuntu 22.04

css背景从上到下颜色渐变、css背景从左到右颜色渐变、 css框线展示外阴影、css框线展示内阴影

微信小程序将高德地图转为腾讯地图的自行车路线规划

系统架构设计师笔记第36期：中间层架构设计

java笔记+理论复习大全

gitlab CI/CD的gitlab-runner构建项目（go web项目实战体验）

Vue项目中使用ECharts构建交互式中国地图的详细指南

ASP.NET-Server.UrlEncode

MapReduce超详解