论文辅助笔记:t2vec 模型部分

1 t2vec.py 函数

命令行参数

data训练、测试数据路径
checkpoint保存的检查点路径
prefixtrjfile的前缀
pretrained_embedding预训练的词(或称为单元)嵌入的路径 。默认值是None
num_layersRNN单元中的层数。默认值是3
bidirectional在编码器中是否使用双向rnn。默认值是True
hidden_sizeRNN单元中的隐藏状态大小。默认值是256。
embedding_size词(或称为单元)嵌入的大小。默认值是256。
dropoutdropout的概率。默认值是0.2
max_grad_norm最大梯度范数。默认值是5.0。
learning_rate学习率。默认值是0.001
batch批处理大小。默认值是128
generator_batch每次生成的最大词数。数值越高,需要的内存越多。默认值是32。
t2vec_batch每次在t2vec中编码的最大轨迹数。默认值是256。
start_iteration开始的迭代次数。默认值是0。
epochs训练的周期数。默认值是15。
print_freq打印频率。默认值是50。
save_freq:保存频率。默认值是1000。
cuda是否使用GPU来训练模型。默认值是True
use_discriminative如果给定此参数,将使用判别损失。
discriminative_w判别损失的权重。默认值是0.1
criterion_name使用的损失函数名称。可以是NLL(负对数似然)或KLDIV(KL 散度)。默认值是NLL
knearestvocabsKLDIVLoss中使用的k最近的单元和距离的文件,由预处理生成,如果使用KLDIVLoss则必需。
dist_decay_speed在dist2weight中距离衰减的速度。数值越小,远离的单元的权重越高。默认值是0.8。
max_num_line默认值是20000000
max_length目标序列的最大长度。默认值是200
mode运行模式(0: 训练,1:评估,2:t2vec)。默认值是0
vocab_size词汇表大小。默认值是0
bucketsize

训练时的桶大小。默认值是一系列的元组

  • 桶是一种策略,用于在序列长度可变的情况下处理数据。
  • 例如,假设我们有不同长度的句子,我们可能不希望为每个句子单独创建一个批处理,因为这会非常低效。
  • 桶策略是将句子放入一个接近它们长度的桶中,以尽量减少填充。 

2 train t2vec

几个注意事项:

numpy 版本不能过高 1.23以下

原github给的vocab_size有点问题,调整到20000就好了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/129000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【云原生基础】了解云原生,什么是云原生?

📑前言 本文主要讲了云原生的基本概念和原则的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是青衿🥇 ☁️博客首页:CSDN主页放风讲故事 🌄每日一句&#x…

测试工具:hurl

文章目录 Hurlinstallstartdemo 功能变量RequestResponseCapturing values 捕获值Asserts 断言Implicit asserts 隐式断言Explicit asserts 显式断言 Filerts 过滤器 CI/CD Hurl 官网:https://hurl.dev/ Hurl 是一个命令行工具,它运行以简单的纯文本格…

软考 系统架构设计师系列知识点之净室软件工程(3)

接前一篇文章:软考 系统架构设计师系列知识点之净室软件工程(2) 所属章节: 第5章. 软件工程基础知识 第5节. 净室软件工程 相关试题 1. 以下关于软件开发方法的叙述,错误的是()。 A. 对于较为…

分享一个抖音视频解析神器~

怎么样下载抖音视频?相信很多人都有过这样的困惑。作为一个资深短视频剪辑工作者,常常需要用到各种视频素材,其中不乏需要从抖音上下载的,因此我也尝试过许多下载工具,但是效果都不大满意,直到有一次朋友给…

SpringBoot可以同时处理多少请求?

前言 前两天面试的时候,面试官问我:一个ip发请求过来,是一个ip对应一个线程吗?我突然愣住了,对于SpringBoot如何处理请求好像从来没仔细思考过,所以面试结束后就仔细研究了一番,现在就来探讨一…

C++——list

目录 list介绍 list的函数接口 构造函数 push_front和pop_front push_back和pop_back insert erase 迭代器 front和back size resize empty clear list::sort unique reverse 迭代器的实现 list介绍 list是一种可以在常数范围内在任意位置进行插入和删除的序列…

“AI换脸诈骗”来势汹汹,三个层面科学应对……

当前,AI技术的广泛应用为社会公众提供了个性化智能化的信息服务,也给网络诈骗带来可乘之机,如不法分子通过面部替换语音合成等方式制作虚假图像、音频、视频仿冒他人身份实施诈骗、侵害消费者合法权益。你认为AI诈骗到底应该如何防范&#xf…

Selenium3-获取元素的css属性

来个元素CSS值 代码1: 通过javaScript执行脚本获取css值 String jsStr "return document.getElementById(\"buyers\").style.getPropertyValue(width)"; Object o ((JavascriptExecutor) driver).executeScript(jsStr); System.out.println(o.toString(…

短视频平台Roposo入驻印尼,会成为下一个Tiktok吗

Roposo是一个印度本土的短视频平台,功能和风格都和Tiktok很相似。 早在2020年7月,印度下令封禁了多个app,其中就包括了TikTok。在那之前,TikTok已经在印度累计了约2亿的用户,基数已经非常的大,那么被封禁之…

北京君正X2600处理器亮相ELEXCON 2023,打造多核异构跨界新价值

伴随下游应用持续丰富,细节需求不断增多,标准化产品已越来越难以满足市场需求,芯片方案提供商需要不断深入行业,根据市场需求推出适配的产品。在这样的背景下,北京君正迅速推出X2600系列多核异构跨界处理器&#xff0c…

ONNX的结构与转换

ONNX的结构与转换 1. 背景2. ONNX结构分析与修改工具2.1. ONNX结构分析2.2. ONNX的兼容性问题2.3. 修改ONNX模型 3. 各大深度学习框架如何转换到ONNX?3.1. MXNet转换ONNX3.2. TensorFlow模型转ONNX3.3. PyTorch模型转ONNX3.4. PaddlePaddle模型转ONNX3.4.1. 简介3.4…

python冒泡排序算法

冒泡排序(Bubble Sort),依次比较两个相邻的元素,如果顺序错误就把他们交换过来。直到没有相邻元素需要交换,也就是说该元素列已经排序完成。 操作步骤 1)比较相邻的元素。如果第一个比第二个大&#xff0…

高阶数据结构学习——LRU Cache

文章目录 1、了解LRU Cache(Least Recently Used缩写)2、代码实现 1、了解LRU Cache(Least Recently Used缩写) Cache是缓存,在磁盘和内存之间,内存和寄存器之间都存在,CPU和内存之间存在三级缓…

基于PyTorch的中文情绪分析器设计与开发

收藏和点赞,您的关注是我创作的动力 文章目录 概要 一、相关基础理论2.1 主流深度学习框架2.2 神经网络2.2.1 神经网络基础 二、中文情感分类模型构建3.1 开发环境3.2 数据部分3.3 文本特征提取3.3.1、过滤标点符号3.3.2 中文分词、单词过滤 三 运行结果与分析五 结…

2,OpenCV函数解析

1,imread函数:图片读取 CV_EXPORTS_W Mat imread( const String& filename, int flags IMREAD_COLOR );//参数1(filename):文件地址 //参数2(flags):读取标志注:ImreadModes,参数2(flags)枚举定义 enum ImreadModes {IMREA…

快速批量重命名:高效修改文件名并转换为大写扩展名

在文件管理中,批量重命名文件是一个常见的需求。通过快速批量重命名,我们可以高效地修改文件名并将扩展字母转换为大写形式。这样做不仅可以提高文件的可读性,还可以更好地组织和管理文件。用云炫文件管理器可以快速批量重命名,能…

k8s之pod进阶---资源限制与探针

目录 一、资源限制 二、探针(健康检查) 2.1 含义 2.2 探针的三种规则 2.3 probe支持三种检查方法 2.4 探针的示例 1、存活探针:livenessProbe (1)exec方式 (2)httpGet方式 (…

如何使用ps制作ico图标文件

如何使用ps制作ico图标文件 Chapter1 如何使用ps制作ico图标文件Chapter2 ICOFormat.8bi(Photoshop Ico、Cur插件)的下载使用1. ICOFormat.8bi的作用2. ICOFormat.8bi使用 Chapter3 ps手机计算机图标教程,手绘设计精美手机APP软件图标的PS教程步骤 01 制…

目标检测中常见指标 - mAP

文章目录 1. 评价指标2. 计算示例3. COCO评价指标 1. 评价指标 在目标检测领域,比较常用的两个公开数据集:pascal voc和coco。 目标检测与图像分类明显差距是很大的,在图像分类中,我们通常是统计在验证集当中,分类正…

maven配置多仓库

配置多仓库不要用mirror&#xff0c;要用profile。 先将mirror全注释掉。 <?xml version"1.0" encoding"UTF-8"?> <settings xmlns"http://maven.apache.org/SETTINGS/1.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-insta…