Transform机制(1)

本文是对李宏毅老师的课程进行了整理。
视频地址为:
https://www.bilibili.com/video/BV1Wv411h7kN?p=35

1 引入

Transform的应用场景
在这里插入图片描述

2 基本原理

Transform机制由编码器(Encoder)和解码器(Decoder)构成。

  • 编码器:输入是一组向量序列,输出为一组向量序列,attention(注意力机制)、CNN、RNN等都可以作为Encoder;
  • 解码器:根据编码器的输出,利用Begin特殊符号、输入向量序列得到后续的输出向量序列(如一段文字)。
    在这里插入图片描述

上图例子的步骤如下:

  • Encoder的输入为:机器学习;输出为:向量序列;
  • Decoder第一次输入为:Encoder输出的向量序列、Begin特殊符号;第一次输出为文字出现的概率,假设最大的概率为:机;
  • Decoder第二次输入为:Decoder第一次输出的向量序列、器;第二次输出为文字出现的概率,假设最大的概率为:器;
  • 重复直到整个序列处理完成为止。

在这里插入图片描述
因为Decoder不知道最后的输出长度是多少,所以必须在输出部分增加一个结束符号,用“END”表示。
在这里插入图片描述
Decoder有两种方式:

  • AT(Autoregressive) Decoder:输入一个序列,输出也是一个序列(一个一个单词输出);
  • NAT Decoder:输入一串Begin(PPT是写的START),直接输出一个句子。

问:NAT Decoder方式如何知道结束?
答:有两种方法,(1)用另外的分类器,输入为Encoder的输入,输出为句子的长度;(2)假设句子最长不超过300,直接输入300个Begin,然后得到一个句子,在输出END之后的单词都不考虑。
问:NAT Decoder方式有什么优点?
答:平行,更稳定。

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507512.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python神经网络调节参数_神经网络进阶-用python实现一个完整的神经网络框架并在CIFAR10数据集上调参...

上一个博客中讲解了用python实现一个简单的两层神经网络,我们是把所有的网络层都直接写在了类中。但是作为一个神经网络框架,网络的结构应该是可以由使用者自定义的,这样一来也就不用为每个网络结构都重写所有代码,我们把每一层模…

CGCKD2021大会报告整理(1)--宽度学习

本文先把这次听陈俊龙老师的报告截图发出来,后面再来整理宽度学习的基本原理。

java根据逗号拆分_Excel技巧—超实用的字符串拆分小技巧

点赞再看,养成习惯;当断不断,反受其乱。微信搜索【亦心Excel】关注这个不一样的自媒体人。本文GitHub https://github.com/hugogoos/Excel已收录,包含Excel系统学习指南系列文章,以及各种Excel资料。我们每天都在Excel…

动漫变身调研报告

1 问题描述 由于手机等移动设备计算资源有限,导致目前风格迁移模型无法在手机等移动设备上实现高分辨率图像的风格转换。 2 竞品调研 为了了解已有产品中对动漫变身技术的使用情况,通过调研,我们发现了在醒图 APP (抖音&#x…

网站维护页面_营销型企业网站有哪些功能?

营销型企业网站是企业进行网络营销的一个利器,现在也越来越多企业重视做一个营销型网站。因为网站是客户和企业在网络上互相沟通的一个平台。所以营销型网站的功能也是运营人员在运营的过程中非常重视的体验,今天牛商网就和你说说营销型企业网站有哪些功…

如何写研究周报?

本文适合准备做研究的本科生或者研究生,目前还是一个初稿,请多提宝贵建议,我会及时更新。 1 为什么要写研究周报? 锻炼自己的文档整理能力;理清自己的思路;研究周报不是写给导师看的,而是写给…

python自动打卡程序_使用Python实现平台自动打卡

众所周知,人的懒惰是技术发展的一大动力。现在正处疫情期间,因为我总是忘记及时健康打卡而导致被年级群通报,故干脆写了个Python脚本来自动打卡。若之后我的身体状态、所在地等信息都没有改变的话,这个脚本就能帮我完成一个小任务…

python莫比乌斯环_有哪些完美或接近完美的构造(机械,生物,数学公式,文章,软件等等)?为什么完美?又能有什么领悟?...

分形。分形是一个几何概念。举个例子,Koch曲线。来自度娘百科由一个等边三角形开始(图1),取去掉每条边中间1/3部分,接上一个等边三角形的两个边(图2),如此重复无穷多次。最后我们得到一个面积有限,边长无限的图形。形状…

python 秒杀12306课程_Python攻破12306网站,实现2020最强抢票模式!

python版本支持2.7.10 - 2.7.15依赖库依赖若快 若快注册地址:推荐用若快,打码兔平台已经关闭项目依赖包 requirements.txt安装方法-Windows:安装方法-Linux:root用户(避免多python环境产生问题): python2 -m pip install -i pip install -i -r requireme…

coverage path planning覆盖路径规划(2021-左海民 )

如何扩展研究问题 1.1 地图已知 -> 离线算法,地图未知 -> 探索算法,地图动态 -> 动态算法 1.2 障碍物 -> 障碍物是概率值 (日常的高速路,有可能道路维护) 1.3 障碍物 -> 障碍物并未填充整个小块 1.4 将这些问题对应到实际应用…

python赋值的数组无序怎么办_Python的多维空数组赋值方法

Python里面的list、tuple默认都是一维的。创建二维数组或者多维数组也是比较简单。可以这样:list1 [1,2,]list1.append([3,4,])可以这样:list2 [1,2,[3,4,],]还可以这样:list3 [1,2]list3.insert(2, [3,4])比较特殊的情况是:li…

二维码研究综述--传统图像处理方法

1 北京交通大学电子信息工程学院–陈后金教授 1.1 基本信息 题目:《Data Matrix二维条码图像识别的算法研究与实现》 学生:李雅静 2009年6月 1.2 摘要 问题:实际采集到的二维条码图像 , 不可避免的会遇到光照不均 、 拍摄角度多样 、 背景…

一文重新认识联邦学习

重要申明:本文转载自https://user.guancha.cn/main/content?id674888。 人工智能助力抗疫又添新场景。据报道,英国剑桥爱登布鲁克医院(Addenbrooke’s Hospital)与全球20家医院和医疗科技中心联合医疗科技领军企业英伟达采用人工…

spi四种工作模式时序图_还没学会SPI总线协议?干货都在这里

SPI总线基本概念SPI是一种高速、全双工、同步的串行通信总线,全称是Serial Peripheral Interface,使用时在芯片的管脚上只占用三根或者四根线(如果单向传输的话只需三根线就可以了),节约了芯片的管脚资源,所以在实际项目中应用也非…

序列推荐系统文献调研(1)

1 简介 论文:用于统一一般推荐和序列推荐的循环协同过滤 Recurrent Collaborative Filtering for Unifying General and Sequential Recommender 出版:Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (…

命令不识别_互助问答138期:GMM命令代码中如何识别年份国家及异方差检验问题...

老师您好,有两个关于系统GMM的问题想请教一下:(1)在所学的教程里,系统GMM没有引入时间,我目前是分行业分国家的时间为T年的面板数据,请问时间应该放入xtdpdsys的命令中的哪个位置?代码是写作i.year吗&#…

研究生培养三部曲

1 引言 研究生培养是否有规律可以遵循,在多年实践的基础上,我们认为研究生应具备如下三方面的能力: (1)标准化:包括文档、代码必须遵循一定的规范; (2)逻辑严谨性&#…