文本解码原理–以MindNLP为例
重要的就是怎么样把数字最后转化成真正的文字。而且自回归模型它会一个字给一个字的预测,下一个字应该是什么?
如果这个模型下载很慢,你就可以通过这种方式从摩大社区进行下载。
这种方式, 每一次候选的词都只会是固定的数目。在固定的数目里面选概率最大的值作为真正要输出的值。
这个语法的意思就是使用的框架得到tensor是用的华为的这个框架。
这段代码就是为了防止出现两个词,两个词的重复值出现。
这种方式解码它的优点就是能够生成很多的种类比较有创造性,但是生成的东西由于比较有创造性,也往往显得不是那么通顺,不是那么连贯。
调节的这个温度值,把它的温度值降低以后,可以看到这个分布就会比较尖锐。分布比较尖锐的话,那么每一次选的这个词呢就是最高概率的词是比较固定的。所以看起来就是温度越低,说的话越稳定,每次都是差不多的。温度越高说的话每一次都是比较不一样的,有创造性的。
使用这种方式,那么他后选的这个词就不是一定的,它是变化的。是靠每一次的积累的概率从而得到限定的候选词的个数的,所以它是个变化的值。
如果你希望返回三个句子,那么它就会给你三个句子,然后你可以从这三个句子中选择最好的那个句子作为最后的答案。