GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析

GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析
Gavin大咖微信：NLP_Matrix_Space
5.1 ChatGPT提示词流程解析
本节主要是跟大家剖析 GPT内部的源码，在进入源码及运行项目之前，我们先思考一下ChatGPT的机制，ChatGPT默认情况下使用的模型是GPT-3.5，作者在日常工作中使用的模型是GPT-4，在做一些研究的时候，会涉及大量的长文本，无论是推理能力，还是逻辑分析能力，GPT-4信息产出的质量都明显高于GPT-3.5。
ChatGPT在GPT的基础上形成了某种意义上的封装，这种封装有两个方面，一个是交互方式，它是一种类似对话机器人的方式，这是第一点；第二点它是以Transformer预训练模型为底层的核心，上面只不过有很多对话的方式，ChatGPT它本身不是模型本身，它只是上层的一种封装，大家一般都作为API的方式去使用。
如图5-1所示，如果给ChatGPT输入一个指令或者提示词（Prompt），ChatGPT提示词评估器作为一个封装的API应用，会对你的提示词进行评估，这是第一个步骤，确定这个提示词有没有问题，这也是现在很多开放式框架做的很重要的一个工作，评估提示词、改进提示词，有时也会禁止你的提示词，举个例子，使用SQL操作数据库的时候，如果使用一个提示词，里面有一些危险的操作，可能让整个平台返回用户名和密码的信息，这称之为提示词的注入，很多的框架或者平台，在提示词的评估和改进方面，首先去分析评估，然后进行一些后续的处理。ChatGPT本身也是这种基本思路，如果是正常安全的&#x

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/115734.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！