Prompt Engneering(提示词工程)

大模型的目标是理解和生成人类语言。给定一些词语,语言模型可以预测下一个词语可能是什么,或者给定的一些词语生层对应内容。

那么如何引导它们产生期望的输出,或者说如何提问,就成为了一个关键的问题。这就引入了一个重要的概念,即"Prompt Engineering",也就是提示工程。

什么是提示词(Prompt)?

如何向大语言模型提问,或者更好的提问,就是指提示词(Prompt);提示词是给LLM(大语言模型)的指令,它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。LLM会基于 prompt 所提供的信息,生成对应的内容从而获得符合预期的结果。

什么是提示工程(Prompt Engineering):

Prompt Engineering 是一种人工智能(AI)技术,它通过设计和改进 AI 的 prompt 来提高 AI 的表现。通俗而言,是指如何在不更新模型权重的情况下与 LLM 进行沟通,以引导LLM的输出得到更有意义结果的方法。Prompt Engineering 的目标是创建高度有效和可控的 AI 系统,使其能够准确、可靠地执行特定任务。但是我们要知道,我们发给大模型的 prompt,不会改变大模型的参数。和大模型对话,不会让 ta 变聪明,或变笨。但对话历史数据,可能会被用去训练大模型。

学会提示工程,就像学用鼠标、键盘一样,是 AGI 时代的基本技能。

  • 「Prompt」 是 AGI 时代的「编程语言」
  • 「Prompt 工程」是 AGI 时代的「软件工程」
  • 「提示工程师」是 AGI时代的「程序员」

想让机器很好地理解人类说的话,还需要一个过程,因为人类的语言从根本上说是不精确的,这个过程可能3年,可能5年,但不会太长。即使过程不会太长,但提示工程依然是需要我们掌握的。

Prompt 的典型构成

角色:给 AI 定义一个最匹配任务的角色,比如:「你是一位软件工程师」「你是一位小学老师」
指示:对任务进行描述
上下文:给出与任务相关的其它背景信息(尤其在多轮交互中)
例子:必要时给出举例,学术中称为 one-shot learning, few-shot learning 或 in-context learning;实践证明其对输出正确性有很大帮助
输入:任务的输入信息;在提示词中明确的标识出输入
输出:输出的格式描述,以便后继模块自动解析模型的输出结果,比如(JSON、XML)

类似下边例子,可以指定角色,给定描述,然后提出问题:
在这里插入图片描述
在这里插入图片描述

提示工程种类

随着提示工程的进步,可以分为三类:

  • Zero-shot:仅使用当前任务的自然语言描述,不进行任何梯度更新;
  • One-shot:当前任务的自然语言描述,加上一个简单的输入输出样例,不进行任何梯度更新;
  • Few-shot:当前任务的自然语言描述,加上几个简单的输入输出样例,不进行任何梯度更新;

chatGPT 的发展史,就是从 zero-shot 到 few-shot。

Zero-shot Learning

Zero-shot learning(零样本学习),零样本学习是指该模型可通过从未见过的类别进行分类,使机器具有推理能力,实现真正的智能。

从原理上来说,ZSL 就是让计算机模拟人类的推理方式,来识别从未见过的新事物。之所以独立出来,是因为它解决问题的思路不同于传统的机器学习方法。

首先通过一个例子来引入zero-shot的概念。假设小明和爸爸,到了动物园,看到了马,然后爸爸告诉他,这就是马;之后,又看到了老虎,告诉他:“看,这种身上有条纹的动物就是老虎。”;最后,又带他去看了熊猫,对他说:“你看这熊猫是黑白色的。”然后,爸爸给小明安排了一个任务,让他在动物园里找一种他从没见过的动物,叫斑马,并告诉了小明有关于斑马的信息:“斑马有着马的轮廓,身上有像老虎一样的条纹,而且它像熊猫一样是黑白色的。”最后,小明根据爸爸的提示,在动物园里找到了斑马。

上述例子中包含了一个人类的推理过程,就是利用过去的知识(马,老虎,熊猫和斑马的描述),在脑海中推理出新对象的具体形态,从而能对新对象进行辨认。(如图1所示)ZSL就是希望能够模仿人类的这个推理过程,使得计算机具有识别新事物的能力。
ZSL就是希望我们的模型能够对其从没见过的类别进行分类,让机器具有推理能力,实现真正的智能。其中零次(Zero-shot)是指对于要分类的类别对象,一次也不学习。

One-Shot Learning

一次样本学习(One-Shot Learning)是一种只需要一个样本就能学习新类别的方法。这种方法试图通过学习样本之间的相似性来进行分类。例如,当我们只有一张狮子的照片时,一次样本学习可以帮助我们将新的狮子图像正确分类。

Few-Shot Learning

少样本学习(Few-Shot Learning)是介于零样本学习和一次样本学习之间的方法。它允许模型在有限数量的示例下学习新的类别。相比于零样本学习,少样本学习提供了更多的训练数据,但仍然相对较少。这使得模型能够从少量示例中学习新的类别,并在面对新的输入时进行准确分类。

Prompt 调优

找到好的 prompt 是个持续迭代的过程,需要不断调优。比如按照模型友好的格式提供prompt,更有利于得到我们想要的答案。

  • OpenAI GPT 对 Markdown 格式友好
  • OpenAI 官方出了 Prompt Engineering 教程,并提供了一些示例
  • Claude 对 XML 友好。

另外高质量 prompt 核心要点是:具体、丰富、少歧义。
最有效的方式就是多试,「试」是常用方法,有时一字之差,对生成概率的影响都可能是很大的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/666617.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QStandardItemModel与QTableView里如何设置复选框居中

笔者为这个问题思索了不少时间,这个问题就是c qt里创建了一个QStandardItemModel设置了表格的表头,往表格填充数据时,数据的复选框左对齐,想要设置复选框居中对齐,不知道如何处理,这里给出代码与运行效果&a…

用Python画一条祥龙,祝您新年龙腾万里

用Python画一条祥龙,祝您新年龙腾万里 龙年到了,祝大家新年龙行龘龘,龙腾万里! 从2021年开始,我每年都用Python画一幅当年生肖的图。 用Python标准库turtle画一头金牛,祝您新年牛气冲天! 用P…

vscode 括号 python函数括号补全

解决方法 在setting.json中添加 “python.analysis.completeFunctionParens”: true 打开设置; 点击图中按钮打开setting.json文件 添加 “python.analysis.completeFunctionParens”: true

apipost 简单的性能压测总结

1、简单的使用机型牌评估 1)jdk默认256M给100用,推荐给1000人同时用JVM 堆栈建议2G~4G(目前定了机型4核8G内存 2T磁盘做radio0存储); 2)数据库配置文件写了占了2G内存(my.cnf文件&#xff09…

Python算法100例-1.3 牛顿迭代法求方程根

完整源代码项目地址,关注博主私信’源代码’后可获取 1.问题描述 编写用牛顿迭代法求方程根的函数。方程为 a x 3 b x 2 c x d 0 ax^3bx^2cxd0 ax3bx2cxd0,系数a、b、c、d由主函数输入,求x在1附近的一个实根。求出根后&…

详解SkyWalking前端监控的性能指标

SkyWalking 从8.2.0版本开始支持对前端浏览器端的性能进行监控,不仅可以像以前一样监控浏览器发送给后端服务的与请求,还能看到前端的渲染速度、错误日志等信息——这些信息是获取最终用户体验的最有效指标。实现的方式是引入skywalking-client-js库&…

STL篇三:list

文章目录 前言1.list的介绍和使用1.1 list的介绍1.2 list的使用1.3 list的迭代器的失效 2.list的模拟实现2.1 结点的封装2.2 迭代器的封装2.2.1 正向迭代器2.2.2 反向迭代器 2.3 list功能的实现2.3.1 迭代器的实例化及begin()、end() 2.3.2 构造函数2.3.3 赋值运算符重载2.3.4 …

YGG 为 Axie Infinity: Origins 发布超级任务游戏内训练器,深化对 Ronin 的支持

自 2023 年以来,Ronin 已成为增长最快的游戏区块链。由于 Axie Infinity 和 Pixels 等游戏的持续成功,日活跃用户数量至少增长了 10 倍。在过去的一年里,有超过 120 万个新地址加入,并且,这个数字还在持续增长。 ​Ron…

科技助力快乐养老,山东恒康养老服务中心与清雷科技达成合作

谈到养老服务,大家或许会有一些刻板印象。 如果说一个落落大方、笑容温柔的90后女孩是一家养老院的院长,很多人都会感到诧异。但就是这位来自山东省龙口市恒康养老服务中心的90后院长韩雨,实现了百分百入住率、百分百好评的养老服务奇迹。 韩…

北斗卫星在物联网时代的应用探索

北斗卫星在物联网时代的应用探索 在当今数字化时代,物联网的应用已经深入到人们的生活中的方方面面,让我们的生活更加智能便捷。而北斗卫星系统作为我国自主研发的卫星导航系统,正为物联网的发展提供了强有力的支撑和保障。本文将全面介绍北…

【软件设计师笔记】深入探究操作系统

【软件设计师笔记】计算机系统基础知识考点(传送门) 💖 【软件设计师笔记】程序语言设计考点(传送门) 💖 🐓 操作系统的作用 1.通过资源管理提高计算机系统的效率 2.改善人机界面向用户提供友好的工作环境 🐓 操作系统的特征 …

nodejs 事件循环

浏览器的事件循环比较熟悉了,也来了解下 node 的。 参考来源: https://nodejs.org/en/guides/event-loop-timers-and-nexttick/ https://juejin.cn/post/6844903999506923528 事件循环分为 6 个阶段,图中每个框都是一个阶段,每个阶…

Acwing---827.双链表

双链表 1.题目2.基本思想3.代码实现 1.题目 实现一个双链表,链表初始为空,支持5种操作: 在最左侧插入一个数;在最右侧插入一个数;将第 k k k 个插入的数删除;在第 k k k个插入的数左侧插入一个数&#…

安装Canal

安装和配置Canal 下面我们就开启mysql的主从同步机制,让Canal来模拟salve 1.开启MySQL主从 Canal是基于MySQL的主从同步功能,因此必须先开启MySQL的主从功能才可以。 这里以之前用Docker运行的mysql为例: 1.1.开启binlog 打开mysql容器…

景联文科技受邀出席全国信标委生物特征识别分委会二届五次全会

全国信息技术标准化技术委员会生物特征识别分技术委员会(SAC/TC28/SC37,以下简称“分委会”)二届五次全会于2024年1月30日在北京顺利召开,会议由分委员秘书长王文峰主持。 分委会由国家标准化管理委员会批准成立,主要负…

社交平台内容创作未来会有哪些方向?

内容为王的时代下,企业如果想要通过社交平台占据用户心智,可以找到适合自己的内容营销策略,好的内容能够与消费者建立信任关系,今天 媒介盒子就来和大家聊聊:社交平台内容创作的方向。 一、 内容逐渐细分 相比于原来…

WorkPlus打造个性化移动门户,实现协作创新与工作高效

在移动办公逐渐成为企业工作方式的主流趋势下,构建高效的移动门户平台对于提升信息传递与团队协作效能至关重要。移动门户作为企业信息交流和协作的重要枢纽,WorkPlus以其领先的功能和卓越的性能,助力企业实现智能移动门户平台的搭建。 为何…

在WORD中设置公式居中编号右对齐设置方式

1 软件环境 Office Microsoft Office LTSC 专业增强版2021 2 最终效果 3 操作步骤 编辑公式;光标定位到公式的最后(不是行的最后);输入#编号光标定位在公式最后(不是行的最后),按Enter键回车…

R3 下动态加载的模块的保护(一)

前言 在 R3 下防护动态加载的模块不被意外卸载需要很多的策略,比如:LDR 断链、VAD 记录擦除、PE 头擦除、修改入口函数、内存注入等。文本我们将浅析模块静态化技术这一项技术。模块静态化是一个很常见的模块保护技术,它通过修改模块的引用计…

建筑工程答案在哪搜?九个免费好用的大学生搜题工具 #经验分享#知识分享

大学生必备,这条笔记大数据一定定要推给刚上大学的学弟学妹!! 1.七燕搜题 这是一个公众号 解题步骤详细解析,帮助你理解问题本质。其他考试领域也能找到答案。 下方附上一些测试的试题及答案 1、据《素问太阴阳明论》所论&…