一 提示词
(一) 提示词(Prompt)是用户发送给大语言模型的问题、指令或请求,**
1 来明确地告诉模型用户想要解决的问题或完成的任务,是大语言模型理解用户需求并据此生成相关、准确回答或内容的基础。对于大语言模型来说,提示词就是用户输入给大语言模型的文本信息。
提示词:
请结合《星球崛起》整个系列评价最近刚刚上映的电影《猩球崛起:新世界》输出:
《猩球崛起:新世界》作为《星球崛起》系列的最新篇章,延续了这一科幻经典IP的传奇,尽管它……
在角色刻画上,《猩球崛起:新世界》似乎得到了积极的反馈,尤其是对于反派和配角的描绘……
对于老粉丝而言,这部电影可能没有提供必须观看的新鲜理由,但对于新加入的观众……
总体而言,《猩球崛起:新世界》在保持系列精髓的同时,尝试了某种程度的软重启,为新老观众都提供了值得一看的科幻体验。虽然可能在创新性上有所欠缺,但它在情感深度、视觉震撼以及对未来叙事线索的铺设上都交出了满意的答卷。
(二)提示词工程
1 研究如何构建和调整提示词,从而让大语言模型实现各种符合用户预期的任务的过程
a 直接提问
原则:
简洁:尽量用最简短的方式表达问题。过于冗长的问题可能包含多余的信息,导致模型理解错误或答非所问。
具体:避免抽象的问题,确保问题是具体的,不含糊。
详细上下文:如果问题涉及特定上下文或背景信息,要提供足够的详情以帮助模型理解,即使是直接提问也不例外。
避免歧义:如果一个词或短语可能有多重含义,要么明确其含义,要么重新表述以消除歧义。
逻辑清晰:问题应逻辑连贯,避免出现逻辑上的混淆或矛盾,这样才能促使模型提供有意义的回答。
不好的提示词 提示词: 苹果好看吗? — 输出: 不好意思,我不清楚你所指的“苹果”具体指的是什么,水果还是电子设备。 | 好的提示词 提示词: 这批红色的苹果水果外观怎么样,新鲜吗? — 输出: 新鲜。 |
---|
b 增加示例
提示词中提供少量(通常几个或几十个)示例,也称为少样本提示
未增加示例 提示词: 任务:请根据以下电影评论,判断其情感评价(正面、负面或中性)。 待分类评论:这部电影音乐动人,但剧情略显平淡。 — 输出: 情感评价:中性 | 增加示例 提示词: 要求:请根据以下电影评论,判断其情感评价(正面、负面或中性)。 示例1:这部电影剧情引人入胜,但特效炸裂。情感评价:正面 示例2:虽然这部电影剧情单调,但特效却非常炸裂。情感评价:负面+正面 示例3:这部电影不好不坏。情感评价:中性 待分类评论:这部电影音乐动人,但剧情略显平淡。 — 输出: 情感评价:正面+负面 解释:评论中提到“音乐动人”属于正面评价,表明了对电影音乐部分的喜爱和赞赏。然而,紧接着的“但剧情略显平淡”则为负面评价,表达了对电影剧情的不满或失望。因此,整体评价是正面和负面情感的混合。 |
---|
c 分配角色
赋予模型一个具体的角色或身份,如“作为经验丰富的营养师”,来引导模型在特定角色视角下生成回答。
未增加角色 **** 提示词: 请对刚入住的酒店进行评价。 — 输出: 刚入住的这家酒店给我留下了深刻的印象,整体体验非常满意。 | 增加A角色 + ![]() 提示词: 你是一名酒店评论家,请对刚入住的酒店进行评价。 — 输出: 我对刚入住的这家酒店进行了全方位的考察与体验,现就其各项服务与设施作出如下评价: 位置与周边环境:该酒店位于城市中心地带… 建筑与设计:酒店建筑风格独特,融合了… 服务质量:酒店员工专业素养极高,从接待到… 餐饮设施:酒店内设有多家风格各异的餐厅… 休闲与健身设施:酒店配备完善的休闲与健身… 环保与社会责任:酒店在运营过程中展现出… 综上所述,这家酒店凭借其优越的地理位置、独具匠心的设计、卓越的服务质量、丰富的餐饮选择、完善的休闲设施以及对环保与社会责任的积极践行,为宾客打造了一处兼具舒适性、便利性与文化内涵的高品质下榻之所。无论是商务出行还是休闲度假,这里无疑都是理想的选择,我对此给予高度评价。 | 增加B角色![]() + 提示词: 你是一名刚上小学的学生,请对训练营入住的酒店进行评价。 — 输出: 嗨,我是刚上小学的小朋友,参加了这个训练营,现在我要来分享一下我住的酒店怎么样! 房间超酷!:哇哦,我的房间就像一个小城堡!… 好吃的食物:酒店的饭菜超级好吃!… 好玩的地方:酒店里有个大大的游戏室… 友好的叔叔阿姨:酒店的叔叔阿姨们都对我很好… 安全又干净:酒店到处都很干净,地板亮晶晶的… 总的来说,我非常喜欢这个训练营入住的酒店,它像一个充满乐趣的大乐园,让我在学习之余还能尽情玩耍,享受到家一般的温馨和舒适。如果下次还有训练营,我一定还想再来这里住! |
---|
d 限定输出风格/格式
大语言模型非常善于撰写论文、文章
- 明确指出所需的内容类型,如“论文/散文/诗歌/新闻报道/剧本/日记”等。
- 用形容词限定风格,如“严谨客观”、“感性抒情”、“幽默诙谐”、“庄重典雅”等。
- 列举风格(代表人物/作品)示例,如“仿照鲁迅先生的笔触描述社会现象”或“以J.K.罗琳的叙述风格撰写一段奇幻冒险故事”。
- 设定语境与情感色彩:为模型设定故事背景、情感基调或角色视角,影响其语言表达和修辞选择,从而形成特定风格。如“以一名二战老兵的视角,深情回忆战场经历”。
- 规定语言与句式特点:要求使用特定词汇、短语、成语、俚语、古语等,或强调长句、短句、排比、反问、比喻等修辞手法的运用,以契合特定风格。
F 拆解复杂任务(思维链)
一个复杂的任务,拆解成多个稍微简单的任务,让大语言模型分步来思考问题,称为思维链(Chain-of-Thought Prompting, CoT)
标准提示 提示词: 小明有20个苹果,吃了两个,又买了5个,小明现在一共有多少苹果? — 输出: 27 | 【思维链提示】 提示词: 小明有20个苹果,吃了两个,又买了5个,小明现在一共有多少苹果,通过思维链CoT的方式来分析。 — 输出: 初始小明最初有20个苹果。小明吃了2个苹果后,他剩下20−2=18个苹果。接着,小明又买了5个苹果,所以他现在的苹果数量是 18+5=23个苹果。 因此,通过这个思维链的分析,我们可以得出结论:小明现在一共有23个苹果。 |
---|
(三)提示词框架
1 框架概念,就是做事、构建事物时的基本结构或大致轮廓
打个比方,盖房子时,框架是由梁柱搭建的“骨架”,决定房子形状与空间布局,后续才考虑装修细节。写文章先列提纲,这提纲就是框架,明确文章分几部分、各部分内容及先后顺序,避免跑题、让结构更合理。日常用的表格,行和列构成框架,规定了信息的填写位置,让信息规整、便于查看整理。 总之,框架是做事前预设的结构或规划,能帮我们有条理、高效地推进后续工作,让事物有清晰架构 。
2 框架要素(专有名词的)
专有名词 | ||
---|---|---|
指令 Instruction: | 需要模型去做什么,如回答某个问题、撰写某种类型的文章或按照特定格式进行总结。指令应该简洁、明确,确保 LLM 能够理解任务的目标和要求 | |
背景信息 Context: | 背景信息可以包括任务的背景、目的相关的各类信息,还可以为 LLM 设置角色背景、观点立场等信息,LLM 将在此背景下进行回应或生成文本。 | |
参考样本 Examples: | 与解决用户问题相关的示例,比如通过少样本提示的方式帮助 LLM 更好理解如何处理指令 | |
输出指示 Output Indicator: | 指定输出的类型或格式,我们可以给出限定关键词、限制条件或要求的输出格式/方式(如表格),也可以避免无关或不期望的信息出现 | |
输入数据 Input Data: | 用户输入指令和要求,比如用什么语气,生成多少字的内容。 |
a 指令,就是给模型下的“紧箍咒”
得简单直白,让它秒懂要回答问题、写文章,还是按格式总结,含糊了模型可就抓瞎。
b 背景信息堪称模型的“秘密武器”
交代任务背景、目的,给它设定角色立场。有了这玩意儿,模型输出内容就有谱,不会跑偏。
c 参考样本则是模型的“模范标兵”
给它类似示例,就像老师教做题,模型照葫芦画瓢,处理指令更得心应手。 输入数据,是咱用户给模型的“独家定制”,语气、字数要求都在这。模型就按要求,精准“营业”。
d 输出指示是给模型画的“标准圈”
规定输出类型、格式,限定关键词、条件,或指定表格形式,杜绝无关信息,让输出规范又漂亮。这下都清楚啦!
(四) 提示词框架示例
背景信息”+“指令”+“输出指示
提示词:
背景知识:“阿里云弹性容器实例 ECI(Elastic Container Instance)是敏捷安全的Serverless容器运行服务。您无需管理底层服务器,也无需关心运行过程中的容量规划,只需要提供打包好的Docker镜像,即可运行容器,并仅为容器实际运行消耗的资源付费。”
请参考如上背景知识回答如下问题:
问题:阿里云弹性容器实例 ECI 是用来运行什么的?
回答:分别使用中文和英文回答
输出:
中文回答:阿里云弹性容器实例 ECI 是用来运行 Docker 容器的。
英文回答:Alibaba Cloud Elastic Container Instance (ECI) is used to run Docker containers.
(五) 常见提示词框架及场景
框架 | 具体应用领域(举例子) | 内容含义 |
---|---|---|
CRISPE | 项目管理、团队协作、客户服务 | 能力 (Capabilities) 角色 (Roles) 洞察 (Insights) 陈述 (Statement) 个性 (Personality) 实验 (Experiment) |
ROSES | 软件开发、产品设计、市场营销策略规划 | 角色 (Role) 目标 (Objective) 场景 (Setting) 预期解决方案 (Expected Solution) 步骤 (Steps) |
TRACE | 市场研究、业务分析、教学设计 | 任务 (Task) 请求 (Request) 操作 (Action) 上下文 (Context) 示例 (Examples) |
二 推理模型
一 推理模型通常指专门优化用于逻辑推理、问题解决、多步推断等任务的模型
维度 | 推理模型 | 通用模型 |
---|---|---|
设计目标 | 专注于逻辑推理、多步问题求解、数学计算等需要深度分析的任务 | 面向通用对话、知识问答、文本生成等广泛场景 |
训练数据侧重 | 大量数学题解、代码逻辑、科学推理数据集增强推理能力 | 覆盖百科、文学、对话等多领域海量数据 |
典型输出特征 | 输出包含完整推导步骤,注重逻辑链条的完整性 | 输出简洁直接,侧重结果的自然语言表达 |
响应速度 | 复杂推理任务响应较慢(需多步计算) | 常规任务响应更快(单步生成为主) |
二 高效处理推理模型
- 直接提问:保持提示简洁、清晰,且明确任务限制。
- 避免思维链提示:你无需提示推理模型“逐步思考”或“解释你的推理”,它们本身会进行深入的思考。
- 根据模型响应调整提示词:直接提问推理模型通常能够产生良好的响应,但如果你有更复杂精细的要求,可以在提示词中明确,比如有明确的输入信息和输出要求时,你可以通过增加示例明确这些信息,还可以通过分隔符帮助推理模型区分不同的信息模块。这个过程可以是重复多次的,不断尝试调整提示,让模型不断推理迭代,直到符合你的要求。