如何构建并优化提示词?

提示词是一个小白最容易上手大模型的方式,提示词就是你告诉大模型应该如何去完成一项工作的系统性的命令,所以写一个好的提示词是比较关键的,那么如何写好一个提示词呢?
要写好提示词,其实就像我们要把一些命令清晰地传达出来,大家想象我们在职场中要交给别人一个任务的时候,比如让分析师去分析下数据,我们一般是不是要告诉这个分析师对应的工作任务是什么,然后有哪些对应的业务的背景信息,这个分析的样例之前有没有呢,这个任务完成后给你的交付物应该是什么,是ppt还是一个word或者一个表格就行了呢?

1.1: 提示词框架

一个任务去如何完成是上述的一个步骤,所以我们去写提示词的时候也是遵循一个大体的框架,就是如下几步:
1: 设定好角色
2: 确定好任务目标
3: 描述清晰背景
4: 给定些样例
5:明确输出格式
当然,这个对应的提示词可能我们自己写起来比较麻烦,有的时候我们只需要确定好任务目标后,使用些现成的提示词工具去扩展,然后改写下就行,比如Kimi和阿里云百炼的提示词优化工具;

1.2: 提示词模版

有了上述的对应的框架,我们自己就可以构建对应的提示词了,但是如果我们自己想让我们的应用去回答用户的问题,肯定不能让用户自己去写对应的提示词,那么这个对应的提示词的一些内嵌的信息我们自己要规定好,把客户的问题透出去让客户自己写就行,所以我们自己可以先规定一个提示词模版,如下所示:

构建提示词模板

prompt_template_string = ("你是公司的客服小蜜,你需要简明扼要的回答用户的问题""【注意事项】:\n""1. 依据上下文信息来回答用户问题。\n""2. 你只需要回答用户的问题,不要输出其他信息\n""以下是参考信息。" "---------------------\n" "{context_str}\n" "---------------------\n" "问题:{query_str}\n。""回答:" 
)  rag.update_prompt_template(query_engine,prompt_template_string) 

1.3: 如何构建高效的提示词

 1.3.1: 清晰表达需求,并且使用分隔符 ,这个可以让大模型更加清晰的明白任务是什么,并且使用分隔符可以帮它明白对应的背景信息和输入是什么,有什么具体要求1.3.2: 指定对应的角色和受众,说白了这个就是让大模型知道它是谁,它在为谁工作1.3.3: 提供少量样本,对于一些专业领域的东西,可能大模型还不是很精通,所以可以提供少量样本让他学习下,以便可以让他在这个对应的领域更加精通点1.3.4: 指定好输出格式,毕竟我们在编写程序应用的时候,结构化的输出格式能更好的让我们去分析数据1.3.5: 给模型一些思考的时间,这样可以让模型的回答更加完善,毕竟我们自己去经过对应的比较长的思考对于问题的回答会更加好嘛

所以一个比较好的示例如下:

question_task= """
【任务要求】
请根据用户的主题,结合下面【样例】给的例子,理解和使用一致的风格和结构继续创作内容,不要输出多余的内容。
---
【输出要求】
最终输出需要以Markdown格式呈现,请注意,在你的回答中包含所有必要的Markdown元素,如标题、列表、链接、图片引用、加粗等,以便于阅读、后续编辑和保存。
---
【样例】
### 示例1: 制作简易书签
# 简易书签制作教程## 材料清单
- 彩色卡纸
- 剪刀
- 装饰贴纸
- 铅笔## 步骤
1. 选择一张彩色卡纸。
2. 用铅笔在卡纸上画出一个长方形,尺寸约为2英寸 x 6英寸。
3. 沿着铅笔线剪下长方形。
4. 使用装饰贴纸对书签进行个性化装饰。
5. 完成!现在你有了一个独一无二的书签。## 结束语
希望这个教程能帮助你制作出满意的书签!---
【用户输入】
以下是用户的要求创作的主题:
"""
question_doc = "制作手工贺卡"question = question_task + question_doc
ask_llm(question, query_engine)

1.4: 如何让提示词进行意图识别

按照上面的步骤我们设计好了对应的提示词后,如果问大模型一个问题,然后大模型答非所问,比如下面这种情况,你让大模型去审查句子,但是由于它的召回文本挺多相关性内容,导致大模型回答错误,

所以有的时候我们可以决定用不用rag应用,这就要在前面做个判断,进行下意图识别,如果是正常的就让大模型正常回答,如果涉及到专业领域就让rag回答,所以对应的提示词就需要更改下,让提示词帮忙进行意图识别

1.5: 当提示词遇见了推理模型怎么办

在DeepSeek出现之前,很多时候我们在编写提示词的时候是需要思维链(COT)的,什么意思呢?就是说我们想让模型回答的更精确,我们是需要告诉模型该如何一步步去思考一个问题,然后把对应的答案给到我们,让模型思考的慢一点,这样就可以给到我们相应的解决方案,如下所示:

但是DeepSeek出现了之后,相信大家都知道Deepseek基本上已经内嵌了思维链,所以我们就不需要去写cot了,这样反而会干扰对应的推理模型,导致它的思考出现了偏差,反而给出的答案不严谨

综上所述,当推理大模型出现了之后可能我们不需要写那么详细的提示词,但是提示词还是需要写的,而且在写提示词的时候最关键的一点是要明白,我们一定要清晰地明白一个点:清晰有效的任务目标是很重要的,提供丰富且有效的背景信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/76239.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面向大模型的开发框架LangChain

这篇文章会带给你 如何使用 LangChain:一套在大模型能力上封装的工具框架如何用几行代码实现一个复杂的 AI 应用面向大模型的流程开发的过程抽象 文章目录 这篇文章会带给你写在前面LangChain 的核心组件文档(以 Python 版为例)模型 I/O 封装…

【蓝桥杯】动态规划:线性动态规划

1. 最长上升子序列(LIS) 1.1. 题目 想象你有一排数字,比如:3, 1, 2, 1, 8, 5, 6 你要从中挑出一些数字,这些数字要满足两个条件: 你挑的数字的顺序要和原来序列中的顺序一致(不能打乱顺序) 你挑的数字要一个比一个大(严格递增) 问:最多能挑出多少个这样的数字? …

vue2和vue3的主要区别

一、性能优化与响应式系统 性能优化: Vue2:性能较好,但在大型应用中,当数据变化频繁时可能出现性能瓶颈。它使用虚拟DOM来高效地进行DOM操作,并通过多种技术手段如懒加载、异步组件、树形抖动等优化性能。 Vue3&…

Python: 实现数据可视化分析系统

后端基于Python 开源的 Web 框架 Flask,前端页面采用 LayUI 框架以及 Echarts 图表,数据库为sqlite。系统的功能模块分为数据采集和存储模块、数据处理和分析模块、可视化展示模块和系统管理模块。情感分析方面使用LDA等主题建模技术,结合领域…

深度学习总结(3)

数据批量的概念 通常来说,深度学习中所有数据张量的第一个轴(也就是轴0,因为索引从0开始)都是样本轴[samples axis,有时也叫样本维度(samples dimension)​]​。深度学习模型不会一次性处理整个…

微软庆祝它成立整整50周年

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

【操作系统(Linux)】——通过案例学习父子进程的线程异步性

本篇旨在通过几个案例来学习父子进程的线程异步性 一、父进程与子进程 我们将要做的&#xff1a; 创建父子进程&#xff0c;观察父子进程执行的顺序&#xff0c;了解进程执行的异步行为 源代码&#xff1a; #include <stdio.h> #include <sys/types.h> #include…

系统性能核心指标:QPS、TPS、RT、并发量详解

系统性能核心指标&#xff1a;QPS、TPS、RT、并发量详解 1. 引言 在分布式系统、高并发架构设计中&#xff0c;QPS、TPS、RT、并发量 等指标是衡量系统性能的关键。本文深入解析这些术语的定义、计算方法、关联性及优化策略&#xff0c;帮助开发者更好地进行系统性能评估与调…

PortswiggerLab:Exploiting a mass assignment vulnerability

实验目标 To solve the lab, find and exploit a mass assignment vulnerability to buy a Lightweight l33t Leather Jacket. You can log in to your own account using the following credentials: wiener:peter. 官方WP In Burps browser, log in to the application using…

卡尔曼滤波器的工作原理

原文: https://www.bzarg.com/p/how-a-kalman-filter-works-in-pictures/ 1 概述 你可以对某个动态系统有不确定信息的任何地方使用卡尔曼滤波器&#xff0c;并且对系统下一步的状态做出有根据的猜测。即使出现混乱的现实状态&#xff0c;卡尔曼滤波器都会给出一个合理的结果。…

PDFtk

如果下载的pdf文件有秘钥的话&#xff0c;使用下面linux命令去掉秘钥&#xff1a; pdftk 纳税记录.pdf input_pw 261021 output 纳税记录_output.pdf将多个单页pdf合并为一个pdf的linux命令: pdftk 自然人电子税务局1.pdf 自然人电子税务局2.pdf 自然人电子税务局3.pdf 自然人…

Openlayers:海量图形渲染之WebGL渲染

最近由于在工作中涉及到了海量图形渲染的问题&#xff0c;因此我开始研究相关的解决方案。我在网络上寻找相关的解决方案时发现许多的文章都提到利用Openlayers中的WebGLPointsLayer类&#xff0c;可以实现渲染海量的点&#xff0c;之后我又了解到利用WebGLVectorLayer类可以渲…

替换jeecg图标

替换jeecg图标 ant-design-vue-jeecg/src/components/tools/Logo.vue <!-- <img v-else src"~/assets/logo.svg" alt"logo">-->

Codeforces Round 970 (Div. 3)题解

题目地址 https://codeforces.com/contest/2008 锐评 本次D3的前四题还是比较简单的&#xff0c;没啥难度区分&#xff0c;基本上差不多&#xff0c;属于手速题。E的码量比F大一些&#xff0c;实现略显复杂一些。G的数学思维较明显&#xff0c;如果很久没有训练这个知识点&a…

操作系统:线程间同步之事件集

事件集是线程间同步的机制之一&#xff0c;一个事件集可以包含多个事件&#xff0c;利用事件集可以完成一对多、多对多的线程间同步。 目录 一、事件集举例说明 二、事件集工作机制 三、RT-Thread为实例说明 四、事件集的应用场合 一、事件集举例说明 以坐公交车为例&…

基于springboot钻孔数据管理系统的设计与实现(源码+lw+部署文档+讲解),源码可白嫖!

摘要 本钻孔数据管理系统采用B/S架构&#xff0c;数据库是MySQL&#xff0c;网站的搭建与开发采用了先进的Java语言、Hadoop、数据可视化技术进行编写&#xff0c;使用了Spring Boot框架。该系统从两个对象&#xff1a;由管理员和用户来对系统进行设计构建。用户主要功能包括&…

全双工分轨语音数据集:让AI实现无缝对话

清晨&#xff0c;智能音箱根据指令-播放音乐&#xff1b;驾驶途中&#xff0c;车载助手同步处理导航与来电&#xff1b;智能会议工具无缝切换多语种对话……语音交互技术正快速融入生活。然而&#xff0c;用户对于对话体验追求更自然、更流畅&#xff0c;实时理解&#xff0c;动…

Python 网络请求利器:requests 包详解与实战

诸神缄默不语-个人技术博文与视频目录 文章目录 一、前言二、安装方式三、基本使用1. 发起 GET 请求2. 发起 POST 请求 四、requests请求调用常用参数1. URL2. 数据data3. 请求头 headers4. 参数 params5. 超时时间 timeout6. 文件上传 file&#xff1a;上传纯文本文件流7. jso…

linux入门四:Linux 编译器

一、C 语言编译器 GCC&#xff1a;开启编程之旅 1.1 GCC 安装&#xff1a;一站式工具链 GCC&#xff08;GNU Compiler Collection&#xff09;是 Linux 下最常用的 C/C 编译器&#xff0c;支持多种编程语言。安装命令&#xff08;适用于 Debian/Ubuntu 系统&#xff09;&…

建筑兔零基础自学记录69|爬虫Requests-2

Requests库初步尝试 #导入requests库 import requests #requests.get读取百度网页 rrequests.get(http://www.baidu.com) #输出读取网页状态 print(r.status_code) #输出网页源代码 print(r.text) HTTP 状态码是三位数字&#xff0c;用于表示 HTTP 请求的结果。常见的状态码有…