prompt开发生命周期

在这里插入图片描述

1.定义任务场景和成功标准

任务场景可分为简单任务:实体抽取、qa等
复杂任务:代码生成、创意写作等

在定义任务后,就要定义模型实现该任务的成功标准:
模型表现和准确率;延迟;价格。

2.开发测试用例

多样化的测试用例覆盖任务的典型应用和边缘情况。

3.设计初始的prompt

设计最初的prompt,从简单描述任务场景、回答的风格等开始。最好是使用few-shot的方式,告诉模型的输入输出格式。

4.针对测试用例评估prompt

将测试用例使用初始的prompt输入到模型,观察和评估回复内容,并与成功标准作比较。使用一致的评分标准,可以是人工评估、与答案核心内容的比较或是用其他模型的回答判断等。

5.优化prompt

根据评估结果,朝着成功标准迭代优化prompt。包括但不限于增加描述明细、示例、模型行为的约束。但是要注意不要过分优化小部分的输入,否则会过拟合。

6.部署prompt

一旦设计的prompt成功通过了测试用例,就可以将其应用。注意监控模型表现,边缘情况等意外仍随时可能发生。

准则:

  1. 清晰直接:提供清晰的指令和背景信息以指导Claude的回应。
  2. 使用示例:在提示中包含示例以展示期望的输出格式或风格。
  3. 赋予Claude角色:让Claude扮演一个特定的角色(如专家),以提升针对你的用例的表现。
  4. 使用XML标签:利用XML标签来结构化提示和回应,以提高清晰度。
  5. 分解提示:将复杂任务分解成更小、更易管理的步骤,以获得更好的结果。
  6. 让Claude思考:鼓励逐步思考以提高Claude输出的质量。
  7. 预填充Claude的回应:用几个词开始Claude的回应,以将其输出引向期望的方向。
  8. 控制输出格式:指定期望的输出格式以确保一致性和可读性。
  9. 请求Claude进行重写:基于评分标准请求修订,以促使Claude迭代并改进其输出。
  10. 利用长上下文窗口技巧:优化利用Claude长上下文窗口的提示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/755709.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue2(七):超详细vue开发环境搭建(win7),nodejs下载与安装,安装淘宝镜像(报错已解决),配置脚手架

一、安装node.js 本来想粗略写一下的,但是搭建脚手架的时候,遇到了很多问题,浪费快两天时间,记录一下自己的解决办法希望对你们有帮助! 1.下载nodejs 安装包下载链接【CNPM Binaries Mirror】 下载我划线的这个&am…

代码随想录算法训练营第25天| 216.组合总和III、17.电话号码的字母组合

216.组合总和III 题目链接:组合总和III 题目描述:找出所有相加之和为 n **的 k ****个数的组合,且满足下列条件: 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次&#xff0c…

2024热门外贸独立站wordpress模板

工艺品wordpress外贸主题 简约大气的wordpress外贸主题,适合做工艺品进出品外贸的公司官网使用。 https://www.jianzhanpress.com/?p5377 日用百货wordpress外贸主题 蓝色大气的wordpress外贸主题,适合做日用百货的外贸公司搭建跨境电商网站使用。 …

Qt教程 — 3.3 深入了解Qt 控件:Input Widgets部件(2)

目录 1 Input Widgets简介 2 如何使用Input Widgets部件 2.1 QSpinBox组件-窗口背景不透明调节器 2.2 DoubleSpinBox 组件-来调节程序窗口的整体大小 2.3 QTimeEdit、QDateEdit、QDateTimeEdit组件-编辑日期和时间的小部件 Input Widgets部件部件较多,将分为三…

centos上安装Docker

0.安装Docker Docker 分为 CE 和 EE 两大版本。CE 即社区版(免费,支持周期 7 个月),EE 即企业版,强调安全,付费使用,支持周期 24 个月。 Docker CE 分为 stable test 和 nightly 三个更新频道…

PlantUML Integration 编写短信服务类图

PlantUML Integration 写一个类图,主要功能为 1、编写一个serviceSms短信服务类; 2、需要用到短信的地方统一调用基建层的服务即可; 3、可以随意切换、增加短信厂商,不需要更改场景代码,只需要更改application.yml 里面…

13个外贸业务员常用邮件模板-订单沟通

除了报价后跟进客户,我们在实际工作过程当中也会遇到很多非常规性的情况,需要和客户及时沟通处理。 以下是13个外贸业务员常用邮件模板-订单沟通:你可以根据自己的行业、公司、产品情况以及自身的经验判断进行调整和完善,做出一套…

水下蓝牙耳机哪个牌子好?业界公认四大高口碑游泳耳机

在这个活力四溢的时代,人们对于健康生活方式的追求愈发热切,游泳作为一项兼顾休闲与健身的运动,深受大众喜爱。在水下世界,音乐的陪伴能增添游泳的乐趣,一款好的水下蓝牙耳机成为游泳爱好者们的新宠。 近年来&#xff…

DZY-212中间继电器 DC 220V 板后接线 面板安装 JOSEF约瑟

系列型号: DZY-200系列中间继电器;DZY-201中间继电器; DZY-202中间继电器;DZY-203中间继电器; DZY-204中间继电器;DZY-205中间继电器; DZY-206中间继电器;DZY-207中间继电器; DZY-20…

openEuler 22.03(华为欧拉)一键安装 Oracle 19C(19.22) 数据库

前言 Oracle 一键安装脚本,演示 openEuler 22.03 一键安装 Oracle 19C 单机版过程(全程无需人工干预):(脚本包括 ORALCE PSU/OJVM 等补丁自动安装) ⭐️ 脚本下载地址:Shell脚本安装Oracle数据…

ssh免密登陆更换目标主机后无法连接

在进行hadoop分布式环境搭建时(三台机,master,slave1,slave2),后期slave2系统出现问题,更换新机后,master与slave2文件传输失败: 以为是秘钥过期的问题,更换…

走出大模型部署新手村!小明这样用魔搭+函数计算

作者:拓山 前文介绍了魔搭 ModelScope 社区模型服务 SwingDeploy 服务。开发者可以将模型从魔搭社区的模型库一键部署至阿里云函数计算,当选择模型并部署时,系统会选择对应的机器配置。按需使用可以在根据工作负载动态的减少资源&#xff0c…

c++多长时间会被Python或者其他语言取代?

c多长时间会被Python或者其他语言取代? 如果不考虑市场因素,C#今天就可以取代C。 自.NET跨平台至今,C能做的工作,C#都能做了,且性能差别不大。 在C最有优势的嵌入式UI方面,C#可以拿出Avalonia替代QT。用 …

9.16单词拆分(LC139-M)

算法: 这道题可以用回溯,但是可能会超时 可以用背包问题解决: 物品:单词 背包:字符串: 单词能否组成字符串s,就是问物品能不能把背包装满。 拆分时可以重复使用字典中的单词,就…

M4芯片和核心板应用于工业网关解决方案

在工业级应用中,M4芯片和核心板凭借其丰富的接口和强大的性能及高性价比特点,已经成为众多工业设备中的首选。本文将从M4芯片和核心板的特点、应用场景、以及其在工业级网关中的应用等方面进行详细阐述。 一、M4芯片和核心板的特点 M4芯片和核心板以其…

nfs介绍与配置

NFS 1. nfs简介 nfs特点 NFS(Network File System)即网络文件系统,是FreeBSD支持的文件系统中的一种,它允许网络中的计算机之间通过TCP/IP网络共享资源在NFS的应用中,本地NFS的客户端应用可以透明地读写位于远端NFS服…

camelot pdf提取表格实践(记录)

参考: 巧用Python的camelot库批量提取PDF发票信息 关于文本pdf的表格抽取 AttributeError: module ‘camelot‘ has no attribute ‘read_pdf‘及类似问题解决办法 camelot 参数 https://blog.csdn.net/INTSIG/article/details/123000010 报错解决: Mod…

美团大规模KV存储挑战与架构实践

KV 存储作为美团一项重要的在线存储服务,承载了在线服务每天万亿级的请求量,并且保持着 99.995% 的服务可用性。在 DataFunSummit 2023 数据基础架构峰会上,我们分享了《美团大规模 KV 存储挑战与架构实践》,本文为演讲内容的整理…

探讨NLP对行业大量数据信息抽取的技术实现

在本文中,为了实现高效的信息抽取,我们采用了一个自主研发的多模态AI的大模型NLP平台。 这个平台的使用过程分为以下几个步骤: 数据收集:我们收集了与项目相关的100条数据样本,这些样本涵盖了各种商品描述&#xff0c…

Go web 基础相关知识

Go web Web工作方式 浏览器本身是一个客户端,当你输入URL的时候,首先浏览器会去请求DNS服务器,通过DNS获取相应的域名对应的IP,然后通过IP地址找到IP对应的服务器后,要求建立TCP连接,等浏览器发送完HTTP …