AIGC学习笔记(1)——AI大模型提示词工程师

文章目录

  • AI大模型提示词工程师
    • 1 Prompt工程之原理
      • 1.1 AIGC的发展和产业前景
        • 前言
        • AIGC时代的到来
        • 发展趋势和应用展望
      • 1.2 大模型的类型和特点
        • 大模型的对比
        • 上手
        • 特点
      • 1.3 大模型技术原理和发展
        • 成语接龙和暴力穷举
        • ChatGPT如何理解人类语言
        • 如何存储数据
        • 图像存储
        • 电脑存数字
        • 如何让电脑知道存的什么?
        • 向量化
        • 为什么需要向量化
        • 向量可以计算
        • 难点
        • 调整位置
        • 科学的方式
        • Word2vec算法
        • 信息压缩与特征提取
        • 谷歌论文-自注意力机制
        • TransFormer算法演进
        • 通用人工智能模型
    • 2 Prompt工程之原则
      • 2.1 设计Prompt的3个原则
        • 相关性
        • 确定焦点
        • 清晰度
      • 2.2 设计Prompt的1个万能公式
      • 2.3 设计Prompt的5个技巧
      • 2.4 设计Prompt高质量答案的2个窍门
    • 3 Prompt工程之迭代
      • 3.1 Prompt优化与迭代
      • 3.2 Prompt样本提示
        • 零样本提示(Zero-shot Prompting)
        • 少量样本提示(Few-shot Prompting)
      • 3.3 Prompt思维链提示
        • 文本转化
        • Zero-shot CoT 零样本思维链
        • 自洽性/自一致性(Self-Consistency)
      • 3.4 Prompt生成知识提示
        • 生成知识提示(Generate Knowledge Prompting)
    • 4 Prompt工程之应用
        • 4.1 Prompt文本总结
      • 4.2 Prompt文本判断
      • 4.3 Prompt文本转化
      • 4.4 Prompt文本扩展

AI大模型提示词工程师

1 Prompt工程之原理

1.1 AIGC的发展和产业前景

前言
  • 什么是AI?
    • 人工智能(Artificial Intelligence)
  • 什么是AGI?
    • 通用人工智能(Artificial General Intelligence)
  • 什么是AI2.0?
    • ChatGPT的横空出世代表着 AI2.0 时代,也就是通用人工智能时代
  • 什么是大模型?
    • 是大规模语言模型(Large Language Model)的简称。语言模型是一种人工智能模型,他被训练成理解和生成人类语言。“大”是指模型的参数量非常大,比如ChatGPT、文心一言等。
AIGC时代的到来
  • 出现了大量的内容生产工具,比如 ChatGPT、Midjourney、Stable Diffusion等。
  • PGC专业生成内容(Professional Generated Content)
  • UGC用户生成内容(User Generated Content)
  • AIGC人工智能生成内容(Artificial Intelligence Generated Content)
发展趋势和应用展望
  • 发展趋势:
    • 更强大的模型
    • 多模态的生成
    • 个性化生成
  • 应用展望:
    • 内容创作和自动写作
    • 娱乐和游戏
    • 广告和营销
    • 个性化组手和教育
    • 自动化客服
  • 会不会是泡沫?
    • OpenAI创始人 Sam Altman:AI是少有的被严重炒作之后,还被严重低估的东西。

1.2 大模型的类型和特点

大模型的对比

image.png

上手

image.png

特点
  • 知识丰富
  • 道德感强,法律边界清晰
  • 有记忆力,可联系上下文
  • 知错就改
  • 知人晓事

1.3 大模型技术原理和发展

成语接龙和暴力穷举

image.png

ChatGPT如何理解人类语言
  • 计算机底层:二进制
  • 将 现实问题 转化为 数学问题
如何存储数据
图像存储
电脑存数字
如何让电脑知道存的什么?
  • 向量化
  • 信息压缩与特征提取
向量化
  • 将 东西 与 数字组合,比如 [0, 180, 75, 35] 分别表示 [性别, 身高, 体重, 年龄]
为什么需要向量化
  • 方便电脑处理
  • 寻找规律
向量可以计算
难点
  • 坐标要多少维度?
  • 每个维度代表什么?
调整位置
  • 通过计算距离,不断调整位置
科学的方式

image.png

Word2vec算法

image.png

信息压缩与特征提取

image.png

谷歌论文-自注意力机制
  • 解决了自然语言特征提取的问题

image.png

TransFormer算法演进

image.png

通用人工智能模型
  • 在此之前,都是一些细分领域:围棋、玩游戏、图像识别、设计模型、标注数据等
  • 而通用人工智能,是利用自然语言,理解整个文明成果的能力,和人类无缝交流的能力

image.png

image.png

2 Prompt工程之原则

2.1 设计Prompt的3个原则

相关性
  • 提示词应该与当前话题或内容相关。
确定焦点
  • 提示词应该能够引起人们的注意力并帮助他们专注于重点。
  • 避免用一些专业的术语,或者一些模糊的语言。
清晰度
  • 提示词应该能够明确传达出想要表达的意思。

2.2 设计Prompt的1个万能公式

  • 内容前提:让ChatGPT知道你是谁
  • 角色设定:给ChatGPT赋予一个身份,让他知道他是谁
  • 明确目标:明确的目标指令,指令一定要清晰
  • 补充需求:回答需要注意什么,或者回答范围和形式等

image.png

2.3 设计Prompt的5个技巧

  • 优化表达式
  • 用继续不断输出
  • 由浅入深,提升问题质量
  • 预设回答方案
  • 给参考答案,让GPT更懂你

2.4 设计Prompt高质量答案的2个窍门

  • 加强 GPT 的思辨分析意识
  • 给 GPT 划分范围

3 Prompt工程之迭代

3.1 Prompt优化与迭代

  • 通常情况下,Prompt很难一次性到位,就需要根据大模型给出的结果,然后不断迭代Prompt

3.2 Prompt样本提示

零样本提示(Zero-shot Prompting)
  • 也就是不需要微调,不需要提供任何示例样本就可以直接通过提问来让模型解决相应的任务。这是因为模型本身就通过了大量数据进行了训练。
少量样本提示(Few-shot Prompting)
  • 在需求比较复杂时,可以使用 few-shot 少量样本提示,相当于在 Prompt 中给问题提供一个 Context 上下文,在上下文里给模型提供示例。
  • 这个示例的作用实际是引导,引导模型找到对应的回答方式,从而生成更准确的响应。

3.3 Prompt思维链提示

文本转化
  • 对于一些需要推理的复杂任务,few-shot就无能为力了。这个时候就引申出一个概念:思维链提示-CoT(Chain-of-Thought Prompting)通常涉及到推理的复杂任务,并不是一步直接得到答案,中间会有很多的计算和推理过程。
在这些数字中,1,3,5,23,69,70,10,84,923,32 有多少个奇数,多少个偶数。
Zero-shot CoT 零样本思维链
  • 让 AI 通过思维推理,分析出最终答案
在这些数字中,1,3,5,23,69,70,10,84,923,32 有多少个奇数,多少个偶数。请一步一步思考
自洽性/自一致性(Self-Consistency)
  • 让ChatGPT 产生多个思维链,也就是多个推理路径,最终选择一个一致性最高的答案。
为一个问题,提供3个解决方案,最终结合3个解决方案给出与问题一致性最高的答案
从北京如何到大理?

3.4 Prompt生成知识提示

生成知识提示(Generate Knowledge Prompting)
  • 还有很小情况下,我们无论怎么让模型思考,都无法解决我们的问题。因为模型本身可能缺少解决问题的背景知识,或者模型想到不到要用什么背景知识。
    • 前者:只能是我们主动通过上下文 Context 的方式把背景知识直接添加到 Prompt 中,再让模型去回答。
    • 后者:可以先给模型一些示例,让模型自己去生成对应问题的背景知识,这个技巧就是【生成知识提示】。这样有了背景知识后,再把生成后的背景知识添加到 Context 中向模型提问,这样模型因为有了背景知识自然就能准确回答我们的问题。

4 Prompt工程之应用

4.1 Prompt文本总结
  • 可以总结评论、新闻等文案,生成简短的摘要

image.png

4.2 Prompt文本判断

  • 输入文本,执行模种分析任务,可能是:提取标签、提取名称、理解文本情感

image.png

4.3 Prompt文本转化

  • 擅长将输出转化为不同格式,比如从一种语言翻译成另一种语言,帮助拼写、语法纠正和编写正则表达式。

image.png

4.4 Prompt文本扩展

  • 将短文本,例如一组说明或主题列表,输入到大语言模型中,让模型生成更长的文本,例如基于某个主题的电子邮件或论文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/601501.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

商智C店H5性能优化实战

前言 商智C店,是依托移动低码能力搭建的一个应用,产品面向B端商家。随着应用体量持续增大,考虑产品定位及用户体验,我们针对性能较差页面做了一次优化,并取得了不错的效果,用户体验值(UEI&…

面部识别技术的突破:IP-Adapter-FaceID实现上传照片秒变多面人生

IP-Adapter-FaceID通过上传个人照片,仅需几分钟即可克隆一个高度真实的个性化面部图像。IP-Adapter-FaceID的独特之处在于,它不仅捕捉到个体的基本外貌特征,更深入地嵌入了面部识别模型的面部ID,使生成的图像在细节上更为准确和逼…

前端--基础 常用标签-超链接标签 外部链接( herf 和 target)

目录 超链接标签 &#xff1a; 超链接的语法格式 &#xff1a; 超链接的属性 &#xff1a; 超链接的分类 &#xff1a; 外部链接 &#xff1a; 超链接标签 &#xff1a; # 在 HTML 标签中&#xff0c;<a> 标签用于定义超链接&#xff0c;作用是从一个页面…

cookie和session、请求转发和重定向

会话 分为有状态会话和无状态会话 在HTML中&#xff0c;"会话"一般指的是Web服务器与客户端&#xff08;通常是浏览器&#xff09;之间进行的一系列请求和响应。它是一种在网络上模拟人与人之间通信的方式&#xff0c;常见于Web应用程序中。 会话、Cookie和Sessio…

(Python + Selenium4)Web自动化测试自学Day2之动手尝试

目录 文章声明⭐⭐⭐让我们开始今天的学习吧&#xff01;小试牛刀关于select标签关于弹窗只有一个点击按钮的弹窗需要确认的弹窗用户可以输入的弹窗 文章声明⭐⭐⭐ 该文章为我&#xff08;有编程语言基础&#xff0c;非编程小白&#xff09;的 Python Selenium4 Web自动化测试…

Servlet 3.0的异步处理

1、传统Servlet处理 Web容器会为每个请求分配一个线程&#xff0c;默认情况下&#xff0c;响应完成前&#xff0c;该线程占用的资源都不会被释放。若有些请求需要长时间(例如长处理时间运算、等待某个资源)&#xff0c;就会长时间占用线程所需资源&#xff0c;若这类请求很多&…

印象笔记02: 笔记本管理系统和空间使用

印象笔记02&#xff1a; 笔记本管理系统和空间使用 印象笔记新建笔记是一件非常容易的事情。笔记多了&#xff0c;就是归纳到笔记本里。 印象笔记一共有三层的笔记结构&#xff1a;最高层级是笔记本组&#xff0c;其次是笔记本&#xff0c;最后是一个个的笔记。合理的分类能够…

【计算机毕业设计】SSM在线化妆品网站

项目介绍 本项目为前后台项目&#xff0c;前台为普通用户登录&#xff0c;后台为管理员登录&#xff1b; 管理员角色包含以下功能&#xff1a; 管理员登录,分类管理,产品管理,用户管理,订单管理等功能。 用户角色包含以下功能&#xff1a; 提交订单,用户登录,用户首页,查看…

产品ESD测试

ESD(Electrical Static Discharge)产生的原因多种多样&#xff0c;对集成电路放电的方式也有所不同。为了保证集成电路产品的良率&#xff0c;提高可靠性&#xff0c;需要对电路ESD防护能力进行测试。一般测试分为两类&#xff1a;样品研究型测试和产品通过型测试&#xff1a; …

CHS_01.1.1.1+1.1.3+操作系统的概念、功能

CHS_01.1.1.11.1.3操作系统的概念、功能 操作系统的概念和定义那我们看一下我们现在所使用的电脑是怎么样一步一步变成我们现在看到的这个样子的操作系统 它是计算机系统当中最基本的系统软件 操作系统 它要向上层提供方便应用的服务 这是什么意思呢我们先来看第一种联机命令接…

配置文件的创建和部署

配置描述文件&#xff08;Configuration Profiles&#xff09;的格式为xml&#xff0c;其提供了一个非常容易的方式去给电脑、移动设备或用户定义一些设置或限制&#xff0c;你可以使用Jamf Pro去创建这样的配置文件。 &#xff08;配置文件的负载&#xff09; 有关配置文件的配…

【电源专题】电池充放电中常说的0.2C是什么概念

在工作中我们时常会听到老员工说拿这个电池去做一下充放电,以0.2C充,0.2C放。那么这个0.2C到底是啥? 这就要说到电池C-rate概念。在《GB 31241:便携式电子产品用锂离子电池和电池安全要求》中我们可以看到3.7中写了额定容量为C,也就是制造商标明的电池或电池组容量。 那么…

Java经典框架之Zookeeper

Zookeeper Java 是第一大编程语言和开发平台。它有助于企业降低成本、缩短开发周期、推动创新以及改善应用服务。如今全球有数百万开发人员运行着超过 51 亿个 Java 虚拟机&#xff0c;Java 仍是企业和开发人员的首选开发平台。 课程内容的介绍 1. Zookeeper的介绍和安装 2. …

程序性能优化全能手册

本文聊一个程序员都会关注的问题&#xff1a;性能。 当大家谈到“性能”时&#xff0c;你首先想到的会是什么&#xff1f; 是每次请求需要多长时间才能返回&#xff1f; 是每秒钟能够处理多少次请求&#xff1f; 还是程序的CPU和内存使用率高不高&#xff1f; 这些问题基本上…

Visual Studio Code安装C#开发工具包并编写ASP.NET Core Web应用

前言 前段时间微软发布了适用于VS Code的C#开发工具包&#xff08;注意目前该包还属于预发布状态但是可以正常使用&#xff09;&#xff0c;因为之前看过网上的一些使用VS Code搭建.NET Core环境的教程看着还挺复杂的就一直没有尝试使用VS Code来编写.NET Core。不过听说C# 开发…

C++结合OpenCV:图像的基本表示方法

1.二值图像 二值图像是指仅仅包含黑色和白色两种颜色的图像。在计算机中&#xff0c;通过一个栅格状排列的数据集&#xff08;矩阵&#xff09;来表示和处理图像。例如&#xff0c;图1是一个字母A的图像&#xff0c;计算机在处理该图像时&#xff0c;会首先将其划分为一个个的小…

6 网关和配置服务器

文章目录 网关模式Spring Cloud网关Spring Cloud网关微服务其他项目的变更运行和测试小结 运行状况Spring Boot Actuator在微服务中包含Actuator 服务发现和负载均衡ConsulSpring Cloud ConsulSpring Cloud负载均衡器网关中的服务发现和负载均衡使用服务发现和负载均衡 环境配置…

数据库开发之事务和索引的详细解析

2. 事务 场景&#xff1a;学工部整个部门解散了&#xff0c;该部门及部门下的员工都需要删除了。 操作&#xff1a; -- 删除学工部 delete from dept where id 1; -- 删除成功 ​ -- 删除学工部的员工 delete from emp where dept_id 1; -- 删除失败&#xff08;操作过程中…

windows下载官方正版notepad++

一、前言 notepad是一款非常好用的编辑器&#xff0c;简洁、快速、高效。可是很多时候我们想去官网下载时&#xff0c;百度出来的都是一堆第三方下载地址&#xff0c;捆绑流氓软件&#xff0c;要么就是付费&#xff0c;作为一款优秀开源软件&#xff0c;我们必须要知道正确的下…

用Redis实现全局唯一ID

全局唯一ID 如果使用数据库自增ID就存在一些问题&#xff1a; id的规律性太明显受表数据量的限制 全局ID生成器&#xff0c;是一种在分布式系统下用来生成全局唯一ID的工具&#xff0c;一般要满足下列特性&#xff1a; 唯一性高可用递增性安全性高性能 为了增加ID的安全性…