AIGC(生成式AI)试用 16 -- 续1,调优和提示词

    本欲结束AIGC的试用,后来的一场AIGC的专业培训讲解,觉得还是有必要再记录些什么。
    个人揣摩是一回事,毕竟与专业还是有着差距。
    揣摩是实践,专业是理论,无论从实践到理论,还是理论到实践,彼此结合总是有着更深入的理解。
    * 培训内容 / 基础专业词汇  / 学习文档。。。,一点点的补起来。
    看懂看不懂的,也许只是现在,慢慢会多明白一些。

Fine tuning and Prompt 调优和提示词

1. 生成式AI

  • 定义:与AI模型进行交互的输入(指令、问题、文本),生成有效的输出(答案或描述)
  • Prompt,提示词

    - 短语、句子、段落 --> 引导模型 --> 生成相关文本、图像、音频
    - 指令,参数,有效训练
    - 对预训练模型的复用:将优化的下游任务目标转换为预训练任务 
    - 应清晰、具体
    - 控制生成模型行为
    - 生成符合特定需求或上下文的内容

    - Prompt 是一种针对特定任务的指令
    - Prompt 是一种对预训练目标的复用
    - Prompt 本质是模型参数有效性训练
  • 目的:生成任务的输入和预期的输出,生成符合特定需求或上下文的内容
  • 分类

    - 模型预训练 Pre-Training,自定义所有训练内容(词汇量,上下文长度,数据)
    - 模型微调 Fine-Tuning,特定任务和特定数据,专项训练
    - 提示词工程 Prompt Engineering,自定义提示词;通过清晰、具体的prompt,控制模型的行为,生成符合特定需求或上下文的内容
  • 形式

    - 问题或指令 --> 引导模型生成答案或文本
    - 开放性描述(主题、概念) --> 由模型按理解生成输出
    - 示例输入(样例)--> 模型从样例中学习,推断规则和模式
    - 对话式(交互进行对话或指令)--> 模型基于上下文生成回应
  • 为什么需要Prompt

    -  引导:明确意图和任务
    - 限制内容生成:避免随机、不相关、不适当、冒犯、不合规的输出
    - 提高模型可控性:精确控制模型行为,符合上下文需求
    - 增强模型适应性:适应不同任务、应用、领域、场景、类型
    - 提高性能:提高试验收敛性,减少不必要的试错,节省时间和资源
    - 实验和对比:对比结果,优化实验和训练,优化性能
    - 个性化和定制:按不同用户需求,满足不同要求
  • 类型

    - 角色扮演
    - 短提示。需求、样例、指标。。。
    - 基于选择的问答提示
    - 引导性提示(起个开头然后生成内容)。基于需求的问答依据(事实、信念或假设),引导至特定的方向
    - 逐步提示,逐步深入。保持主观,基于需求进行描述性提示
  • 构成 -- 再来个续2

    参考,Prompt-Tuning——深度解读一种新的微调范式 - 知乎   (学习文档 1)
    - Examples
    - Directions
    - Parameters
    - Format
    - Chaining

2. 预训练模型

  • MLM,Multimodal Large Models,多模态大模型   (词汇 1)

    - 基于深度神经网络的预训练模型
    - 一种自监督的训练方法
    - 先从大规模的无监督语料上通过固定的替换策略获得自监督语料,设计预训练的目标来训练模型
  • PET,Pattern-Exploiting Training,模式探索训练   (词汇 2)
    参考,提示学习:PET系列 - 知乎   (学习文档 2)
               解读 PET:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference - 知乎    (学习文档 3)
               
    Exploiting Cloze-Questions for Few-Shot Text Classification and Natural Language Inference - ACL Anthology   (学习文档 4)
  • PVP,Pattern-Verbalizer-Pair,模板(Pattern)与标签映射器(Verbalizer)对    (词汇 3)

    参考,Prompt Tuning:深度解读一种新的微调范式    (学习文档 5)
    Template
    - 构建合适的pattern
    - Pattern,模式:一个定义了用户提供的输入应该是什么样的结构或形式的规则或模板;用于生成式 AI 模型的输入,引导模型理解用户的请求或任务。
    - Verbalizer,表述,标签词的映射:一个用自然语言示范了与Pattern匹配的输入应该是什么样的示例文本;用于说明模式中占位符的填充方式和期望的生成结果。
  • LLM,Large Language Models,大语言模型

    参考,万字长文:LLM能力与应用全解析 - 知乎  (学习文档 6)
  • PLM,Pre-trained Lanaguage Models,预训练语言模型 
  • CoT,Chain of Thought,思维链

    参考,一文读懂:大模型思维链 CoT(Chain of Thought) - 知乎  (学习文档 7)
    - Zero-Shot 
    - Zero-Shot CoT 
    - Manual CoT 
    - Auto-CoT
  • ToT,Tree of Thought,思维树

    参考,[Paper Reading] 思维树 Tree of Thoughts - 知乎   (学习文档 8)
    - Propose prompt
    - Value Prompt 

3. Prompt 的局限和风险

  • 局限

    - 无法拓展 LLM 的知识边界
    - 受限于 LLM Context Windows
  • 风险

    - 提示词注入,Prompt injection
    - 信息泄露
    - 越狱、破解,JailBreaking

4. LLM Fine-Tuning,大语言模型调优

  • 基于预训练模型基础上,使用特定领域的语料进行继续训练,以便模型适应领域任务。步骤:
    - 选择预训练好的通用语言模型
    - 选择调优所需的特定领域语料
    - 在预训练模型基础之上,使用特定领域的语料继续训练模型(以较少的参数调整,适应新语料)
    - 在特定任务上调优模型,微调模型参数
    - 获得一个性能提升、适用特定领域和任务的调优模型
  • 调优适用情况
    - 应用于模型预训练时没有遇到过的领域时(获得更好的性能,弥补数量或计算资源不足)
    - 应于到模型不同的下游任务时
    - 预训练语料和目标任务语料存在分布偏差时
    - 目标任务数据较少时,先预训练再目标任务
    - 希望获得定制化的语言模型时
    - 计算资源有限时(训练所需GPU或服务资源有限)
    - 想要快速适配不同任务时(基于预训练的非0基础训练)
  • Parameter-efficient Fine-tuning,模型参数有效性训练

    参考,LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS      (学习文档 9)
    ​​​​​​​- 模型规模剧增,参数增加迅速
    - 训练大型数据集可能需要很长时间
    - 大型模型对于所选的硬件来说可能太大,导致无法训练,因为模型规模超过了 GPU 内存规模
    - 分布式训练可以有效解决大规模数据、大参数下的模型训练的性能、资源问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/599291.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode 超难题目 Hard

动态规划 2945. 找到最大非递减数组的长度 (难度分2943,“超难”) 这道题很有可能是LC主站(LCP除外)新的天花板,之所以难度分没有超过1719题,是因为双周赛样本量本身不多,而这题有一定的“猜结论”。某个LC积分2900+的大佬认为,即使数据范围只有1000,这也是一道相当…

基于MyCat2.0实现MySQL分库分表方案

目录 一、MyCat概述 二、MyCat作用 2.1 数据分片 2.1.1 垂直拆分 2.1.1.1 垂直分库 2.1.1.2 垂直分表 2.1.1.3 总结 2.1.2 水平拆分 2.1.2.1 水平分库 2.1.2.2 水平分表 2.1.2.3 总结 2.2 读写分离 2.3 多数据源整合 三、MyCat 与ShardingJDBC的区别 3.1 MyCat …

某大型电商APP sign头部签名逆向分析

APP版本 唯品会 7.45Java层抓包分析 打开抓包工具 charles进行分析,可以发现对于API采集需要突破当前这个参数,否则不返回信息 jadx静态分析 jadx静态分析,打开app搜索关键词api_sign,可以发现有参数位置 跟进去上边str赋值方…

phpstudy_pro 关于多版本php的问题

我在phpstudy中安装了多个PHP版本 我希望不同的网站可以对应不同的PHP版本,则在nginx配置文件中需要知道不同的PHP版本的监听端口是多少,如下图所示 然而找遍了php.ini配置,并未对listen进行设置,好奇是怎么实现不同的PHP监听不同…

时代变了,Spring 官方抛弃了 Java 8!

先容许我吐槽一句:Spring 官方,窝草尼玛! 原谅我很愤怒!最近编程导航星球和群友们反复问一个问题:为啥用 IDEA 创建 Spring Boot 项目时,不能选择 Java 8 了? 我本来以为是 IDEA 版本更新导致的…

html+css 有关于less的使用和全面解释

目录 less 注释 运算 嵌套 变量 导入 导出 禁止导出 less Less是一个CSS预处理器, Less文件后缀是.less。扩充了 CSS 语言, 使 CSS 具备一定的逻辑性、计算能力 注意:浏览器不识别 Less 代码,目前阶段,网页要引入对应的 CSS 文件 V…

Flink与Kafka集成:跨版本兼容性与性能优化实战

目录 问题背景 一、统一转发Kafka消息 二、回退到基本API 添加 Kafka 客户端库依赖

聚道云软件连接器助力某动漫行业公司实现财务自动化

客户介绍 某动漫行业公司是一家专注于文化创意领域,致力于为人们提供独特、有趣的文化产品。公司拥有一支充满活力和创造力的团队,他们以卓越的创意和精湛的技术,创造出了一系列令人惊叹的作品。未来,该公司将继续秉承这一理念&a…

C++入门【21-C++ 指针 vs 数组】

指针和数组是密切相关的。事实上&#xff0c;指针和数组在很多情况下是可以互换的。例如&#xff0c;一个指向数组开头的指针&#xff0c;可以通过使用指针的算术运算或数组索引来访问数组。请看下面的程序&#xff1a; 实例 #include <iostream> using namespace std;…

若依前后端分离版关联字典值查询数据工具类使用

场景 若依管理系统导出Excel时添加没有的列和关联码表显示中文进行导出&#xff1a; 若依管理系统导出Excel时添加没有的列和关联码表显示中文进行导出_若依的导出添加额外的字段信息-CSDN博客 上面通过关联表的方式实现查询字典值&#xff0c;若依本身提供了查询redis中缓存…

ANTLR4

配置开发环境 下载antlr4 jar包 https://github.com/antlr/antlr4/blob/master/doc/getting-started.md #安装jdk11和antlr4.13 # wget https://github.com/antlr/antlr4/archive/refs/tags/4.13.1.tar.gz # wget https://repo.huaweicloud.com/java/jdk/11.0.29/jdk-11.0.2…

1.5C语言 双曲正弦函数(*) 优化麦克劳林公式

一.传统算法 #include<stdio.h> #include<math.h> int jc(int x); int main(){double x,eps,y0.0;scanf("%lf%lf",&x,&eps);int de1,i1;double item1.0;while(fabs(item)>eps){itempow(x,i)/jc(de);i2;yitem;}printf("%.6f\n",y); …

力扣122. 买卖股票的最佳时机 II

动态规划 思路&#xff1a; 假设 dp[i][0] 是第 i 天手上没有股票时的最大利润&#xff0c; dp[i][1] 是第 i 天手上有 1 支股票的最大利润&#xff1b;dp[i][0] 的迁移状态为&#xff1a; dp[i - 1][0]&#xff0c;前一天手上已经没有股票&#xff0c;没有发生交易&#xff1…

buildroot 编译错误【001】

在GitHub 查找错误,也挺好用 解决办法 fakeroot 错误

linux 安装vscode后打开,报错 undefined symbol:gbm_bo_get_modifier

更换低版本安装 教程如下&#xff1a; Jetson AGX 安装 VScode 教程&#xff0c;适用于所有系统安装旧版本 VScode_vscode 低版本-CSDN博客

UE相关杂项笔记

1.PAK包解析 UE4如何反向查找Pak里面包含哪些文件 - 哔哩哔哩 CMD控制台命令输入 D:&quot;Epic Games&quot;\UE_5.1\Engine\Binaries\Win64\UnrealPak.exe 包路径 -list *文件夹带空格时 添加“ ”包裹住文件夹名 解包工具路径 UE引擎安装路径\UE_5.1\Engine\Binarie…

从Spring Cloud Alibaba开始聊架构

作为SpringCloudAlibaba微服务架构实战派上下册和RocketMQ消息中间件实战派上下册的作者胡弦。 另外我的新书RocketMQ消息中间件实战派上下册&#xff0c;在京东已经上架啦&#xff0c;目前都是5折&#xff0c;非常的实惠。 https://item.jd.com/14337086.htmlhttps://item.jd…

服务端如何防止订单重复支付

概述 如图是一个简化的下单流程&#xff0c;首先是提交订单&#xff0c;然后是支付。 支付的话&#xff0c;一般是走支付网关&#xff08;支付中心&#xff09;&#xff0c;然后支付中心与第三方支付渠道&#xff08;微信、支付宝、银联&#xff09;交互。 支付成功以后&…

C语言——指针

一、定义 指针也就是内存地址&#xff0c;指针变量是用来存放内存地址的变量。 将内存以一个字节分为一个个内存单元&#xff0c;每个内存单元都进行编号&#xff0c;这个编号就是地址&#xff0c;也就是指针。 int b 1;int *pb &b;//这里的pb变量是一个整型指针变量&a…

某音关键词搜索商品接口,某音关键词搜索商品列表接口,宝贝详情页接口,某音商品比价接口接入方案

要接入API接口以采集电商平台上的商品数据&#xff0c;可以按照以下步骤进行&#xff1a; 1、找到可用的API接口&#xff1a;首先&#xff0c;需要找到支持查询商品信息的API接口。这些信息通常可以在电商平台的官方文档或开发者门户网站上找到。 2、注册并获取API密钥&#x…