AI大模型应用与实践指南

  大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。

  本文主要介绍了人工智能大模型应用指南,从入门到精通的AI实践教程,希望能对学习大模型的同学们有所帮助。

文章目录

  • 1. 前言
  • 2. 书籍推荐
    • 2.1 本书特色
    • 2.2 内容简介
    • 2.3 本书作者
    • 2.4 本书目录
    • 2.5 适合读者

1. 前言

  在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。

  • 第一次是互联网时代的兴起,将世界各地连接在一起,改变了人们获取信息和交流的方式。

  • 第二次则是移动互联网时代的到来,智能手机和移动应用程序的普及使人们可以随时随地与他人交流、获取信息和进行商务活动。

  然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。

  2022年11月30日,OpenAI发布了ChatGPT:一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。

  一经发布,ChatGPT 就在市场上引起了强烈反响,月活跃用户数在接下来的两个月迅速突破一亿,打破了互联网行业的用户增长纪录,成为史上增长最快的消费者应用。

  然而,ChatGPT的出现只是一个开端。

  随后,GPT-4、Alpaca、Bard、 ChatGLM、LLaMA、 Claude、Gemini等大语言模型相继问世,呈现出百花齐放的局面。

  这一趋势预示着未来将会有更多的大语言模型涌现,为消费者提供更丰富的体验,进而改变我们与科技互动的方式。

  这一变革的兴奋之处在于,我们或许正处在人类历史上的第四次工业革命的起始阶段。

  这一次,不再是机械化、电气化带来的变革,而是智能化、自动化的革命,将重塑人类社会的方方面面。

  然而,这种变革也带来了焦虑。

  大语言模型的广泛应用将极大地改变各行各业,特别是泛内容产业的规则、生态和格局。

  泛内容产业是一个多元化的领域,包括但不限于编程与软件开发、自媒体与内容创作、娱乐内容制作和传播、游戏开发和运营以及教育内容制作和传播等。

  这些领域将面临前所未有的挑战和机遇,需要不断调整和创新,以适应智能时代的到来。

  2023年11月,OpenAI的创始成员Andrej Karpathy提出了一个引人入胜的观点:未来,大语言模型极有可能发展到与当前计算机操作系统的地位相当。

  他形象地比喻说,我们可以将大语言模型及其周边生态系统看作一种崭新的操作系统。

  大语言模型就像计算机中的中央处理器,它的批处理大小相当于CPU的核心数,而每秒处理的 token数量则相当于CPU的主频,以Hz为单位。这些参数决定了模型的计算能力和处理速度。而语言模型的上下文窗口大小则相当于计算机的内存大小,它决定了模型能够同时考虑的信息量和短期记忆的大小。

  外部数据在语言模型中扮演着长期记忆的角色,类似于计算机的磁盘。这些外部数据的组织方式就像计算机磁盘中的文件系统一样,它们存储和管理着模型需要的信息,供其随时调取。此外,语言模型接收和输出的文本、音频、视频相当于计算机的输入输出设备,它们是模型与外界交互的媒介。

  最后,大语言模型不仅可以与其他模型进行网络通信,还能够通过浏览器访问互联网上的信息,以及利用外部工具执行传统的计算机操作。这种广泛的联接和应用使得语言模型在信息处理和应用方面具有了前所未有的能力和灵活性。

  LLM as OS, Agents as Apps: Envisioning AIOS, Agents and the AIOS-Agent Ecosystem_论文的作者也持有与Andrej Karpathy 相似的观点。

  在这篇论文中,作者提出了 AIOS-Agent 生态系统的概念,并将其与现今的操作系统(OS) -应用程序(App)生态系统进行了比较。下面展示了它们之间的类比关系。

  未来,大语言模型很有可能以这种全新形态融入人类的日常生活和工作中。人类将从移动互联网时代迈入智能时代,应用的载体也将由应用程序逐渐转变为基于大语言模型的智能体。

2. 书籍推荐

  未来,大语言模型极有可能发展到与当前计算机操作系统的地位相当,因此,应用大语言模型可以说是每个人不可或缺的技能。

  《大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程(全彩)》 一书将帮助大家更好地理解和使用大语言模型,即使你对人工智能技术或编程技术一窍不通,也不用担心。本书将用通俗易懂的语言和例子,讲述大语言模型的基本原理、基础使用方法和进阶开发技巧。

2.1 本书特色

  本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:

  • 一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;

  • 二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

2.2 内容简介

  本书的读者对象是大语言模型的使用者和应用开发者,全书共分为4篇。

  • 第1篇讲述机器学习、神经网络的基本概念,自然语言处理的发展历程,以及大语言模型的基本原理。鉴于本书的重点在于大语言模型的应用和二次开发,因此本书将不涉及大语言模型的训练细节。然而,我们仍强烈建议读者熟悉每个关键术语的含义,并了解大语言模型的工作流程,以更好地理解后面的内容。

  • 第2篇讲述大语言模型的基础应用技巧。首先,介绍大语言模型常用的3种交互格式。随后,深入讲解提示工程、工作记忆与长短期记忆,以及外部工具等与大语言模型使用相关的概念。最后,对大语言模型生态系统中的关键参与者——ChatGPT的接口与扩展功能进行详解。

  • 第3篇讲述大语言模型的进阶应用技巧。首先,介绍如何将大语言模型应用于无梯度优化,从而拓宽大语言模型的应用领域。随后,详细讨论各类基于大语言模型的自主Agent系统,以及微调的基本原理。最后,介绍与大语言模型相关的安全技术。

  • 第4篇讲述大语言模型的未来。一方面,探讨大语言模型的生态系统和前景,简要介绍多模态大语言模型和相关的提示工程。另一方面,深入解析大语言模型的尺度定律,并尝试从无损压缩的角度来解析大语言模型具备智能的原因,最后以图灵机与大语言模型的联系作为全书的结尾。

2.3 本书作者

  万俊,南京大学计算数学专业本硕;现任中国香港瑞银软件工程师;OPPO前高级数据挖掘工程师 ;蚂蚁集团前高级机器学习、数据工程师 ;Udacity前机器学习和深度学习资深讲师;曾多次在各类数据竞赛中获奖(Kaggle Kesci Data Castle);已发表CCF A类论文一篇,EI论文一篇,神经网络测试专利一个 ;LeetCode专栏作家,著有“Enlighten AI”专栏。

2.4 本书目录

1篇 基础
第1章 从人工智能的起源到大语言模型 2
11 人工智能的起源 2
111 机器能思考吗 2
112 达特茅斯会议 3
12 什么是机器学习 4
121 演绎推理与归纳推理 4
122 人工编程与自动编程 5
123 机器学习的过程 5
124 机器学习的分类 8
13 什么是神经网络 9
131 还原论与涌现性 9
132 神经网络的发展历史 10
133 神经网络基础 11
134 神经网络的三要素 13
14 自然语言处理的发展历程 17
141 什么是自然语言处理 17
142 文本的向量化 18
143 神经网络中的自监督学习 21
15 大语言模型 24
151 什么是大语言模型 24
152 语言模型中的token 25
153 自回归模型与文本生成 33
154 统一自然语言任务 41
155 大语言模型的训练过程 44
156 大语言模型的局限性 462篇 入门
第2章 交互格式 50
21 Completion交互格式 50
22 ChatML交互格式 52
23 Chat Completion交互格式 543章 提示工程 57
31 什么是提示工程 57
32 提示的构成 58
33 提示的基础技巧 62
331 在提示的末尾重复关键指令 63
332 使用更清晰的语法 63
333 尽量使用示例 65
334 明确要求大语言模型回复高质量的响应 65
34 Chat Completion交互格式中的提示 65
35 提示模板与多轮对话 694章 工作记忆与长短期记忆 72
41 什么是工作记忆 72
42 减轻工作记忆的负担 74
421 Chain-of-Thought 74
422 Self-Consistency 76
423 Least-to-Most 76
424 Tree-of-Tought和Graph -of-Tought 79
425 Algorithm-of-Tought 85
426 Chain-of-Density 88
43 关于大语言模型的思考能力 90
44 长短期记忆 91
441 什么是记忆 91
442 短期记忆 92
443 长期记忆 1055章 外部工具 122
51 为什么需要外部工具 122
52 什么是外部工具 122
53 使用外部工具的基本原理 124
54 基于提示的工具 126
541 Self-ask 框架 126
542 ReAct 框架 128
543 改进ReAct框架 134
55 基于微调的工具 137
551 Toolformer 137
552 Gorilla 140
553 function calling 1416章 ChatGPT接口与扩展功能详解 149
61 OpenAI大语言模型简介 149
62 ChatGPT扩展功能原理 151
621 网页实时浏览 152
622 执行Python代码 153
623 图像生成 154
624 本地文件浏览 157
63 Chat Completion接口参数详解 158
631 模型响应返回的参数 158
632 向模型发起请求的参数 159
64 Assistants API 162
641 工具 162
642 线程 163
643 运行 163
644 Assistants API整体执行过程 164
65 GPTs与GPT商店 164
651 GPTs功能详解 165
652 GPT商店介绍 172
653 案例:私人邮件助手 1743篇 进阶
第7章 无梯度优化 184
71 单步优化 184
72 强化学习入门 188
73 多步优化中的预测 191
74 多步优化中的训练 194
75 多步优化中的训练和预测 2018章 自主Agent系统 210
81 自主Agent系统简介 210
82 自主Agent系统的基本组成 211
83 自主Agent系统案例分析(一) 213
831 BabyAGI 213
832 AutoGPT 216
833 BeeBot 221
834 Open Interpreter 228
835 MemGPT 232
84 自主Agent系统案例分析(二) 243
841 CAMEL 243
842 ChatEval 246
843 Generative Agents 2509章 微调 262
91 三类微调方法 262
92 Transformer解码器详解 264
921 Transformer的原始输入 264
922 静态编码和位置编码 264
923 Transformer层 265
93 高效参数微调 268
931 Adapter高效微调 268
932 Prompt高效微调 269
933 LoRA高效微调 272
934 高效微调总结 274
94 微调RAG框架 275
941 RAG框架微调概述 275
942 数据准备和参数微调 276
943 效果评估 27610章 大语言模型的安全技术 280
101 提示注入攻击 280
1011 攻击策略 281
1012 防御策略 284
102 越狱攻击与数据投毒 285
1021 冲突的目标与不匹配的泛化 285
1022 对抗样本 286
1023 数据投毒 289
103 幻觉和偏见问题 292
104 为大语言模型添加水印 2944篇 展望
第11章 大语言模型的生态与未来 298
111 多模态大语言模型 298
1111 什么是多模态 298
1112 GPT-4V简介 300
1113 Gemini简介 303
112 大语言模型的生态系统 308
113 大语言模型的第一性原理:尺度定律 311
1131 什么是尺度定律 312
1132 尺度定律的性质 313
1133 尺度定律的未来 320
114 通向通用人工智能:压缩即智能 321
1141 编码与无损压缩 322
1142 自回归与无损压缩 331
1143 无损压缩的极限 336
115 图灵机与大语言模型:可计算性与时间复杂度 342
1151 图灵机与神经网络 342
1152 智能的可计算性 346
1153 逻辑推理的时间复杂度 349
参考文献 352

2.5 适合读者

  无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/8304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

虚拟机镜像文件格式qcow2转zst

一、使用qcow2文件还原出pve虚拟机 1.1、在pve上创建一个空的新虚拟机 把虚拟机的网卡和磁盘删除 将外部磁盘镜像为vm中未使用的磁盘。这个镜像格式必须是qemu-img支持的镜像格式(qcow2/raw/vmdk) qm importdisk 101 bigdata-ubuntu-x86.qcow2 local-lvm此时查看pve上虚拟机…

Leetcode167两数之和

题目链接&#xff1a; 167两数之和 解题思路: 缩减空间法 // 167 两数之和 缩减搜索空间方法 vector<int> twoSum(vector<int>& numbers, int target) {int i 0;int j numbers.size() - 1;while (i < j){int tmp numbers[i] numbers[j];if (tmp tar…

3D人体展示仪

网址 https://3dbodyvisualizer.com/ 可以根据身高体重之类的在线生成人体的3D模型&#xff0c;感兴趣的可以试试

Flutter-Statewidget 创建State过程State<XXXX> createState() => _XXXXState()的解释

文章目录 创建widget 的状态对象示例代码解析 完整的代码示例总结 创建widget 的状态对象 今天有个同学问了我下State createState() > _XXXXState()时什么意思。这个代码在flutter开发中一直看到&#xff0c;很多人都不关心这个&#xff0c;直接当模板使用。今天来介绍下这…

2024蓝桥杯CTF writeUP--packet

根据流量分析&#xff0c;我们可以知道129是攻击机&#xff0c;128被留了php后门&#xff0c;129通过get请求来获得数据 129请求ls Respons在这 里面有flag文件 这里请求打开flag文件&#xff0c;并以base64编码流传输回来 获得flag的base64的数据 然后解码 到手

抖音快速涨粉方法揭秘:巨量千川投流助力你快速增粉1000~10万!

在当前热门社交媒体平台中&#xff0c;抖音无疑是备受追捧的。然而&#xff0c;要在抖音上快速涨粉并获得更多关注&#xff0c;是一项具有挑战性的任务。但别担心&#xff01;今天&#xff0c;我们将揭秘全网都在搜索的抖音快速涨1000粉的秘籍&#xff0c;教你如何利用巨量千川…

返回链表的中间节点题目讲解(超快方法)

一&#xff1a;题目 二&#xff1a;思路讲解 采用快慢指针方法来解决 1&#xff1a;slow指针一次跳一个节点&#xff0c;fast指针一次跳两个节点&#xff0c;这样当fast到尾节点的时候&#xff0c;slow刚好到中间节点&#xff0c;但是奇数个的时候&#xff0c;fast不会刚好的…

Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》

Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》 一、参与方式二、作者荐语三、图书简介四、本期推荐图书4.1 前 言4.2 本书内容4.3 本书目的4.4 本书适合的读者4.5 配套源码、PPT课件等资源下载 五、目 录六、&#x1f6d2; 链接直达 Hadoop框架入门书&#xff0c;可当…

语言模型测试系列【7】

语言模型 文心一言星火认知大模型通义千问豆包360智脑百川大模型腾讯混元助手Kimi Chat商量C知道 今天看CSDN文章&#xff0c;看到了斐波那契数列这个有趣的数列计算&#xff0c;然后就在文心一言中对答了一波&#xff0c;给的答案很完整&#xff0c;而且给出来python的实现代…

Golang | Leetcode Golang题解之第69题x的平方根

题目&#xff1a; 题解&#xff1a; func mySqrt(x int) int {if x 0 {return 0}C, x0 : float64(x), float64(x)for {xi : 0.5 * (x0 C/x0)if math.Abs(x0 - xi) < 1e-7 {break}x0 xi}return int(x0) }

【GUI软件】调用YouTube的API接口,采集关键词搜索结果,并封装成界面工具!

文章目录 一、背景介绍1.1 爬取目标1.2 演示视频1.3 软件说明 二、代码讲解2.1 调用API-搜索接口2.2 调用API-详情接口2.3 API_KEY说明2.4 软件界面模块2.5 日志模块 三、获取源码及软件 一、背景介绍 1.1 爬取目标 您好&#xff01;我是马哥python说&#xff0c;一名10年程序…

D盘被格式化了能找回吗 d盘格式化了数据可以找回来吗

D盘作为电脑中重要的磁盘之一&#xff0c;很多用户都会将一些重要的数据保存在D盘。但在磁盘空间不足的情况下&#xff0c;或许有些用户会将其进行格式化&#xff0c;D盘被格式化了如何恢复数据&#xff1f; 如果是比较重要的数据&#xff0c;建议用户立即进行数据恢复操作&am…

Ansible之Playbook的Template模板和tags标签

文章目录 一、Template模块1、准备template模板文件2、修改主机清单文件3、编写playbook4、执行playbook5、准备测试网页6、访问测试 二、tags模块1、编写脚本2、执行tags"xx01"3、执行tags"xx02" 一、Template模块 Jinja是基于Python的模块引擎。Templat…

小米手机怎么截屏?一篇文章教会你!

我们经常需要截取手机屏幕上的内容&#xff0c;无论是为了分享、教学还是记录。对于小米手机用户来说&#xff0c;掌握截屏技巧不仅能够方便地记录精彩瞬间&#xff0c;还能在需要时轻松分享或保存屏幕内容。小米手机怎么截屏&#xff0c;有哪些截屏方式呢&#xff1f;本文将为…

idea快捷键被占用,如何解决ctrl+\ 为例

本来这个这个快捷键ctrl\ 是只有restful 插件才生效的&#xff0c;但是idea升级了之后&#xff0c;多了个 AI Assistant 这样他也有个快捷键是这个&#xff0c; 所以 需要借助 settings - keymap - 直接找到右边的放大镜&#xff0c;可以输入快捷键查询 把ai 那个啥玩意…

什么是香草看涨期权?香草看涨期权有哪些特点?

什么是香草看涨期权&#xff1f;香草看涨期权有哪些特点&#xff1f; 香草看涨期权&#xff0c;通常也称为香草期权&#xff0c;是金融市场上的一种金融衍生品&#xff0c;由券商或金融机构推出。它允许投资者以较小的费用获取相应股票市值的收益权&#xff0c;主要用于风险管…

Python爬虫获取豆瓣电影Top100

大家好&#xff0c;我是秋意零。 今天分析一篇&#xff0c;Python爬虫获取豆瓣电影Top100。 在此之前&#xff0c;我没有学习过爬虫&#xff0c;只有一丢丢的Python基础。下面效果的实现源码几乎没经过我&#xff0c;而是AI百老师。我主要负责了对应的调试以及根据我想要的功…

5月7号(信息差)

&#x1f30d;首次&#xff0c;西湖大学用蛋白质语言模型定向改造碱基编辑器&#xff0c;登Cell子刊 https://www.jiqizhixin.com/articles/2024-05-07-10 &#x1f384; 哈马斯宣布同意停火提议 https://finance.eastmoney.com/a/202405073067687785.html ✨ 中国将对…

吴恩达机器学习笔记:第 9 周-16推荐系统(Recommender Systems) 16.3-16.4

目录 第 9 周 16、 推荐系统(Recommender Systems)16.3 协同过滤16.4 协同过滤算法 第 9 周 16、 推荐系统(Recommender Systems) 16.3 协同过滤 在之前的基于内容的推荐系统中&#xff0c;对于每一部电影&#xff0c;我们都掌握了可用的特征&#xff0c;使用这些特征训练出了…

推荐网站(6)33台词,通过台词找电影、电视剧、纪录片等素材

今天推荐一个网站33台词&#xff0c;你可以根据电影、电视剧、纪录片等某一段台词&#xff0c;来找到来源&#xff0c;帮你精确到多少分多少秒出现的&#xff0c;非常的好用&#xff0c;尤其是对那种只记得一些经典台词&#xff0c;不知道是哪个电影的人来说&#xff0c;帮助巨…