学习大语言模型(LLM),从这里开始

在见识了ChatGPT的各种强大能力后,不少 NLP一线从业人员很自然地想到,以后开发者只要借助 ChatGPT,就可以做到现在大部分NLP工程师在做的事,比如文本分类、实体抽取、文本推理等。甚至随着大语言模型(largelanguagemodel,LLM)能力的不断提升,它们可能做得比NLP 工程师都要好。

如何利用大语言模型做一些NLP任务或服务?这本关于大语言模型的开发指南《ChatGPT原理与应用开发》来啦!

ChatGPT原理与应用开发

Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品。

本书主要面向非算法、有一定编程基础、对人工智能和 ChatGPT(或其他类似的大语言模型)感兴趣,并乐意使用大语言模型接口开发相关应用的读者。当然,部分内容不需要任何编程经验也可以学习。通过本书进一步降低大语言模型的使用 门槛,让更多对人工智能和大语言模型感兴趣的非 NLP 工程师或算法专业人士, 能够无障碍地使用大语言模型并创造价值。希望新的技术突破能够更多地改善我 们所处的世界。

本书内容

本书内容聚焦于如何使用大语言模型开发新的功能和应用,一共有 8 章内 容,分别如下。

第 1 章 基础知识 —大语言模型背后,主要介绍了与 ChatGPT 相关 的 NLP 领域的基础知识和原理,具体内容包括自然语言背景、Token 与 Embedding、语言模型、Transformer、GPT和RLHF 等。掌握了这部分知 识,就能大概知道 ChatGPT 或其他大语言模型是怎么回事。

第 2 章 相似匹配—万物皆可 Embedding, 主要介绍了文本表示, 以 及与文本匹配相关的任务和应用。这是 NLP 领域(以及其他一些算法领 域)最常用的技术,具体内容包括相似匹配基础、接口使用,以及简单 问答、聚类任务和推荐应用。

第 3 章 句词分类—句子 Token 都是类别,主要介绍了 NLP 领域最常 见的任务—分类。这其实也是人类最基本的认知方式(比如用男或女、 老或少、勤奋、乐于助人等简单的标签化方式具象化某个个体),具体内 容包括句词分类基础、接口使用,以及文档问答、模型微调和智能对话 应用。

第 4 章 文本生成—超越理解更智能,主要介绍了与文本生成技术相 关的任务,具体内容包括文本摘要、文本纠错和机器翻译。文本生成技 术在实际场景中的使用相对少一些,也相对独立一些。

第 5 章 复杂推理—更加像人一样思考,主要介绍了如何使用大语言 模型做复杂的逻辑推理任务。这部分内容在现实中的应用很少,但在新 的产品形态上有很多想象空间。

第 6 章 工程实践—真实场景大不同,主要介绍了如何在真实业务上 使用大语言模型。我们不再仅仅构建一个简单的 Demo(demonstration 的 简写,指示例、样品),而是要将大语言模型真正用在产品开发上。我们 会给出一些需要特别注意的事项,以帮助读者更高效地构建应用。

第 7 章 局限与不足—工具不是万能的,主要介绍了 ChatGPT(或其 他类似的大语言模型)的缺陷或不擅长的地方,包括事实性错误、实时 更新、性能瓶颈等方面。我们在畅想和利用 ChatGPT 或其他类似的大语言模型做各种人工智能应用时,也应该了解其不擅长的地方:一方面要 对其有更加全面的认识;另一方面,反向思维有时候也能想象出好的应 用或服务。

第 8 章 商业应用—LLM是星辰大海,可以把该章当作一篇调研报告 来阅读,主要针对工具应用和行业应用两大方面展开,期望能够给读者 更多启迪,帮助大家构思更好的应用或服务。

本书有两个基本的设计理念。

各章相对独立,彼此之间没有明显的依赖关系。这既体现在内容上,也 体现在设计上。读者可以灵活选取自己感兴趣的章节阅读。

以“任务”为核心。我们始终强调“任务”多于“工具”,ChatGPT 是目 前大语言模型领域总体效果最好的,但未来一定会有其他大语言模型出 现。不过,只要我们理解了要做的事情,理解了系统设计,工具就能为 我们所用。

阅读建议

通过上面的介绍,相信读者应该对本书有了初步了解。下面主要从创作者的 角度简单说明如何更好地使用本书。

第一,我们期望读者能够亲自动手完成一个应用或服务的 Demo 。光看不做 在编程领域是绝对不行的,实践出真知,脑子想、嘴上说与亲自干完全不一样。 而且,万事开头难,做了第一个,后面再做类似的就会相对容易一些。

第二,我们期望读者能在学习过程中多思考,既可以与自己工作的实际业务 相结合,也可以天马行空地构想。我们非常期待读者能分享自己的想法,众人拾 柴火焰高,个人能想到的太少了,但这么多人一起想,也许能够改变一个行业。

第三,我们期望读者能对 NLP 领域的常见任务有个基本的认识。我们并非 想要读者都成为 NLP 工程师,阅读本书也不会让你成为 NLP 工程师。但我们期望读者能够利用 ChatGPT (或其他类似的大语言模型)提供的接口来完成 NLP 任务,并提供相关服务。期望读者在阅读完本书后都具备这样的能力。

第四,洛克菲勒说过:真正重要的不在于有多少知识,而在于如何使用现有 的知识。知识只是潜在的力量,只有将其付诸应用,而且是建设性的应用,才会 显示出其威力。本书内容围绕着任务展开,很多设计思路和细节其实可以应用到 多个领域。我们再次强调,期望读者能够多实践,多应用,尤其是与自己的工作 多结合。

第五,由于创作团队精力有限,本书难免有疏漏甚至错误,我们期望读者在 学习的同时,也能积极给我们提建议,我们将不胜感激。

ChatGPT 火爆背后蕴含着一个基本道理:人工智能能力得到了极大突破— 大模型,尤其是大语言模型的能力有目共睹,未来只会变得更强。世界上唯一不 变的就是变化。适应变化、拥抱变化、喜欢变化。“天行健,君子以自强不息。” 我们相信未来会有越来越多的大模型出现。人工智能正在逐渐平民化,将来每个 人都可以利用大语言模型轻松地做出自己的人工智能产品。我们正在经历一个伟 大的时代,我们相信这是一个值得每个人全身心拥抱的时代,我们更加相信这个 世界必将因此而变得更加美好。

详细目录

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/709557.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Keepalived 双机热备基础知识

7.1 Keepalived 双机热备基础知识 Keepalived起初是专门针对LVS设计的一款强大的辅助工具,主要用来提供故障切换(Failover) 和健康检查査(Health Checking)功能一一判断LVS 负载调度器、节点服务器的可用性,及时隔离并替 换为新的服务器,当故…

Container killed on request. Exit code is 143

Bug信息 WARN YarnAllocator: Container marked as failed: container_e33_1480922439133_0845_02_000002 on host: hdp4. Exit status: 143. Diagnostics: Container killed on request. Exit code is 143 Container exited with a non-zero exit code 143 Killed by externa…

day03_登录注销(前端接入登录,异常处理, 图片验证码,获取用户信息接口,退出功能)

文章目录 1. 前端接入登录1.1 修改前端代码1.2 跨域请求1.2.1 跨域请求简介1.2.2 COSR概述CORS简介CORS原理 1.2.3 CORS解决跨域 2. 异常处理2.1 提示空消息分析2.2 系统异常分类2.3 异常处理2.2.1 方案一2.2.2 方案二 3. 图片验证码3.1 图片验证码意义3.2 实现思路3.3 后端接口…

java找工作之JavaWeb(一)

JavaWeb 一个web应用有多部份组成(静态web,动态web) html,css,jsjsp,servletjava程序jar包配置文件(Properties) web应用程序编写完毕后,若想提供给外界访问,需要一个服务器来统一…

【IC验证】数据类型

一、思维导图 二、代码 (1)字符串 字符串的结尾不带空标识符null,\0。是动态存储方式,因此不用担心存储空间被用完。 编辑.SV文件使用 gvim 文件名 运行仿真使用 vcs -sverilog -full64 string_type.sv 和./simv命令如果是字…

【微服务】微服务架构包含哪些组件、各个组件又承担什么职责呢?

前面的文章里我们介绍了微服务架构的一些基础知识以及特点,也提到了国产的微服务架构标准实现SpringCloud Alibaba,聊了这么多,还是没有开始阐述各组件在Java技术体系中的具体实现。那从这里开始,我们开始全面认识微服务架构在Jav…

上拉电阻与下拉电阻、电容的作用

上拉电阻与下拉电阻 在单片机电路中,上拉电阻和下拉电阻都是常见的电路元件,它们在数字电路设计中扮演着重要的角色。它们的作用如下: 1. **上拉电阻**: - **作用**:当一个引脚没有外部信号时,上拉电阻…

微调(Fine-tuning)技术概念

——微调,像化妆,一种“精细化、风格性调整”的人工美颜技能。 微调(Fine-tuning)是指在深度学习领域中,特别是针对预训练模型的一种训练策略。预先训练好的模型通常是在大规模无标注数据上通过自监督学习得到的&#…

【Micropython】I2C层次结构、I2C协议

文章目录 前言一、I2C的结构层次1.1 怎样在两个设备之间传输数据1.2 I2C如何传输数据1.3 硬件框图1.4 软件层次 二、IIC协议2.1 硬件连接2.2 I2C 总线的概念2.3 传输数据类比2.3 I2C信号2.4 I2C数据的含义 总结 前言 I2C(Inter-Integrated Circuit)是一…

【Redis】redis事务和发布订阅

Redis 事务 Redis 事务可以一次执行多个命令, 并且带有以下三个重要的特性: 批量操作在发送 EXEC 命令前被放入队列缓存。收到 EXEC 命令后进入事务执行,事务中任意命令执行失败,其余的命令依然被执行。在事务执行过程&#xff…

C++设计模式——抽象工厂模式

文章目录 抽象工厂模式的主要组成部分抽象工厂模式的一个典型例子抽象工厂模式用于其他场景抽象工厂模式与其他设计模式结合使用 C 中的抽象工厂模式是一种创建型设计模式,它主要用于处理对象家族的创建,这些对象之间可能存在一定的关联关系或属于相同的…

国产航顺HK32F030M: HK32F030MJ4M6_SOP8资料

最小系统 参考资料 [1] 航顺MCU HK32F030MJ4M6-SOP8 各个文件夹简介: Boards:HK32F030xMF4P6开发板的BSP驱动代码。 Documents:HK32F030xMxx数据手册、用户手册、API手册以及HK32F030xMxx开发板原理图。 Package:HK32F030xMxx Ke…

任务系统之API子任务

日常运维工作中有许多的任务要执行,例如项目发布/数据备份/定时巡检/证书更新/漏洞修复等等,大部分的任务都会有多个步骤共同完成,例如一个发布任务会有拉代码、编译、分发、通知等等步骤,而不同的任务可能还包含相同或相似的步骤…

PRL算法调控

伴随汽车电子技术发展,传统轮式车辆制动系统的气体或液体传输管路长,阀类原件多原有的真空助力系统无法兼顾车辆的再生制动功能,而再生制动功能是混合动力车辆是混动车辆最主要的市场优势之一,真空助力器逐渐被eBooster 所取代。针…

微信小程序 - 渲染和逻辑

通信模型 渲染层的界面使用了WebView 进行渲染;逻辑层采用JsCore线程运行JS脚本。 数据驱动 WXML会解析对应model值,并生成js对象,最后生成最终的dom树。 当model发生变更时候,会判断解析wxml后的js对象是否改动,若改动…

[重磅更新] Mac玩游戏必备!Crossover24版现已上线!附免费升级攻略 Crossover软件使用方法安装程序 免费版

好久不见啦,最近一直在忙着研究Mac玩游戏,什么幻兽帕鲁、女神异闻录之类的,有些沉迷了,实在对不住大家… 不过今天还是给大家带来了好消息!那就是让Mac玩游戏不再是笑话的神器,Crossover正式发布了2024版&a…

使用CANoe进行27服务安全认证解密算法

方法:通过cdd文件dll文件进行27服务通过安全认证解密 步骤1:菜单栏选中Diagnostics&XCP这一栏, 步骤2:鼠标左击CANdelaStudio 步骤3:弹出如下弹窗,选择 I accept 步骤4:选择新建 步骤5&…

redis-Redis主从,哨兵和集群模式

一,Redis的主从复制 ​ 主机数据更新后根据配置和策略, 自动同步到备机的master/slaver机制,Master以写为主,Slave以读为主。这样做的好处是读写分离,性能扩展,容灾快速恢复。 1.1 环境搭建 如果你的redi…

ModStartCMS v8.1.0 图片前端压缩,抖音授权登录

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…

手机AI摄影时代开启,传音引领行业标准化建设

今年春节,AI摄影可谓大出风头。人们在社交平台晒出自己在龙年的AI写真,极大地增添了节日的氛围感,也让我们看到了“AI摄影”的价值。新年伊始,手机巨头们纷纷布局该赛道,基于AI大模型实现的影像功能成为业界关注焦点。…