Seal^_^【送书活动第8期】——《ChatGLM3大模型本地化部署、应用开发与微调》

Seal^_^【送书活动第8期】——《ChatGLM3大模型本地化部署、应用开发与微调》

  • 一、参与方式
  • 二、本期推荐图书
    • 2.1 作者建语
    • 2.2 编辑推建
    • 2.3 图书简介
    • 2.4 前 言
    • 2.5 目 录
  • 三、正版购买

大模型领域 既是繁星点点的未知宇宙,也是蕴含无数可能的广阔天地,

正是这一独特的魅力,令无数的探索者为之倾倒,为之奋斗。

随着大模型应用逐渐走入人们的日常生活,支撑它的深度学习技术也开始登上更为广阔和深远的人工智能大舞台。

一、参与方式

1、关注博主的账号。
2、点赞、收藏、评论博主的文章。
3、在文章下留下评论,每位参与者最多可以评论三次。
4、加入粉丝群,通过小程序自动抽奖。

📚 本次将 送出2本 书籍。

🕚 活动截止时间为 2024年7月10日晚上8点整

注意: 活动结束后,请留意查看您的私信消息。

加入粉丝群,通过小程序自动抽奖。

在这里插入图片描述

二、本期推荐图书

在这里插入图片描述

2.1 作者建语

王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。著有《PyTorch语音识别实战》《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow+Keras自然语言处理实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战:基于TensorFlow2.2的深度学习实践》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

2.2 编辑推建

"通过多个实战案例,快速掌握大模型应用开发与微调技术

基于网页端的ChatGLM3部署
基于私有云服务的ChatGLM3部署
猫狗分类可视化训练与预测
搭建专业问答机器人
实战知识图谱抽取与智能问答
撰写剧情梗概、评论与宣传文案实战
多文本检索的增强生成实战
结合提示工程的网页搜索服务实战
基于ChatGLM3的思维链实战
GLM文本生成实战
单GPU微调ChatGLM3实战
个人助理之美妆助手实战
上市公司财务报表非结构化信息抽取实战
上市公司财务报表智能问答与财务预警实战

2.3 图书简介

《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。
全书共分13章,全方位、多角度地展示了大模型本地化实战的完整方案,内容包括大模型时代的开端、PyTorch 2.0深度学习环境搭建、基于gradio的云上自托管ChatGLM3部署实战、使用ChatGLM3与LangChain实现知识图谱抽取和智能问答、适配ChatGLM3终端的Template与Chain详解、ChatGLM3多文本检索的增强生成实战、构建以人为本的ChatGLM3规范化Prompt提示工程、使用ChatGLM3的思维链构建、GLM源码分析与文本生成实战、低资源单GPU微调ChatGLM3实战、会使用工具的ChatGLM3、上市公司财务报表非结构化信息抽取实战、上市公司财务报表智能问答与财务预警实战。

《ChatGLM3大模型本地化部署、应用开发与微调》适合大模型的初学者、有一定基础的大模型研究人员、大模型应用开发人员。同时,《ChatGLM3大模型本地化部署、应用开发与微调》还可作为高等院校或高职高专相关专业大模型课程的教材,助力培养新一代的大模型领域人才。

2.4 前 言

大模型领域既是繁星点点的未知宇宙,也是蕴含无数可能的广阔天地,正是这一独特的魅力,令无数的探索者为之倾倒,为之奋斗。随着大模型应用逐渐走入人们的日常生活,支撑它的深度学习技术也开始登上更为广阔和深远的人工智能大舞台。

关于本书

本书将揭示大模型ChatGLM3的本地化实战应用,带领读者领略ChatGLM3的高级应用之美.书中不仅详细如何进行ChatGLM3的私有云部署、开发应用、构建思维链以及在有限资源条件下的微调方法,为了让读者更深入地了解ChatGLM3的模型架构,还将解析GLM系列模型的源码,并完成一项文本生成任务。本书的最后将通过实现基于自然语言的真实上市公司大规模年度财务报表非结构化信息抽取实战、智能问答与财务预警实战,展现大模型应用的美好前景。这两个实战案例将融合本书前面介绍的所有知识,从大模型程序应用入手,涉及微调以及工具的使用,并结合具体的业务知识背景,为读者带来一次深度学习的完整体验。

本书涉及的深度学习编程方法与技巧以PyTorch为主。PyTorch因其易用性和普及性而成为深度学习领域的翘楚。当然,本书只是围绕大模型的应用进行深入剖析,若想了解更多关于深度学习的内容,例如卷积神经网络、循环神经网络等模块的构建和使用方法,强烈推荐参阅《PyTorch 2.0深度学习从零开始学》。

本书作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,不仅延续了《PyTorch 2.0深度学习从零开始学》中的核心理念与知识体系,更将深度学习引向了一个新的高度,专注于大模型的本地化研究与应用。本书将帮助读者深入理解深度学习与大模型的精髓,探寻其背后的思维逻辑和创新精神。在这个过程中,读者不仅能学习到理论知识,更能感受到大模型背后的力量与智慧,从而为自己在这一领域的研究和 实践提供有力的支撑。

2.5 目 录

1章  大模型时代的开端 11.1  大模型的历史与发展 11.1.1  大模型的“涌现” 11.1.2  深度学习与大模型的起源 31.1.3  大模型的概念与特点 41.1.4  大模型开启了深度学习的新时代 51.2  为什么要使用大模型 61.2.1  大模型与普通模型的区别 71.2.2  为什么选择ChatGLM 81.2.3  大模型应用场合与发展趋势 91.3  本章小结 102PyTorch 2.0深度学习环境搭建 112.1  安装Python开发环境 122.1.1  Miniconda的下载与安装 122.1.2  PyCharm的下载与安装 142.1.3  softmax函数练习 182.2  安装PyTorch 2.0 192.2.1  NVIDIA 10/20/30/40系列显卡选择的GPU版本 192.2.2  PyTorch 2.0 GPU NVIDIA运行库的安装 192.2.3  Hello PyTorch 222.3  Hello ChatGLM3 232.3.1  ChatGLM3简介与安装 232.3.2  CPU版本的ChatGLM3推演 252.3.3  GPUINT4INT8量化)版本的ChatGLM3推演 262.3.4  GPU(half或float量化)版本的ChatGLM3推演 282.3.5  离线状态的ChatGLM3的使用 292.3.6  ChatGLM的高级使用 302.4  本章小结 313章  基于gradio的云上自托管ChatGLM3部署实战 323.1  gradio的基本使用详解 323.1.1  从gradio的Interface开始 333.1.2  gradio输入与输出组件 353.1.3  启动gradio的launch 413.1.4  gradio中多样化的输入和输出组件 423.1.5  gradio中常用的几个组件 453.1.6  使用gradio搭建视频上色服务 573.2  基于gradio的猫狗分类可视化训练与预测实战 593.2.1  运行环境与数据集的准备 603.2.2  模型的设计 633.2.3  PyTorch模型训练的基本流程 643.2.4  可视化训练流程 653.2.5  使用训练好的模型完成gradio可视化图像分类 673.3  基于网页端的ChatGLM3部署和使用 693.3.1  使用gradio搭建ChatGLM3网页客户端 703.3.2  使用ChatGLM3自带的网页客户端 713.4  基于私有云服务的ChatGLM3部署和使用 723.4.1  使用FastAPI完成ChatGLM3私有云交互端口的搭建(重要) 733.4.2  基于streamlit的ChatGLM3自带的网页客户端 743.5  本章小结 744章  使用ChatGLM3LangChain实现知识图谱抽取和智能问答 754.1ChatGLM3遇见LangChain 764.1.1  LangChain的基本构成、组件与典型场景 764.1.2  确认统一地址的ChatGLM3部署方案 784.1.3  使用ChatGLM3构建LangChainLLM终端 784.1.4  从一个简单的提示模板开始 814.1.5  ChatGLM3格式化提示词的构建与使用 824.2  ChatGLM3+ LangChain搭建专业问答机器人 844.2.1  使用LangChainLLM终端完成文本问答 844.2.2  数据准备与基础算法分析 864.2.3  使用LangChain完成提示语Prompt工程 874.2.4  基于ChatGLM3LLM终端完成专业问答 884.3  使用ChatGLM3LLM终端搭建知识图谱抽取与智能问答 894.3.1  基于ChatGLM3LLM终端完成知识图谱抽取 894.3.2  基于ChatGLM3LLM终端完成智能问答 914.4  本章小结 925章  适配ChatGLM3终端的TemplateChain详解 935.1  基于输入模板的人机交互 935.1.1  提示模板的4种类型 945.1.2  可嵌套的提示模板 955.2  Template中示例的最佳选择 975.2.1  基于长度的输出示例 975.2.2  基于相似度的输出示例 995.3  使用Chain提高ChatGLM3的能力 1005.3.1  Chain的数学计算方法 1015.3.2  多次验证检查器 1015.4  LangChain中的记忆功能 1025.4.1  ConversationChain会话链的使用 1025.4.2  系统memory的使用 1035.5  基于ChatGLM3终端撰写剧情梗概、评论与宣传文案实战 1055.5.1  对过程进行依次调用的顺序链SimpleSequentialChain 1055.5.2  对过程进行依次调用的顺序链SequentialChain 1075.5.3  对顺序链添加额外参数的方法 1095.6  本章小结 1116ChatGLM3多文本检索的增强生成实战 1126.1  使用自然语言处理方法对目标进行查找 1136.1.1  数据集的准备 1136.1.2  分别基于BM25LLM终端进行目标查找的方法 1146.1.3  建立工业级标准化输出:LLM终端与BM25结合 1166.2  基于LLM终端完成文本内容抽取与文本问答 1186.2.1  读取目标内容 1186.2.2  LangChain对文档的读取与分割方法 1196.2.3  基于LangChain的文本分块 1236.2.4  找到最近似问题的文本段落 1246.2.5  使用LLM终端完成智能文本问答 1256.3  使用LLM终端完成反向问题推断 1276.3.1  文本问题提取实战 1276.3.2  存储提取后的内容 1306.4  本章小结 1317章  构建以人为本的ChatGLM3规范化Prompt提示工程 1327.1  提示工程模板构建的输入与输出格式 1327.1.1  提示模板的输入格式 1337.1.2  提示模板的输出格式 1357.2  提示工程模板高级用法 1387.2.1  提示模板的自定义格式 1387.2.2  提示模板的FewShotPromptTemplate格式 1397.2.3  部分格式化的提示模板详解 1407.3  结合提示工程的网页搜索服务实战 1427.3.1  网页搜索的API实现 1427.3.2  网页问答提示模板的实现 1437.3.3  结合网页搜索的LLM终端问答实战 1447.4  本章小结 1458章  使用ChatGLM3的思维链构建 1468.1  思维链初探 1468.1.1  思维链源于人类使用自然语言的概念来理解事物 1478.1.2  思维链的优势与应用场景 1478.2  思维链详解及其实战 1498.2.1  思维链详解 1498.2.2  基于ChatGLM3的思维链实战 1508.3  本章小结 1529GLM源码分析与文本生成实战 1539.1  GLM组件详解 1549.1.1  GLM模型架构重大突破:旋转位置编码 1549.1.2  添加旋转位置编码的注意力机制 1569.1.3  新型的激活函数GLU详解 1569.1.4  GLM“三角掩码”与“错位”输入输出格式详解 1579.2  GLM整体架构详解与文本生成实战 1599.2.1  调整架构顺序的GLMBlock 1599.2.2  自定义GLM模型(单文本生成版) 1629.3  本章小结 16710章  低资源单GPU微调ChatGLM3实战 16810.1  什么是大模型微调 16810.1.1  大模型微调的作用 16910.1.2  大模型微调技术有哪些 16910.1.3  参数高效微调详解 17010.2  ChatGLM3大模型微调的准备内容 17110.2.1  从数据准备看ChatGLM3微调:有监督微调详解 17210.2.2  从实施看ChatGLM3微调:LoRA详解 17310.2.3  适配ChatGLM3微调的辅助库:PEFT详解 17410.3  虚拟客服多轮问答实战 18010.3.1  ChatGLM3数据输入结构和处理函数 18110.3.2  ChatGLM3微调训练 18610.3.3  ChatGLM3微调推理 18910.4  加速的秘密:accelerate训练方法与模型量化详解 19110.4.1  加速器accelerate详解与完整代码编写 19210.4.2  加速的秘密1:大模型的量化技术 19510.4.3  加速的秘密2:大模型的INT8量化方案 19610.4.4  加速的秘密3:大模型ChatGLM3中的量化源码分析与实践 19810.5  更快的量化训练方案:QLoRA基础内容详解 20010.5.1  加速的秘密4:基于bitsandbytes的ChatGLM3量化QLoRA实现 20010.5.2  加速的秘密5QLoRA详解 20210.5.3  微调的目的:让生成的结果更聚焦于任务 20510.6  QLoRA微调文本生成实战 20710.6.1  数据处理 20710.6.2  损失函数设计 21010.6.3  基于QLoRAChatGLM3文本生成微调实战 21110.6.4  基于QLoRAChatGLM3文本生成 21310.7  本章小结 21511章  会使用工具的ChatGLM3 21611.1  ChatGLM3调用工具源码详解与实战 21611.1.1  Python调用工具详解 21711.1.2  ChatGLM3工具调用流程详解 21811.1.3  大模型ChatGLM3工具调用实战详解 22011.1.4  大模型ChatGLM3工具调用原理详解 22311.1.5  ChatGLM3消息传递方式详解 23011.2  ChatGLM3官方工具注册与调用源码分析与实战 23111.2.1  Python中的装饰器与回调函数 23111.2.2  ChatGLM3官方工具函数的注册源码分析详解 23311.2.3  大模型ChatGLM3官方工具调用的判定依据详解 23611.2.4  ChatGLM3官方工具函数的调用分析详解 23711.2.5  ChatGLM3调用工具分析与实战演示 23811.3  ChatGLM3实战:构建个人助理之美妆助手 24011.3.1  背景和参考资料设定 24011.3.2  美妆助手的使用实战 24611.4  本章小结 24712章  上市公司财务报表非结构化信息抽取实战 24912.1  超长文本处理功能的ChatGLM3与真实财务报表的处理 25012.1.1  ChatGLM3-6B-32K模型的获取与缓存 25012.1.2  超大规模的20202023年真实中国股票市场年度财务报表数据库的建立 25012.2  单报表非结构化信息抽取实战 25312.2.1  单报表数据探查与提取信息结构化处理 25312.2.2  单报表数据非结构化信息抽取的实现 25412.3  本章小结 25613章  上市公司财务报表智能问答与财务预警实战 25713.1  基于ChatGLM3的非结构化数据抽取与大规模财务报表数据库的建立 25713.1.1  逐行代码讲解使用ChatGLM3对关键数据进行抽取 25813.1.2  大规模上市公司财务报表目标字段抽取函数的建立 26013.1.3  大规模上市公司财务报表目标字段数据库的建立 26213.2  基于自然语言的上市公司财务报表智能问答与财务预警实战 26413.2.1  使用自然语言结合ChatGLM3实现上市公司财务报表智能问答与预警解决方案1 26413.2.2  使用自然语言结合ChatGLM3-6B实现上市公司财务报表智能问答与预警解决方案2 26713.2.3  使用自然语言结合ChatGLM3实现上市公司财务报表智能问答与预警解决方案3 27013.3  本章小结 272附录  大模型的“幻觉” 273

三、正版购买

在这里插入图片描述

有兴趣的朋友可以前往查看。 JD搜索关键词:

✨ ChatGLM3大模型本地化部署、应用开发与微调,ChatGLM3大模型 ✨

🛒 链接直达:https://item.jd.com/14575684.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/39762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea创建自定义的maven spark scala archetype脚手架

一:先创建一个Maven项目net.alchim31.maven(选该模板,得要等一会儿才能加载出来) 之后将自己的目录结构建立好,最好不要有空目录,可能会因为没有文件在install的时候编译不进去 pom中内容也按照自己的需要改…

Stable Diffusion web UI 插件

2024.7.3更新,持续更新中 如果需要在linux上自己安装sd,参考:stable diffusion linux安装 插件复制到 /stable-diffusion-webui/extensions 目录下,然后重新启动sd即可 一、插件安装方法 每种插件的安装方法可能略有不同&#xf…

苹果p12证书最简单最新申请流程

使用uniapp打包,在ios上打正式包需要苹果的p12证书和证书profile文件,点进去uniapp的ios证书申请教程,通篇就是使用mac电脑申请的教程,假如没有mac电脑就无法继续了。 因此,假如没有mac电脑的同志们,可以参…

Pytest+Allure+Yaml+PyMsql+Jenkins+Gitlab接口自动化(五)Jenkins配置

一、背景 Jenkins(本地宿主机搭建) 拉取GitLab(服务器)代码到在Jenkins工作空间本地运行并生成Allure测试报告 二、框架改动点 框架主运行程序需要先注释掉运行代码(可不改,如果运行报allure找不到就直接注释掉) …

鸿蒙应用开发-时间屏幕

点击下载源码: https://download.csdn.net/download/liuhaikang/89509449 做一个时间屏幕,可以点击切换白色和黑色,有渐变效果,使用到了鸿蒙的动画效果。 在这个设计中,我们首先引入了通用能力包,以实现功…

Kubernetes 离线安装的坑我采了

Kubernetes 离线安装的坑我采了 一、Error from server: Get "https://xx.xx.xx.xx:10250/containerLogs/kube-system/calico-node-8dnvs/calico-node": tls: failed to verify certificate: x509: certificate signed by unknown authority二、calico 或 pod 启动正…

cesium公交车轨迹漫游

个人博客:CSDN 博客-满分观察网友 z 演示地址:哔哩哔哩-满分观察网友 z 这是一个用 Cesium.js 做的公交车轨迹漫游,实现的功能有加载站点和道路轨迹点数据、监听车辆的实时位置、车辆控制器。滚动屏等等。 文章目录 1. 地图初始化2. 数据渲…

【高中数学/基本不等式】已知:x,y均为正实数,且xy+2x+y=4 求:x+y的最小值?

【问题】 已知:x,y均为正实数,且xy2xy4 求:xy的最小值? 【来源】 https://www.ixigua.com/7147585275823292942?logTagf25494de7fce23a3a3d0 【解答】 解: 由xy2xy4 两边加二得 xy2xy24 2 分解因式得 (x1)(…

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第53课-语音指令跳舞

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第53课-语音指令跳舞 使用dtns.network德塔世界(开源的智体世界引擎),策划和设计《乔布斯超大型的开源3D纪念馆》的系列教程。dtns.network是一款主要由JavaScript编写的智体世界引擎&…

面试题springboot面试

文章目录 Spring的依赖注入构造器注入stetter注入属性注入 springboot的优势第一开箱即用约定大于配置内嵌tomcat服务器 javaweb的三大组件springboot的自动配置原理SpringIoc的实现机制springmvcspring如何简化开发 Spring的依赖注入 构造器注入 stetter注入 属性注入 使用…

前端进阶:Vue.js

目录 框架&#xff1a; 助解&#xff1a; 框架&#xff1a; VUE 什么是Vue.js? Vue.js优点 Vue安装 方式一&#xff1a;直接用<script>引入 方式二&#xff1a;命令行工具 第一个Vue程序 代码 代码解释&#xff1a; 运行 Vue指令 v-text v-html v-tex…

Mysql和ES使用汇总

一、mysql和ES在业务上的配合使用 一般使用时使用ES 中存储全文检索的关键字与获取的商品详情的id&#xff0c;通过ES查询获取查询商品的列表中展示的数据&#xff0c;通过展示id 操作去获取展示商品的所有信息。mysql根据id去查询数据库数据是很快的&#xff1b; 为什么ES一般…

10 - Python文件编程和异常

文件和异常 在实际开发中&#xff0c;常常需要对程序中的数据进行持久化操作&#xff0c;而实现数据持久化最直接简单的方式就是将数据保存到文件中。说到“文件”这个词&#xff0c;可能需要先科普一下关于文件系统的知识&#xff0c;对于这个概念&#xff0c;维基百科上给出…

亚马逊云科技AWS免费大热AI应用开发证书(含题库、开卷)

亚马逊云科技AWS官方生成式AI免费证书来了&#xff01;内含免费AI基础课程&#xff01;快速掌握AWS的前沿AI技术&#xff0c;后端开发程序员也可以速成AI专家&#xff0c;了解当下最&#x1f525;的AWS AI架构解决方案&#xff01; 本证书内容包括AWS上的AI基础知识&#xff0c…

剖析DeFi交易产品之UniswapV4:Swap

文章首发于公众号&#xff1a;Keegan小钢 Swap 可分为两种场景&#xff1a;单池交易和跨池交易。在 PoolManager 合约里&#xff0c;要完成交易流程&#xff0c;会涉及到 lock()、swap()、settle()、take() 四个函数。单池交易时只需要调一次 swap() 函数&#xff0c;而跨池交易…

【面向就业的Linux基础】从入门到熟练,探索Linux的秘密(七)-shell语法(5)

shell语法的一些知识和练习&#xff0c;可以当作笔记收藏一下&#xff01;&#xff01; 文章目录 前言 一、shell 二、shell语法 1.文件重定向 2.引入外部脚本 3.作业 总结 前言 shell语法的一些知识和练习&#xff0c;可以当作笔记收藏一下&#xff01;&#xff01; 提示&…

七种大模型微调方法:让你的Offer拿到爽

在当今的人工智能和机器学习领域&#xff0c;大型预训练模型&#xff08;如GPT、BERT等&#xff09;已成为解决自然语言处理&#xff08;NLP&#xff09;任务的强大工具。然而&#xff0c;要让这些模型更好地适应特定任务或领域&#xff0c;往往需要进行微调。本文将详细介绍七…

手把手教你:如何在51建模网免费下载3D模型?

作为国内领先的3D互动展示平台&#xff0c;51建模网不仅汇聚了庞大的3D模型资源库&#xff0c;供用户免费下载&#xff0c;更集成了在线编辑、格式转换、内嵌展示及互动体验等一站式功能&#xff0c;为3D创作者及爱好者搭建起梦想与现实的桥梁。 如何在51建模网免费下载3D模型…

鸿蒙认证值得考吗?

鸿蒙认证值得考吗&#xff1f; 鸿蒙认证&#xff08;HarmonyOS Certification&#xff09;是华为为了培养和认证开发者在鸿蒙操作系统&#xff08;HarmonyOS&#xff09;领域的专业技能而设立的一系列认证项目。这些认证旨在帮助开发者和企业工程师提升在鸿蒙生态中的专业技能…

linux——IPC 进程间通信

IPC 进程间通信 interprocess communicate IPC&#xff08;Inter-Process Communication&#xff09;&#xff0c;即进程间通信&#xff0c;其产生的原因主要可以归纳为以下几点&#xff1a; 进程空间的独立性 资源隔离&#xff1a;在现代操作系统中&#xff0c;每个进程都…