AI大模型-启航

文章目录

    • 什么是大模型?(大体现在参数量巨大)
    • 大模型将会改变那些行业(大模型有哪些作用?)
    • 如何搞数据训练模型?
    • LangChain带来的技术变革
      • LangChain架构

什么是大模型?(大体现在参数量巨大)

多维角度拆解分析复杂事实,维度数量就是未知参数量,分析公式就是万事万物的规律。
将数据(答案)喂给大模型(复杂公式)逐步求解出来未知参数,最终表达式就是大模型。
我们想要找到一组复杂事实背后的规律,但由于事实的复杂性,我们需要建立一个含有大量(十亿/百亿/千亿1万亿)未知参数的表达式,试图用这个表达式描述复杂事实背后的规律,如果我们求解出,或者近似求解出这些参数,那么我们就掌握了这组复杂事实的规律。
大模型就是这样的一个拥有大量未知参数的表达式,我们通过海量数据去求解或者说迭代更新它的参数,从而让大模型无限接近于复杂事实背后的规律,从而帮助我们实现需求。
实例

通俗理解:大模型就是一个复杂的带未知参数表达式(ax+b=y),数据就是部分实例(坐标),数据喂给大模型训练求出未知参数值后就是最终的大模型(2x+4=y),后面对大模型提出问题(x=9时,y等于多少?)就能通过计算获得答案(y=22)。

  • 数据训练中数据被抽象剥离演化为了未知参数值体现在大模型算式中。
  • 大模型只进行逻辑处理(参数值是逻辑处理能力的决定因素)还是需要外部知识储备库才能回答问题,外部知识储备库分为两种:一种是上网实时搜索,另一种是离线静态知识库(大数据存储方向:矢量存储)。

在这里插入图片描述

大模型将会改变那些行业(大模型有哪些作用?)

所有基于沟通、文案撰写和分析类的基础岗位,不需要特殊经验背景的行业及岗位都会收到AIGC的冲击。
纯技术就完蛋了,要业务强相关才行也就是需要特殊经验背景。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

如何搞数据训练模型?

师夷长技以制夷
让GPT做数据标注:根据文本总结问题然后回答问题,最后用该数据训练自己的模型。

  • 数据训练中数据被抽象剥离演化为了未知参数值体现在大模型算式中。
  • 大模型只进行逻辑处理(参数值是逻辑处理能力的决定因素)还是需要外部知识储备库才能回答问题,外部知识储备库分为两种:一种是上网实时搜索,另一种是离线静态知识库(大数据存储方向:矢量存储)。

LangChain带来的技术变革

Large language models (LLMs) are emerging as a transformative technology, enabling developers to build applications that they previously could not. However, using these LLMs in isolation is often
insufficient for creating a truly powerful app - the real power comes when you can combine them with other sources of computation or knowledge.
大型语言模型 (LLM) 正在成为一种变革性技术,使开发人员能够构建他们以前无法构建的应用程序。 然而,单独使用这些 LLM 往往不足以创建一个真正强大的应用程序 — 当你可以将它们与其他计算或知识来源相结合时,那么我们将拥有真正强大的技术力量。

LangChain 是一套标准化规范,其技术团队致力于完成LLM到应用层的连接,LangChain 定义了从LLM到应用层的整体框架(分层+模块)— 你只需要按照LangChain定义的标准框架,完成其中的每个模块,就可以实现LLM能力到外部应用的完整链路。
LangChain 技术团队认为单一LLM并不能完全支撑复杂需求,可以通过现有技术与LLM的结合,形成综合的技术系统,由此来实现LLM时代的技术变革。

LangChain架构

Models:指定语言模型或者API接口。
Prompts(将问题处理为大模型更容易理解的话术):预设Prompt template,对输入的query进行调format之成为更好的Prompt。
Indexes:通过Indexes对文档进行构建使得系统更好地与文档进行交互。LangChain 支持的主要索引和检索类型目前以矢量数据库为中心(大数据存储方向:矢量存储)。
Memory:让系统拥有长期记忆,记录用户之前的历史对话记录。
Chains:一个任务无法用一问一答解决时,需要使用chain,由chain根据任务进行进一步的拆分,决定如何通过多步骤,使用LLM解决问题。
Tools:Agent运行过程中要使用的一些工具,比如网页搜索工具、专门进行数学运算的工具等。
Agents:应用端,面向客户,调用chain完成任务,实现LLM与应用的链接,将llm、tools等传入agent。

实例展示:
“谁是日本的现任领导人,小于他年龄的最大质数是多少?”

  1. 初始化Agent(传入Tools信息,传入LLM信息,指定使用的agent)
  2. 调用Agent,传入query;
  3. Agent通过Tools中的网页搜索工具,搜索找到日本现任领导人信息;
  4. Agent通过Tools中的网页搜索工具,搜索他的年龄(65岁);
  5. Agent通过Tools中的llm(大模型)-math计算小于65的最小质数;
  6. 返回答案;

实例解析:
大模型只进行第五步的逻辑处理,以上四步都是插件实现,外部知识储备库采取的上网实时搜索。

  • 数据训练中数据被抽象剥离演化为了未知参数值体现在大模型算式中。
  • 大模型只进行逻辑处理(参数值是逻辑处理能力的决定因素)还是需要外部知识储备库才能回答问题,外部知识储备库分为两种:一种是上网实时搜索,另一种是离线静态知识库(大数据存储方向:矢量存储))。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/711064.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

九、GG bond的逻辑运算

描述 GG bond想要锻炼自己的逻辑能力,于是输入了两个整型变量x和y,分别判断它们的与、或、非关系,你能帮他输出x与y,x或y,非x,非y的值吗? 输入描述: 输入两个整数x和y&#xff0c…

Vue+SpringBoot打造不良邮件过滤系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统用户模块2.2 收件箱模块2.3 发件箱模块2.4 垃圾箱模块2.5 回收站模块2.6 邮箱过滤设置模块 三、实体类设计3.1 系统用户3.2 邮件3.3 其他实体 四、系统展示五、核心代码5.1 查询收件箱档案5.2 查询回收站档案5.3 新…

Linux学习-etcdctl安装

etcdctl3.5下载链接 1. 先通过上面链接下载gz包2. 解压 [rootk8s-master ~]# tar xf etcd-v3.5.11-linux-amd64.tar.gz [rootk8s-master etcd-v3.5.11-linux-amd64]# ls Documentation etcd etcdctl etcdutl README-etcdctl.md README-etcdutl.md README.md READMEv2-e…

图像分割 - 查找图像的轮廓(cv2.findContours函数)

1、前言 轮廓,是指图像中或者物体的外边缘线条。在简单的几何图形中,图形的轮廓是由平滑的线条构成,容易被识别。但不规则的图形或者生活中常见的物体轮廓复杂,识别起来比较困难 2、findContours函数 这里先介绍函数的参数,具体的含义会在下面实验中阐述 opencv 提供的轮…

『大模型笔记』自用的“科技文章翻译 GPT”和它的 Prompt

自用的“科技文章翻译 GPT”和它的 Prompt 你是一位精通简体中文的专业翻译,尤其擅长将专业学术论文翻译成浅显易懂的科普文章。请你帮我将以下英文段落翻译成中文,风格与中文科普读物相似。规则: - 翻译时要准确传达原文的事实和背景。 - 即使上意译也要保留原始段落格式,…

每天一个数据分析题(一百八十四)

在下列哪种情况下线性回归模型不适合代替逻辑回归模型? A. 预测的目标变量是连续型的并且分布范围不受限制 B. 预测的目标变量是二元的并且服从二项分布 C. 自变量与因变量之间的关系可以假设为线性关系 D. 需要预测客户的具体购买金额 题目来源于CDA模拟题库 …

React入门之React_渲染基础用法和class实例写法

渲染元素 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>04元素渲染</title><script src&…

什么是RPC?谈谈你对RPC的理解

RPC&#xff08;Remote Procedure Call&#xff0c;远程过程调用&#xff09;是一种计算机通信协议。它允许一台计算机&#xff08;客户端&#xff09;通过网络调用另一台计算机&#xff08;服务器&#xff09;上的程序&#xff0c;并等待该程序的结果返回。RPC抽象了网络通信的…

go mod中如何解决 xxx/yyy/lib@v1.1.0: unrecognized import path

需要检查的几个地方 这个错误通常出现在 Go 模块系统无法找到指定版本的模块时。有几种可能的原因和解决方法&#xff1a; 模块未被发布或标记&#xff1a; 确保 xxx/yyy/lib 模块的版本 v1.1.0 已经被正确地发布或标记。你可以在对应的 GitLab 仓库中查看是否存在 v1.1.0 标签…

2024-2-29-网络编程作业

1>TCP 源代码: 服务器端&#xff1a; #include <myhead.h> #define SER_IP "10.168.1.111" #define SER_PORT 8888 #define MAXSIZE 128 int main(int argc, char const *argv[]) {int sfd socket(AF_INET, SOCK_STREAM, 0);struct sockaddr_in sin;sin…

代码随想录算法训练营|day47

第九章 动态规划 198.打家劫舍213.打家劫舍II337.打家劫舍III代码随想录文章详解 198.打家劫舍 dp[i]表示偷第i家及之前所能获取的最大金额 偷第i家&#xff1a;dp[i] dp[i-2]nums[i]&#xff0c;不偷第i家&#xff1a;dp[i] dp[i-1] func rob(nums []int) int {if len(num…

RDD简介与基础编程

1. 什么是RDD&#xff1f; RDD&#xff08;Resilient Distributed Dataset&#xff09;叫做弹性分布式数据集&#xff0c;是Spark中最基本的数据处理模型。在代码中&#xff0c;RDD是一个抽象类&#xff0c;他代表着一个弹性的、不可变的、可分区的、里面的元素可并行计算的集…

android TextView 实现富文本显示

android TextView 实现富文本显示&#xff0c;实现抖音直播间公屏消息案例 使用&#xff1a; val tvContent: TextView helper.getView(R.id.tvContent)//自己根据UI业务要求&#xff0c;可以控制 图标显示 大小val levelLabel MyImgLabel( bitmap 自己业务上的bitmap )va…

第零章_计算机导论

0.1 计算机&#xff1a;辅助人脑的好工具 所谓的计算机就是一种计算器&#xff0c;而计算器其实是:『接受用户输入指令与数据&#xff0c;经由中央处理器的数学与逻辑单元运算处理后&#xff0c;以产生或储存成有用的信息』。因此&#xff0c;只要有输入设备(不管是键盘还是触摸…

UE5基于RumtimeFBXImport插件使用C++加载服务器上fbx文件方法

UE5的RumtimeFBXImport插件其实只能加载本机的fbx文件&#xff0c;要加载服务器上的fbx文件的话&#xff0c;需要先将该fbx文件下载到本地&#xff0c;然后再使用RumtimeFBXImport插件加载。 示例文件如下&#xff1a; #include "Loader/WebLoader.h" #include &quo…

HTML5:七天学会基础动画网页4

backgorund-size 值与说明 length(单位像素):设置背景图片高度和宽度&#xff0c;第一个值设置宽度&#xff0c;第二个值设置高度&#xff0c;如果只给出一个值&#xff0c;第二个是设置为auto。 percentage(百分比):以父元素的百分比来设置背景图像的宽度和高度&#xff0c…

CSS技巧:实现两个div在同一行显示的方法

css如何让两个div在同一行显示 - web开发 - 亿速云 在Web开发中&#xff0c;经常遇到需要将多个元素水平排列在同一行的情况。其中一个常见的需求是将两个div元素放置在同一行上&#xff0c;使它们并排显示。在本文中&#xff0c;我们将介绍几种实现这一效果的CSS方法。 1. 使…

TypeScript基础知识:类型推导和上下文类型化

在 TypeScript 中&#xff0c;类型推导和上下文类型化是两个重要的概念。它们使得代码编写更加简洁、可读性更高&#xff0c;并且帮助我们避免冗余的类型注解。本文将深入探讨这两个概念&#xff0c;并通过示例代码演示它们的用法和好处。 一、类型推导 类型推导是 TypeScript…

day06_菜单管理(查询菜单,添加菜单,添加子菜单,修改菜单,删除菜单,角色分配菜单,查询菜单,保存菜单,动态菜单)

文章目录 1 菜单管理1.1 表结构介绍1.2 查询菜单1.2.1 需求说明1.2.2 页面制作1.2.3 后端接口SysMenuSysMenuControllerSysMenuServiceMenuHelperSysMenuMapperSysMenuMapper.xml 1.2.4 前端对接sysMenu.jssysMenu.vue 1.3 添加菜单1.3.1 需求说明1.3.3 页面制作1.3.3 后端接口…

【git随笔,日常积累】

Git常用基础 branch 查看所有分支&#xff1a; git branch -a切换到分支&#xff1a;git checkout develop创建分支并切换到&#xff1a;git checkout -b develop创建一个新分支&#xff1a;git checkout --orphan new_branch --orphan 选项用于创建一个没有历史记录的分支 删…