一、对人工智能大模型了解与认知


黑8说

月黑风高,乌云密布,树木低垂,黯淡沉闷。这黎明前的风暴,预示着新时代的变革即将到来。 在一个8线小城市的办公室中

黑8对主任说: 世界上有男人、女人、人妖,米国有1/3男,2/3女…,以后会增加一个非常重要的人种,他就像孙悟空拔毫毛,变化出拥有各种本事的自己。如果咱们不懂驾驭他,做他的师傅,咱们可就被统治了。

革委会梁主任好奇的问: 这是什么妖怪啊?

黑8郑重的说: 人工智能大模型

主任不屑的说: 哪有那么夸张,离咱们远了去了,你小子是不是疯了,危言耸听,自以为是。

黑8顺着主任说: 梁主任啊,这妖怪来头还不小呢,正以一日千里的速度赶来。咱们非常有必要提升对他的了解和认知。您知道吗?他比咱们看的真,听的细,想的快,说的准,未来他能让机器人不知疲倦的用双手、双脚进行精细劳作,简直就是要把我们替了。他可不同于智能手机、电脑的应用功能,还有siri、小度、小艺什么的,这些都太Low了。他才是真正的“超人”

主任质问到: 这么牛,不能落地不还是等于0吗?

黑8认真的说: 能落地啊,主任您要是不信,今天我立个Flag,做不到我请您吃大餐,您看行吗?

主任着急的问: 你倒是说说他能干什么呀?

黑8这下可来了劲头,心有成竹的说: 您看啊,我老婆是老师,经常收文后写摘要通知,我让大模型替她写了。

我儿子学翻译,让他记录难点和错题,我让大模型以听、说、读、写的方式,使他强化学习,直至掌握。

我女儿爱跳舞、画画,让她指出主题、音乐和动作类型,我让大模型给她编舞;让她指出主题、线条、色彩,我让大模型给她画画。

我一哥们是搞开发的,我让大模型给他出产品PPT、技术方案、架构设计、前后端代码和测试用例,一条龙,流水线完成。

还能做医生、老师、律师、会计师、画家、作家、心理医生等等,很多很多,先做这些案例,您看怎么样?

梁主任“哼”了一声,将信将疑,心里盘算,说的这么悬,看来我真得了解一下,这也是我们革委会的使命啊。正当梁主任转身刚要走时。

被黑8叫住: 主任,您看我这有篇文章,您可以先了解了解。黑8是多聪明的人,一眼就看出主任的心思。

主任会心的笑了,心想: 黑8就是黑8,你个棒槌。

之后,可想而知,梁主任确实认真看了这篇文章。收获很大,为之一振,从心里认识到,他真不是什么妖怪,确实是个【新新人类】

OpenAI 首席科学家 Ilya Sutskever 说过:


数字神经网络和人脑的生物神经网络,在数学原理上是一样的

1.AI是什么

AI(人工智能)是指通过计算机系统模拟、复制和执行人类智能行为的技术和方法。

AI的实现方式包括机器学习、深度学习、自然语言处理、计算机视觉等技术。

AI在各个领域,包括医疗、金融、制造、交通等,都有着广泛的应用,并对社会和经济产生深远的影响。

2.大模型能干什么

大模型,全称「大语言模型」,英文「Large Language Model」,缩写「LLM」。

国家对话产品大模型链接
美国OpenAI ChatGPTGPT-3.5、GPT-4https://chat.openai.com/
美国Microsoft CopilotGPT-4 和未知https://copilot.microsoft.com/
美国Google BardGeminihttps://bard.google.com/
中国百度文心一言文心 4.0https://yiyan.baidu.com/
中国讯飞星火星火 3.5https://xinghuo.xfyun.cn/
中国智谱清言GLM-4https://chatglm.cn/
中国月之暗面 Kimi ChatMoonshothttps://kimi.moonshot.cn/
中国MiniMax 星野abab6https://www.xingyeai.com/

2.1 按格式输出

在这里插入图片描述

2.2 分类

在这里插入图片描述

2.3 聚类

在这里插入图片描述

2.4持续互动

在这里插入图片描述

2.5技术相关问题

在这里插入图片描述

2.6解决问题

大模型把语言描述作为输入,有输入就能输出结果
但如何发挥大模型的现有能力呢?最大的障碍是没有形成认知对齐
在这里插入图片描述
找落地场景的思路:

  1. 从最熟悉的领域入手
  2. 让AI学最厉害员工的能力,再让他辅助其他员工,实现降本增效
  3. 找[文本进、文本出]的场景
  4. 别求大而全。将任务拆解,先解决小任务、小场景

3.认知

3.1 目标

懂AI、懂编程、懂业务你就是AGI(artificial general intelligence 通用人工智能)SuperStar。

要懂原理、重实践、提认知

不懂原理就不会举一反三,走不了太远。
不懂实践就只能纸上谈兵,做事不落地。
认知不高就无法做对决策,天花板太低。

目前行业共识:两个确定和一个不确定

  • 确定未来,AI必定重构世界
  • 确定进入,收获红利
  • 不确定落地,解决需求,技术路线,产品策略

只等不确定 确定了,巅峰即来

3.2 知识体系

请添加图片描述

3.3 学习方法

  • 至少懂一门语言
  • 有真实的项目经验
  • 原理一定用心学
  • 认知一定用心领悟
  • 实践一定要多

4.大模型是怎么工作的

其实它只是根据上文,猜下一个词(的概率)
请添加图片描述

通俗理解

  1. 大模型阅读了人类曾说过的所有话。这就是机器学习,也叫训练
  2. 大模型将输入文字转化为一串编码,并计算后面跟着的不同编码的概率,存入神经网络,并保存数据参数(权重)
  3. 大模型用之前输入的文字编码加上现在输入的文字编码,并计算出下一个最高概率的编码。这个过程就是生成(推理)
  4. 步骤3循环反复,生成更多的文字

这套生成机制的内核叫「Transformer 架构」。但其实,transformer 已经不是最先进的了。

架构设计者特点链接
TransformerGoogle最流行,几乎所有大模型都用它OpenAI 的代码
RWKVPENG Bo可并行训练,推理性能极佳,适合在端侧使用官网、RWKV 5 训练代码
MambaCMU & Princeton University性能更佳,尤其适合长文本生成GitHub

5.用好AI的关键

OpenAI 首席科学家 Ilya Sutskever 说过:

数字神经网络和人脑的生物神经网络,在数学原理上是一样的

我们要把 [AI当人看] ,来理解、控制和看待,其有优点也有不足。

6.大模型应用架构

大模型技术分两个部分:

  • 基础大模型的训练
  • 开发大模型的应用

大模型应用技术特点:门槛低,天花板高

6.1典型业务架构

在这里插入图片描述
Agent 还太超前,Copilot 值得追求

6.2技术架构

prompt(提词) 一问一答方式
在这里插入图片描述

Agent + Function Calling (代理+函数调用)

  • Agent:AI主动提要求
  • Function Calling: AI要求执行某个函数
  • 场景举例:你问水果好吃吗?他反问你哪种水果
    在这里插入图片描述

RAG(Retrieval-Augmented Generation 检索增强生成)

  • Embeddings:把文字转换为更易于相似度计算的编码。这种编码叫向量
  • 向量数据库:把向量存起来,方便查找
  • 向量搜索:根据输入向量,找到最相似的向量
  • 场景举例:考试时,看到一道题,到书上找相关内容,再结合题目组成答案。然后,就都忘了
    在这里插入图片描述

Fine-tuning (精调)

在这里插入图片描述

6.3如何选择技术路线

在这里插入图片描述
值得尝试Fine-Tuning的情况:

  • 提高大模型的稳定性
  • 用户量大,降低推理成本的意义很大
  • 提高大模型的生成速度

6.4基础模型选型

合规和安全是首要考量因素。使用测试数据选择最优的模型。

需求国外大模型国产大模型开源大模型
国内 2C🛑
国内 2G🛑
国内 2B
出海
数据安全特别重要🛑🛑

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/650774.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

黑马程序员JavaWeb开发|Maven高级

一、分模块设计与开发 分模块设计: 将项目按照功能拆分成若干个子模块,方便项目的管理维护、扩展,也方便模块间的相互调用,资源共享。 注意:分模块开发需要先对模块功能进行设计,再进行编码。不会先将工…

比较两组相同构造结构的迭代次数

( A, B )---9*50*2---( 1, 0 )( 0, 1 ) 做一个网络分类A和B,让B全是0,让训练集A中只有9张图片,共有4个点。共有16种情况 迭代次数 迭代次数 1 - - - - - - - 1 9252.186 1 1 1 - - - - - - - 49334.66 9 1 - - - …

十款数据可视化工具横评:优缺点大揭秘

作为一位热衷于数据可视化的爱好者,我深知选择一款得心应手的数据可视化工具对于呈现数据的魅力至关重要。在市面上众多的数据可视化工具中,我精选了十款备受瞩目的产品,下面就为大家简单介绍一下它们的优缺点,以帮助大家进行选择…

区块空间----流动性铭文

铭文正在改变加密世界,越来越多的人开始关注铭文,并参与进来!铭文赛道的未来是非常具有潜力和想象力的,甚至能够达到加密货币的普及水平。当然,这需要更多的基础设施更多的用例支持,但是一切都才刚刚开始。…

数据库之 基础概念、安装mysql、sql语句基础

数据库之 基础概念、安装mysql、sql语句基础 【一】存储数据的演变过程: 文件存储: 初始阶段随意存放数据到文件,格式任意。目录规范引入: 软件开发使用目录规范,限制数据位置,建立专门文件夹。本地数据存…

单片机学习笔记---独立按键控制LED状态

上一节学习的是独立按键控制LED亮灭 这一节我们先来讲一下按键的抖动: 对于机械开关,当机械触点断开、闭合时,由于机械触点的弹性作用,一个开关在闭合时不会马上稳定地接通,在断开时也不会一下子断开,所以…

基于51单片机智能电子秤

实物显示效果: https://www.bilibili.com/video/BV1Wb4y1A7Aw/?vd_source6ff7cd03af95cd504b60511ef9373a1d 功能介绍: (1)用键盘设计单价; (2)称重后同时显示该物品的重量、单价和总额&…

大创项目推荐 题目:基于大数据的用户画像分析系统 数据分析 开题

文章目录 1 前言2 用户画像分析概述2.1 用户画像构建的相关技术2.2 标签体系2.3 标签优先级 3 实站 - 百货商场用户画像描述与价值分析3.1 数据格式3.2 数据预处理3.3 会员年龄构成3.4 订单占比 消费画像3.5 季度偏好画像3.6 会员用户画像与特征3.6.1 构建会员用户业务特征标签…

VR漫游:赋予用户720度身临其境的沉浸式体验

如今,VR全景技术已经成为了千行百业中不可或缺的一部分,随着用户对交互式、沉浸式体验的需求不断加强,VR漫游逐渐取代了传统图片,为人们带来了流畅且完整的VR宣传观看体验。 VR实景漫游真实的展示了现场环境,不仅增加了…

JavaEE 网络编程

JavaEE 网络编程 文章目录 JavaEE 网络编程引子1. 网络编程-相关概念1.1 基本概念1.2 发送端和接收端1.3 请求和响应1.4 客户端和服务端 2. Socket 套接字2.1 数据包套接字通信模型2.2 流套接字通信模型2.3 Socket编程注意事项 3. UDP数据报套接字编程3.1 DatagramSocket3.2 Da…

【C语言/数据结构】排序(直接插入排序|希尔排序)

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343🔥 系列专栏:《数据结构》https://blog.csdn.net/qinjh_/category_12536791.html?spm1001.2014.3001.5482 ​​​​ 目录 插入排序 直接插入排序&…

Fink CDC 1.0 至3.0的从古至今

本文主要分享Flink CDC 1.0 至3.0的发展历程,了解其背后的关键特性和发展趋势,探讨其在大数据领域的影响和价值。 一、CDC概述 CDC是一种用以掌控数据变化的软件架构(技术思路),用于捕获和传递数据库中发生的数据变化。当数据库中发生增(INSERT)/删(DELETE)/改(UPD…

Java实现数字化社区网格管理系统 JAVA+Vue+SpringBoot+MySQL

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、开发背景四、系统展示五、核心源码5.1 查询企事业单位5.2 查询流动人口5.3 查询精准扶贫5.4 查询案件5.5 查询人口 六、免责说明 一、摘要 1.1 项目介绍 基于JAVAVueSpringBootMySQL的数字化社区网格管理系统&#xf…

燃烧的指针(三)

🌈个人主页:小田爱学编程 🔥 系列专栏:c语言从基础到进阶 🏆🏆关注博主,随时获取更多关于c语言的优质内容!🏆🏆 😀欢迎来到小田代码世界~ &#x…

【AndroidStudio】2022.3Giraffe连接超时,更换下载源,使用本地gradle,版本对应问题

记录了使用AndroidStudio2022.3 Giraffe版本在搭建环境时遇到的问题,包括连接超时,gradle无法读取等。 如果只看如何正确的配置,直接跳转第3节 配置汇总 1 连接超时 项目一开始会自动下载gardle文件来加载项目 1.1 Connect timed out 基…

算法38:子数组的最小值之和(力扣907题)----单调栈

题目: 给定一个整数数组 arr,找到 min(b) 的总和,其中 b 的范围为 arr 的每个(连续)子数组。 示例 1: 输入:arr [3,1,2,4] 输出:17 解释: 子数组为 [3],[…

go语言(十八)---- goroutine

一、goroutine package mainimport ("fmt""time" )func main() {//用go创建承载一个形参为空,返回值为空的一个函数go func() {defer fmt.Println("A.defer")func() {defer fmt.Println("B.defer")//退出当前goroutinefmt…

Ubuntu添加AppImage到桌面及应用程序菜单

将AppImage添加到桌面,以PicGo为例 效果: 在桌面创建PicGo.desktop文件,输入以下内容: [Desktop Entry] EncodingUTF-8 TypeApplication #应用名称 NamePicGo #图标路径 Icon/usr/local/AppImage/icons/PicGo.png #启动是否开启…

谁管谁叫爹

L1-8 谁管谁叫爹 分数 20 作者 陈越 单位 浙江大学 《咱俩谁管谁叫爹》是网上一首搞笑饶舌歌曲,来源于东北酒桌上的助兴游戏。现在我们把这个游戏的难度拔高一点,多耗一些智商。…

探索Pyecharts之美-绘制多彩旭日图的艺术与技巧【第37篇—python:旭日图】

文章目录 引言准备工作绘制基本旭日图调整颜色和样式添加交互功能定制标签和标签格式嵌套层级数据高级样式与自定义进阶主题:动态旭日图数据源扩展:外部JSON文件总结 引言 数据可视化在现代编程中扮演着重要的角色,而Pyecharts是Python中一个…