大模型学习笔记1-大模型应用基础

一、什么是 AI

在当前AI概念大火的大环境下,似乎不加上AI的系统都不够潮流,但如何定义什么是AI?一种观点:基于机器学习、神经网络的是 AI,基于规则、搜索的不是 AI。从我个人理解上来看,更通俗的来说运行结果没有规律、不可预知,但能够在一定程度上符合预期的系统可以认为是AI。

二、大模型 AI 能干什么

虽然我们平时熟知的大模型产品主要以对话为主,例如ChatGPT、通义千问,文心一言等等,可以这样说,这些对话产品只是大模型的一种应用方式,或许是当前最能够产生热度或使用门槛最低的一种应用方式,但在我看来并不是最能够产生生产力的一种应用方式,我们可以给大模型建立一套规则,让大模型在这套规则里按照我们的设定去运行,听起来是不是就很像传统工程应用上产品经理给开发提需求,或者换句话说,可以直接把大模型当成一个能够接收文本或者二进制并根据要求输出文本或者二进制的电子人或智能体。

三、大模型是怎样工作的

简单来说,语言类大模型工作方式主要就是通过上文推测下一个字/词的概率,千万别觉得这很简单,也许人类的思考方式也是类似的机制。

大模型的工作主要有两个核心过程训练、推理,简单来说训练就是学习的过程,推理就是应用的过程。

训练:

  1. 大模型阅读了人类说过的所有的话。这就是「机器学习
  2. 训练过程会把不同 token 同时出现的概率存入「神经网络」文件。保存的数据就是「参数」,也叫「权重

推理:

  1. 我们给推理程序若干 token,程序会加载大模型权重,算出概率最高的下一个 token 是什么
  2. 用生成的 token,再加上上文,就能继续生成下一个 token。以此类推,生成更多文字

其中推理可能是一个单词、汉字,也可能是三分之一个单词、汉字,具体看训练者的想法和经验,如何对token进行定义。

这套机制就是大名鼎鼎的Transformer架构,目前只有 transformer 被证明了符合 scaling-law。

四、用好 AI 的核心心法

其实就一句话,把AI当人看,换句话说就是用跟人说话的方式跟AI交互,从个人日常体验来看这句话非常精髓,相比以前用搜索引擎搜索精简关键字的习惯,AI更适合用尽量没有二义性的与人交流的方式来进行交互。

五、大模型应用产品架构

1.AI Embebbed

2.AI Copilot

3.AI Agent

简单来说就是从1-3逐渐减少人对整个产品操作的参与度,从AI支持流程中部分节点到支持大部分节点,最终到AI自主决策完成整个流程,目前主流的还是AI Copilot。

六、大模型应用技术架构

1.纯 Prompt:

完全只通过提示词的方式使用大模型。

2.Agent + Function Calling

由AI自主决策是否需要调用函数(用户自定义,例如RestApi接口),调用的过程通常由外部程序完成,AI提供调用参数。

3.RAG(Retrieval-Augmented Generation)

将外部文档向量化存储(也可以使用es这种传统关键字检索,通常与向量库混合使用,具体后续文章会详细说明),使用提示词向量化检索相关文档配合使用,相当于开卷考试。

4.Fine-tuning(精调/微调)

对模型本身的训练进行微调,长期保存在模型的记忆中。

七、总结

相比传统软件工程true or false的底层逻辑,大模型应用颠覆了这个底层逻辑,把严谨的执行过程和结果变成了一个概率性的趋近结果,尽管它牺牲了一部分得出正确结果的概率,但同时也带来了更多的可能性,也许这就是所谓智能的意义吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/43834.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

链动2+1小程序商城开发,模式商城开发

链动21小程序商城的开发是一个涉及多个方面和步骤的复杂过程。以下是开发链动21小程序商城的基本步骤和要点: 需求分析与规划: 明确商城的功能和特性,包括商品展示、购物车管理、订单处理、支付功能、积分系统等1。 了解客户需求&#xff0…

HumanoidBench——模拟仿人机器人算法有未来

概述 论文地址:https://arxiv.org/pdf/2403.10506 仿人机器人具有类似人类的外形,有望在各种环境和任务中为人类提供支持。然而,昂贵且易碎的硬件是这项研究面临的挑战。因此,本研究开发了使用先进模拟技术的 HumanoidBench。该基…

GTK是如何加密WLAN组播和广播数据的?

1. References WLAN 4-Way Handshake如何生成GTK?_tk bigtk gtk igtk-CSDN博客 2. 概述 在Wi-Fi网络中,单播、组播和广播帧的加密算法是由AP决定的。其中组播帧和广播帧的加密使用GTK密钥,其PTK的密钥结构如下图所示: GTK的组成…

2024 Q3 NAND闪存价格|企业级依然猛涨,消费级放缓

在企业领域持续投资于服务器基础设施,特别是在人工智能应用的推动下,企业级SSD需求增加的同时,消费电子市场却依旧疲软。加之NAND供应商在2024年下半年积极扩大生产,预计到2024年第三季度,NAND闪存供应充足率将上升至2…

“郑商企航”暑期社会实践赴美丽美艳直播基地开展调研

马常旭文化传媒网讯(记者张明辉报道)导读:2024 年 7 月 3 日,商学院暑期社会实践团“郑商企航”在河南省郑州市新密市岳村镇美丽美艳直播基地,展开了一场意义非凡的考察活动,团队成员深度调研了直播基地的产…

【系统架构设计】计算机组成与体系结构(二)

计算机组成与体系结构 计算机系统组成存储器系统前言主存储器存储器存储数量(计算) 辅助存储器(以磁盘为例)Cache存储器 流水线 计算机系统组成 存储器系统 前言 存储器用来存放程序和数据的部件,是一个记忆装置&am…

【自动驾驶/机器人面试C++八股精选】专栏介绍

目录 一、自动驾驶和机器人技术发展前景二、C在自动驾驶和机器人领域的地位三、专栏介绍四、订阅需知 一、自动驾驶和机器人技术发展前景 随着人工智能、机器学习、传感器技术和计算能力的进步,自动驾驶和机器人的技术水平不断提升,使得它们更加智能、可…

fatal error: napi.h: No such file or directory

使用Cmake-js构建基于node-addon-api的C扩展 基于node-addon官方的eample改造测试:https://github.com/nodejs/node-addon-examples Cmake-js的github给了一个例子,但是是基于NAN的,而不是node-addon-api:https://github.com/cma…

如何压缩视频大小不改变画质,视频太大怎么压缩变小

在现代生活中,视频已经成为我们记录生活、分享快乐的重要工具。但随之而来的问题就是视频文件体积过大,不仅占用大量存储空间,还难以在社交平台上快速分享。别担心,下面我就来教大家几种简单有效的方法,让视频文件轻松…

回溯算法-以医院信息管理系统为例

1.回溯算法介绍 1.来源 回溯算法也叫试探法,它是一种系统地搜索问题的解的方法。 用回溯算法解决问题的一般步骤: 1、 针对所给问题,定义问题的解空间,它至少包含问题的一个(最优)解。 2 、确定易于搜…

移除元素的讲解,看这篇就够了!

一:题目 博主本文将用指向来形象的表示下标位的移动。 二:思路 1:两个整形,一个start,一个end,在一开始都 0,即这里都指向第一个元素。 2:在查到val之前,查一个&…

Jackson与FastJson时间Date转换问题

今天在开发Excel导出时发现一个Date类型的属性导出的不对,因为导出时将Vo装换成了Json, Vo类Date字段也添加了DateTimeFormat(pattern "yyyy-MM-dd"),JsonFormat(timezone "GMT8", pattern "yyyy-MM-dd"),那么这是为什么呢&#…

渲染农场怎么用更省钱?渲染100邀请码1a12

现在越来越多的设计师开始使用渲染农场,其中收费是个大问题,怎么用渲染农场才能更省钱呢?今天我们就来看下吧。 1、明确渲染方式 要根据不同情况选择合理的渲染方式,比如渲染农场就适合大场景渲染和紧急出图情况,其他…

前端JS特效第26波:jQuery日期时间选择器插件

jQuery日期时间选择器插件&#xff0c;先来看看效果&#xff1a; 部分核心的代码如下&#xff1a; <!DOCTYPE html> <html> <head lang"zh-CN"> <meta charset"UTF-8"> <title>jQuery日期时间选择器插件 - PHP中文网</t…

MySQL手注之布尔型盲注详解

布尔型盲注简介 基于布尔型SQL盲注即在SQL注入过程中&#xff0c;应用程序仅仅返回True&#xff08;页面&#xff09;和False&#xff08;页面&#xff09;。 这时&#xff0c;我们无法根据应用程序的返回页面得到我们需要的数据库信息。但是可以通过构造逻辑判断&#xff08;…

搜维尔科技:scalefit人体工程学分析表明站立式工作站的高度很重要

搜维尔科技&#xff1a;scalefit人体工程学分析表明站立式工作站的高度很重要 搜维尔科技&#xff1a;scalefit人体工程学分析表明站立式工作站的高度很重要

TCP/IP协议族结构和协议

TCP/IP协议族是互联网及许多其他网络的基础,它由一系列相互关联的协议组成,用于实现网络通信。TCP/IP协议族采用ARPANET参考模型,大致可以分为四个层次:链路层、网络层、传输层和应用层。每个层次都有特定的协议和功能,确保数据能够从一个网络设备传输到另一个网络设备。 …

WSL2编译使用6.6版本内核

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、有什么变化二、下载6.6内核三、开始编译1.安装环境2.开始编译 四、使用1.杀死虚拟机2.防止内核文件3.修改配置文件 总结 前言 最近出了一件不大不小的事&a…

品牌文化五大维度,构建品牌竞争力的秘诀!

品牌文化对于企业的发展和成功至关重要。 品牌文化不仅是企业和消费者之间的纽带&#xff0c;也是企业内部员工的凝聚力。 在当今竞争激烈的市场环境中&#xff0c;建立一个有活力和影响力的品牌文化是每个企业都需要认真思考和实践的事情。 品牌文化的五大维度包括价值观、…

前端面试题31(TCP与UDP区别)

TCP (Transmission Control Protocol) 和 UDP (User Datagram Protocol) 是两种在网络通信中常用的传输层协议&#xff0c;它们在多个方面存在显著差异&#xff0c;主要体现在以下几个方面&#xff1a; 连接方式&#xff1a; TCP 是面向连接的协议。在数据传输开始之前&#xf…