agi入门-大模型开发基础

AGI(Artifical General Inteligence)的到来还有多久?

  • 乐观预测:明年
  • 主流预测:3-5年
  • 悲观预测:10年

AGI时代,AI无处不在,相关从来者将如何分?

  • AI使用者:使用别人开发的AI产品
  • AI产品开发者:设计和开发AI产品
  • 基础模型相关:训练基础大模型,或为大模型提供基础设施

什么是AI?

基于机器学习、神经网络的是AI,基于规则、搜索的不是AI

 AI发展历史?

大模型能干什么?

大模型,全称【大语言模型】,英文【Large Language Model],缩写[LLM]

 什么是AGI?

  • 大模型是就是一个函数,给输入,生成输出
  • 任何可以用语言描述的问题,都可以输入给大模型,就能生成问题的结果
  • 进而,任何二进制数据,都可以输入给大模型,生成二进制数据

大模型落地的有五个要素?

  • 从最熟悉的领域入手
  • 找【文本进、文本出】的场景
  • 别求大而全。将任务分解,先解决小任务、小场景
  • 让AI学最历害的员工的能力,再让它辅助其它的员工,实现降本增效

大模型是如何生结果的?

训练和推理是大模型工作的两个核心过程。

用人类比,训练就是学,推理就是用。学以致用,如是也。

用不严密但通俗的语言描述和推理的原理:

训练

         1、大模型阅读了人类说过的所有的话,这就是【机器学习】

         2、训练过程中会把不同的token同时出现的概率存入【神经网络】文件。保存的数据就是【参数】,也叫【权重】

推理

        1、我们推理程序很多个token,程序会加载大模型权重,算出概率最高的下一个token是什么

        2、用生成的token,再加上上文,就能继续生成下一个toke。以此类推,生成更多文字

什么是token?

        1、可能是一个英文单词,也可能是半个,三分之一个

        2、可能是一个中文词,或者一个汉字,也可能是半个汉字,甚至三分之一个汉字

        3、大模型在开训前,需要先训练一个tokenizer模型连续能把所有的文件,切成token

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/805622.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

brctl 和ip link 操作网桥(Bridge)网卡

在Linux系统中,可以使用以下命令来进行网卡的桥接操作: brctl addbr :创建一个桥接设备,例如:brctl addbr br0。brctl addif :将网卡添加到桥接设备中,例如:brctl addif br0 eth0。…

LangChain学习——核心组件

LangChain是一个用于大语言模型(LLM)应用开发的框架,它简化了LLM应用的开发难度,帮助开发者快速构建复杂的LLM应用。 一、LangChain 库简介​ LangChain 包的主要价值主张是: 组件:用于处理语言模型的可…

面试经典算法系列之双指针6 -- 三数之和

面试经典算法题6 – 三数之和 LeetCode.15 公众号:阿Q技术站 问题描述 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums[j] nums[k] 0 。请 你返回所有…

密码学与密码安全:理论与实践

title: 密码学与密码安全:理论与实践 date: 2024/4/10 21:22:31 updated: 2024/4/10 21:22:31 tags: 密码学加密算法安全协议密码分析密码安全实际应用未来发展 第一章:密码学基础 1.1 密码学概述 密码学是研究如何保护信息安全的学科,旨在…

OSPF数据报文格式

OSPF协议是跨层封装的协议,跨四层封装,直接将应用层的数据封装在网络层协议后面,IP协议包中协议号字段对应的数值为——89 OSPF的头部信息: ——所有数据包公有的信息 版本:OSPF版本 在IPV4中一般使用OSPFV2&#xf…

配置启动nacos,保姆级教程

下载nacos 下载链接 https://github.com/alibaba/nacos/releases进去下拉,找到下载版本信息。 下载后如图所示。 配置数据库 在我们的conf文件夹中有一个nacos-mysql的数据库文件 我们需要导入数据库,可通过工具Navicat等进行导入。 会有一下几张表…

计算机进制

进制 进制也就是进位制,是人们规定的一种进位方法对于任何一种进制—X进制,就表示某一位置上的数运算时是逢X进一位 十进制是逢十进一,十六进制是逢十六进一,二进制就是逢二进一,以此类推,x进制就是逢x进…

WebGPU vs. 像素流

在构建 Bzar 之前,我们讨论过我们的技术栈是基于在云上渲染内容的像素流,还是基于使用设备自身计算能力的本地渲染技术。 由于这种选择会极大地影响项目的成本、可扩展性和用户体验,因此在开始编写一行代码之前,从一开始就采取正确…

浅入浅出容器化部署

目录 1. 概念2. 主要理念(优点)3. 容器与虚拟机的区别4. Docker 基本常用命令查看版本信息显示系统信息帮助命令镜像命令拉取镜像查看本地镜像列表删除镜像 容器命令运行容器查看正在运行的容器查看所有容器(包括未运行的)停止容器重启容器进入容器删除容…

在B站看课的进度助手

效果 代码 BilibiliVideoDurationCrawler import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.IOException; import java.text.ParseException; import java.util.ArrayList; imp…

深度优先搜索(DFS)算法遍历图

import java.util.*;public class GraphDFS {private int V; // 图中节点的数量private List<List<Integer>> adj; // 邻接表表示的图public GraphDFS(int v) {V v;adj new ArrayList<List<Integer>>(v);for (int i 0; i < v; i)adj.add(new Arr…

从零开始学RSA:已知e,n,dp,c求m等4类问题解答

(13)已知e,n,dp,c求m 题目内容如下: e65537n963757146665289974184814265445141340580197683432866741850921714950323851383087098535391831463316027758059181901618178530052186690153667066623404652169759023007916186728238912499809352663779657110014705243044508960…

yum和配置yum源

yum 以及配置yum 源。 文章目录 一、Linux 软件包管理器yum二、使用yum安装软件三、配置yum源四、yum源仓库五、lrzse 实现linux远端和本地 互传文件 一、Linux 软件包管理器yum (1)什么是yum? yum 是一个软件下载安装管理的一个软件包管理器&#xff0c;它就相当于我们手机…

浅谈.版本管理工具

定义&#xff1a; 版本控制是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史&#xff0c;方便查看更改历史记录&#xff0c;备份以便恢复以前的版本的软件工程技术。 特点&#xff1a; 1、方便用于管理多人协同开发项目 2、并行开发&#xff0c;可实现跨区…

KVM+GFS分布式存储系统构建KVM高可用

概述 本章利用KVM 及 GlusterFS 技术&#xff0c;结合起来从而实现 KVM 高可用。利用 GlusterFS 分布式复制卷&#xff0c;对 KVM 虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点&#xff0c;当其中一个节点数据丢失…

[Java、Android面试]_15_Android为什么使用Binder?

Android为什么使用Binder&#xff1f;用 Linux原有的IPC不行吗&#xff1f; 本人今年参加了很多面试&#xff0c;也有幸拿到了一些大厂的offer&#xff0c;整理了众多面试资料&#xff0c;后续还会分享众多面试资料。 整理成了面试系列&#xff0c;由于时间有限&#xff0c;每天…

雪花飘,购物抛物线,进度条等四个案列,带入走进 CSS transition

前言 今天从四个案例&#xff0c;我们一起走进 CSS Transition。 源码 以及 在线演示地址 源码地址&#xff1a; 四个案例&#xff0c; CSS Transition 源码 在线演示地址&#xff1a;(兼容移动端) 贝塞尔曲线运动进度条雪花飘飘效果购物车抛物线效果 案例演示 内置贝塞…

windows server 2019 -DNS服务器搭建

前面是有关DNS的相关理论知识&#xff0c;懂了的可以直接跳到第五点。 说明一下&#xff1a;作为服务器ip最好固定下来&#xff0c;以DNS服务器为例子&#xff0c;如果客户机的填写DNS信息的之后&#xff0c;服务器的ip如果变动了的话&#xff0c;客户机都得跟着改&#xff0c…

深入浅出Redis(九):Redis的发布订阅模式

引言 Redis是一款基于内存的键值对数据库&#xff0c;提供了多种数据结构存储数据&#xff0c;存取数据的速度还非常快&#xff0c;除了这些优点它还提供了其他特色功能&#xff0c;比如&#xff1a;管道、lua脚本、发布订阅模型 本篇文章主要描述发布订阅模型&#xff0c;将…

配置 vscode debug 用的 launch.json 文件

打开新项目左边的“运行和调试” 点击蓝色字体“创建 launch.json 文件” 选择上方“python” 选择“Python 文件 调试当前正在运行的Python文件” 配置launch.json文件内容&#xff1a; {// 使用 IntelliSense 了解相关属性// 悬停以查看现有属性的描述。// 欲了解更多信息&a…