翻译: 生成式人工智能的工作原理How Generative AI works

在这里插入图片描述

ChatGPT 和 Bard 等系统生成文本的能力几乎像魔法一样。它们确实代表了 AI 技术的一大步进。但是文本生成到底是如何工作的呢?在这个视频中,我们将看看生成式 AI 技术的底层原理,这将帮助你理解你可以如何使用它,以及何时可能不想依赖它。让我们来看看。首先让我们看看生成式 AI 在 AI 领域中的位置。关于 AI 有很多炒作和兴奋,我认为一个有用的方式是将 AI 视为一系列工具的集合。AI 中最重要的工具之一是监督学习,它非常擅长于标记事物。如果你不知道这意味着什么,不用担心,我们将在下一张幻灯片中更多地讨论这个。其次是生成式 AI,这个领域直到最近才开始表现得非常好。如果你研究 AI,你可能会认识到还有其他工具,比如所谓的无监督学习和强化学习。但为了这门课程的目的,我将简要介绍什么是监督学习,然后花大部分时间讨论生成式 AI。

这两个,监督学习和生成式 AI,是当今 AI 中最重要的两个工具。对于大多数商业用例,如果你现在不担心这些工具以外的其他工具,你应该没问题。
在这里插入图片描述

在描述生成式 AI 如何工作之前,让我简要描述一下什么是监督学习,因为生成式 AI 是使用监督学习构建的。监督学习是一种技术,使计算机在给定一个输入(我将称之为 A)时非常擅长生成相应的输出(我将称之为 B)。
在这里插入图片描述

看几个例子。给定一封电子邮件,监督学习可以决定这封电子邮件是否是垃圾邮件。输入 A 是一封电子邮件,输出 B 是 0 或 1,其中 0 表示非垃圾邮件,1 表示垃圾邮件。这就是今天的垃圾邮件过滤器工作原理。作为第二个例子,可能是我曾经参与过的最赚钱的应用,不是最鼓舞人心,但对一些公司来说是赚钱的,是在线广告,其中给定一个广告和一些关于用户的信息,一个 AI 系统可以生成一个与您是否可能点击该广告相对应的输出 B。通过显示略微更相关的广告,这为在线广告平台带来了可观的收入。在自动驾驶汽车和驾驶辅助系统中,监督学习被用来将你的汽车前方的图像和雷达信息作为输入,并标记出其他汽车的位置。给它一个医疗 X 光片,它可以尝试用医疗诊断来标记它。我还在制造缺陷检查方面做了很多工作,你可以让一个系统拍摄一部手机的照片,当它从生产线上滚下来时,检查手机是否有任何划痕或其他缺陷,或者在语音识别中,输入 A 将是一段音频,我们将用文本转录来标记它,或者作为最后一个例子,如果你经营一家餐馆或其他偶尔有人写评论的生意,监督学习可以阅读这些评论,并将每一个标记为具有正面或负面情绪。这对于监控业务声誉很有用。

在这里插入图片描述

事实证明,大约 2010-2020 年的十年是大规模监督学习的十年。我想简要谈谈这一点,因为事实证明,这为现代生成式 AI 奠定了基础。但我们从 2010 年左右开始发现的是,对于很多应用来说,我们有很多数据,但即使我们提供了更多数据,如果我们训练的 AI 模型很小,它的性能并没有变得更好。这意味着,例如,如果你正在构建一个语音识别系统,即使你的 AI 听了成千上万小时或数十万小时的数据,这是很多数据,与只听了较少量音频数据的系统相比,它并没有变得更准确。但越来越多的研究人员在这一时期开始意识到,如果你训练一个非常大的 AI 模型,意味着在非常快速、非常强大的计算机上,有很多内存的 AI 模型,那么随着你提供越来越多的数据,它的性能会越来越好。

事实上,多年前当我开始并领导了 Google Brain 团队时,我为 Google Brain 团队设定的主要使命是,我说,让我们只是构建非常非常大的 AI 模型并向它们提供大量数据。幸运的是,这个配方奏效了,并最终推动了 Google 的许多 AI 进步。大规模监督学习今天仍然很重要,但这种用于标记事物的非常大的模型的想法是我们今天如何获得生成式 AI 的。
在这里插入图片描述

让我们看看生成式 AI 是如何使用一种叫做大型语言模型的技术来生成文本的。这是大型语言模型(我将缩写为 LLM)生成文本的一种方式。给定一个输入,比如“我喜欢吃”,这被称为提示,一个 LLM 然后可以用“百吉饼配奶油芝士”之类的东西来完成这个句子,或者如果你再运行一次,它可能会说“我妈妈的肉饼”,或者如果你第三次运行,也许它会说“和朋友一起出去”。一个大型语言模型是如何生成这个输出的呢?事实证明,LLM 是通过使用监督学习构建的。这是一种将输入 A 和输出标签 B 的技术。它使用监督学习来反复预测下一个词是什么。例如,如果一个 AI 系统在互联网上读到了一句话,比如“我最喜欢的食物是百吉饼配奶油芝士”,那么这一个句子就会变成很多数据点,让它尝试学习预测下一个词。具体来说,根据这个句子,我们现在有一个数据点,它说,给定短语“我最喜欢的食物是”,你认为下一个词是什么?在这种情况下,正确的答案是百吉饼。此外,给定“我最喜欢的食物是百吉饼”,你认为下一个词是什么?是“配”,等等。

在这里插入图片描述

这句话被转化为多个输入 A 和输出 B,以便从中学习,其中 LLM 正在学习给定几个词来预测接下来的词是什么。当你在大量数据上训练一个非常大的 AI 系统时,对于 LLM 来说,大量数据意味着数千亿甚至超过一万亿的词,那么你就会得到一个像 ChatGPT 这样的大型语言模型,它在给定一个提示时非常擅长生成一些额外的词作为响应。现在,我暂时省略一些技术细节。具体来说,下周我们将讨论一个使 LLM 不仅仅预测下一个词,而且实际上学会遵循指令并在其输出中保持安全的过程。但 LLM 的核心是这项从大量数据中学习预测下一个词的技术。这就是大型语言模型的工作方式;它们被训练来反复预测下一个词。事实证明,许多人,也许包括你,已经发现这些模型对日常工作中的写作、寻找基本信息或作为思考伙伴帮助思考问题很有用。

参考

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/FhzP3/how-generative-ai-works

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/197644.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【开源】基于JAVA的考研专业课程管理系统

项目编号: S 035 ,文末获取源码。 \color{red}{项目编号:S035,文末获取源码。} 项目编号:S035,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 考研高校模块2.3 高…

免费的SEO外链发布工具,提升排名的利器

互联网已经成为信息传播和商业发展的重要平台。而对于拥有网站的个人、企业来说,如何让自己的网站在搜索引擎中脱颖而出?SEO(Search Engine Optimization)作为提高网站在搜索引擎中排名的关键手段. 什么是SEO外链? S…

【STM32入门】3.OLED屏幕

1.OLED引脚 OLED屏幕的接线按图所示,本例中用的是4管脚OLED屏幕 2.驱动程序 配套的驱动程序是“OLED.c",主要由以下函数构成:1、初始化;2、清屏;3、显示字符;4、显示字符串;5、显示数字…

使用激光雷达(LiDAR)和相机进行3D物体跟踪

使用相机和激光雷达进行时间到碰撞(TTC)计算 在我的先前文章中,我介绍了通过检测关键点和匹配描述符进行2D特征跟踪的主题。在本文中,我将利用这些文章中的概念,以及更多的内容,开发一个软件流水线&#xf…

STM32串口通信初探:使用HAL库实现基本功能

在本文中,我们将探索如何使用STM32的HAL库来实现串口通信的基本功能。串口通信是一种常见的外设通信方式,用于在微控制器和其他外部设备之间进行数据传输。在STM32系列微控制器中,HAL库提供了简单且灵活的方法来实现串口通信。我们将重点讨论…

深入理解强化学习——马尔可夫决策过程:蒙特卡洛方法-[代码实现]

分类目录:《深入理解强化学习》总目录 在文章《深入理解强化学习——马尔可夫决策过程:蒙特卡洛方法-[基础知识]》中我们介绍了利用蒙特卡洛方法计算马尔可夫决策过程价值的方法,本文将用代码定义一个采样函数。采样函数需要遵守状态转移矩阵…

使用栈解决括号匹配问题(详解)

项目结构 项目头文件的代码或截图 头文件代码 #ifndef LINKSTACK_H #define LINKSTACK_H #include <stdio.h> #include <stdlib.h> // 链式栈的节点 typedef struct LINKNODE {struct LINKNODE* next; }LinkNode; // 链式栈 typedef struct LINKSTACK {LinkNode h…

【Java 基础】19 多线程基础

文章目录 进程和线程进程&#xff08;Process&#xff09;线程&#xff08;Thread&#xff09; 线程的创建1&#xff09;继承 Thread 类2&#xff09;实现 Runnable 接口3&#xff09;使用 Lambda 表达式4&#xff09;总结 线程的状态状态的分类状态间转换 多线程是一种 同时执…

6、原型模式(Prototype Pattern,不常用)

原型模式指通过调用原型实例的Clone方法或其他手段来创建对象。 原型模式属于创建型设计模式&#xff0c;它以当前对象为原型&#xff08;蓝本&#xff09;来创建另一个新的对象&#xff0c;而无须知道创建的细节。原型模式在Java中通常使用Clone技术实现&#xff0c;在JavaSc…

SpringBoot系列之集成Jedis教程

SpringBoot系列之集成Jedis教程&#xff0c;Jedis是老牌的redis客户端框架&#xff0c;提供了比较齐全的redis使用命令&#xff0c;是一款开源的Java 客户端框架&#xff0c;本文使用Jedis3.1.0加上Springboot2.0&#xff0c;配合spring-boot-starter-data-redis使用&#xff0…

基恩士软件的基本操作(六,KV脚本的使用)

目录 什么是KV脚本&#xff1f; KV脚本有什么用&#xff1f; 怎么使用KV脚本&#xff08;脚本不能与梯形图并联使用&#xff09;&#xff1f; 插入框脚本&#xff08;CtrlB&#xff09; 插入域脚本&#xff08;CtrlR&#xff09; 区别 脚本语句&#xff08;.T是字符串类…

【C进阶】C程序是怎么运作的呢?-- 程序环境和预处理(上)

前言&#xff1a; 由于c语言的程序编译链接的这块知识点不清楚&#xff0c;回来复习一遍&#xff0c;以便于好理解c知识&#xff0c;我会尽快更新下一篇文章。 目录 1.程序的翻译环境和执行环境 2.翻译环境&#xff08;编译链接&#xff09; 编译&#xff08;编译器&#xf…

算符优先语法分析程序设计与实现

制作一个简单的C语言词法分析程序_用c语言编写词法分析程序-CSDN博客文章浏览阅读378次。C语言的程序中&#xff0c;有很单词多符号和保留字。一些单词符号还有对应的左线性文法。所以我们需要先做出一个单词字符表&#xff0c;给出对应的识别码&#xff0c;然后跟据对应的表格…

电子学会C/C++编程等级考试2022年09月(四级)真题解析

C/C++等级考试(1~8级)全部真题・点这里 第1题:最长上升子序列 一个数的序列bi,当b1 < b2 < … < bS的时候,我们称这个序列是上升的。对于给定的一个序列(a1, a2, …, aN),我们可以得到一些上升的子序列(ai1, ai2, …, aiK),这里1 <= i1 < i2 < … &l…

IoT DC3 是一个基于 Spring Cloud 全开源物联网平台 linux docker部署傻瓜化步骤

如有不了解可先参考我的另一篇文章本地部署:IoT DC3 是一个基于 Spring Cloud 的开源的、分布式的物联网(IoT)平台本地部署步骤 如有不了解可先参考我的另一篇文章本地部署: 1 环境准备: JDK 8 以上 docker 安装好 下载docker-compose-dev.yml 文件 执行基础环境docker安装 …

gitlab-jenkins-shell-helm-chart-k8s自动化部署微服务

1.准备好编译环境的容器&#xff0c;所有容器的镜像制作在gemdale-dockerfile这个代码库里面&#xff0c;也可以直接拉取官方镜像部署 docker run --name node1420-patternx -v /data/var/www/:/data/var/www/ -v /var/jenkins_home/:/var/jenkins_home/ -v /mnt/hgfs/:/mnt/h…

zabbix的自动发现机制:

zabbix的自动发现机制: zabbix客户端主动的和服务端联系&#xff0c;将自己的地址和端口发送给服务端&#xff0c;实现自动添加监控主机 客户端是主动的一方 缺点&#xff1b;如果自定义网段中主机数量太多&#xff0c;等级耗时会很久&#xff0c;而且这个自动发现机制不是很…

后端部署-阿里云服务器-开设端口-域名解析-安全证书-备案

本文以阿里云的轻量级数据库为例子。 前言 要搭建一个完整的后端系统一般的步骤&#xff1a; 获得一台服务器----->开设端口----->搭建后台所需要的语言和应用---->利用公网ip地址测试后端程序------->购买域名和证书-------->域名绑定和解析------->icp备…

Nginx安装

Nginx简介 Nginx 是一个高性能的HTTP和反向代理web服务器&#xff0c;其特点是占有内存少&#xff0c;并发能力强&#xff0c;其并发能力在同类型的网页服务器中表现较好。 Nginx安装 下载地址 安装稳定版本 下载完成后进行解压 可以双击nginx.exe 启动nginx 也可以打开cm…

【mysql】基于binlog数据恢复指令和坑

文章目录 1.binlog相关配置是否开启binlogbinlog日志格式 2.导出binlog日志mysqlbinlog指令updateinsertdeletebinlog中的事件 3.数据恢复4.特别注意的坑为什么bash脚本执行mysqlbinlog&#xff0c;无法找到指令为什么执行mysqlbinlog&#xff0c;无法数据恢复 1.binlog相关配置…