Google DeepMind推出大模型 Gemini (vs GPT4):规模最大、能力最强的人工智能模型

系列文章目录


文章目录

  • 系列文章目录
  • 前言
  • 谷歌和 Alphabet 首席执行官桑达尔-皮查伊(Sundar Pichai)的说明
  • 一、Gemini 介绍
  • 二 、最先进的性能
  • 三、新一代功能
  • 四、复杂的推理能力
  • 五、理解文本、图像、音频及其他内容
  • 六、先进的编码技术
  • 七、更可靠、可扩展、高效
  • 八、以责任和安全为核心
  • 九、让 Gemini 走向世界
    • 9.1 谷歌产品中的 Gemini Pro
    • 9.2 使用 Gemini 进行构建
    • 9.3 Gemini Ultra 即将推出
    • 9..4 Gemini 时代:成就创新未来


前言

2023 年 12 月 06 日

12 分钟阅读

让人工智能为每个人提供更多帮助

Sundar Pichai
谷歌和 Alphabet 首席执行官

Demis Hassabis
谷歌 DeepMind 首席执行官兼联合创始人

在这里插入图片描述


谷歌和 Alphabet 首席执行官桑达尔-皮查伊(Sundar Pichai)的说明

每一次技术变革都是推动科学发现、加快人类进步和改善生活的机遇。我相信,我们现在看到的人工智能转型将是我们有生之年最深刻的转型,远远超过之前向移动或网络的转型。人工智能有可能为世界各地的人们创造从日常到非凡的机遇。它将带来新一轮的创新和经济进步,并以前所未有的规模推动知识、学习、创造力和生产力的发展。

这正是让我感到兴奋的地方:让人工智能在世界各地为每个人带来帮助的机会。

作为一家以人工智能为先的公司,我们已经走过了将近八年的历程,进步的步伐只会越来越快: 现在,数百万人正在我们的产品中使用生成式人工智能来完成他们一年前无法完成的事情,从寻找更复杂问题的答案到使用新工具进行协作和创作。与此同时,开发人员正在使用我们的模型和基础架构来构建新的生成式人工智能应用,世界各地的初创企业和企业正在利用我们的人工智能工具不断发展壮大。

这是令人难以置信的发展势头,然而,我们才刚刚开始触及可能的表面。

我们正在大胆而负责地开展这项工作。这意味着我们要雄心勃勃地开展研究,追求能为人类和社会带来巨大利益的能力,同时建立保障措施,并与政府和专家合作,随着人工智能能力的提高来应对风险。我们将继续投资于最优秀的工具、基础模型和基础设施,并在人工智能原则的指导下,将它们应用到我们的产品和其他产品中。

现在,我们正通过双子座(Gemini)在我们的征程上迈出下一步,这是我们迄今为止能力最强、最通用的模型,在许多领先基准测试中具有最先进的性能。我们的第一个版本 Gemini 1.0 针对不同尺寸进行了优化: Ultra、Pro 和 Nano。这些是双子座时代的首批模型,也是我们今年早些时候成立谷歌 DeepMind 时的愿景的首次实现。这一新时代的模型代表了我们公司在科学和工程方面所做的最大努力之一。对于未来的发展,以及双子座将为世界各地的人们带来的机遇,我感到由衷的兴奋。

  • Sundar Pichai

一、Gemini 介绍

由谷歌 DeepMind 首席执行官兼联合创始人 Demis Hassabis 代表 Gemini 团队撰写

和我的许多研究同事一样,人工智能一直是我毕生工作的重点。自从少年时代为电脑游戏编写人工智能程序,以及多年来作为神经科学研究员试图了解大脑的工作原理以来,我一直坚信,如果我们能制造出更智能的机器,就能利用它们以不可思议的方式造福人类。

人工智能以负责任的方式赋予世界力量,这一承诺将继续推动我们在谷歌 DeepMind 的工作。长期以来,我们一直希望从人们理解世界和与世界互动的方式中汲取灵感,建立新一代人工智能模型。人工智能给人的感觉不像一款智能软件,而更像是一种有用的、直观的东西–专家帮手或助手。

今天,我们向这一愿景又迈进了一步,因为我们推出了 Gemini,这是我们迄今为止构建的最强大、最通用的模型。

Gemini 是包括我们在谷歌研究院的同事在内的谷歌团队大规模合作的成果。它从一开始就是为多模态而构建的,这意味着它可以概括并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。

Gemini 也是我们迄今为止最灵活的模型–能够在从数据中心到移动设备的所有设备上高效运行。其最先进的功能将大大增强开发人员和企业客户构建和扩展人工智能的方式。

我们对 Gemini 1.0(我们的第一个版本)进行了优化,使其适用于三种不同的规模:

  • Gemini Ultra - 我们最大、功能最强的模型,适用于高度复杂的任务。
  • Gemini Pro - 我们的最佳模型,适用于各种任务的扩展。
  • Gemini Nano - 我们用于设备上任务的最高效模型。

二 、最先进的性能

我们一直在严格测试我们的 Gemini 模型,并评估其在各种任务中的性能。从自然图像、音频和视频理解到数学推理,在大型语言模型(LLM)研发中广泛使用的 32 个学术基准中,Gemini Ultra 在其中 30 个基准上的表现超过了当前最先进的结果。

Gemini Ultra 的得分率高达 90.0%,是第一个在 MMLU(大规模多任务语言理解)上超过人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等 57 个学科来测试世界知识和解决问题的能力。

我们对 MMLU 采用了新的基准方法,使 Gemini 能够利用其推理能力,在回答难题之前进行更仔细的思考,从而比仅仅利用第一印象有显著提高。

在这里插入图片描述

Gemini Ultra 在新的 MMMU 基准测试中也取得了 59.4% 的一流成绩,该基准测试由跨不同领域、需要慎重推理的多模态任务组成。

在我们测试的图像基准测试中,Gemini Ultra 在没有对象字符识别 (OCR) 系统(从图像中提取文本进行进一步处理)辅助的情况下,表现超过了以前的一流模型。这些基准测试凸显了 Gemini 的原生多模态性,并显示了 Gemini 更复杂推理能力的早期迹象。

更多详情,请参阅我们的 Gemini 技术报告。

在这里插入图片描述

三、新一代功能

到目前为止,创建多模态模型的标准方法是为不同模态训练不同的组件,然后将它们拼接在一起,以大致模仿其中的某些功能。这些模型有时可以很好地完成某些任务,如描述图像,但在概念性更强、更复杂的推理方面却很吃力。

我们将 Gemini 设计为原生多模态模型,从一开始就在不同模态上进行预训练。然后,我们利用额外的多模态数据对其进行微调,以进一步提高其有效性。这有助于 Gemini 从一开始就无缝地理解和推理各种输入,远远优于现有的多模态模型–其能力几乎在每个领域都是最先进的。

了解有关 Gemini 功能的更多信息,看看它是如何工作的。

四、复杂的推理能力

Gemini 1.0 先进的多模态推理能力可帮助理解复杂的书面和视觉信息。这使它在发掘海量数据中难以辨别的知识方面具有独特的技能。

通过阅读、过滤和理解信息,双子星 1.0 能够从成千上万的文档中提取独到的见解,这将有助于在从科学到金融等众多领域以数字化的速度实现新的突破。

五、理解文本、图像、音频及其他内容

Gemini 1.0 经过训练,可以同时识别和理解文本、图像、音频等,因此它能更好地理解细微信息,并能回答与复杂主题相关的问题。这使它尤其擅长解释数学和物理等复杂学科的推理。

六、先进的编码技术

我们的第一版 Gemini 可以理解、解释和生成世界上最流行的编程语言(如 Python、Java、C++ 和 Go)中的高质量代码。它能够跨语言工作并对复杂信息进行推理,这使它成为世界领先的编码基础模型之一。

Gemini Ultra 在多个编码基准测试中表现出色,其中包括用于评估编码任务性能的重要行业标准 HumanEval,以及我们内部保留的数据集 Natural2Code,该数据集使用作者生成的来源而非基于网络的信息。

Gemini 还可用作更高级编码系统的引擎。两年前,我们推出了 AlphaCode,它是第一个在编程竞赛中达到具有竞争力水平的人工智能代码生成系统。

利用 Gemini 的专门版本,我们创建了一个更先进的代码生成系统 AlphaCode 2,它擅长解决超出编码范围、涉及复杂数学和计算机科学理论的编程竞赛问题。

在与最初的 AlphaCode 相同的平台上进行评估时,AlphaCode 2 显示出巨大的改进,解决的问题数量几乎是 AlphaCode 的两倍。当程序员与 AlphaCode 2 合作,为代码样本定义某些属性时,AlphaCode 2 的表现会更好。

我们很高兴程序员能越来越多地使用高能力人工智能模型作为协作工具,帮助他们推理问题、提出代码设计方案并协助实施,这样他们就能更快地发布应用程序并设计出更好的服务。

更多详情,请参阅我们的 AlphaCode 2 技术报告。

七、更可靠、可扩展、高效

我们使用谷歌内部设计的张量处理单元 (TPU) v4 和 v5e,在我们的人工智能优化基础架构上对 Gemini 1.0 进行了大规模训练。我们将其设计为最可靠、可扩展的训练模型和最高效的服务模型。

在 TPU 上,Gemini 的运行速度明显快于早期规模较小、能力较弱的模型。这些定制设计的人工智能加速器是谷歌人工智能产品的核心,这些产品为搜索、YouTube、Gmail、谷歌地图、Google Play 和 Android 等数十亿用户提供服务。它们还帮助世界各地的公司经济高效地训练大规模人工智能模型。

今天,我们发布了迄今为止最强大、最高效、可扩展的TPU系统–Cloud TPU v5p,专为训练尖端的人工智能模型而设计。这款新一代 TPU 将加速 Gemini 的发展,帮助开发人员和企业客户更快地训练大规模生成式 AI 模型,让新产品和新功能更快地与客户见面。

在这里插入图片描述

八、以责任和安全为核心

在谷歌,我们致力于在一切工作中推进大胆而负责任的人工智能。在谷歌人工智能原则和我们所有产品的健全安全政策的基础上,我们正在增加新的保护措施,以应对 Gemini 的多模式能力。在每个开发阶段,我们都会考虑潜在风险,并努力进行测试和降低风险。

Gemini 拥有迄今为止谷歌人工智能模型中最全面的安全评估,包括偏差和毒性评估。我们对网络攻击、说服和自主性等潜在风险领域进行了新颖的研究,并应用了谷歌研究院一流的对抗测试技术,帮助在 Gemini 部署前找出关键的安全问题。

为了找出内部评估方法中的盲点,我们正与不同的外部专家和合作伙伴合作,针对一系列问题对我们的模型进行压力测试。

为了在 Gemini 的训练阶段诊断内容安全问题,并确保其输出符合我们的政策,我们正在使用 “真实毒性提示”(Real Toxicity Prompts)等基准,这是一套由艾伦人工智能研究所(Allen Institute for AI)的专家从网络上提取的 10 万条具有不同程度毒性的提示。有关这项工作的更多详情即将公布。

为了限制危害,我们建立了专门的安全分类器来识别、标记和分类涉及暴力或负面刻板印象等内容。结合强大的过滤器,这种分层方法旨在使 Gemini 对每个人都更加安全和包容。此外,我们还在继续解决已知的模型难题,如事实性、基础、归属和确证。

责任和安全将始终是我们开发和部署模型的核心。这是一项需要合作建设的长期承诺,因此我们正在与业界和更广泛的生态系统合作,通过 MLCommons、前沿模型论坛及其人工智能安全基金等组织,以及我们的安全人工智能框架(SAIF),定义最佳实践并设定安全和安保基准。在开发 Gemini 的过程中,我们将继续与世界各地的研究人员、政府和民间团体合作。

九、让 Gemini 走向世界

Gemini 1.0 现已在一系列产品和平台中推出:

9.1 谷歌产品中的 Gemini Pro

我们将通过谷歌产品为数十亿人带来 Gemini。

从今天起,Bard 将使用经过微调的 Gemini Pro 版本,以实现更高级的推理、规划、理解等功能。这是 Bard 推出以来最大的一次升级。它将在 170 多个国家和地区提供英语版本,我们计划在不久的将来扩展到不同的模式,并支持新的语言和地区。

我们还将为 Pixel 带来 Gemini。Pixel 8 Pro 是首款运行 Gemini Nano 的智能手机,Gemini Nano 支持录音机应用中的摘要等新功能,并从 WhatsApp 开始在 Gboard 的智能回复中推出,明年还将推出更多消息应用。

未来几个月,Gemini 将应用于我们更多的产品和服务,如搜索、广告、Chrome 浏览器和 Duet AI。

我们已经开始在搜索中尝试使用 Gemini,它使我们的搜索生成体验(SGE)对用户来说更快,在美国英语中的延迟降低了 40%,同时质量也得到了改善。

9.2 使用 Gemini 进行构建

从 12 月 13 日开始,开发人员和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。

Google AI Studio是一款免费的基于网络的开发人员工具,可使用API密钥快速创建原型并启动应用程序。当需要一个全面管理的人工智能平台时,Vertex AI 允许对 Gemini 进行定制,并提供全面的数据控制,同时受益于额外的谷歌云功能,以实现企业安全性、安全性、隐私性以及数据治理和合规性。

从 Pixel 8 Pro 设备开始,Android 开发人员还将能够通过 AICore(Android 14 中提供的一项新系统功能)使用 Gemini Nano(我们用于设备上任务的最高效模型)进行构建。注册获取 AICore 的早期预览版。

9.3 Gemini Ultra 即将推出

对于 Gemini Ultra,我们目前正在完成广泛的信任和安全检查,包括由受信任的外部方进行红组,并在广泛提供之前使用微调和人类反馈强化学习(RLHF)进一步完善模型。

作为这一过程的一部分,我们将向部分客户、开发人员、合作伙伴以及安全和责任专家提供 Gemini Ultra,供其进行早期实验和反馈,然后在明年初向开发人员和企业客户推出。

明年年初,我们还将推出 Bard Advanced,这是一种全新的尖端人工智能体验,从 Gemini Ultra 开始,您可以使用我们最好的模型和功能。

9…4 Gemini 时代:成就创新未来

这是人工智能发展的一个重要里程碑,也是谷歌新时代的开始,我们将继续快速创新,以负责任的态度提升我们模型的能力。

到目前为止,我们在 Gemini 上已经取得了巨大进步,我们正在努力为未来版本进一步扩展其能力,包括在规划和记忆方面的进步,以及增加上下文窗口以处理更多信息,从而给出更好的反应。

我们对人工智能赋予世界的无限可能感到兴奋–未来的创新将提高创造力、扩展知识、推动科学发展,并改变全球数十亿人的生活和工作方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204784.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推荐一个可以记录历史进价的进销存软件?

“我是卖数码产品的,数码产品价格变动是比较大的,每次采购时候我都会多家对比价格,再决定在哪个厂家进货。所以基本上我每次进价价格都不一样,但是之前的询价情况又很难一一单独记录,让我采购的时候很被动。” “准备…

java--枚举

1.枚举 枚举是一种特殊类 2.枚举类的格式 注意: ①枚举类中的第一行,只能写一些合法的标识符(名称),多个名称用逗号隔开。 ②这些名称,本质是常量,每个常量都会记住枚举类的一个对象。 3.枚举类的特点 ①枚举类的…

预测:2024年的安防监控行业将迎来怎样的变化?

随着科技的飞速发展,安防监控视频技术已经成为我们生活中的重要部分。通过对其发展趋势的深入了解,我们可以对未来做出更为精确的预测。本文将探讨2024年安防监控视频技术的可能发展趋势。 1、5G技术的普及将加速安防视频监控技术的发展 5G的高速率、低…

背包问题学习

背包问题是常见的动态规划dp的问题 下面用到的符号: 常用n表示物品数, m表示背包容积f[i][j]表示i件物品, j的背包容量的最大价值w[i]表示第i件物品的价值, v[i] 表示第i件物品的容量f[0][0~m] 0, 所以n可以从1开始遍历一般是有两层嵌套循环 第一层遍历物品, 第二层遍历背包…

PHP使用HTTP代码示例模板

PHP是一种广泛用于服务器端的编程语言&#xff0c;它提供了许多内置的函数和扩展&#xff0c;以便开发人员能够轻松地处理HTTP请求和响应。在PHP中&#xff0c;您可以使用以下代码示例模板来处理HTTP请求和生成HTTP响应。 php复制代码 <?php // 处理GET请求 if ($…

获取Github Copilot的Token

可以在线提取出Github Copilot插件的Token&#xff0c;这样的话就可以把Token拿来做别的用处了&#xff0c;比如共享给其他人 Github Copilot是一款由GitHub和OpenAI合作开发的人工智能编程助手。它利用机器学习和自然语言处理技术&#xff0c;能够根据用户的输入自动生成代码…

IDEA中配置Git

Git 在IDEA中使用Git1 在IDEA中配置Git2 在IDEA中使用Git2.1在IDEA中创建工程并将工程添加至Git2.2 将文件添加到暂存区2.3 提交文件2.4 将代码推送到远程仓库2.5 从远程仓库克隆工程到本地2.6 从远程拉取代码2.7 版本对比2.8 创建分支2.9 切换分支2.10 分支合并 3 使用IDEA进行…

数据结构与算法编程题49

假设不带权有向图采用邻接表G存储&#xff0c;设计实现以下功能的算法。 &#xff08;1&#xff09;求出图中每个顶点的出度。 &#xff08;2&#xff09;求出图中出度为0的顶点数。 &#xff08;3&#xff09;求出图中每个顶点的入度。 #include <iostream> using names…

私域最全养号攻略---微信

微信号的使用规则&#xff1a; 注册新微信、微信实名认证、主动添加好友、面对面建群、被动添加好友、进群限制、朋友圈限制、好友上限 微信权重加分规则&#xff1a; 基础信息是否完整、注册时间、微信使用行为、 微信权重扣分规则&#xff1a; 使用的环境是否正常、部分行为会…

Michael.W基于Foundry精读Openzeppelin第40期——ERC20Burnable.sol

Michael.W基于Foundry精读Openzeppelin第40期——ERC20Burnable.sol 0. 版本0.1 ERC20Burnable.sol 1. 目标合约2. 代码精读2.1 burn(uint256 amount)2.2 burnFrom(address account, uint256 amount) 0. 版本 [openzeppelin]&#xff1a;v4.8.3&#xff0c;[forge-std]&#x…

1.pipenv创建pyqt5虚拟环境

pipenv创建pyqt5虚拟环境 一、安装pipenv ​ cmd输入指令&#xff1a; pip install pipenv二、安装虚拟环境 cmd进入我要创建环境的目录下 我使用以下命令在当前目录下创建虚拟环境&#xff1a; pipenv --python 3.8创建一个基于Python 3.8的虚拟环境&#xff0c;并生成一个…

华为鸿蒙开发——开发及引用静态共享包(HAR)、应用配置文件

文章目录 简述一、创建HAR模块二、编译HAR模块三、应用配置文件&#xff08;Stage模型&#xff09;四、应用配置文件&#xff08;FA模型&#xff09;1、配置文件的内部结构&#xff08;1&#xff09;app&#xff08;2&#xff09;deviceConfig&#xff08;3&#xff09;module …

C - 语言->内存函数

目录 系列文章目录 前言 1. memcpy使⽤和模拟实现 1.2 memcpy函数的模拟实现: 2. memmove 使⽤和模拟实现 2.1memmove的模拟实现&#xff1a; 3. memset 函数的使⽤ 4. memcmp 函数的使⽤ 系列文章目录 ✅作者简介&#xff1a;大家好&#xff0c;我是橘橙黄又青&#xff…

uniapp实战 —— 猜你喜欢(含滚动触底分页加载)

效果预览 组件封装 src\components\SUI_Guess.vue <script setup lang"ts"> import { ref, onMounted } from vue import type { GuessItem } from /types/index import { getGuessListAPI } from /apis/index import type { PageParams } from /types/global…

如何使用技术 SEO 优化 Pinterest 富图钉

Pinterest 可以影响搜索引擎排名&#xff0c;尤其是谷歌。不过&#xff0c;它的作用方式与其他搜索引擎优化因素不同。这就是 Google 将图钉放在 nofollow 列表中。但是&#xff0c;它们仍然可以作为搜索引擎优化的一个重要因素。 高质量的图钉具有高分辨率的图片、吸引人的内…

(汇川H5U-A8)Modbus Poll与AutoShop使用RS-485通讯

一、初步认识: AutoShop: Modbus Poll: 1、连接配置 ConnectionSerial PortRS-485转串口,所以是串口Serial SettingsCOM3当你插入串口后,会显示新的一个端口,就是这个端口通讯速率9600与PLC协议配置一致数据长度8与PLC协议配置一致奇偶校验位0与PLC协议配置一致停止位2…

用perl解决小朋友问的2的10000次方是多少的问题

2的10000次方是多少&#xff0c;用perl单行命令搞定&#xff0c; perl -Mbigint -le print 2**10000如果是安装了strawberry perl &#xff0c;在Windows控制台上输入&#xff0c;单行命令的单引号要换成双引号。 perl -Mbigint -le "print 2**10000"在git-bash中执…

Linux sed 正则表达式的分组查找和替换

Linux sed 正则表达式的分组查找和替换。 替换IP:PORT信息中的某一段信息&#xff0c;用于IP:端口信息的脱敏。 替换前 cat a01.txt 10.10.32.82:3100 10.10.22.49:21034 10.15.2.246:61501 10.200.18.89:3100 10.200.18.89:21 替换后&#xff08;-E 和 -r 都是EBR扩展模式…

基于LSTM和N-gram序列的英文文本生成(文末送书)

&#x1f935;‍♂️ 个人主页&#xff1a;艾派森的个人主页 ✍&#x1f3fb;作者简介&#xff1a;Python学习者 &#x1f40b; 希望大家多多支持&#xff0c;我们一起进步&#xff01;&#x1f604; 如果文章对你有帮助的话&#xff0c; 欢迎评论 &#x1f4ac;点赞&#x1f4…

echarts图之 底部滚动横轴 缩放图形大小

//折线图-堆叠面积图function pileLineChart(odata, dom){//放大缩小的代码startvar dataZoom [],y240;if(odata.xData.length > 7){dataZoom [{show: true,realtime: true,startValue:0, endValue:5,left:"center",top:"auto",right:"auto"…