Gemini 1.0:Google推出的全新AI模型,改变生成式人工智能领域的游戏规则!

个人头像Gemini 1.0:Google推出的全新AI模型,将改变生成式人工智能领域的游戏规则!

🎥 屿小夏 : 个人主页
🔥个人专栏 : IT杂谈
🌄 莫道桑榆晚,为霞尚满天!

文章目录

  • 📑前言
  • 一. Gemini的发布前期
    • 1.1 Gemini的准备
    • 1.2 DeepMnid
  • 二. Gemini的三大杀手锏
    • 2.1 多模态能力
    • 2.2 可拓展性
    • 2.3 新硬件,新架构
  • 三. 生成式人工智能领域的新格局会是什么样?

image-20231218202658001

📑前言

北京时间 12 月 6 日晚,Google 给近期稍显沉寂的 AI 模型战场扔下了一颗新的炸弹:号称多模态任务处理能力首次超越人类的 AI 模型,Gemini 1.0 正式发布。

一. Gemini的发布前期

1.1 Gemini的准备

在Gemini正式发布之前,外媒就有诸多关于 Google 这款全新 AI 模型的消息流出,Google 最早在今年五月的 IO 大会期间透露了 Gemini 的存在,但与之前外界预期的不同,Google 声称 Gemini 的发布并未因为任何内部原因而延期,表示其 AI 模型的研发进程从 2012 年已经开始,直到最近 2023 年发布 PaLM2 与 Bard 之后,就开始为 Gemini 的正式发布做准备。

1.2 DeepMnid

DeepMind本就是 AI 领域顶尖研究机构,早在 OpenAI 踏入聚光灯下之前,DeepMind 就凭借 AI 围棋棋手 —— AlphaGo 赢得了全世界对 AI 时代的关注,如今名为「双子座」的新一代 AI 大模型正式对外发布,也颇有抢回 AI 模型领域主导地位的感觉:双子座在神话本身就对应着「快速思维」的能力,同时也有着包罗万象、善于沟通等寓意。

image-20231218202900640

二. Gemini的三大杀手锏

2.1 多模态能力

Gemini是一款由Google开发的AI模型,它是史上第一款原生支持多模态能力的模型。与以往的多模态模型不同,Gemini在不同的模态上进行预训练,并利用额外的多模态数据进行微调,从而在处理复杂问题时表现更为出色。Gemini Ultra在行业标准MMLU基准测试中取得了90%的成绩,超过了人类专家和GPT-4同类测试的结果,并在九项独立基准测试中击败了竞争对手。这一突破性的训练架构让Gemini能够快速理解和推理人类的各种内容,为解决复杂问题提供了更加高效的解决方案。

image-20231218203433174

Gemini展示了其多模态理解能力,包括根据简笔画实时解读、根据视频中的颜色比例推荐编织玩具、以及玩猜硬币游戏。它与其他生成式AI模型最大的区别在于能够同时处理多种形态的信息输入。Google强调了Gemini在数学领域的复杂理解能力,展示了通过视频输入数学题,Gemini辅助解决的场景。这展示了Gemini在处理复杂逻辑的数学问题中的优势。

image-20231218203601183

2.2 可拓展性

到 2023 年下半年,大模型并行发展成为行业主流,尤其是端侧大模型在生成式 AI 应用中备受瞩目。vivo、小米、OPPO等手机品牌推出了端侧大模型与云端大模型的结合应用。在Gemini 1.0中,Google发布了三个版本:Gemini Ultra最聪慧,需要更大的计算量;Pro最均衡,适用于多场景;Nano体积最小最高效,主打部署在Android手机等设备上的端侧大模型。

image-20231218203908773

Gemini Nano具备完全在端侧离线运行的能力,已适配Pixel系统自带的录音App,可生成AI摘要,甚至在无网络连接时也可运行。Gemini Nano的能力已整合进Android系统,第三方应用开发者也可通过应用适配调用其能力。Google计划将Gemini适配到其他Android智能手机,但目前仅有Pixel 8 Pro适配。虽未正面回应是否超越GPT-4,但Gemini Ultra在MMLU中获得的评分比GPT-4更高,是唯一超越人类专家测试结果的AI模型。

img

img

2.3 新硬件,新架构

Google的TPU(张量处理单元)是专为神经网络机器学习开发的专用硬件,从2015年发布TPU v1至今已经迭代了五个大版本。

Gemini 1.0基于Google数据中心的TPU v4和TPU v5e大规模阵列训练而来。TPU阵列不仅用于训练Gemini,也应用在Gmail、YouTube、Google Play等Google生态应用中,并从2018年开始开放给第三方客户使用。

Gemini在TPU上的运行速度也明显优于早期的小模型。同时,Google展示了最新的TPU v5p系列,提升了可拓展性,浮点运算能力相比v4提升了两倍,训练速度也提升了2.8倍以上。

此外,还推出了代号为「AI Hypercomputer」的超级计算机架构,可以与Google Cloud计算中心的硬件协同工作,支持现代AI模型开发的工作负载。

image-20231218203827197

三. 生成式人工智能领域的新格局会是什么样?

最近OpenAI经历了一些领导层的变动,包括首席执行官被罢免后又回归,导致了一些不确定性。谷歌发布了Gemini,与OpenAI的GPT-4进行了对比,显示出在大型语言模型领域的激烈竞争。OpenAI也在密切关注谷歌的动向,并推出了一系列更新,包括GPT-4的升级版、将个性化GPT赋予用户的功能以及计划开放GPT应用商店等。OpenAI目前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

image-20231218205446562

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/233914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu18.04 上通过 jihu 镜像完成 ESP-IDF 编译环境搭建流程

为了解决国内开发者从 github 克隆 esp 相关仓库慢的问题,已将 esp-idf 和部分重要仓库及其关联的子模块镜像到了 jihu,这些仓库将自动从原始仓库进行同步。此篇博客用来阐述 Ubuntu18.04 上通过 jihu 镜像完成 ESP-IDF 编译环境搭建流程。 注&#xff1…

LeetCode Hot100 51.N皇后

题目: 按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题 研究的是如何将 n 个皇后放置在 nn 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的…

亚马逊鲲鹏系统:引领批量自动操作买家号先进技术

亚马逊,作为全球最大的电商平台之一,其独特的自动化批量操作一直是众多我追逐的焦点。深入了解其主要使用方法,通过批量导入无数个买家账户,借助最新的反指纹技术和国外代理IP的绑定,可以成功规遍亚马逊市场&#xff0…

TortoiseGit通过SSH连接配置,生成SSH密钥方法

生成SSH密钥: Win环境下命令(git ssh key是可以自定义命名的): ssh-keygen -t ed25519 -C "git ssh key" && start "" "C:\Windows\notepad.exe" "C:\Users\%username%\.ssh\id_ed25519.pub" 打开cm…

三相异步电机动态数学模型推导及矢量控制仿真

文章目录 **原文链接,点击跳转**三相异步电机动态数学模型及矢量控制仿真1、异步电机三相方程2、坐标变换3、磁链3/2变换推导4、两相静止坐标系下的方程5、两相旋转坐标系下的方程6、以 ω-is-Ψr 为状态变量的状态方程7、矢量控制及 matlab 仿真 原文链接&#xff…

Linux中使用HTTP协议进行API交互的示例

在Linux中,HTTP协议就像一个神奇的传送门,让我们可以通过网络进行各种交互。这不,今天我们就来探讨一下如何使用HTTP协议在Linux中进行API交互。 首先,我们需要一个API。为了方便演示,我们假设有一个天气预报API&…

spark介绍及简单使用

简介 Spark是由加州大学伯克利分校AMPLab(AMP实验室)开发的开源大数据处理框架。起初,Hadoop MapReduce是大数据处理的主流框架,但其存在一些限制,如不适合迭代算法、高延迟等。为了解决这些问题,Spark在20…

Re解析(正则表达式解析)

正则表达式基础 元字符 B站教学视频: 正则表达式元字符基本使用 量词 贪婪匹配和惰性匹配 惰性匹配如下两张图,而 .* 就表示贪婪匹配,即尽可能多的匹配到符合的字符串,如果使用贪婪匹配,那么结果就是图中的情况三 p…

【Unity】运行时创建曲线(贝塞尔的运用)

[Unity]运行时创建线(贝塞尔的运用) 1. 实现的目标 在运行状态下创建一条可以使用贝塞尔方法实时编辑的网格曲线。 2. 原理介绍 2.1 曲线的创建 unity建立网格曲线可以参考Unity程序化网格体的实现方法。主要分为顶点,三角面&#xff0c…

浪潮信息KOS服务器操作系统:经过周密考虑后的智慧之选

文章目录 一、引言二、服务器操作系统概述三、选择服务器操作系统的关键因素四、评估服务器操作系统的标准五、选择服务器操作系统的实践经验六、浪潮信息KOS服务器操作系统一、稳定可靠二、高效协同三、全天候运维四、广泛兼容 七、总结与展望 浪潮信息信息KOS是浪潮信息信息基…

linux: ip route 与 route 用法详解与对比

文章目录 1. 引言2. ip route2.1 描述2.2 语法2.3 参数2.4 例子 3. route3.1 描述3.2 语法3.3 参数3.4 例子 4. 对比5. 参考 1. 引言 本文主要介绍 ip route 以及 route 的用法和区别。 2. ip route 2.1 描述 用于管理静态路由表。linux 系统中,可以自定义从 1&…

【docker】数据管理

Docker容器会随时关闭和开启,Docker 容器的数据放哪里呢? 答案就是:数据卷和数据卷容器 官网文档 Manage data in Docker | Docker Docs 数据卷(Data Volume) 数据卷就是将宿主机的某个目录,映射到容器中,作为数据存储的目录&…

无框架Java转go语言写http与tcp请求

项目地址 https://github.com/cmdch2017/http_tcpServer 项目结构 如何快速上手 http篇 1、controller包就相当于RestController,这里返回了一个Person对象,当你需要新建一个接口时,再新写一个func仿照下面的方法就行了 package control…

CSS设计器的使用

目录 css的概念 css的优势 css的基本语法 html中引入css样式 CSS基本选择器 选择器的使用 初级选择器: 标签选择器 类选择器 id选择器 高级选择器(结构选择器) ①后代选择器(E F) ②子选择器(E>F) ③相邻兄弟选择器(EF) ④通用兄弟选择器(…

kubernetes-L7负载均衡ingress

一、iptables/ipvs 前面我们说到kube-proxy是基于iptables/ipvs的分布式L4负载均衡技术,但是有很多的需求场景是这种网络层的dnat不能提供的能力。 基于L4的服务 每个应用独占ELB,浪费资源每个服务都需要创建DNS配置启动HTTPS,每个服务需要…

从零开始制作一个Douban图像下载器:Wt库的基础知识和操作指南

引言 欢迎来到本文,如果你希望从豆瓣下载海量的高清图像、学习使用现代C web应用程序框架Wt库开发web应用程序,或者了解如何利用代理IP和多线程技术提高爬虫效率和稳定性,那么你来对地方了。在接下来的内容中,我们将为你提供一个…

Taro旧项目埋坑日记

Taro旧项目埋坑日记 unexpected "\" at pos 148

过滤器和监听器及应用

Filter及应用 Filter有什么用?一、Filter处理中文乱码二、监听器,统计网站在线人数1.监听器引入2.统计网站在线人数 三、Filter实现权限拦截 Filter有什么用? Filter:过滤器,可以用来过滤网站的数据。 比如处理中文乱码,每次写servlet&…

docker小白第六天

docker小白第六天 容器数据卷是什么 首先,容器卷有个坑:容器卷需要加入privilegedtrue,如下图所示,是为了解决permission denied的问题。其中“挂载”的意思是相当于一个硬盘插到主机上。使用该命令。是扩大容器的权限解决挂载目…

力扣面试题 16.19. 水域大小(java DFS解法)

Problem: 面试题 16.19. 水域大小 文章目录 题目描述思路解题方法复杂度Code 题目描述 思路 该问题可以归纳为一类遍历二维矩阵的题目,此类中的一部分题目可以利用DFS来解决,具体到本题目(该题目可以的写法大体不变可参看前面几个题目&#…