谷歌发布Gemini 1.0,开启生成式AI模型新时代!

个人头像
🎥 屿小夏 : 个人主页
🔥个人专栏 : IT杂谈
🌄 莫道桑榆晚,为霞尚满天!

文章目录

  • 📑前言
  • 一. Gemini的发布前期
    • 1.1 Gemini的准备
    • 1.2 DeepMnid
  • 二. Gemini的三大杀手锏
    • 2.1 多模态能力
    • 2.2 可拓展性
    • 2.3 新硬件,新架构
  • 三. 生成式人工智能领域的新格局会是什么样?

image-20231218202658001

📑前言

北京时间 12 月 6 日晚,Google 给近期稍显沉寂的 AI 模型战场扔下了一颗新的炸弹:号称多模态任务处理能力首次超越人类的 AI 模型,Gemini 1.0 正式发布。

一. Gemini的发布前期

1.1 Gemini的准备

在Gemini正式发布之前,外媒就有诸多关于 Google 这款全新 AI 模型的消息流出,Google 最早在今年五月的 IO 大会期间透露了 Gemini 的存在,但与之前外界预期的不同,Google 声称 Gemini 的发布并未因为任何内部原因而延期,表示其 AI 模型的研发进程从 2012 年已经开始,直到最近 2023 年发布 PaLM2 与 Bard 之后,就开始为 Gemini 的正式发布做准备。

1.2 DeepMnid

DeepMind本就是 AI 领域顶尖研究机构,早在 OpenAI 踏入聚光灯下之前,DeepMind 就凭借 AI 围棋棋手 —— AlphaGo 赢得了全世界对 AI 时代的关注,如今名为「双子座」的新一代 AI 大模型正式对外发布,也颇有抢回 AI 模型领域主导地位的感觉:双子座在神话本身就对应着「快速思维」的能力,同时也有着包罗万象、善于沟通等寓意。

image-20231218202900640

二. Gemini的三大杀手锏

2.1 多模态能力

Gemini是一款由Google开发的AI模型,它是史上第一款原生支持多模态能力的模型。与以往的多模态模型不同,Gemini在不同的模态上进行预训练,并利用额外的多模态数据进行微调,从而在处理复杂问题时表现更为出色。Gemini Ultra在行业标准MMLU基准测试中取得了90%的成绩,超过了人类专家和GPT-4同类测试的结果,并在九项独立基准测试中击败了竞争对手。这一突破性的训练架构让Gemini能够快速理解和推理人类的各种内容,为解决复杂问题提供了更加高效的解决方案。

image-20231218203433174

Gemini展示了其多模态理解能力,包括根据简笔画实时解读、根据视频中的颜色比例推荐编织玩具、以及玩猜硬币游戏。它与其他生成式AI模型最大的区别在于能够同时处理多种形态的信息输入。Google强调了Gemini在数学领域的复杂理解能力,展示了通过视频输入数学题,Gemini辅助解决的场景。这展示了Gemini在处理复杂逻辑的数学问题中的优势。

image-20231218203601183

2.2 可拓展性

到 2023 年下半年,大模型并行发展成为行业主流,尤其是端侧大模型在生成式 AI 应用中备受瞩目。vivo、小米、OPPO等手机品牌推出了端侧大模型与云端大模型的结合应用。在Gemini 1.0中,Google发布了三个版本:Gemini Ultra最聪慧,需要更大的计算量;Pro最均衡,适用于多场景;Nano体积最小最高效,主打部署在Android手机等设备上的端侧大模型。

image-20231218203908773

Gemini Nano具备完全在端侧离线运行的能力,已适配Pixel系统自带的录音App,可生成AI摘要,甚至在无网络连接时也可运行。Gemini Nano的能力已整合进Android系统,第三方应用开发者也可通过应用适配调用其能力。Google计划将Gemini适配到其他Android智能手机,但目前仅有Pixel 8 Pro适配。虽未正面回应是否超越GPT-4,但Gemini Ultra在MMLU中获得的评分比GPT-4更高,是唯一超越人类专家测试结果的AI模型。

img

img

2.3 新硬件,新架构

Google的TPU(张量处理单元)是专为神经网络机器学习开发的专用硬件,从2015年发布TPU v1至今已经迭代了五个大版本。

Gemini 1.0基于Google数据中心的TPU v4和TPU v5e大规模阵列训练而来。TPU阵列不仅用于训练Gemini,也应用在Gmail、YouTube、Google Play等Google生态应用中,并从2018年开始开放给第三方客户使用。

Gemini在TPU上的运行速度也明显优于早期的小模型。同时,Google展示了最新的TPU v5p系列,提升了可拓展性,浮点运算能力相比v4提升了两倍,训练速度也提升了2.8倍以上。

此外,还推出了代号为「AI Hypercomputer」的超级计算机架构,可以与Google Cloud计算中心的硬件协同工作,支持现代AI模型开发的工作负载。

image-20231218203827197

三. 生成式人工智能领域的新格局会是什么样?

最近OpenAI经历了一些领导层的变动,包括首席执行官被罢免后又回归,导致了一些不确定性。谷歌发布了Gemini,与OpenAI的GPT-4进行了对比,显示出在大型语言模型领域的激烈竞争。OpenAI也在密切关注谷歌的动向,并推出了一系列更新,包括GPT-4的升级版、将个性化GPT赋予用户的功能以及计划开放GPT应用商店等。OpenAI目前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

image-20231218205446562

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/232519.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AWS RDS慢日志文件另存到ES并且每天发送邮件统计慢日志

1.背景:需要对aws rds慢日志文件归档到es,让开发能够随时查看。 2.需求:并且每天把最新的慢日志,过滤最慢的5条sql 发送给各个产品线的开发负责人。 3.准备: aws ak/sk ,如果rds 在不同区域需要认证不同的…

Apache RocketMQ 5.0 腾讯云落地实践

Apache RocketMQ 发展历程回顾 RocketMQ 最早诞生于淘宝的在线电商交易场景,经过了历年双十一大促流量洪峰的打磨,2016年捐献给 Apache 社区,成为 Apache 社区的顶级项目,并在国内外电商,金融,互联网等各行…

TSINGSEE青犀边缘AI计算基于车辆结构化数据的车辆监控方案

随着人工智能技术的不断发展,边缘AI技术逐渐成为智能交通领域的研究热点。其中,基于边缘AI的车辆结构化数据技术与车辆监控系统是实现智能交通系统的重要手段之一。为了满足市场需求,TSINGSEE青犀边缘AI智能分析网关/视频智能分析平台推出了一…

《代码随想录》--二叉树(一)

《代码随想录》--二叉树 第一部分 1、二叉树的递归遍历2、二叉树的迭代遍历3、统一风格的迭代遍历代码4、二叉树的层序遍历226.翻转二叉树 1、二叉树的递归遍历 前序遍历 中序遍历 后序遍历 代码 前序遍历 class Solution {public List<Integer> preorderTraversal(T…

opencv 入门二(播放视频)

环境配置如下&#xff1a; opencv 入门一&#xff08;显示一张图片&#xff09;-CSDN博客 用OpenCV播放视频就像显示图像一样简单。唯一不同的是&#xff0c;我们需要某种循环来读取视频序列中的每一帧。 源码如下&#xff1a; #include <iostream> #include <str…

实时时钟(RTC)的选择与设计:内置晶体与外置晶体的优缺点对比

实时时钟(RTC)作为一种具备独立计时和事件记录功能的设备&#xff0c;现已广泛应用于许多电子产品中&#xff0c;并对时钟的精度要求越来越高。根据封装尺寸、接口方式、附加功能、时钟精度和待机功耗等因素进行分类&#xff0c;市场上有各种种类的RTC产品可供选择。 而在设计…

epi 外延炉 简介

因半导体制造工艺复杂&#xff0c;各个环节需要的设备也不同&#xff0c;从流程工序分类来看&#xff0c;半导体设备主要可分为晶圆制造设备&#xff08;前道工序&#xff09;、封装测试设备&#xff08;后道工序&#xff09;等。 本文介绍影响着晶体管性能和可靠性的外延炉。 …

C#调用阿里云接口实现动态域名解析,支持IPv6(Windows系统下载可用)

电信宽带一般能申请到公网IP&#xff0c;但是是动态的&#xff0c;基本上每天都要变&#xff0c;所以想到做一个定时任务&#xff0c;随系统启动&#xff0c;网上看了不少博文很多都支持IPv4&#xff0c;自己动手写了一个。 &#xff08;私信可全程指导&#xff09; 部署步骤…

Vue 使用 js-audio-recorder 实现录制、播放、下载音频

Vue 使用 js-audio-recorder 实现录制、播放、下载 PCM 数据 Vue 使用 js-audio-recorder 实现录制、播放、下载 PCM 数据js-audio-recorder 简介Vue 项目创建下载相关依赖主界面设计设置路由组件及页面设计项目启动源码下载 Vue 使用 js-audio-recorder 实现录制、播放、下载 …

FPGA时序分析与时序约束(二)——时钟约束

目录 一、时序约束的步骤 二、时序网表和路径 2.1 时序网表 2.2 时序路径 三、时序约束的方式 三、时钟约束 3.1 主时钟约束 3.2 虚拟时钟约束 3.3 衍生时钟约束 3.4 时钟组约束 3.5 时钟特性约束 3.6 时钟延时约束 一、时序约束的步骤 上一章了解了时序分析和约束…

IDEA shorten command line介绍和JAR manifest 导致mybatis找不到接口类处理

如果类路径太长&#xff0c;或者有许多VM参数&#xff0c;程序就无法启动。原因是大多数操作系统都有命令行长度限制。在这种情况下&#xff0c;IntelliJIDEA将试图缩短类路径。最好选中 classpath file模式。 shorten command line 选项提供三种选项缩短类路径。 none&#x…

破局:国内母婴市场“红利减退”,母婴店如何拓客引流裂变?

破局&#xff1a;国内母婴市场“红利减退”&#xff0c;母婴店如何拓客引流裂变&#xff1f; 背景&#xff1a;中国母婴市场近年来人口出生率一直在恒定范围值&#xff0c;国家也在鼓励优生、多生政策&#xff0c;并且随着互联网的高速发展&#xff0c;人均可支配收入也在增加&…

你是无醇葡萄酒的爱好者吗?

不含酒精的蒸馏酒和起泡酒正在流行&#xff0c;尽管它们是葡萄酒市场中最小的细分市场之一&#xff0c;但需求和供应都在稳步增长。这是因为&#xff0c;和啤酒一样&#xff0c;消费者越来越多地询问无醇葡萄酒。 来自云仓酒庄品牌雷盛红酒分享不含酒精的酒好喝吗&#xff1f;尼…

单通道 6 阶高清视频滤波驱动 MS1631

MS1631 是一个单通道视频缓冲器&#xff0c;它内部集成 6dB 增益的轨到轨输出驱动器和 6 阶输出重建 滤波器。MS1631 的-3dB 带宽典型值为 72MHz&#xff0c;压摆率为 400V/us。MS1631 比无源 LC 滤波器与外加 驱动的解决方案能提供更好的图像质量。它单电源供电范围为2.5V 到…

从零开始学习Web自动化:用Python和Selenium实现网站登录功能!

Web自动化测试实战项目&#xff1a;使用Selenium和Python完成网站登录功能的自动化测试 本文将介绍如何使用Selenium和Python编写自动化测试脚本&#xff0c;对网站登录功能进行测试。我们将通过模拟用户在网站上输入用户名和密码&#xff0c;并点击登录按钮&#xff0c;来检验…

flink yarn-session 启动失败retrying connect to server 0.0.0.0/0.0.0.0:8032

原因分析&#xff0c;启动yarn-session.sh&#xff0c;会向resourcemanager的端口8032发起请求&#xff1a; 但是一直无法请求到8032端口&#xff0c;触发重试机制会不断尝试 备注&#xff1a;此问题出现时&#xff0c;我的环境ambari部署的HA 高可用hadoop&#xff0c;三个节点…

电力智能化管理系统

电力智能化管理系统是一种综合性的电力管理解决方案&#xff0c;它利用先进的信息技术、自动化技术和智能控制技术&#xff0c;实现对电力系统的全面管理和优化。 该系统依托电易云-智慧电力物联网&#xff0c;它的主要功能包括实时监测、故障预警、自动巡检、设备管理、数据分…

【Unity 实用工具篇】✨| I2 Localization 实现本地化及多种语言切换,快速上手

前言【Unity 实用工具篇】| I2 Localization 实现本地化及多种语言切换,快速上手一、多语言本地化插件 I2 Localization1.1 介绍1.2 效果展示1.3 使用说明及下载二、插件资源简单介绍三、通过示例快速上手3.1 添加 Languages语种3.2 添加 Term资源3.3 静

Java版直播商城规划:电商源码、小程序、三级分销与免 费搭建全攻略

【saas云平台】打造全行业全渠道全场景的saas产品&#xff0c;为经营场景提供一体化解决方案&#xff1b;门店经营区域化、网店经营一体化&#xff0c;本地化、全方位、一站式服务&#xff0c;为多门店提供统一运营解决方案&#xff1b;提供丰富多样的营销玩法覆盖所有经营场景…

在Next.js渲染Markdown竟然如此简单

Next.js 作为一款开箱即用的 React 框架&#xff0c;因其优秀的服务器渲染能力和灵活的配置方式&#xff0c;已经吸引了大量的开发者。同时&#xff0c;Markdown 作为一种轻量级的标记语言&#xff0c;以其简洁的语法和强大的功能&#xff0c;已经成为了写作的首选工具。那么&a…