超越GPT-4!谷歌AI大模型Gemini震撼发布

原创 | 文 BFT机器人 

图片

在Open AI风头正盛之际,谷歌大杀器终于上线!

当地时间12月6日,谷歌CEO桑达尔・皮查伊宣布正式推出其规模最大、功能最强大的新大型语言模型Gemini 1.0版。

据悉,Gemini 1.0是谷歌筹备了一年之久“对抗”GPT-4的真正竞品,也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型。其下包括三种不同套件,分别是能力最强复杂度最高的Gemini Ultra,适配性拓展性最强的Gemini Pro和适用于特定任务或端侧的Gemini Nano。

图片

目前,谷歌旗下类ChatGPT的人工智能聊天机器人Bard已经启用Gemini Pro作为底层大模型驱动,实现了更高级的推理、规划、理解等能力,同时继续保持免费。并且谷歌预计明年将推出“Bard Advanced”,计划使用Gemini最顶配的Ultra版本。

01

文本、图像、音频精准理解

Gemini 1.0经过训练,可以同时识别和理解文本、图像、音频等各种形式的输入内容,因此它也能更好地理解细微的信息,回答与复杂主题相关的各类问题。

图片

当你随手画个鸭子,从曲线开始到鸭子成型,Gemini都可以精准识别。给鸭子身下画条波浪线,它也能快速理解你的言外之意,精准地指出鸭子在水中游泳的场景,甚至还能模仿鸭子的叫声,或者用其他语言说出鸭子的叫法。

图片

或者闲暇时刻,跟Gemini玩个游戏,即使你的手速再快,也逃不过Gemini的眼睛。

02

复杂推理能力强悍

此外,Gemini 1.0具有复杂多模态推理能力,可以帮助更好地理解复杂的书面以及视觉信息。这使得它在发掘埋藏在海量的数据中难以辨别的知识方面具有优越的性能。Gemini 1.0能够通过阅读、理解和过滤信息从数十万份文件中提取insights的能力,这有助于科学、金融等诸多领域实现新突破。

图片

谷歌首席科学家、人工智能负责人Jeff Dean也通过一个简单的示例为大家展示了Gemini 1.0的能力:

当用户提供给Gemini一份学生手写的计算滑雪者滑到山下速度的解题内容提示后,Gemini能够在读懂题目的同时,指出正确的解答方法应该是怎样。这仅仅是在教育方面的能力体现,而未来这样的多模态能力或许能够在许多不同的领域发挥巨大作用。

图片

03

Gemini VS GPT-4

据谷歌内部消息称,Gemini有亿万参数,训练所使用的算力甚至达到了GPT-4的五倍之多!通过在多种任务对比评估Gemini Ultra和GPT-4两个模型的性能,从谷歌官方放出的测试结果来看,在文本、推理、音频、代码等领域,Gemini的表现几乎是全方位碾压了GPT-4。

图片

MMLU(大规模多任务语言理解)是结合了数学、物理、历史、法律、医学和伦理学等57个科目的测试集,通常被认为是测试AI模型知识和解决问题能力最流行方式之一。而在MMLU测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家,作为对比,GPT-4仅有86.4%的准确率。

图片

04

Gemini的下一步

虽然谷歌官方资料和演示视频把Gemini吹得神乎其神,仿佛已经“遥遥领先”Open AI,但实际上有能力对标GPT-4的Gemini Ultra要到明年年初才会上线。

据悉,Gemini Ultra模型目前正处于信任和安全检查阶段,同时使用微调和人类反馈强化学习(RLHF)进一步完善模型。之后,谷歌会先向部分客户、开发人员、合作伙伴以及安全和责任专家提供Gemini Ultra,供其进行早期实验和反馈。而普通用户体验Gemini Ultra的首个方式会是通过Bard Advanced,谷歌表示将在明年年初推出Bard Advanced。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/220749.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python通过selenium获取输入框的文本值爬取编辑框内容

以百度首页的输入框为例,当输入‘你好‘后,html中的value的值会变成‘你好’ from selenium import webdriver web webdriver.Chrome() web.get(http://www.baidu.com) # 初始页面 cc web.find_element_by_xpath(//*[id"kw"]) #定位输入通过复制xpat…

Excel单元格隐藏如何取消?

Excel工作表中的有些单元格隐藏了数据,如何取消隐藏行列呢?今天分享几个方法给大家 方法一: 选中隐藏的区域,点击右键,选择【取消隐藏】就可以了 方法二: 如果工作表中有多个地方有隐藏的话,…

数据分析基础之《numpy(1)—介绍》

一、numpy介绍 1、numpy 数值计算库 num - numerical 数值化的 py - python 2、numpy是一个开源的python科学计算库,用于快速处理任意维度的数组 numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用numpy比直接使用python要简洁的多 numpy使…

二、如何保证架构的质量、架构前期准备、技术填补与崩溃预防、系统重构

1、如何保证架构的质量 -- 稳定性和健壮性 2、正确的选择是良好的开端 -- 架构前期准备 ① 架构师分类:系统架构师、应用架构师、业务架构师 3、技术填补与崩溃预防 4、系统重构

Python创建代理IP池详细教程

一、问题背景 在进行网络爬虫或数据采集时,经常会遇到目标网站对频繁访问的IP进行封禁的情况,为了规避这种封禁,我们需要使用代理IP来隐藏真实IP地址,从而实现对目标网站的持续访问。 二、代理IP池的基本概念 代理IP池是一个包…

RLC防孤岛负载测试的操作和维护

孤岛现象是指当电网因故障或停电而与主电网断开连接时,某些部分仍然保持供电的现象。这种情况下,如果电力系统的保护设备不能及时检测到孤岛并切断供电,可能会导致严重的安全事故。因此,进行RLC防孤岛负载测试对于确保电力系统的安…

亿欧网首届“元创·灵镜”科技艺术节精彩纷呈,实在智能AI Agent智能体展现硬核科技图景

12月4日-10日,持续一周的首届“元创灵镜”科技艺术节在海南陵水香水湾拉开帷幕,虚实交互创造出的“海岛之镜”开幕式呈现出既真实又虚幻的未来感,融入前沿科技元素的艺术装置作品在“虚实之镜&自然生长”科技艺术展诠释着浪漫想象&#x…

C# WPF上位机开发(树形控件在地图软件中的应用)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 前面我们聊过图形软件的开发方法。实际上,对于绘制的图形,我们一般还会用树形控件管理一下。举个例子,一个地图…

功率信号源可以用在工业哪些产品上

功率信号源是一种关键的工业设备,其在各种产品和系统中发挥着至关重要的作用。这些信号源产生电信号,用于测试、校准、仿真和驱动各种工业设备。以下是功率信号源在工业中广泛应用的一些方面。 1.电源测试和校准 功率信号源常用于测试和校准电源系统。在…

【Spark精讲】Spark存储原理

目录 类比HDFS的存储架构 Spark的存储架构 存储级别 RDD的持久化机制 RDD缓存的过程 Block淘汰和落盘 类比HDFS的存储架构 HDFS集群有两类节点以管理节点-工作节点模式运行,即一个NameNode(管理节点)和多个DataNode(工作节点)。 Namenode管理文件系统的命名空…

JFlash烧写单片机bin/hex文件

1,安装压 JLink_Windows_V660c,官网可下载; 2,打开刚刚安装的 J-Flash V6.60c 选择创建新工程“Create a new project”,然后点击StartJ-Flash 点击之后跳出Select device框,选择TI 选择TI后&#xff0c…

TypeScript入门实战笔记 -- 04 什么是字面量类型、类型推断、类型拓宽和类型缩小?

🍍开发环境 1:使用vscode 新建一个 04.Literal.ts 文件,运行下列示例。 2:执行 tsc 04.Literal.ts --strict --alwaysStrict false --watch 3:安装nodemon( 全局安装npm install -g nodemon ) 检测.js文件变化重启项…

谈谈数据归一化与标准化

背景: 归一化(Normalization)和标准化(Standardization)是常用的数据预处理技术,用于将不同范围或不同单位的特征值转换为统一的尺度,以便更好地进行数据分析和模型训练。一句话:消…

Go EASY游戏框架 之 RPC Guide 03

1 Overview easy解决服务端通信问题,同样使用了RPC技术。easy使用的ETCDGRPC,直接将它们打包组合在了一起。随着服务发现的成熟,稳定,简单,若是不用,甚至你也并不需要RPC来分解你的架构。 GRPC 有默认res…

银河麒麟重置密码

桌面版银河麒麟重置密码 1.选择界面按e 出现银河麒麟系统选择的页面,我们点击键盘上的“e”键,进入电脑启动项编辑页 2.编辑启动页 在启动项编辑页面,我们将光标移动到linux这一行的最后,然后输入“init/bin/bash consoletty0”…

给一个容器添加el-popover/el-tooltip内容提示框

效果&#xff1a; html: <div class"evaluate"><div class"list flex-column-center" v-for"(item, index) in evaluateList" :key"index"mouseenter"mouseenterHandler(item)" mouseleave"mouseleaveHandle…

【Vue第5章】vuex_Vue2

目录 5.1 理解vuex 5.1.1 vuex是什么 5.1.2 什么时候使用vuex 5.1.3 案例 5.1.4 vuex工作原理图 5.2 vuex核心概念和API 5.2.1 state 5.2.2 actions 5.2.3 mutations 5.2.4 getters 5.2.5 modules 5.3 笔记与代码 5.3.1 笔记 5.3.2 23_src_求和案例_纯vue版 5.3…

什么是跨站脚本攻击(XSS)?如何防止它?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

【面试】数据库—优化—聚簇索引和非聚簇索引、回表查询

数据库—优化—聚簇索引和非聚簇索引、回表查询 1. 什么是聚簇索引什么是非聚簇索引 ? 聚集索引选取规则: 如果存在主键&#xff0c;主键索引就是聚集索引&#xff1b;如果不存在主键&#xff0c;将使用第一个唯一&#xff08;UNIQUE&#xff09;索引作为聚集索引&#xff1b…

【移动通讯】【MIMO】[P1]【科普篇】

前言&#xff1a; 前面几个月把CA 的技术总体复盘了一下,下面一段时间 主要结合各国一些MIMO 技术的文档,复盘一下MIMO. 这篇主要参考华为&#xff1a; info.support.huawei.com MIMO 技术使用多天线发送和接受信号。主要应用在WIFI 手机通讯等领域. 这种技术提高了系统容量&…