Google大模型Bard更名Gemini,现在实力如何?(VS gpt系列)

名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

目录

      • 一、简要介绍
        • 1、Gemini是什么?
        • 2、主要特点
        • 3、Gemini的版本
        • 4、应用潜力
        • 5、使用方法
      • 二、分类问题测试
        • 1、基础问答(5个)
        • 2、数学题解答(5个)
        • 3、逻辑推理(5个)
        • 4、创造性写作(3个)
        • 5、代码编写(3个)
        • 6、对话理解与情感交流(2个)
        • 7、翻译任务(1个)
        • 8、策略规划(1个)
      • 三、测试结果(仅代表个人观点)

★观前提示以下内容仅为测试内容,不代表未来新版本如何。

在本篇博客中,我们将一起探讨Google AI模型——Gemini。Gemini标志着Google在人工智能领域的一大飞跃,不仅因为它的先进技术,也因为它在多任务语言理解(MMLU)测试中首次超越了人类专家。这一成就显示了Gemini在知识获取和问题解决能力上的卓越性能,最初名称为Bard,最近赋名为了Gemini,那么它究竟如何,本篇内容将采用与上篇gpt3.5相同的问题来进行测试,最后会在测试感受出说一下对比gpt3.5它能力的强弱。

一、简要介绍

1、Gemini是什么?

在这里插入图片描述

Gemini 是 Google 开发的最新一代大型人工智能模型,代表了 Google 在人工智能领域的最新进展。它是一个跨部门协作的成果,由 Google 研究部的同事从头开始构建,具有多模态能力,能够处理、理解、操作并结合不同类型的信息,包括文本、代码、音频、图像和视频。Gemini 被设计为迄今为止 Google 最灵活的模型,旨在处理各种复杂的任务和挑战。

2、主要特点
  • 多模态能力:Gemini 能够无缝集成并处理文本、图像、音频和视频等多种类型的信息。
  • 超越人类专家的性能:在多个领域的测试中,特别是大规模多任务语言理解(MMLU)和小学数学推理(GSM8K)的测试中,Gemini Ultra 的性能超越了现有的最先进模型,包括GPT-4,甚至在某些领域超越了人类专家。
  • 高度灵活:Gemini 设计用于适应从大型数据中心到移动设备等不同的运行环境,支持各种规模的应用部署。
3、Gemini的版本
  • Gemini Ultra:针对最复杂任务的最强大版本,性能在多个学术基准上超过了GPT-4。
    例如官方公布的对比数据,在文本上:

在这里插入图片描述

在多模式上:

在这里插入图片描述

  • Gemini Pro:适合日常使用的版本,已集成到 Google 的 Bard 聊天机器人中,提升了其高级推理、规划和理解的能力。
  • Gemini Nano:设计用于嵌入移动设备,如谷歌Pixel手机,使大模型能够成为日常生活中的小助手。
4、应用潜力

由于其多模态处理能力,Gemini 可以在多种应用场景中大放异彩,包括自然语言处理(文本生成、文本摘要、翻译等)、高质量代码生成(支持 Python、Java、C++ 和 Go 等编程语言),以及处理超出编码范围的复杂问题,如涉及复杂数学和理论计算机科学的竞争性编程问题。

5、使用方法

官网注册使用即可:Gemini官网

在这里插入图片描述

了解了以上内容之后,咱们一起去测试体验一下:

二、分类问题测试

测试采用多类问题提问,以检验其多方面的功能。

1、基础问答(5个)
  • Q1: 澳大利亚的首都是哪座城市?(✔)
    在这里插入图片描述

  • Q2: 地球与太阳之间的距离是多少?(✔)

在这里插入图片描述

  • Q3: 水的沸点是多少度?(✔)
    在这里插入图片描述

  • Q4: 比萨斜塔在哪个国家?(✔)

在这里插入图片描述

  • Q5: 世界上最长的河流是哪一条?(✔)
    在这里插入图片描述

从回答来看,5个问题均正确✔,相比gpt3.5更加完善和全面。

2、数学题解答(5个)
  • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)

在这里插入图片描述

  • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述

结果算对了,但是中间则怎么突然冒出英文解释了?san值狂掉…

  • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)

在这里插入图片描述

  • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x36x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)

在这里插入图片描述

这题虽然解对了,但是与gpt3.5一样用到了一些高等数学的知识,这里要注意甄别。

  • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)

在这里插入图片描述

gpt3.5在大学基础难度的题出了错,而Gemini此处求解正确。

3、逻辑推理(5个)
  • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)
    在这里插入图片描述

一般的判断答案应该是喜欢,但是它的回答不无道理,因此也可看作对的。

  • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
    在这里插入图片描述

一般的判断答案应该是A大于C,但是它的回答考虑范围更广,因此也是对的。

  • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✔)

在这里插入图片描述

gpt3.5在这里出现了计算错误。

  • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

在这里插入图片描述

正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

  • Q5: 72、36、24、18、( )(✖)
    在这里插入图片描述

正确答案:14.4

4、创造性写作(3个)
  • Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
    在这里插入图片描述

写的偏对话式的故事,不过也算有头有尾。

  • Q2: 编写一首关于秋天落叶的五言律诗。
    在这里插入图片描述

相比于gpt3.5,此处出现了语意理解错误以及常识性错误。

  • Q3: 写一个关于人工智能与人关系的短篇小说。
    在这里插入图片描述

前后逻辑性还不错,但是小说的情节过于简单流水化,不具有创新性。

5、代码编写(3个)
  • Q1: 用Python编写一个函数,用于判断一个数是否为质数。

在这里插入图片描述

Gemini所写代码如下:

def is_prime(n):"""判断一个数是否为质数Args:n: 要判断的数Returns:True 如果n是质数,False 如果不是"""if n <= 1:return Falseif n % 2 == 0 and n != 2:return Falsefor i in range(3, int(n ** 0.5) + 1, 2):if n % i == 0:return Falsereturn Trueprint(is_prime(13))  # True
print(is_prime(15))  # False

在这里插入图片描述

  • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。
    在这里插入图片描述

Gemini所写代码如下:

def is_palindrome(s):"""检查一个字符串是否为回文Args:s: 要检查的字符串Returns:True 如果s是回文,False 如果不是"""s = s.lower()  # 将字符串转换为小写s = "".join(ch for ch in s if ch.isalnum())  # 删除非字母数字字符return s == s[::-1]  # 将字符串反转并与原字符串比较print(is_palindrome("racecar"))  # True
print(is_palindrome("madam"))  # True
print(is_palindrome("hello"))  # False

在这里插入图片描述

测试了下,成功运行并得到正确反馈。

  • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
    在这里插入图片描述
def dfs(root):"""实现二叉树的深度优先搜索Args:root: 二叉树的根节点Returns:所有节点的遍历顺序"""if root is None:return []result = []# 递归访问左子树result += dfs(root.left)# 访问根节点result.append(root.val)# 递归访问右子树result += dfs(root.right)return result
class TreeNode:def __init__(self, val):self.val = valself.left = Noneself.right = Noneroot = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)print(dfs(root))  # [4, 2, 5, 1, 3]

在这里插入图片描述

6、对话理解与情感交流(2个)
  • Q1: 我今天心情不好,能给我讲个笑话吗?
    在这里插入图片描述

这个笑话,且别说,get到笑点了

  • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

在这里插入图片描述

给的方法不错,几个建议挺有道理,分解任务,学会说“不”,寻求帮助。

7、翻译任务(1个)
  • Q: 将这段文字翻译成英语:“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的“丝绸之路”。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
    正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。”(六级翻译原题

在这里插入图片描述

翻译着…怎么还拓展了???

  • Q: 再将这段英语翻译成中文

在这里插入图片描述

整体可以看出,翻译效果是不错,但是语意理解上跟gpt模型还是有一定差距的。

8、策略规划(1个)
  • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?

在这里插入图片描述

这计划还不错,但是跟gpt3.5一样的通病在于流水账,很多描述上偏流水化,没有像人一样在交流时的创造性和灵活性。

本次测评就到这里,接下来总结一下感受。

三、测试结果(仅代表个人观点)

根据之前使用3.5和4的感受,Gemini整体实力大概在gpt3.5 - 4之间的水平,小部分能力确实超过了4,但综合实力gpt4目前更强一些。至于官方公布的实力对比,可能是付费版本,或预览版本之间的比较,笔者对此尚存疑惑,不在此表态,欢迎大家评论谈一下你们的观点。

不过从gpt3.5到今天的Gemini,给我一个感受就是,铁打的流水(机器人)很长一段时间内不可能完全替代有创造性的人。相比于担心AI发展太快,不如精进技术,做AI的引领者!

关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/709630.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

zookeeper启动报错

启动zookeeper报错 从报错中可以看到 Invalid config, exiting abnormally 意思是&#xff1a;配置无效&#xff0c;异常退出 在往上看是没有zoo.cof这个配置文件 2024-02-27 14:47:03,285 [myid:] - ERROR [main:o.a.z.s.q.QuorumPeerMain99] - Invalid config, exiting…

基于AMDGPU-ROCm的深度学习环境搭建

在风起云涌的AI江湖&#xff0c;NVIDIA凭借其CUDA生态和优秀的硬件大杀四方&#xff0c;立下赫赫战功&#xff0c;而另一家公司AMD也不甘示弱&#xff0c;带着他的生态解决方案ROCm开始了与不世出的NVIDA的正面硬钢&#xff0c;"ROCm is the answer to CUDA", AMD官网…

Java——数组的定义与使用

目录 一.数组的基本概念 1.什么是数组 2.数组的创建及初始化 3.数组的使用 二.数组是引用类型 1.初始JVM的内存分布 2.基本类型变量与引用类型变量的区别 3.再谈引用变量 4.认识 null 三.数组的应用场景 1.保存数据 2.作为函数的参数 2.1参数传基本数据类型 2.…

学习vue3第二节(使用vite 创建vue3项目)

使用vite 创建vue3项目 node 安装请移步 node官网&#xff1a; https://nodejs.p2hp.com/ node 版本控制 请移步 nvm官网&#xff1a;https://nvm.uihtm.com/ vite 生成vue项目完整版 请移步 vite官网&#xff1a;https://cn.vitejs.dev/ 1、使用 npm 或者 yarn 创建vue3 项目…

NXP实战笔记(十一):32K3xx基于RTD-SDK在S32DS上配置DFLASH、MemAcc、Fee

目录 1、概述 2、RTD-SDK配置之Cache_Ip 3、RTD-SDK配置之Mem_43_InFls 4、RTD-SDK配置之MemAcc 5、RTD-SDK配置之Fee 6、代码示例 1、概述 S32K3目前安装的RTD普遍使用的是R22-11版本的AUTOSAR规范&#xff0c;作为一直使用AUTOSAR4.2.2的程序员来讲&#xff0c;属实迭代…

东方博宜 1511. 数字之和为13的整数

东方博宜 1511. 数字之和为13的整数 #include<iostream> using namespace std; int main() {int n ;cin >> n ;int cnt 0 ;for(int i 1 ; i < n ; i){int sum 0 ;int y ;y i ;while(true){sum y%10;y y / 10 ;if(y0)break; }if(sum 13)cnt 1 ; }cout…

91、在推理流程中加载动态库中的Infer函数

注:建议在 new_version_with_notes 目录下尝试本节内容,有更为丰富的细节输出。 在上一节将生成的代码编译成一个动态链接库之后,接下来需要加载动态链接库中写好的推理入口函数,完成推理。 在生成的代码中,在 codegen 目录下,有一个 codegen.cc 文件,里面是一个 Infe…

二、TensorFlow结构分析(2)

目录 1、会话 1.1 __init__(target,graphNone,configNone) 1.2 会话的run() 1.3 feed操作 TF数据流图图与TensorBoard会话张量变量OP高级API 1、会话 1.1 __init__(target,graphNone,configNone) def session_demo():# 会话的演示# Tensorflow实现加法运算a_t tf.constan…

Appium + mitmProxy 实现APP接口稳定性测试

随着 App 用户量的不断增长&#xff0c;任何小的问题都可能放大成严重的线上事故&#xff0c;为了避免对App造成损害的任何可能性&#xff0c;我们必须从各个方面去思考 App 的稳定性建设&#xff0c;尽可能减少任何潜在的威胁。 1.背景介绍 为了保障 App 的稳定性&#xff0…

算法基础(三)(模拟)

1.模拟算法介绍&#xff1a; 模拟算法通过模拟实际情况来解决问题&#xff0c;一般容易理解但是实现起来比较复杂&#xff0c;有很多需要注意的细节&#xff0c;或者是一些所谓很“麻烦”的东西。模拟题一般不涉及太难的算法&#xff0c;一般就是由较多的简单但是不好处理的部…

redis启动错误

错误&#xff1a; Creating Server TCP listening socket 127.0.0.1:6379: bind: No error redis-server.exe redis.windows.conf redis-cli.exe shutdown auth "yourpassword"

9 easy 28. 找出字符串中第一个匹配项的下标

暴力法&#xff1a; //给你两个字符串 haystack 和 needle &#xff0c;请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标&#xff08;下标从 0 开始&#xff09;。 //如果 needle 不是 haystack 的一部分&#xff0c;则返回 -1 。 // // // // 示例 1&…

harbor配置目录被误删后救援

我司微服务产品的业务镜像&#xff0c;在客户现场上云安全检测中发现需要打补丁&#xff1b;放在角落、时不常用一次的harbor镜像仓库需要用到了&#xff1a;将加固后的基础镜像上传以备份&#xff0c;方便其他同学拉取使用。 然鹅&#xff0c;启动后harbor-db频繁重启 harbo…

最新 CLion 2023.3.4 下载与安装 + 永久免费

文章目录 Stage 1 : 官网下载Stage 2 : 下载工具Stage 3-1 : windows为例Stage 3-2 : mac为例常见问题部分小伙伴 Mac 系统执行脚本遇到如下错误&#xff1a;解决方法&#xff1a; 执行脚本做了啥&#xff1f;和正版区别&#xff1f; Stage 1 : 官网下载 先去官网下载 我这里下…

EAP-TLS实验之H3C MSR2600-10-X1配置相关

H3C MSR2600充当802.1x流程中的NAS&#xff08;Network Access System&#xff09;角色&#xff0c;一般负责实际待验证的设备与认证服务器之间沟通的桥梁&#xff08;当然也可以配置成认证服务器角色&#xff09;工作。在挑选购买支持802.1x的路由器或交换机时需要跟厂家明确是…

DFS之剪枝与优化

剪枝 1.优化搜索顺序&#xff1a;在大部分情况下&#xff0c;我们应该优先搜索分支较少的结点 2.排除等效冗余&#xff08;在不考虑顺序的情况下&#xff0c;尽量用组合的方式来搜索&#xff09; 3.可行性剪枝 4.最优性剪枝 5.记忆化搜索 165. 小猫爬山 - AcWing题库 import …

小狐狸chat2.7.2免授权修复版可用版

小狐狸chat2.7.2免授权修复版可用版 在网络上面找了好几个版本不能使用&#xff0c;今天发布这个仔细测试正常使用 主要功能&#xff1a;独立版无限多开支持分销会员充值自己APP打包小程序万能创作MJ绘图多个国内接口 国外很火的ChatGPT&#xff0c;这是一种基于人工智能技术…

《汇编语言》- 读书笔记 - 第13章-int 指令

《汇编语言》- 读书笔记 - 第13章-int 指令 13.1 int 指令13.2 编写供应用程序调用的中断例程中断例程&#xff1a;求一 word 型数据的平方主程序中断处理程序执行效果 中断例程&#xff1a;将一个全是字母&#xff0c;以0结尾的字符串&#xff0c;转化为大写主程序中断处理程序…

IDEA利用鼠标调整字体大小

就可以按住ctrl和鼠标调节代码字体的大小啦&#xff01; 如果有用&#xff0c;记得给我来个赞~ 谢啦&#xff01;

【性能测试】loadrunner12.55--知识准备

1.0. 前言 ​ 在性能测试中&#xff0c;牵扯到了许多比较杂的知识点&#xff0c;这里将给大家说一下&#xff0c;loadrunner性能测试前需要做的一些准备&#xff0c;本节中我们将先从性能测试的一些术语入手&#xff0c;再到HTTP的一些知识&#xff0c;最后导我们loadrunner12…