Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接

🔗 精选专栏

  • 《面试题大全》 — 面试准备的宝典!
  • 《IDEA开发秘籍》 — 提升你的IDEA技能!
  • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
  • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
  • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!
  • 《21天精通IPV4 To IPV6》 — 踏入新IP时代的大门!

领域矩阵

🌐 猫头虎技术领域矩阵
深入探索各技术领域,发现知识的交汇点。了解更多,请访问:

  • 猫头虎技术矩阵
  • 新矩阵备用链接

在这里插入图片描述

文章目录

  • Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
    • 关于 Gemini
      • 1. Gmail 中的 Gemini
      • 2. Gemini 1.5 Pro & Flash
      • 3. Gemini Live
      • 4. Gemini Nano
      • 5. Android 上的 Gemini
    • 新模型&项目
      • 1. Imagen3
      • 2. Veo 视频生成模型
      • 3. LearnLM 模型
      • 4. Project IDX
    • 应用&工具更新
      • 1. AI 在搜索中的应用
      • 2. 圈选搜索
      • 3. 在通话过程中检测诈骗
      • 4. 询问照片
      • 5. Firebase Genkit
      • 6. Google Play

Hello, 大家好!我是猫头虎,今天凌晨,Google I/O 开发者大会如期而至,持续了整整两个小时。相信很多朋友没有熬夜看发布会,所以我在这里为大家整理了一下重要内容,希望大家喜欢!

关于 Gemini

1. Gmail 中的 Gemini

Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。

图片

2. Gemini 1.5 Pro & Flash

Gemini 1.5 Pro 新版本可以处理多达 200 万 token,比以前的容量翻倍。而针对要求较低的应用,Google 还推出了 Gemini 1.5 Flash,这是个“精炼”版本,适合高频生成 AI 工作负载,依然可以处理 200 万个 token 上下文窗口。

图片

3. Gemini Live

Google 还预览了 Gemini Live,让用户可以在智能手机上与 Gemini 进行“深入”的语音聊天。你可以在聊天中打断 Gemini,提出澄清问题,它会实时适应你的语音模式。还可以通过智能手机摄像头拍摄的照片或视频来让 Gemini 了解周围环境并做出反应。

图片

4. Gemini Nano

Gemini Nano 是最小的 AI 模型,将直接集成到 Chrome 桌面客户端中,让开发者可以在设备上使用模型来支持自己的 AI 功能。Google 计划利用这一新功能来增强 Gmail 中的“帮助我写作”工具。

图片

5. Android 上的 Gemini

Android 设备上的 Gemini 将成为 Google Assistant 的 AI 替代品。用户可以将 AI 生成的图像直接拖放到 Gmail、Google Messages 和其他应用程序中,还能从 YouTube 视频中查找特定信息。

图片

新模型&项目

1. Imagen3

谷歌推出了 Imagen 3 模型,相比前身 Imagen 2,它能更准确地理解文本提示并生成更创意和细致的图像。为防止深度伪造,Imagen 3 将使用 SynthID 技术应用不可见的加密水印。

图片

2. Veo 视频生成模型

Veo 是一个 AI 模型,可以根据文本提示创建大约一分钟长的 1080p 视频剪辑,能够捕捉不同的视觉和电影风格。谷歌计划探索故事板和生成更长场景的功能,以了解 Veo 的潜力。

图片

3. LearnLM 模型

谷歌推出了 LearnLM,一个针对学习进行“微调”的新生成 AI 模型系列,旨在“对话式”辅导学生一系列科目,已经在 Google 的多个平台上使用,正在通过 Google Classroom 的试点项目进行试用。

图片

4. Project IDX

Project IDX 是谷歌的下一代、以 AI 为中心、基于浏览器的开发环境,现已进入公开测试阶段。它是一种多平台开发体验,可以快速构建应用程序,集成了 Google Maps Platform、Chrome 开发工具和 Lighthouse,并支持 Cloud Run 的部署。

图片

应用&工具更新

1. AI 在搜索中的应用

谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。这个 AI 驱动的搜索概述功能已经在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

图片

2. 圈选搜索

由 AI 驱动的“圈选搜索”功能允许 Android 用户通过圈选、突出显示等手势立即获得答案,现在能解决更复杂的心理学和数学应用题。

图片

3. 在通话过程中检测诈骗

Google 将在未来的 Android 版本中内置一个功能,利用 Gemini Nano 实时检测诈骗对话模式,并提醒用户注意潜在的诈骗。

图片

4. 询问照片

Google Photos 推出了一项新功能“Ask Photos”,允许用户使用自然语言查询来搜索照片集,利用 AI 对照片内容和元数据的理解,让搜索更直观。

图片

5. Firebase Genkit

Firebase 平台新增了一个名为 Firebase Genkit 的功能,旨在让开发人员更轻松地使用 JavaScript/TypeScript 构建 AI 驱动的应用,并即将支持 Go 语言。

图片

6. Google Play

Google Play 增强了应用发现功能、用户获取方式,并推出了 Play Points 更新和开发者工具(如 Google Play SDK Console 和 Play Integrity API),为开发者提供更多支持。

图片


这次 Google I/O 发布的内容真是干货满满啊!Gemini 系列不仅覆盖了邮件、搜索、浏览器等多个场景,还推出了多种新模型和工具,期待未来这些功能能给我们的生活和工作带来更多便利。

我是猫头虎,感谢大家的阅读,我们下期再见!

在这里插入图片描述

👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬

🚀 技术栈推荐
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明

📩 联系方式

  • 微信: Libin9iOak
  • 公众号: 猫头虎技术团队

⚠️ 版权声明
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/12668.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试前端随笔20240510

最近公司招聘前端开发人员有幸参与帮听,总结了三个有关vue的面试问题和答案,现在分享一下。 1.Vue2数据监听无法监听数组为啥?有啥解决方案?vue3中是如何处理这个问题? vue2的官方说明了defineProperty的一些限制&…

Oracle SQL Developer 脚本输出中文显示乱码

问题描述 在测试Oracle Select AI(自然语言查询数据库)时,发现Run Statement中文显示正常: 而Run Script中文显示乱码: 问题解决 进入菜单Tools>Preferences...>Environment, 修改SQL Developer…

JavaScript-JSON对象

JSON格式 JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式。它基于ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会的一个子集,采用完全独立于编程语言的文本格式来存储和表示…

盘点那些年我们一起玩过的网络安全工具

一、反恶意代码软件 1.Malwarebytes 这是一个检测和删除恶意的软件,包括蠕虫,木马,后门,流氓,拨号器,间谍软件等等。快如闪电的扫描速度,具有隔离功能,并让您方便的恢复。包含额外…

项目中使用Elasticsearch的API相关介绍

项目中使用Elasticsearch的API相关介绍 0、域映射类型 text:会分词,不支持聚合对当前搜索关键词,先自身分词,分成多个词,然后去一个一个的词去利用倒排索引去查询es索引库一般应用在搜索关键字匹配的字段的类型。 商…

Beego 使用教程 6:Web 输入处理

beego 是一个用于Go编程语言的开源、高性能的 web 框架 beego 被用于在Go语言中企业应用程序的快速开发,包括RESTful API、web应用程序和后端服务。它的灵感来源于Tornado, Sinatra 和 Flask beego 官网:http://beego.gocn.vip/ 上面的 bee…

Spring的监听器使用(实用,直接拿去修改可用)

一,前言 这里我们以ApplicationListener为例,简单说明一下监听器如何使用。 本人基本只输出实用,即用的代码,希望能帮助到各位,如果想研究底层逻辑,大家可自行根据代码去类源码查看。 监听器的使用主要分…

上层建筑(理解)

上层建筑(Superstructure)是指建立在一定经济基础上的社会意识形态以及与之相适应的政治法律制度和设施等的总和。它包括阶级关系(基础关系)、维护这种关系的国家机器、社会意识形态以及相应政治法律制度、组织和设施等。 上层建筑与经济基础对立统一。建…

相机模型,坐标变换,畸变

小孔成像模型 墨子就记录了小孔成像是倒立的。这从几何光学的角度是很好理解的:光沿直线传播,上方和下方的光线交叉,导致在成像平面位置互换。 小孔的大小有什么影响? 小孔越大,进光量变大了,但是成像平…

第二步 完善MBR

文章目录 前言一、什么是MBR?二、我们需要什么样的MBR?三、设计我们的MBR!1、打印“1 MBR”2、加载次引导程序——loader 四、实践检验! 查看系列文章点这里: 操作系统真象还原 前言 在上一篇文章 第一步 从启动BIOS开…

社交电商的三大模式,新零售招商模式策划

链动21奖励模式,七人拼团模式拆解,分享购模式解析 坐标:厦门,我是易创客肖琳 深耕社交新零售行业10年,主要提供新零售系统工具及顶层商业模式设计、全案策划运营陪跑等。 随着数字时代的到来,“互联网”概…

PyCharm2023 社区版安装 +中文语言包+配置教程+Python环境搭建

一、Python 安装 我们在安装Pycharm之前,首先要先安装Python环境也就是安装Python解释器 因为PyCharm是一个用于编写和调试Python代码的开发工具,而Python解释器是用于解释执行Python代码PyCharm需要依赖Python解释器来执行Python代码,因此…

R语言贝叶斯方法在生态环境领域中的应用

贝叶斯统计已经被广泛应用到物理学、生态学、心理学、计算机、哲学等各个学术领域,其火爆程度已经跨越了学术圈,如促使其自成统计江湖一派的贝叶斯定理在热播美剧《The Big Bang Theory》中都要秀一把。贝叶斯统计学即贝叶斯学派是一门基本思想与传统基于…

R语言基础--文件读写

From生物技能树(R第五节) 文章目录 一、文件读写1.注意用project管理工作目录2、文件读取1、读取.txt文件2、读取.csv文件注意:数据框不允许重复的行名 3.数据框的导出4.读取文件的其他方式(用于读取/导出文件的R包)--经验1.base2.readr3.dat…

图搜索算法-最小生成树问题-克鲁斯卡尔算法(kruskal)

相关文章: 数据结构–图的概念 图搜索算法 - 深度优先搜索法(DFS) 图搜索算法 - 广度优先搜索法(BFS) 图搜索算法 - 拓扑排序 图搜索算法-最短路径算法-戴克斯特拉算法 图搜索算法-最短路径算法-贝尔曼-福特算法 最小生…

【Redis】数据类型

Redis数据类型(5 3 1) 五种基本数据类型 String字符串 特点 二进制安全,可以包含任何数据,如数字,字符串,jpg图片或者序列化的对象 应用场景 缓存: redis作为缓存层,mysql做持…

【ORACLE战报】2024.4月最新OCP考试喜报.

课程介绍 DBA数据库管理必备认证:ORACLE OCP 19C 教材下载 ORACLE OCP 19C 官方电子教材 ORACLE OCP 12C官方电子教材 题库下载 ORACLE 19C题库 (083384题、082362题)-2024答案修正版.rar 所有的收获都是默默耕耘的成果 2024.4月【最新考试成…

Chromium 调试指南2024 Windows11篇-条件断点、函数断点(十一)

1. 前言 在调试过程中,步进代码和条件断点/函数断点是非常有用的工具和技术,它们可以帮助开发者更加精确地定位和解决问题。本文将介绍步进代码的常用工具以及条件断点/函数断点的设置方法,帮助开发者更加高效地进行调试工作。 2. 步进代码…

ControlNet原理解析

前排提示照片已经获得小姐姐许可。 光知道ControlNet好用,不想知道它背后的原理么?今天就看一看这篇论文,带大家了解一下ControlNet是如何炼成的。 ControlNet是干嘛的 我们知道现在文本到图像生成很火爆,你只需要输入文字就可以…

内存函数:memcpy(拷贝),memmove(拷贝),memcmp(比较),memset(设置)

内存函数 一.memcpy(内存拷贝1)1.函数使用2.模拟实现 二.memmove(内存拷贝2)1.函数使用2.模拟实现 三.memcmp(内存比较)1.函数使用2.模拟实现 四.memset(内存设置)1.函数使用2.模拟实…