Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接

🔗 精选专栏

  • 《面试题大全》 — 面试准备的宝典!
  • 《IDEA开发秘籍》 — 提升你的IDEA技能!
  • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
  • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
  • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!
  • 《21天精通IPV4 To IPV6》 — 踏入新IP时代的大门!

领域矩阵

🌐 猫头虎技术领域矩阵
深入探索各技术领域,发现知识的交汇点。了解更多,请访问:

  • 猫头虎技术矩阵
  • 新矩阵备用链接

在这里插入图片描述

文章目录

  • Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
    • 关于 Gemini
      • 1. Gmail 中的 Gemini
      • 2. Gemini 1.5 Pro & Flash
      • 3. Gemini Live
      • 4. Gemini Nano
      • 5. Android 上的 Gemini
    • 新模型&项目
      • 1. Imagen3
      • 2. Veo 视频生成模型
      • 3. LearnLM 模型
      • 4. Project IDX
    • 应用&工具更新
      • 1. AI 在搜索中的应用
      • 2. 圈选搜索
      • 3. 在通话过程中检测诈骗
      • 4. 询问照片
      • 5. Firebase Genkit
      • 6. Google Play

Hello, 大家好!我是猫头虎,今天凌晨,Google I/O 开发者大会如期而至,持续了整整两个小时。相信很多朋友没有熬夜看发布会,所以我在这里为大家整理了一下重要内容,希望大家喜欢!

关于 Gemini

1. Gmail 中的 Gemini

Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。

图片

2. Gemini 1.5 Pro & Flash

Gemini 1.5 Pro 新版本可以处理多达 200 万 token,比以前的容量翻倍。而针对要求较低的应用,Google 还推出了 Gemini 1.5 Flash,这是个“精炼”版本,适合高频生成 AI 工作负载,依然可以处理 200 万个 token 上下文窗口。

图片

3. Gemini Live

Google 还预览了 Gemini Live,让用户可以在智能手机上与 Gemini 进行“深入”的语音聊天。你可以在聊天中打断 Gemini,提出澄清问题,它会实时适应你的语音模式。还可以通过智能手机摄像头拍摄的照片或视频来让 Gemini 了解周围环境并做出反应。

图片

4. Gemini Nano

Gemini Nano 是最小的 AI 模型,将直接集成到 Chrome 桌面客户端中,让开发者可以在设备上使用模型来支持自己的 AI 功能。Google 计划利用这一新功能来增强 Gmail 中的“帮助我写作”工具。

图片

5. Android 上的 Gemini

Android 设备上的 Gemini 将成为 Google Assistant 的 AI 替代品。用户可以将 AI 生成的图像直接拖放到 Gmail、Google Messages 和其他应用程序中,还能从 YouTube 视频中查找特定信息。

图片

新模型&项目

1. Imagen3

谷歌推出了 Imagen 3 模型,相比前身 Imagen 2,它能更准确地理解文本提示并生成更创意和细致的图像。为防止深度伪造,Imagen 3 将使用 SynthID 技术应用不可见的加密水印。

图片

2. Veo 视频生成模型

Veo 是一个 AI 模型,可以根据文本提示创建大约一分钟长的 1080p 视频剪辑,能够捕捉不同的视觉和电影风格。谷歌计划探索故事板和生成更长场景的功能,以了解 Veo 的潜力。

图片

3. LearnLM 模型

谷歌推出了 LearnLM,一个针对学习进行“微调”的新生成 AI 模型系列,旨在“对话式”辅导学生一系列科目,已经在 Google 的多个平台上使用,正在通过 Google Classroom 的试点项目进行试用。

图片

4. Project IDX

Project IDX 是谷歌的下一代、以 AI 为中心、基于浏览器的开发环境,现已进入公开测试阶段。它是一种多平台开发体验,可以快速构建应用程序,集成了 Google Maps Platform、Chrome 开发工具和 Lighthouse,并支持 Cloud Run 的部署。

图片

应用&工具更新

1. AI 在搜索中的应用

谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。这个 AI 驱动的搜索概述功能已经在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

图片

2. 圈选搜索

由 AI 驱动的“圈选搜索”功能允许 Android 用户通过圈选、突出显示等手势立即获得答案,现在能解决更复杂的心理学和数学应用题。

图片

3. 在通话过程中检测诈骗

Google 将在未来的 Android 版本中内置一个功能,利用 Gemini Nano 实时检测诈骗对话模式,并提醒用户注意潜在的诈骗。

图片

4. 询问照片

Google Photos 推出了一项新功能“Ask Photos”,允许用户使用自然语言查询来搜索照片集,利用 AI 对照片内容和元数据的理解,让搜索更直观。

图片

5. Firebase Genkit

Firebase 平台新增了一个名为 Firebase Genkit 的功能,旨在让开发人员更轻松地使用 JavaScript/TypeScript 构建 AI 驱动的应用,并即将支持 Go 语言。

图片

6. Google Play

Google Play 增强了应用发现功能、用户获取方式,并推出了 Play Points 更新和开发者工具(如 Google Play SDK Console 和 Play Integrity API),为开发者提供更多支持。

图片


这次 Google I/O 发布的内容真是干货满满啊!Gemini 系列不仅覆盖了邮件、搜索、浏览器等多个场景,还推出了多种新模型和工具,期待未来这些功能能给我们的生活和工作带来更多便利。

我是猫头虎,感谢大家的阅读,我们下期再见!

在这里插入图片描述

👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬

🚀 技术栈推荐
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明

📩 联系方式

  • 微信: Libin9iOak
  • 公众号: 猫头虎技术团队

⚠️ 版权声明
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/12668.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试前端随笔20240510

最近公司招聘前端开发人员有幸参与帮听,总结了三个有关vue的面试问题和答案,现在分享一下。 1.Vue2数据监听无法监听数组为啥?有啥解决方案?vue3中是如何处理这个问题? vue2的官方说明了defineProperty的一些限制&…

Oracle SQL Developer 脚本输出中文显示乱码

问题描述 在测试Oracle Select AI(自然语言查询数据库)时,发现Run Statement中文显示正常: 而Run Script中文显示乱码: 问题解决 进入菜单Tools>Preferences...>Environment, 修改SQL Developer…

JavaScript-JSON对象

JSON格式 JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式。它基于ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会的一个子集,采用完全独立于编程语言的文本格式来存储和表示…

spring基于XML的声明式事务控制

在Spring框架中,基于XML的声明式事务控制是一种通过配置来管理事务的方式,而无需在代码中显式编写事务逻辑。以下是如何在Spring中使用XML来配置声明式事务控制的步骤: 添加必要的依赖 确保你的项目中包含了Spring框架的核心包和Spring事务…

赶紧收藏!2024 年最常见 100道 Java 基础面试题(四十八)

上一篇地址:赶紧收藏!2024 年最常见 100道 Java 基础面试题(四十七)-CSDN博客 九十五、spring支持几种bean的作用域? Spring框架支持多种Bean的作用域,每种作用域都定义了Spring容器如何管理和创建Bean的…

论文:论面向服务的架构设计

题目 在面向服务的架构(Service-Oriented Architecture,SOA)中,服务的概念有了延伸,泛指系 统对外提供的功能集。例如,在一个大型企业内部,可能存在进销存、人事档案和财务等多个系统&#xff…

Java程序运行流程

Java运行流程 Java源代码 — 编译工具 —> Java字节码文件 — 运行工具 —> Java程序运行 Java程序的基本单位 类 Java程序执行入口 main方法

盘点那些年我们一起玩过的网络安全工具

一、反恶意代码软件 1.Malwarebytes 这是一个检测和删除恶意的软件,包括蠕虫,木马,后门,流氓,拨号器,间谍软件等等。快如闪电的扫描速度,具有隔离功能,并让您方便的恢复。包含额外…

项目中使用Elasticsearch的API相关介绍

项目中使用Elasticsearch的API相关介绍 0、域映射类型 text:会分词,不支持聚合对当前搜索关键词,先自身分词,分成多个词,然后去一个一个的词去利用倒排索引去查询es索引库一般应用在搜索关键字匹配的字段的类型。 商…

上海市计算机学会竞赛平台2020年8月月赛丙组促销骰子

题目描述 小爱的商店正在促销。顾客在付款的时候,有机会掷一次骰子,如果掷出 66,可以获得优惠,并且可以继续掷骰子,直到出现不是 66 的情况,或掷三次为止。获奖规则如下: 如果没有 66&#xf…

【C#】某AGV调度系统源码笔记(十二)

AGV调度服务的核心类库 小车事件参数 两个公共属性:车辆信息、事件描述。一个构造函数传入两个参数赋值给属性。 核心数据类 初始化及存储调度系统中所有的档案信息。 多个静态公共属性存储不同类型的系统数据:是否全局服务、数据库操作对象、系统参数集…

Beego 使用教程 6:Web 输入处理

beego 是一个用于Go编程语言的开源、高性能的 web 框架 beego 被用于在Go语言中企业应用程序的快速开发,包括RESTful API、web应用程序和后端服务。它的灵感来源于Tornado, Sinatra 和 Flask beego 官网:http://beego.gocn.vip/ 上面的 bee…

P2234 [HNOI2002] 营业额统计

题目描述 Tiger 最近被公司升任为营业部经理,他上任后接受公司交给的第一项任务便是统计并分析公司成立以来的营业情况。 Tiger 拿出了公司的账本,账本上记录了公司成立以来每天的营业额。分析营业情况是一项相当复杂的工作。由于节假日,大…

对话机器人技术解说

一、RAG介绍 如何不通过微调模型来提高LLM性能,检索增强生成(RAG)是未来的发展方向。 Embedding:将文档的句子或单词块转换为数字向量。就向量之间的距离而言,彼此相似的句子应该很近,而不同的句子应该离…

react-native 渲染引擎经历了什么

React Native 的渲染引擎经历了多个迭代,不断优化和改进。以下是一些较为显著的迭代: 原生组件封装:最初的 React Native 版本是通过 JavaScript 渲染 UI,并通过桥接层将 UI 转化为原生组件。随着发展,React Native 开…

Spring的监听器使用(实用,直接拿去修改可用)

一,前言 这里我们以ApplicationListener为例,简单说明一下监听器如何使用。 本人基本只输出实用,即用的代码,希望能帮助到各位,如果想研究底层逻辑,大家可自行根据代码去类源码查看。 监听器的使用主要分…

美易官方:收盘美股收涨纳指创历史新高,市场关注CPI通胀数据

​收盘之际,美股市场呈现出一派欣欣向荣的景象,各大指数纷纷收红,尤其是纳斯达克指数更是创下了历史新高,市场气氛热烈而积极。这一日的交易过程中,投资者们信心满满,积极寻觅着能够带来丰厚回报的投资机会…

上层建筑(理解)

上层建筑(Superstructure)是指建立在一定经济基础上的社会意识形态以及与之相适应的政治法律制度和设施等的总和。它包括阶级关系(基础关系)、维护这种关系的国家机器、社会意识形态以及相应政治法律制度、组织和设施等。 上层建筑与经济基础对立统一。建…

用go语言写一个代码,加班就自动给老婆发信息,下班自动提醒的代码

文章推荐 1 作为程序员,开发用过最好用的AI工具有哪些? 2 Github Copilot正版的激活成功,终于可以chat了 3 idea,pycharm等的ai assistant已成功激活 4 新手如何拿捏 Github Copilot AI助手,帮助你提高写代码效率 5 Jetbrains的a…

相机模型,坐标变换,畸变

小孔成像模型 墨子就记录了小孔成像是倒立的。这从几何光学的角度是很好理解的:光沿直线传播,上方和下方的光线交叉,导致在成像平面位置互换。 小孔的大小有什么影响? 小孔越大,进光量变大了,但是成像平…