[AI Google] Ask Photos: 使用Gemini搜索照片的新方法

借助Gemini模型,将Google Photos提升到一个新的水平。

Illustration of Ask Photos with Gemini feature in Google Photos mobile app with the prompt “What can i help you with?”

Google Photos是我们最早以AI为核心构建的产品之一,让你能够搜索照片和视频中的人、宠物、地点等。现在,我们通过我们最强大的AI模型Gemini对Google Photos进行重大升级。通过Ask Photos这一将在未来几个月内推出的最新实验功能,你可以更轻松地寻找特定记忆或回忆相册中的信息。

更直观地找到合适的内容

每天有超过60亿张照片上传到Google Photos。随着人们的相册不断增加,找到所需内容可能会导致浏览大量照片和视频,即使你拥有正确的关键字组合。通过Ask Photos,你可以自然地询问你要找的东西,比如:“展示我去过的每个国家公园的最佳照片。”Google Photos可以显示你需要的内容,帮你省去所有的浏览麻烦。

提问,获得有用的答案

我们经常拍照以捕捉记忆或保存重要细节,但这些照片中的信息可能会被遗忘。Ask Photos在你询问有关生活的问题时,为你揭示这些信息,比如你去年在哪里露营或你的代金券何时到期。Gemini的多模态功能可以理解照片的上下文和主题,从而提取细节。例如,你可以问:“我们给Lena办的生日派对主题有哪些?”Ask Photos将理解背景中的装饰或生日蛋糕上的细节,以给出答案。

除了搜索,获得更多任务帮助

借助Gemini模型,在Google Photos中完成任务也变得更加容易。例如,在一次长途旅行结束时,挑选最佳照片与朋友和家人分享可能会令人望而生畏。Ask Photos可以帮助你更轻松地创建旅行亮点。你只需询问,它会推荐顶级照片,甚至为你写一个个性化的标题以分享到社交媒体上。

Ask Photos的工作原理

  • 理解你的问题:Ask Photos理解你的查询,然后制定计划来找到答案。它代表你发出复杂的搜索,不仅识别相关的关键字,如地点、人物和日期,还包括自然语言概念,如“主题生日派对”。
  • 构建响应:下一步是研究搜索结果,找出哪些是最相关的,哪些似乎是你要找的。Gemini的多模态功能可以帮助准确理解每张照片中发生的事情,甚至可以在需要时读取图像中的文本。然后,Ask Photos会构建一个有用的响应并选择要返回的照片和视频。
  • 确保安全和记住纠正:尽管Ask Photos是实验性的,并且不会完全正确,但我们采用了多层次的保障措施和AI模型,以帮助确保响应的安全性和适当性。如果你纠正了答案或提供了额外的信息,Ask Photos可以记住这些细节以供将来使用。

如何保护你的隐私

照片中的信息可能非常个人化,我们非常认真地对待保护它的责任。你在Google Photos中的个人数据永远不会用于广告。除非在极少数情况下为了解决滥用或危害问题,否则不会有人审查你在Ask Photos中的对话和个人数据。我们也不会在Google Photos之外的任何生成式AI产品上训练这些个人数据,包括其他Gemini模型和产品。正如往常一样,你在Google Photos中的所有数据都受到我们行业领先的安全措施的保护。

未来几个月内试用Ask Photos

Ask Photos是一项实验性功能,我们即将开始推出,并将陆续添加更多功能。我们迫不及待地希望你试用并分享反馈,以便我们能在共同构建Google Photos的下一篇章时,使其更加实用。


  • 原文
  • 博客 - 从零开始学AI
  • 公众号 - 从零开始学AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22016.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C/C++】——小白初步了解——内存管理

目录 1. C/C内存分布 代码区(Code Segment): 数据区(Data Segment): 堆区(Heap): 栈区(Stack): 常量区(Constant Seg…

数据中心横向虚拟化 M-LAG 技术

M-LAG 一、M-LAG概述 1、M-LAG定义:M-LAG(Multichassis Link Aggregation Group)是跨设备链路聚合组。可以将两台设备进行跨设备链路聚合,从而把链路的可靠性从单板机提高到了设备级。 2、优势: (1)、M-LAG系统的两台…

UE 打包报错 MarketplaceRules.dll‘ does not exist.

Precompiled rules assembly /Users/unity/Library/Application Support/Epic/UnrealEngine/Intermediate/Build/BuildRules/MarketplaceRules.dll does not exist. Window下找到该DLL 拷到Mac对应的目录下即可。如没有则需要手动创建相应的文件夹 /Users/unity/Library/Appl…

# 全面解剖 消息中间件 RocketMQ-(5)

全面解剖 消息中间件 RocketMQ-(5) 一、RocketMQ :过滤消息的两种方式 1、Tag 过滤 在大多数情况下,TAG 是一个简单而有用的设计,其可以来选择您想要的消息。 例如: DefaultMoPushconsumer consumer new DefaultM…

文件夹突变解析:类型变文件的数据恢复与预防

在数字化时代,文件夹作为我们存储和组织数据的基本单元,其重要性不言而喻。然而,有时我们可能会遇到一种令人困惑的情况——文件夹的类型突然变为文件,导致无法正常访问其中的内容。这种现象不仅会影响我们的工作效率,…

[MySQL最详细的知识点]

MySQL 关系型数据库以一行作为一个记录,列数据库以一列为一个记录一行是一个记录,一列是一个字段一行是一个实体,一列是一个属性 MySQL引擎: MySQL引擎:可以理解为,MySQL的“文件系统”,只不过功能更加强大。​MySQL引擎功能:除…

mysql 分区

目标 给一个表(半年有800万)增加分区以增加查询速度 约束 分区不能有外键否则会报错 https://blog.csdn.net/yabingshi_tech/article/details/52241034 主键 按照时间列进行分区 https://blog.csdn.net/winerpro/article/details/135736454 参看以…

安全测试 之 常见安全漏洞:CORS

1. 背景 安全测试定义:安全测试,是在软件产品开发基本完成时,验证产品是否符合安全需求定义和产品质量标准的过程。目的:通过对系统进行全面的脆弱性安全测试,发现系统未知的安全隐患并提出相关建议,确保系…

BUAA操作系统万字笔记-课堂笔记-期末考试-考研必备-北航961系列

文章目录 1 概论1.1 CPU漏洞攻击1.2 操作系统简史1.2.1 体系结构1.2.2 系统发展 1.3 操作系统基本实现机制1.3.1 异常:陷阱和中断 2 系统引导3 内存管理3.1 预备知识-链接与装载3.2 存储管理基础3.2.1 存储器管理目标3.2.2 存储器硬件发展3.2.3 存储管理的功能3.2.4…

【python】成功解决“TypeError: not enough arguments for format string”错误的全面指南

成功解决“TypeError: not enough arguments for format string”错误的全面指南 一、引言 在Python编程中,TypeError: not enough arguments for format string错误是一个常见的字符串格式化问题。这个错误通常发生在使用str.format()方法时,提供的参数…

frp之XTCP实现内网穿透家用电脑远程桌面公司电脑

官网XTCP介绍 《XTCP介绍》 实现图 fprs.toml # frps 服务端口(不填,则默认:7000) bindPort 81 auth.token "token 令牌"公司电脑frpc.toml serverAddr "frps公网服务器域名或ip" serverPort frps 服…

Java图形用户界面程序设计所需要使用的工具

Java图形用户界面程序设计 前言一、图形用户界面程序设计的概述GUI概述Java GUI技术的发展 二、AWT概述简介AWT继承体系总结 三、Swing概述Swing概述优势Swing的特征总结 前言 推荐一个网站给想要了解或者学习人工智能知识的读者,这个网站里内容讲解通俗易懂且风趣…

Python程序设计 身份证号的奥秘

第1关:判断性别 通过身份证的第17位也就是倒数第二位的数字可以辨别该身份证所属人的性别,奇数为男性,偶数为女性。 任务:输入身份证号,第17位若是偶数,输出男性,否则输出女性 如何截取字符串的一个字符 如何判断一个…

机器视觉检测--相机

一,相机就是CCD么? 通常,我们把相机都叫作CCD,CCD已经成了相机的代名词。其实很可能正在使用的是CMOS。CCD以及CMOS都称为感光元件,都是将光学图像转换为电子信号的半导体元件。他们在检测光时都采用光电二极管&#…

AI降痕:让AI代写的论文,也能成为原创佳作

随着人工智能技术的突飞猛进,AI生成内容(AIGC)已被广泛用于学术论文撰写中,提高效率同时也带来了原创性的挑战。面对日益严格的学术审查,一个突出的问题是:使用AI代写的论文能否通过内容检测?因…

【Postman接口测试】第四节.Postman接口测试项目实战(中)

文章目录 前言五、Postman断言 5.1 Postman断言介绍 5.2 响应状态码断言 5.3 包含指定字符串断言 5.4 JSON数据断言六、参数化 5.1 Postman参数化介绍 5.2 Postman参数化实现 5.3 针对项目登录接口参数化实现 总结 前言 五、Postman断言 5.1 Postman断言介…

【STM32之FreeRTOS(二)】任务的创建与删除

【STM32之FreeRTOS(二)】任务的创建与删除 文章目录 【STM32之FreeRTOS(二)】任务的创建与删除一、什么是任务?二、任务创建与删除相关函数1.任务创建与删除相关函数2.任务动态创建与静态创建的区别3.xTaskCreate 函数原型4.vTaskDelete 函数原型 三、实操(同时控制…

面试题:谈谈你对 JS 原型链的理解

面试题:谈谈你对 JS 原型链的理解 JavaScript 是一种基于原型的语言,即每个对象都拥有一个原型对象,对象通过其原型对象继承方法和属性。原型对象也有其原型对象,依次类推,就构成了原型链。当对象访问一个属性或方法后…

BioTech - 计算大量 蛋白质结构预测结果 的聚类中心(Cluster)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/139419653 CASP16 的 H0215 样本,聚类之后,10个类别的最高置信度结果。 Agglomerative Clustering,即凝聚层次聚类,属于层次聚类算法,通过逐步合并或聚集数据点,…

Qt-demo高级感无边框窗口、美化基础控件

展示: 代码实现: // 鼠标按下事件(记录拉伸窗口或移动窗口时的起始坐标(左上角)) void framelessWidget::mousePressEvent(QMouseEvent *event) {if(event->button() Qt::LeftButton){mousePressed true; #if (QT_VERSION &…