2024年了,苹果可以通话录音了

 

dd3f5d43598c2a98a8352180c00a09de.png

人不走空

 

                                                                      

      🌈个人主页:人不走空      

💖系列专栏:算法专题

⏰诗词歌赋:斯是陋室,惟吾德馨

 

da14e5cf865a427ea959fca470d8245a.gif

 

e6d2c45cbc09e5c0b8ed4033292cbc24.jpeg

 

6月11日凌晨,苹果在WWDC24大会上,密集输出了酝酿多时的AI应用更新。苹果对通话、对话、图片,乃至最令人一言难尽的Siri都做了“全家桶”式改造,可谓诚意满满。市场的反应是滞后的。或因出现了过多OpenAI的能力介入,大会后,“苹果市值一夜蒸发4213亿元”的话题也随之冲上热搜。但一夜过后,苹果股价又大涨7.26%,市值涨至31765亿美元,单日上涨超2150亿美元,合超15000亿人民币。

 

 

 

继OpenAI、微软、谷歌、Meta相继奔赴“AI高考”,掀起了一波波热浪后,苹果作为最后一个被万众期待的优等生,磨蹭许久,也终于交卷了。

 

6月11日凌晨,苹果2024年全球开发者大会(WWDC24)如约而至。不出所料,发布会上对AI功能的介绍吸引了最多目光,占据了多达一半的演讲时间。

 

 

2be832acc649c81d7b19eb1b40b565d8.png

 

此前,围绕着苹果与OpenAI的合作落地,苹果会不会借此改造一言难尽的Siri,苹果的AI命名(Apple Intelligence)问题,轮番上阵的预热和讨论,已经在互联网上持续了不短的时间。

 

最意味深长的部分则是,向来崇尚自有生态的苹果,虽然屡屡传出将允许OpenAI深度介入,但或出于“挣扎”,传言也数次被“辟谣”。发布会让猜测的靴子落地——苹果与OpenAI达成的,几乎是“颗粒度级”的合作。

 

很难说这样的升级,对于苹果究竟是喜是忧。最直观的是,市场反应惨淡:发布会进行同时,苹果股价便不断下跌,最终每股报收193.12美元,跌1.91%,市值缩水578亿美元至2.96万亿美元。

 

微博上有用户表示:比起AI能力,发布会最大亮点是——电话通话终于允许录音了。

 

 

c9dc723ff8b28f377a49e91f310672a6.png

▲ 图 / 科技博主@AshutoshShrivastava

 

 

 

0719ef548c791634947d37f960191b62.png

AI全家桶,OpenAI来套壳

 

c85063844dfa7c21a851a779c6bd19a4.png

 

大会开始,OpenAI创始人山姆·奥特曼(Sam Altman)被安排到了前排就座。这是他自2008年后第二次于公众视野亮相WWDC,似乎也预示着,苹果这次与OpenAI的合作,绝不寻常。

 

虽然5月以来,OpenAI、微软、谷歌、Meta已密集地上演了一场场“AI春晚”,展示了不少精彩技术;但AI距离普通人的理解,以及真实的场景落地还有不小距离。而苹果看起来,才是最有希望将“AI”拉入凡间的公司:可以用更贴近用户的手机AI功能,通过OS和各种App与生活交融。

 

这也是苹果在这次发布会上希望传达的调性,库克将苹果的升级概括为个人智能(personal intellegence)。他表示:“我们希望产品强大、易用、符合直觉、能和现有的产品集成、个人化。”

 

作为预热过场,苹果先用了一个多小时介绍了MR头显VisionPro、iOS、Watch OS、iPad OS、Mac OS乃至于Apple TV的一系列更新。这些“点缀前菜”让观众们听得不胜其烦,直到进度条拉到1小时后,Apple Intelligence才姗姗来迟——把One more thing放在最后,也是苹果的传统艺能。

 

很难讲苹果的AI升级究竟有多少震撼惊喜。其展示的各类功能,比如人工助手回答问题、修改图片、自动翻译、邮件摘要、润色文章等,在近期AI厂商和国内的AI手机发布上都“似曾相识”。但苹果的整合能力,还是能让人看到AI可能带来的深刻改变。

 

 

3825d60a2c9d364f2eb9ae8a7601d7d4.png

 

能显现出苹果最大决心的,无疑是为Siri引用了GPT-4o,让它变得更聪明。

 

回头看去,诞生于2011年的Siri,着实是起了大早赶了晚集。在ChatGPT横空出世前,Siri十几年来从智能助手,沦为了只会讲笑话和被“调戏”的对象,难用程度已“槽多无口”。

 

发布会前,外媒曾剧透,苹果对于是否要帮Siri全面接入ChatGPT,有过两极分化的“撕裂”讨论。从结果看,不论是在AI大潮中感到了沉重危机,还是对OpenAI最终认栽,苹果都痛下了决心,让Siri活成它该有的样子。

 

 

eb9d60ec8585bafa689481b8ed8c04f3.png

▲ Siri将支持文字交互

 

Siri的升级不可谓不多:苹果为其在主屏上设计了一个大光圈;基于Apple Intelligence能力,Siri具备了丰富的语义和大模型上下文理解能力,能理解用户对“那次”“那时”“那里”等代词的具体描述。在原本的语音交互外,Siri还将增加文字交互功能、跨App执行操作等新玩法。

 

现在,用户可以用文字、语音与Siri交流,它可以读懂用户说话间的犹豫——当遇到困难问题时,比如用户询问某道复杂菜式的做法时,Siri会提示是否需要唤起ChatGPT,并由后者详细作答。

 

有了GPT-4o的能力垫底,用户可以用文档、图片、PDF多模态对Siri提问,它也可以基于iPhone内的应用和数据库,做出反应。

 

比如,一个朋友在短信中提到新地址,用户可以让Siri把地址添加到联系人卡片上。用户也可以直接对Siri说:找到某张图片,并进行修图。或者在填表时,提示“帮我找到驾驶证号码”,并填到表格内。

 

苹果还在发布会上展示了一个智能示例,对Siri说,“我要去机场接妈妈了”,苹果便会读取妈妈的航班信息、时刻延误、机场交通,接着智能生成好时间表,填入日程中。

 

 

aefaf118bd1b1ea88627e4f9f9fe4026.png

▲ Siri可读取iMessage中的地址并添加到联系人卡

 

 

 

1f5b7ce288f8343c36e1f480d59ae148.png

iPhone 15 Pro以上能用,国行暂无缘

 

af2db1e637c99339f0472f7228aa0f8b.png

 

为了表达对AI智能化的诚意,苹果着实一股脑拿出了“全家桶”的选择。从通话、语音转文字、智能对话助手、图片处理,到访问第三方应用,苹果几乎对每项核心功能都进行了智能优化。

 

例如,Apple Intelligence支持智能回复邮件。面对长篇的邮件线程,用户仅需轻触屏幕,就可获取关键信息。iPhone可以对邮件快速总结提要,进行简单回复,同步翻译。

 

基于苹果内置芯片的强大算力,Apple Intelligence也把生成式模型部署在了iPhone、iPad和Mac本地,让苹果的原生系统多了不少新功能。

 

例如iPhone始终被诟病的无法通话录音,也终于做出了改变,更新后不仅能够录音,在AI加持下还能够提供文字转录、要点提取等服务。不过,使用通话录音时,考虑到隐私保护,对方将会收到相应通知。

 

针对无边记等写作应用,Apple Intelligence会帮助用户提供写作优化建议、内容校对等,用户可以从多个版本中挑选,调整文风以适应不同的读者和场合。例如,用户撰写邮件时,写作工具菜单会弹出润色选项,并提供智能回复邮件等功能。

 

 

5deaef33562ceb1336002a5cad63360c.png

 

最能让用户发挥个人想象力的功能还包括“智能图像生成”。苹果推出了Genmoji(表情生成)功能,支持用户通过自然语言描述生成表情符号;并进一步推出了Image Playground(图像游乐场),能够让用户自选服装、地点、配饰等关键词,在几秒钟内创造出有趣的图像。

 

 

0160479259247a11fa00c799a8b475c9.png

 

7cee4cc64ee081dc807d79608d04e99e.png

 

种种Apple Intelligence的功能更新,背后少不了和各家大模型,特别是OpenAI达成的颗粒级合作。如AI从业者“歸藏”所说:“连文字改写都用的ChatGPT,图像看起来用的是DALL-E(OpenAI于2021年发布的图像生成模型)。”

 

而对于以上的大模型调取,苹果宣布都将完全免费。用户不必创建账户,就可以免费使用ChatGPT,ChatGPT订阅用户也能关联自己的账户,并在苹果设备中接入付费功能。

 

包含上述功能的“英语试用版”系统将于今年夏天推出,并于今秋落地在iOS 18、iPadOS 18及macOS Sequoia中。但考虑到GPT-4o对大陆的访问限制,本次iPhone和Mac功能更新,可能基本与国行版本无缘。

 

按照官方说法,苹果还计划于明年推出更多AI功能。但由于以上功能需要A17 Pro芯片支持,用户必须要购买iPhone 15 Pro以上级别产品,才可以使用。

 

 

 

d6ea818e78d1276863c12ec56ca6fc36.png

苹果努力捍卫AI铁王座

 

51f2e966d6ac78e31c001f79f21e4889.png

 

实际上,这是一场并无多少秘密的发布会。几乎提前一星期,WWDC24的核心信息就被路透殆尽。可以预见的是,苹果发布的诸多功能,将很快引来友商跟随。而在大模型和AIGC时代,作为智能手机市场的“旧王”,苹果将如何捍卫铁王座,也将成为重要命题。

 

但某种程度上,对自有生态护城河格外重视的苹果,选择对OpenAI敞开大门,已经站在了被动的身位。虽然在大模型横空出世后,苹果一度也躬身入局尝试自研,但结果并不尽如人意。

 

去年,市场一度传出苹果正在积极自研大模型“Ajax”。今年3月苹果曾公布自研的MM1多态大语言模型,但后来并未对该模型开启公测,也未发布上线时间规划。

 

同月,在发布新款Macbook Air时,苹果也在宣传文案中首次强调了“AI”。4月,曾有媒体爆料称苹果正在研发一种运行于设备端的大型语言模型,该模型将优先保证响应速度和隐私保护能力。

 

不过这些,显然都未帮助苹果放大出强劲势能,挽救AI颓势。而友商们,还在不断通过各种合作,跑步入场AI硬件。

 

早在2023年,华为、小米、vivo、OPPO、荣耀等国产手机厂商,就已开始大模型试水,自研亦或接入外部大模型的努力,频频见于报端。

 

2023年7月,华为在开发者大会HDC上发布了盘古大模型3.0,官宣新一代智能操作系统HarmonyOS 4已接入了盘古大模型。一个月后,在年度演讲上,雷军透露小米的13亿参数版本自研大模型已经成功在手机端侧跑通。11月,vivo、OPPO先后推出蓝心大模型矩阵(BlueLM)和安第斯大模型(AndesGPT),同期搭载于手机亮相。

 

兜兜转转,苹果在手机大模型赛道的进度条显然落后了。而这在本已红海厮杀的智能手机市场中,无疑是极大劣势。

 

 

25fcade26aa8df861173e9c8c96e49bd.png

 

有开发者指出,目前还未有一家智能手机企业如苹果这样,如此大范围、细颗粒度地引入了AI大模型的嵌入。随之而来地,频繁端侧推理带来的高耗电问题能否解决?还要等苹果全面开放使用后,才有论断。

 

值得一提的是,2008年,年仅23岁的山姆·奥特曼曾来WWDC演讲,推广自己的首个创业项目,并于Apple Store上架了好友定位应用Loopt。16年后,凭借苹果与OpenAI的深度合作,山姆不仅再次成为WWDC座上宾,更摇身变为最大的隐形Boss,堪称最大赢家。

 

在大会结束后,山姆通过个人社交媒体发帖称:“非常开心与苹果达成伙伴关系,并将在今年晚些时候将ChatGPT嵌入他们的设备中。”

 

 

de9d3bf119f3b68eb7f1ac87f6b3104e.png

▲ 图 / 网络

 

对于OpenAI而言,在微软之后又收获了苹果这个重大的合作伙伴,意味着在大模型的浪潮里,又多了一块最重磅级别的压舱石。

 

不过苹果的合作,也未必代表着甘愿长期与OpenAI绑定,或许也只是在为自研进程争取时间。近期,Siri联合创始人达格·基特劳斯 (Dag Kittlaus) 预测:OpenAI 的合作对苹果来说可能只是短期到中期的关系。

 

(文中插图如无特别说明,均来自于苹果)

 


作者其他作品:

【Java】Spring循环依赖:原因与解决方法

OpenAI Sora来了,视频生成领域的GPT-4时代来了

[Java·算法·简单] LeetCode 14. 最长公共前缀 详细解读

【Java】深入理解Java中的static关键字

[Java·算法·简单] LeetCode 28. 找出字a符串中第一个匹配项的下标 详细解读

了解 Java 中的 AtomicInteger 类

算法题 — 整数转二进制,查找其中1的数量

深入理解MySQL事务特性:保证数据完整性与一致性

Java企业应用软件系统架构演变史

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/28245.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣 SQL题目

185.部门工资前三高的所有员工 公司的主管们感兴趣的是公司每个部门中谁赚的钱最多。一个部门的 高收入者 是指一个员工的工资在该部门的 不同 工资中 排名前三 。 编写解决方案,找出每个部门中 收入高的员工 。 以 任意顺序 返回结果表。 返回结果格式如下所示。 …

Android studio如何导入项目

打开解压好的安装包 找到build.gradle文件 打开查看gradle版本 下载对应的gradle版本Index of /gradle/(镜像网站) 下载all的对应压缩包 配置gradle的环境变量 新建GRADLE_HOME 将GRADLE_HOME加入到path中 将项目在Android studio中打开进行配置 将gr…

LM339模块电路故障查询

最近的电路测试中出现一个问题,如果不接液晶屏,LM339输入端是高电平,如果接了液晶屏,输入端就是低电平,即使在输入端加了上拉电阻,还是如前面的结论,如果越过LM339,直接和后级电路连接&#xff…

Python爬虫JS逆向进阶课程

这门课程是Python爬虫JS逆向进阶课程,将教授学员如何使用Python爬虫技术和JS逆向技术获取网站数据。学习者将学习如何分析网站的JS代码,破解反爬虫机制,以及如何使用Selenium和PhantomJS等工具进行模拟登录和数据抓取。课程结合实例演练和项目…

ThinkPHP邮件发送配置教程?怎么配置群发?

ThinkPHP邮件发送安全性如何保障?ThinkPHP如何实现? 无论是用户注册后的验证邮件,还是订单处理的通知邮件,都需要一个可靠的邮件发送机制。AokSend将详细介绍如何在ThinkPHP框架中配置邮件发送功能,并带您逐步了解其中…

Python武器库开发-武器库篇之Mongodb未授权漏洞扫描器(五十六)

Python武器库开发-武器库篇之Mongodb未授权漏洞扫描器(五十六) MongoDB 未授权访问漏洞简介以及危害 MongoDB是一款非常受欢迎的开源NoSQL数据库,广泛应用于各种Web应用和移动应用中。然而,由于默认配置的不当或者管理员的疏忽,导致不少Mon…

维度建模中的事实表设计原则

维度建模是一种数据仓库设计方法,其核心是围绕业务过程建立事实表和维度表。事实表主要存储与业务过程相关的度量数据,而维度表则描述这些度量数据的属性。 以下是设计事实表时需要遵循的几个重要原则,来源于《维度建模》那本书上&#xff0…

Dictionary 字典

文章目录 一、什么是字典1.1 字典的创建方式 一、什么是字典 字典: 用来存储数据,与列表和元组不一样的是,字典以键值对的形式对数据进行存储,也就是 key 和 value。相当于 Java 中的 Map。 注意: 1、 key 的值不可重…

[C++][数据结构][AVL树]详细讲解

目录 1.AVL树的概念2.AVL树节点的定义3. AVL树的插入4.AVL树的旋转1.新节点插入较高左子树的左侧 -- 左左:右单旋2.新节点插入较高右子树的右侧 -- 右右:左单旋3.新节点插入较高左子树的右侧 -- 左右:先左单旋再右单旋4.新节点插入较高右子树…

基于System-Verilog点亮LED灯

文章目录 一、System-Verilog介绍1.1System-Verilog 二、简单的语法介绍2.1接口实例2.2全局声明和语句实例2.3时间单位和精度2.4用户定义的类型2.5 枚举类型 三、流水灯参考 一、System-Verilog介绍 1.1System-Verilog SystemVerilog是一种硬件描述和验证语言(HDV…

书生·浦语大模型实战营第二期作业五

1、开发机创建conda环境: 2、安装第三方库: 3、新建pipeline_transformer.py文件,并运行: 4、运行结果: 5、执行模型: 6、与大模型进行对话: 7、默认占有的显存: 8、--cache-max-en…

git删除已创建tag标签

前言 一不小心把tag标签名称复制错了&#xff0c;现将删除 1.删除本地标签 1.1.执行下面命令 git tag -d 1.5.2401161.5.240116是创建的tag标签名称 2.如果是删除远程的tag标签名称的话&#xff0c;看下面命令 2.1.删除远程标签 git push --delete origin <tagname>…

【博客719】时序数据库基石:LSM Tree的增删查改

时序数据库基石&#xff1a;LSM Tree的增删查改 LSM结构 LSM树将任何的对数据操作都转化为对内存中的Memtable的一次插入。Memtable可以使用任意内存数据结构&#xff0c;如HashTable&#xff0c;BTree&#xff0c;SkipList等。对于有事务控制需要的存储系统&#xff0c;需要在…

【MySQL基础随缘更系列】DML语句

文章目录 一、表记录操作-上1.1、DML概述1.2、插入记录 二、表记录操作-下2.1、更新记录2.2、删除记录 &#x1f308;你好呀&#xff01;我是 山顶风景独好 &#x1f388;欢迎踏入我的博客世界&#xff0c;能与您在此邂逅&#xff0c;真是缘分使然&#xff01;&#x1f60a; &a…

用CloudCompare软件拟合点云中的圆柱体

用CloudCompare软件拟合点云中的圆柱体 软件下载 点击下面的链接&#xff0c;进入下载页面&#xff1a; 下载页面 然后根据需要选择下载合适的软件版本。 一般选择windows installer版&#xff0c;如图所示&#xff1a; 下载完成后&#xff0c;安装并打开软件。软件的默认语…

解决 kali 中使用 vulhub 拉取不到镜像问题

由于默认情况下&#xff0c;访问的镜像是国外的&#xff0c;而从 2023 年开始&#xff0c;docker 的镜像网站就一直访问不了&#xff0c;所以我们可以把镜像地址改成国内的阿里云镜像地址。 1、在 cd /etc/docker/目录下创建或修改daemon.json文件 sudo touch daemon.json 2、在…

docker 简单在线安装教程

1、配置阿里镜像源 wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo 2、指定版本安装docker 本次制定安装 docker 服务版本、客户端版本都为&#xff1a; 19.03.14-3.el7 yum -y install docker-ce-19.03.14-3.e…

ffmpeg实现视频播放 ----------- Javacv

什么是Javacv和FFmpeg&#xff1f; Javacv是一个专门为Java开发人员提供的计算机视觉库&#xff0c;它基于FFmpeg和Opencv库&#xff0c;提供了许多用于处理图 像、视频和音频的功能。FFmpeg是一个开源的音视频处理工具集&#xff0c;它提供了用于编码、解码、转换和播放音视频…

Unity Meta Quest 开发:与 Unity 的 UI 系统进行交互

文章目录 &#x1f4d5;教程说明&#x1f4d5;教程内容概括&#x1f4d5;添加玩家物体&#x1f4d5;添加 Canvas 物体和 EventSystem 物体&#x1f4d5;修改 Canvas 组件的 Render Mode&#x1f4d5;在 Canvas 上搭建 UI 面板&#x1f4d5;利用 Interaction SDK 的 Quick Actio…

英伟达与斯坦福携手,打造未来全息XR眼镜:头带时代的终结

在XR(扩展现实)技术的演进过程中,一个显著的挑战在于如何平衡设备的便携性与视觉体验。传统的XR设备由于需要厚重的头带固定光学器件和显示器,不仅增加了体积,还为用户带来了社交上的不便。然而,随着英伟达与斯坦福大学戈登韦茨斯坦教授领导的研究团队的合作,这一难题似…