全球AI新闻速递
1.广东 / 山东警方破获两起“AI 换脸伪造不雅照”案。
2.腾讯混元、港科大、清华推出表情包框架:Follow Your Emoji。
3.抖音联合博纳影业推出首部 AIGC 科幻短剧集《三星堆:未来启示录》。
4.亚马逊:宣布向全球创企提供 2.3 亿美元资助。
5.软银与 Perplexity AI 搜索引擎达成战略合作。
6.加州大学研究表示:54% 的人将AI误认为真人。
7.麦当劳“炒掉”AI 点餐员,叫停与 IBM 合作的自动点餐测试项目。
8.三星电子与首尔大学成立AI联合研究中心。
9.韩国年轻人约会文化不看脸,在黑暗咖啡馆约会。
10.金山办公 WPS AI 海外版发布,海外月活设备数已超两亿。
11.国家药监局:AI 可用于药品说明书适老化改造、业务办理及政策咨询等场景。
12.AI 教父 Hinton:我支持超级 AI 取代人类。
13.Runway 发布第三代视频生成模型,90 秒生成 10 秒片段。
14.让用户更省心驾驭 PDF 文档,Adobe Acrobat 升级 AI 技能:文生图、梳理信息等。
人工智能的未来
人工智能平台正在努力消除交通拥堵
对于大多数司机来说,连续通过绿灯可能感觉像是一种罕见的运气。但很快,人工智能就可能让这种情况更有可能发生。世界各地的城市开始测试可以分析汽车和地图应用程序数据的新平台,以促进“绿波”的出现,保持交通畅通。
细节:
1.开发商表示,在繁忙的路口,只需调整几秒钟的信号就能带来很大的不同
2.尤其是在交通高峰期,红绿灯时间不合适很容易导致交通堵塞
3.新的人工智能模型可以建议如何在一天中的不同时间点优化信号,其精度比旧方法高得多
4.城市工程师无需彻底改造整个交通系统,只需几分钟即可输入更改内容
5.这是因为它们整合了已经在道路上行驶的汽车的数据,减少了城市对冗长的交通研究的依赖
这些举措取得了很大成功:据《华尔街日报》报道,Alphabet 的一项名为 Green Light 的项目已帮助减少了高达 30% 的交通拥堵。该项目已在 16 个城市投入使用,包括阿布扎比、西雅图和汉堡。Green Light 每月已影响约 3000 万次汽车出行,并计划很快扩展到更多城市。
另一个好处是:十字路口排放的一半来自红灯启动和停止的汽车。因此,如果我们能够减少司机在红灯处等待的空闲时间,我们也可以减少城市的整体污染。一些模型已经成功将十字路口的等待时间减少了 10%——考虑到汽车是美国污染的主要来源,这是一个值得注意的数字。
甲骨文将于 9 月 30 日停止其所有广告产品
NVIDIA 展示视觉 AI 领域的最新进展
NVIDIA 研究人员本周在西雅图举行的计算机视觉和模式识别(CVPR) 会议上展示了新的视觉生成 AI 模型和技术。这些进步涵盖了自定义图像生成、3D 场景编辑、视觉语言理解和自动驾驶汽车感知等领域。
NVIDIA 学习和感知研究副总裁 Jan Kautz 表示:“人工智能,尤其是生成式人工智能,代表着一项关键的技术进步。
“在 CVPR 上,NVIDIA Research 分享了我们如何突破可能的界限——从可以为专业创作者提供强大动力的强大图像生成模型,到可以帮助实现下一代自动驾驶汽车的自动驾驶软件。”
在 50 多个 NVIDIA 研究项目中,有两篇论文入围 CVPR 最佳论文奖决赛——一篇探讨了扩散模型的训练动态,另一篇探讨了自动驾驶汽车的高清地图。
此外,NVIDIA 还赢得了 CVPR 自动驾驶大赛的端到端大规模驾驶赛道,在全球 450 多个参赛者中脱颖而出。这一里程碑展示了 NVIDIA 在将生成式 AI 用于全面自动驾驶汽车模型方面的开创性工作,同时还获得了 CVPR 颁发的创新奖。
其中一个主要研究项目是JeDi,这是一项新技术,允许创作者快速定制扩散模型(文本到图像生成的领先方法),仅使用几个参考图像即可描绘特定对象或字符,而无需在自定义数据集上进行耗时的微调。
另一项突破是FoundationPose,这是一种新的基础模型,可以立即理解和跟踪视频中物体的 3D 姿势,而无需对每个物体进行训练。它创下了新的性能记录,并可能解锁新的 AR 和机器人应用。
NVIDIA 研究人员还推出了 NeRFDeformer,这是一种使用单个 2D 快照编辑神经辐射场 (NeRF) 捕获的 3D 场景的方法,而不必手动重新制作更改或完全重新创建 NeRF。这可以简化图形、机器人和数字孪生应用的 3D 场景编辑。
在视觉语言方面,NVIDIA 与麻省理工学院合作开发了VILA,这是一系列新的视觉语言模型,在理解图像、视频和文本方面取得了最先进的性能。凭借增强的推理能力,VILA 甚至可以结合视觉和语言理解来理解互联网模因。
NVIDIA 的视觉 AI 研究涉及众多行业,包括十几篇探索自动驾驶汽车感知、测绘和规划新方法的论文。NVIDIA AI 研究团队副总裁 Sanja Fidler 介绍了视觉语言模型对自动驾驶汽车的潜力。
NVIDIA CVPR 研究的广度体现了生成式 AI 如何能够赋能创作者、加速制造业和医疗保健领域的自动化,同时推动自主性和机器人技术的发展。
人工智能与生产力
DeepMind 为视频制作声音
摘要: Google DeepMind 刚刚发布了关于实验室视频转音频 (V2A) 系统的新研究,该系统可以为视频生成详细、同步的配乐——包括音乐、音效、对话等。
细节:
V2A 将原始视频像素与文本描述相结合,以产生与视频输出的视觉效果和音调相匹配的逼真的音频。
V2A 模型在视频、音频、音效注释和语音记录上进行训练,以学习视觉和音频事件之间的关联。
DeepMind 表示,正在与领先的电影制作人一起测试 V2A 模型,并计划在向公众开放之前进行更多的安全测试。
重要性:尽管人工智能视频生成技术发展迅速,但结果往往出奇地安静。V2A 与 Veo 或其他模型的集成可以将创意能力提升到一个新的水平——对话、音效和音乐很快就能与视频输出无缝匹配。
Salesforce 的新功能为消费品规划和执行带来统一数据和相关 AI 洞察
Salesforce 今天宣布推出面向消费品云的新数据和 AI 解决方案,使从规划到执行的上市流程的每一步都更加高效和智能。面向消费品的数据云可解锁并统一客户数据和行业市场研究,为客户代表提供有关买家偏好的更深入见解,以优化零售规划和执行。此外,面向消费品公司的全新 Salesforce AI 工具可提供智能指导并生成客户摘要,使销售、服务和现场代表能够更有效地规划并处理客户查询,以帮助提高收入。
重要性:绝大多数(92%)消费品领导者表示,增长是他们的首要任务——而人工智能提供了实现增长所需的规模和效率机会。根据麦肯锡的研究,生成式人工智能可以通过提高生产力为该行业创造 4000 亿至 6600 亿美元的价值。然而,消费品行业营销人员报告称,他们平均使用18 个数据源来获取客户参与和促销机会。这不仅降低了促销计划的效率,还限制了数据准确、相关地为公司用于扩展的人工智能模型提供信息的能力。
新功能:消费品云包括贸易促销管理和零售执行,将规划和执行与排名第一的 AI CRM 结合在一起,帮助企业实现盈利增长。现在,通过与统一和协调结构化和非结构化数据的Salesforce Data Cloud连接,并深度集成Einstein AI,客户将能够利用新的解决方案来加强渠道合作伙伴关系。解决方案包括:
消费品数据云允许大客户经理连接账户数据和行业数据,为每个客户创建统一的档案,细分账户,按零售店定义微细分,并创建细分仪表板,以在超本地级别规划精确的分类和促销。
例如,一家在拉丁美洲销售软饮料的公司可以使用消费品数据云来统一忠诚度数据和联合消费者数据(如Circana或尼尔森市场研究)。利用这些信息,他们可以确定哪些柑橘味苏打水在墨西哥某个地区的当地消费者中特别受欢迎,以及哪些便利店倾向于要求补货该产品。然后,该公司可以为该地区的每家商店推荐更高的月度采购订单或更频繁地补货该特定苏打水。
Einstein Copilot帐户摘要功能可直接在服务控制台中提供 AI 生成的帐户摘要,从而帮助提高 Consumer Goods Cloud 中服务代理的工作效率。这样就无需在屏幕、知识文章和历史记录之间切换,因此代理可以以个性化的方式处理复杂的查询,同时鼓励根据帐户需求进行追加销售和交叉销售。
例如,一家家居消费品公司的服务代理首次与大型零售商互动时,可以使用 Einstein Copilot 客户总结功能在几秒钟内了解最近的互动、下达的订单、客户满意度得分,直至零售商的具体促销销售点位置。该总结有助于准确回答零售商关于最近订单的问题,同时建议在解决问题时增加销售产品。
Consumer Goods Cloud Einstein 1 for Sales 是一套全新的数据和 AI 功能,为每位销售经理、现场销售代表、推销员和送货司机提供工具,以推动账户增长和提高生产力。Consumer Goods Cloud Einstein 1 for Sales 中会显示和显示相关的零售执行细节和建议,让销售代表能够确定是否需要为易腐烂或易碎产品提供特殊产品处理、确保快速补货周期、改善农村地区的产品供应,或通过在产品交付期间收取付款来减少付款违约。
例如,一家零食公司的现场代表在发现一家大型零售店中销量最高的冷冻食品之一缺货后,向客户触发了缺货 (OOS) 通知。销售经理在 Consumer Goods Cloud Einstein 1 for Sales 仪表板中看到缺货通知,并立即通知直接送货团队优先补货。由于所有团队都在 Consumer Good Cloud 中使用相同的实时数据和连接系统,因此商店可以补货并实现增量销售