赛博·新闻
1、OpenAI发布最强模型o1
本周四(9月12日),OpenAI宣布推出OpenAIo1系列模型,标志着AI推理能力的新高度。o1系列包括性能强大的o1以及经济高效的o1-mini,适用于不同复杂度的推理任务。新模型在科学、编码、数学等领域表现出色,但目前仍存在一些限制,如无法进行网页浏览和处理多模态输入。其中o1-preview还是预览版,OpenAI还会继续更新开发下一版本。目前使用有一定次数限制,Plus和Team的用户可在ChatGPT中访问,o1-preview每周30条消息,o1-mini每周50条。
2、苹果发布史上首台 AI iPhone
本周二(9月10日),苹果公司发布了iPhone 16系列,这是其首款真正意义上的AI手机。iPhone 16系列在外观上进行了微调,新增了配色,并引入了“相机控制”功能。Pro系列在影像和性能上进行了显著升级,包括四棱镜长焦镜头和4K 120fps杜比视界视频拍摄。A18 Pro芯片提供了更强的性能和更低的功耗。苹果还宣布将在2025年支持中文的Apple智能。iPhone 16系列的预购和发售时间分别为9月13日和9月20日,价格与上一代持平。
3、「欧洲版 OpenAI」发布首个多模态模型
法国AI初创公司Mistral AI发布了首个多模态模型Pixtral 12B,该模型拥有120亿参数,能处理与图像相关的多种问题。尽管性能测试显示其全面超越其他模型,但HuggingFace的技术主管指出测试结果可能存在问题。Pixtral 12B具备强大的视觉处理能力和语言理解能力,支持大尺寸图像和复杂符号识别。Mistral AI的估值已达60亿美元,其商业模式可能从开源转向闭源。
4、阿里通义即将发布 AI 视频生成模型:支持文本、图片生成
多家媒体报道称,阿里通义将在 2024 年云栖大会(9 月 19 日至 21 日)发布视频生成大模型,目前通义万相官网已上线「视频生成」入口,开放用户预约(预约地址:https://tongyi.aliyun.com/wanxiang/wanxvideo?autoReservation=true)。特色功能方面,通义视频生成将支持运动生成、复杂语义理解和概念组合生成等能力。艺术风格方面,支持勾线动画、国漫 3D、毛毡动画、CG 厚涂、3D 动画等风格,以及国风画风和元素的呈现。根据介绍,用户可以从通义万相 PC 端或 App,通过文字描述或图像控制生成视频:
- 输入文字控制画面内容与变化过程,配合提示词智能扩写功能
- 将图片作为视频首帧延续生成,生成更可控,画面更精准
5、传字节再试智能硬件
字节跳动正在探索将AI大模型与硬件结合,开发智能耳机和眼镜等产品,并与豆包大模型联动。团队由Kayden领导,首款产品为智能耳机,与豆包App结合使用。字节还计划通过投资或内部团队研发AI眼镜。尽管字节在硬件领域的早期尝试未达预期,但公司仍看好AI硬件的潜力,认为它是大模型落地的重
赛博·洞见
1、「草莓」实测:可能只是工程 Trick,且有扣费陷阱!
作者大聪明第一时间对OpenAI新发布的o1系列模型「草莓」进行了全面测试与分析。作者指出该模型在STEM(理工科)领域表现优异,但在实际应用中存在功能限制、计费陷阱等问题。o1系列模型实际输出远低于宣称的最大输出,且价格昂贵,存在百倍计费风险。作者认为「草莓」更像是工程优化而非模型优化,实际表现未达预期。
2、试完这个神级Prompt,我发现Claude3.5确实就是现在的No.1。
李继刚编写的一个NB提示词“汉语新解”,该Prompt能够通过AI对汉语词汇进行独特角度的解释并生成精美卡片。作者通过比较不同AI模型处理此Prompt的效果,认为Claude3.5在理解和输出方面表现出色,能够精准地执行任务并生成高质量的SVG代码。文章还讨论了Claude3.5在自我学习方面的优势,以及其对开发小型产品和简化产品开发过程的潜在影响。
3、通往人类永生!AI时代如何保存记忆和历史?
本文探讨了在AI时代如何保存记忆和历史,以实现人类“永生”。文章通过个人故事引入主题,讨论了数据存储的挑战、重要性以及未来可能的解决方案。强调了数据的脆弱性,以及如何通过各种技术手段,如DNA存储和玻璃介质,确保数据能够长期保存。同时,提出了关于数据保存的伦理和选择问题,以及如何为未来的历史学家和人类学家提供丰富的资料。
4、陶芳波:Me.bot现在是第二大脑,以后是Memory Infra
本文探讨了Me.bot作为一款记录记忆的AI产品背后的设计理念和应用潜力。Me.bot旨在成为用户的“第二大脑”,通过连接用户的记忆和思想,提供个性化的洞察和建议。文章通过作者与陶芳波的深入对话,揭示了Me.bot如何帮助用户与自己的记忆进行互动,以及如何通过AI技术促进自我反思和个人成长。此外,文章还讨论了Me.bot在Product Hunt上的成功推广策略,以及产品的未来发展和潜在应用。
5、因为相信所有想法都值得变成珍珠,他做了一款AI语音笔记
「闪念贝壳」是另外一款记录记忆的AI语音笔记产品,由创始人Ping开发,旨在通过AI技术帮助用户快速记录灵感和想法。Ping认为,每个想法都值得被记录和实现,如同珍珠般珍贵。产品的核心理念是将想法从记录、思考到行动的流程化,并通过多种输入方式如语音、快捷指令和Apple Watch来实现。Ping强调AI应服务于用户需求,而非主导产品设计,同时坚持长期主义和理想主义,希望产品能改变世界。
6、谷歌创始人布林:一次计划外的访谈
谷歌联合创始人谢尔盖·布林在All-In 2024峰会上进行了一次意外的公开访谈,分享了他对AI未来的看法和谷歌在AI领域的战略。布林讨论了AI技术的快速发展,其对编程、搜索等领域的影响,以及谷歌在AI技术方面的最新进展。他还展望了AI模型的未来发展,强调了计算资源的重要性,并肯定了谷歌在全球AI竞争中的地位。
7、AGI范式大转移:从LLM到self-play RL
2024年第三季度,AGI领域发生了显著的范式转变,以OpenAI的“草莓”项目和Anthropic的Claude 3.5 Opus为标志,硅谷的AGI发展重点从传统的LLM转向了self-play RL(自博弈强化学习)。这一转变意味着,面对语言模型预训练的Scaling Law遭遇瓶颈,硅谷开始探索新的发展路径。本期《全球大模型季报》探讨了这一转变,并对硅谷一级市场的明星赛道进行了分析,包括编程、视频生成和通用机器人等领域。同时,节目还讨论了强化学习作为新范式的可能性和挑战,以及其对未来AI发展的影响。
8、Kimi创始人杨植麟最新分享:关于OpenAI o1新范式的深度思考
杨植麟在天津大学宣怀学院的分享中,深入探讨了人工智能大模型发展的新范式,强调了强化学习在突破数据墙和提升计算效率中的作用。他指出,AI技术的上限由文本模型的能力决定,而AI产品的能力与模型能力紧密相关。杨植麟认为,AI时代的超级应用很可能是AI助理,并且随着技术的进步,AI将能完成更复杂的任务,同时在不同模态间切换。他还提到了数据作为变量的重要性,以及通过与用户的交互来优化AI系统。以下是重点:
① 规模定律之后,大模型发展的下一个范式是强化学习。
② OpenAI o1模型的发布,通过强化学习尝试突破数据墙,并看到计算更多向推理侧增加的趋势。
③ 决定这一代AI技术的上限,核心是文本模型能力的上限。
④ AI产品的能力由模型能力的决定,这和互联网时代有本质不同,模型能力不强,产品体验就不会好。
⑤ AI时代的超级应用,大概率会是一个AI助理。
赛博·资源
1、AI个人名片生成器
2、BoardOS:在线实时白板协作系统
一个支持实时协同的白板软件,有免费版。
3、Apple人机界面指南
苹果出品,《人机界面指南》包含可帮助你为任何 Apple 平台设计优秀使用体验的指南和最佳实践。