上周,关于Google的Bard和Midjourney v6的讨论异常火热。
接下来,让我们回顾一下上周那些引人注目的AI新闻。
① 已近乎真实拍摄:Midjourney v6的画质令人惊叹
由Midjourney v6制作的图片,质量之高,媲美电影级别,让人难以置信。如此高质量的作品,电影、摄影、海报、杂志等创意领域将来都有可能被AI所主导。
■ 使用工具
Midjourney v6(图像生成AI)
Magnific AI(图像质量提升AI)
Lightroom(Adobe的图像编辑软件)
② Google发布了视频生成AI Video Poet。
【终于,Google也发布了视频生成AI!】
Google在官方博客上于12月19日宣布,推出了视频自动生成工具“VideoPoet”。
“VideoPoet”可以实现从文本到视频,从图像到视频的生成,视频风格化,以及音声生成。
每天,新的视频生成AI不断涌现,我们已经完全进入了生成AI的战国时代!
③ Meta开发实时翻译AI
Meta公司推出了一款名为“SeamlessStreaming”的实时翻译AI,其延迟不到2秒,大大增强了同声传译的现实可行性。一旦应用于在线会议系统,它有望直接消除国际间的沟通障碍。
④Bard兼容Gmail、YouTube、Google Map
Google宣布,其生成AI聊天工具“Bard”已可与Gmail、YouTube、Google地图、Google文档等服务一同联动使用。
⑤ AGI?模仿人类动作的AI出现,可自动操作应用程序
这是一项具有划时代意义的技术,可能将日常生活和工作中的许多事务委托给AI。
● 地图搜索
● 社交网络帖子发布
● 图像编辑
● 邮件撰写和发送
● 网络购物
等在10种应用中实现50种任务。
未来,只需对智能手机说“随便回复一下未读邮件!”或“帮我买些日用品!”就能完成这些任务。
这项名为AppAgent的AI技术是由腾讯和德克萨斯大学达拉斯分校的研究团队共同开发的。
⑥ Perplexity AI增加图像分析功能
Perplexity AI中新增了多模态图像分析功能。类似于GPT-4V,能够分析上传的图片。
Perplexity的月费为20美元,
● 使用多个大型语言模型(LLM)
(GPT-4、Claude 2.1、Gemini、Perplexity)等等
● 基于YouTube和网页文章内容生成回答
● 附带已要約新闻列表
● 生成结果的图像、视频搜索功能
● 图像分析、文件学习功能
性价比相当高。
期间限定,使用圣诞节优惠券可以享受两个月的免费服务。虽然需要注册信用卡,但到期后可以免费取消。对此感兴趣的朋友们千万不要错过。
链接: Perplexity
折扣券:
⑦OpenAI市值超过1000亿美元
大语言模型技术领先的 OpenAI,马不停蹄又要融资了。
本周五据彭博社报道,OpenAI 正在开始讨论讨论筹集新一轮融资,估值将达到超过 1000 亿美元。这笔交易将为 OpenAI 这个 ChatGPT 提出者的融资历程再添上重要一笔。据了解情况的多位相关人士透露,如果实现,OpenAI 将成为仅次于字节、SpaceX 的全球第三大初创公司。
据要求匿名的相关人士透露,原因是此事尚属机密,可能参与资金筹集轮的投资者正参与讨论。关于条件、估值和时间等细节尚未确定,未来还有可能发生变化。