麦肯锡在其《生成人工智能的经济潜力:下一个生产力前沿》中声称,“ChatGPT、GitHub Copilot、Stable Diffusion 等生成式人工智能应用程序以 AlphaGo 没有的方式吸引了世界各地人们的想象力,这要归功于它们广泛的实用性——几乎任何人都可以使用它们进行交流和交流。”创造与用户对话的超自然能力。” 具体来说,生成式人工智能能够编写文本、创作音乐,最重要的是能够创造数字艺术,这些能力已成为全球头条新闻,并说服数百万消费者尝试这项技术。能够执行各种日常任务(例如重新组织和分类数据)仅此而已,尤其是当您只需在 DALL-E 2 中输入简单的文本提示即可创建在太空中骑马的宇航员时。
麦肯锡表示:“生成式人工智能有望改变销售和营销、客户运营和软件开发等职能部门的角色并提高绩效。"他们表示,可以释放数万亿美元的价值,其中大约 75% 的价值分布在四个领域:“客户运营、营销和销售、软件工程和研发”。
OpenAI:一张宇航员骑马的照片
什么是生成式人工智能?
生成式人工智能是一种可以生成各种类型内容的技术,包括文本、图像、音频、视频和合成数据。它使用生成模型根据在数据集中找到的现有模式和结构创建新内容。它可用于各个行业,包括艺术、写作、软件开发、医疗保健、金融、游戏、营销和时尚。然而,用例并不仅仅局限于这些行业,因为每天都有越来越多的行业加入生成式人工智能革命。它是一项快速发展的技术,并且随着新研究的开展,其功能正在迅速扩展。MidJourney、Dalle-3、ChatGPT 和 Google 的 Bard 等工具都是正在获得广泛使用的生成式 AI 工具的示例。
在他的文章《什么是生成式人工智能?》中 你需要知道的一切,乔治·劳顿说,“生成式人工智能是一种人工智能技术,可以产生各种类型的内容,包括文本、图像、音频和合成数据。最近围绕生成式人工智能的热议是由新用户界面的简单性推动的,这些用户界面可以在几秒钟内创建高质量的文本、图形和视频。”
生成式 AI 应用程序在基础模型上运行,例如经过大量内容训练的大型语言模型 (LLM)。谷歌云在其生成人工智能高管指南中表示,一些法学硕士接受了文本或语言方面的培训,另一些则接受了图像、照片、视频、音乐、软件代码甚至网络安全数据方面的培训。
基础模型最好被认为是由人类输入塑造的概率引擎。“他们使用在训练和调整过程中学到的模式来计算最可能的输出,例如问题最可能的答案或图像的准确标题,”谷歌云补充。
极其强大的基础模型可以执行许多下游任务,例如问答、摘要和开放式内容生成 - 几乎不需要或不需要额外的数据或调整。然而,它们的训练和运行成本高昂,容易产生不准确的输出,被称为“幻觉”,并且难以使用,这就是为什么它们只由有能力花费数十亿美元投资的顶尖科技公司推出。这项技术需要。
生成式人工智能并不新鲜,它于 20 世纪 60 年代被引入,作为简单聊天机器人的基础。然而,直到 2014 年 GAN 推出时,它才引起了人们的真正兴趣。GAN 生成的图像、文本、视频和音频非常准确,看起来和听起来都很真实。最近的另外两项进展——变压器和它们所实现的突破性语言模型——也在生成人工智能的主流化中发挥了关键作用。
Anantrasirichai 和 Bull在他们的文章《创意产业中的人工智能:评论》中认为,人工智能已经越来越“与人类创造力和艺术实践联系在一起。由于它展示了“看”、“听”、“说”、“移动”和“写”的能力,因此它已被应用于以下领域和应用:音频、图像和视频分析、游戏、新闻、脚本编写、电影制作、社交媒体分析和营销。”
生成式人工智能应用
根据Google Cloud 的说法,生成式 AI 的核心具有以下四种功能:
- 创建
- 总结
- 发现
- 自动化
Google Cloud认为它在以下四个应用程序中表现出色:
- 聊天——聊天机器人界面是大多数人接触生成式人工智能的方式。这是与这些强大工具交互的自然方式。聊天机器人可用于改善客户互动、增强产品功能、培训员工等等。
- 搜索——通过将生成式人工智能功能与搜索相结合,您可以创建公司知识库,以实现更具针对性和针对性的交互。这种方法消除了幻觉,因为信息来自事实来源。
- 生成内容——生成高质量文本、图像和语音的能力在客户服务和个性化营销方面具有巨大潜力。更快地生成代码的能力将帮助程序员更快地将想法转化为输出。
- 联想推理——利用联想推理,生成式人工智能可以通过解析大量转录的客户对话来识别呼叫中心交互最终积极或消极的最常见原因。
麦肯锡表示:“2012 年,麦肯锡全球研究院 (MGI) 估计知识工作者花费了大约五分之一的时间,即每周工作一天来搜索和收集信息。” 利用生成式人工智能可以保留每周 20% 的工作时间,这是其他方式无法实现的生产力,海量的企业信息库可以被快速扫描,而人类可以帮助微调研究,这是一种比为每项所需任务雇用人类专家团队更具可扩展性的解决方案。
生成式人工智能应用程序可以:
- 创建内容:生成式人工智能可以生成各种类型的内容,包括文本、图像、音频、音乐和视频。新的和重新调整用途的内容可用于为个人用户提供个性化的消息传递。
- 自动化内容:生成式人工智能可以通过提供电子邮件、文章和其他书面或基于图像的内容的初稿来自动化内容创建。
- 构建代码:生成式人工智能可以建议代码完成、优化现有代码并生成替代实现,以提高效率或生成更易于理解的软件代码。
- 提供客户支持:生成式人工智能可以提供实时支持并通过聊天机器人回答常见问题。
- 工人增强:生成式人工智能可以增强工人起草和编辑文本、图像和其他媒体的能力。它还可以汇总、简化和分类数据。
- 产品设计:生成式人工智能可用于根据用户偏好和反馈创建新产品设计并优化现有设计。
- 个性化内容:人工智能模型可以根据个人用户偏好生成个性化内容。
- 重新调整内容的用途:现有内容可以重新用于其他平台,例如社交媒体帖子、播客和操作视频,其中大部分重写工作由人工智能完成。
内容创作
毫无疑问,内容创作是生成式人工智能最有趣的领域。MidJourney、Stable Diffusion 和 Dalle-3 等工具被证明是革命性的服务,有望改变许多图形设计师、故事板艺术家、服装设计师和书籍封面插画师的生计。
生成式人工智能成功地彻底改变了图像创建,现在它的目标是训练视频。YouTube 正在拥抱这项技术,将生成的主题创意、背景、音乐建议和音频翻译添加到其服务中。
生成式人工智能多久之后就会减少对电影布景和大量工作人员的需求?
新功能将帮助视频制作人设计、规划和发布他们的内容。
YouTube Studio 最近发布了AI Insights、Dream Screen 和 YouTube Create。第一个是生成式人工智能工具,旨在根据 YouTuber 过去上传的内容和/或热门话题来激发视频创意和草拟大纲。今年晚些时候,YouTube 将测试 Dream Screen,这是一种根据提示生成图像和短视频的工具,然后可以在 YouTube Shorts 的背景中使用。YouTube Create 是一款新应用程序,其中包含多种新的视频编辑和制作工具。
生成人工智能音频方面的另一个工具是谷歌的Aloud,它可以将英语语音录音翻译成西班牙语或葡萄牙语。该工具将英语音频转录成可编辑的文本脚本,然后将其翻译成所需的语言。
YouTube 的目标是什么?当然是赚更多的钱。底线始终是底线。生成式人工智能有能力简化视频制作过程。贡献者变得更有生产力。他们制作更多视频,吸引更多眼球,从而增加每个人的收入。这是双赢的,特别是对于生成式人工智能来说,它需要做更多的工作。
至于文本转图像工具,2021年初,OpenAI推出了其图片制作神经网络DALL-E,并带有一串超现实和卡通图像后,OpenAI联合创始人兼首席科学家Ilya Sutskever将该系统描述为“卓越的美丽即服务。” 这是一种相当丰富多彩和诗意的赞美,但却是非常真实的。希望 DALL-E 能够激励艺术家和外行人在日常工作中使用该工具。嗯,任务完成了,生成式人工智能 Dall-E 4、Stable Diffusion 和 MidJourney 的巨大成功已经证明了这一点。本文中的所有图像都是在 MidJourney 上创建的,除了 Dall-E 的宇航员骑马外。没有一个需要花费超过几分钟的时间来创建。
编码
通过一种称为神经代码生成的技术,生成式人工智能为编码人员带来了帮助。这涉及在大型代码示例数据集上训练神经网络,然后使用微调网络生成结构和功能与其训练示例相似的代码。目前,它可用于:
- 代码生成
- 代码优化
- 代码完成
- 软件测试
- 数据库优化
GitHub Copilot、ChatGPT、CodeWhisperer、TabNine 和 IBM Watson Code Assistant 是生成式 AI 工具,可为开发人员提供代码建议。通过利用生成式人工智能的力量,这些类型的工具正在为技术领域更具包容性和可访问性的未来铺平道路。
生成式人工智能帮助开发人员
虽然像 GitHub Copilot 这样的工具为开发人员提供了代码建议,但 TabNine 根据上下文建议了下一行代码。其他工具根据编码器期望结果的自然语言描述生成代码。大多数这些工具还有助于优化现有代码。这些生成式人工智能工具正在彻底改变编码过程,使其更加高效、生产力更高,而且同样重要的是,更容易被更广泛的受众所使用。
营销
根据 David Ratajczak 等人的《首席营销官如何利用生成式人工智能取得成功》一书,“生成式人工智能 (GenAI) 的现实正在赶上关于它如何颠覆营销人员和营销本身的角色的炒作。” 2023 年 4 月对全球 200 多名首席营销官 (CMO) 进行的一项调查对生成式 AI 未来提高生产力和创造竞争优势的能力持乐观和信心。
尽管首席营销官正在考虑的应用程序包括内容生成、洞察生成和市场细分等核心营销功能,但个性化是最重要的,大约三分之二的受访者追求这些努力。David Ratajczak 等人表示,一些银行使用生成式“人工智能来分析客户数据并提供与其风险偏好相匹配的个性化投资建议” 。研究人员补充说,一些零售商通过生成人工智能创建了超个性化的推荐,吸引购物者购买更多商品。总结道:“这些努力的目标和好处包括更好的参与度、更高的转化率以及更高的客户忠诚度。 ”
对于德国汽车制造商梅赛德斯来说,生成式人工智能有助于内容生成。在播客Gen AI in high gear:梅赛德斯-奔驰利用 ChatGPT 的力量中,麦肯锡高级合伙人兼 QuantumBlack 全球领导者 Ben Ellencweig 解释了梅赛德斯如何在客户个性化营销中使用生成式 AI。过去,营销人员必须带着摄制组和几辆奔驰汽车前往死亡谷,拍摄一些汽车穿越沙漠的照片。如今,生成式人工智能可以立即制作出让任何人进入车内的广告。现在可以根据客户的偏好、品牌历史和体验来针对单个客户开展营销活动。
MidJourney 为提示提供了四个选项:“一位 50 多岁的白人驾驶着一辆全新的昂贵奔驰穿过死亡谷,他微笑着,享受着这趟旅程。照片逼真,看起来像梅赛德斯奔驰的广告,使品牌相当突出”,揭示了生成式人工智能工具的强大和弱点。
ChatGPT 甚至可以个性化新车的用户手册。例如对于汽车营销活动,“Gen AI 能够指导技术人员、识别问题并快速确定如何解决该问题。”
生成式人工智能还可以预测某人是否以及何时会从汽车制造商提供的特定功能中受益。例如,汽车购买者可能不熟悉先进的驾驶员辅助系统,但生成式人工智能可以为几乎所有汽车购买者制作个人教程。
我们不要超越自己
所有这些都让生成式人工智能听起来似乎只有一个美好的未来。然而,这并不是故事的全部。该工具有很大的局限性;缺乏创造力;人工智能的黑匣子性质导致创建过程缺乏透明度,这意味着用户可能很难理解幕后发生的事情;版权和开源许可问题困扰着 ChatGPT、Dall-E、MidJourney 和 Stable Diffusion 等 AI 工具。作家和艺术家已经起诉这些工具背后的公司侵犯版权,因为创建这些模型的训练数据使用了许多书籍和图像,直接违反了版权所有者的意愿。这是法院尚未解决的灰色地带。然而,一些早期案例似乎正朝着创造者的方向发展,因此这些可能预示着生成型人工智能公司将面临问题。
巴勃罗·毕加索曾经说过:“艺术就是消除不必要的东西”,他可能从来没有想到,在艺术的创作中,不必要的部分可能是人。然而,可以肯定地说,我们距离这一点还有很长的路要走。最近美国作家协会(WGA)在好莱坞的和解肯定给好莱坞的黑暗摄影棚带来了一股寒风,即使不是也给生成人工智能制片人带来了影响。制片厂可能希望将他们的写作需求外包给计算机,而不是好莱坞山上那些有点易怒的人类作家。Open AI、Google、Meta 和其他一些科技公司看到,他们向工作室出售生成式 AI 梦想的希望因 WGA 的授权而破灭。美国复兴的劳工运动大声疾呼,我们不会安静地进入生成式人工智能的晚安。最起码到现在。
生成式人工智能对人类劳动力的攻击并不全是坏事。现实是,很多人都喜欢将苦差事交给计算机程序或人工智能机器人。通过利用生成式人工智能,每周节省百分之二十的工作时间是不容小觑的。
Anantrasirichai 和 Bull认为人工智能应该增强而不是取代人类的创造力。创造力需要高水平的创新,坦率地说,人工智能目前不具备这种能力,而且可能永远无法实现。他们认为:“虽然人工智能的成就在很大程度上依赖于数据的一致性,但创造力往往会利用人类的想象力来推动可能不遵循一般规则的原创想法。”
对于生成式人工智能来说,遗憾的是,创造力在取代人类的竞赛中似乎迈得太远了。也许我们创造的故事中的某些东西是机器永远无法复制的。“生命是两个相同的虚空之间的火花,即出生前的黑暗和死后的黑暗,”作家欧文·D·亚洛姆写道。也许存在于人类心灵和集体无意识中的某些东西将永远将我们与我们创造的任何东西分开,无论它多么复杂。
当宇航员萨莉·莱德从太空返回时,她说,“星星看起来并不更大,但它们看起来确实更亮”,这可能更多地说明了她的观点,而不是星星的固有亮度。她在外太空,不受地球大气层中任何东西的阻碍,所以这种差异是可以理解的。当生成式人工智能骑在一匹马(背上骑着一名宇航员)时,它无疑发出了一个声明,对任何以平面设计为生的人都产生了冲击波。然而,也许清楚地看待生成式人工智能可能有助于我们了解其真正的优势和劣势。生成式人工智能可能会抢走我们的许多工作,但创造力可能是人类本质上的东西,这总是会否认生成式人工智能有能力承担人类最重要的天赋——艺术。