根据最新的报告可以看出ChatGPT到底有多厉害,多个方面实现从判别决策到创造生成
生成式AI VS Web 3.0 :不追求生产关系的重塑,但将大幅度提升和创造生产力
创造是生成式AI的核心,本质是对生产力的大幅度提升和创造。生成式AI通过从数据中学习要素,进而生成
全新的、原创的内容或产品,不仅能够实现传统AI的分析、判断、决策功能,还能够实现传统AI力所不及的创
造性功能。生成式AI已催生了营销、设计、建筑和内容领域的创造性工作,并开始在生命科学、医疗、制造、
材料科学、媒体、娱乐、汽车、航空航天进行初步应用,为各个领域带来巨大的生产力提升。
生成式AI将促进生产关系高效发展,而不是像Web3.0重塑生产关系。Web3.0通过底层的分布式与去中心化、
密码学的应用、加密货币的结算方式,为集体协作、分工、收益提供了更好的结算方式,去中心化自治组织
(Decentralized Autonomous Organization,DAO)将是常见的组织形态,打破了原有的生产关系。生成式
AI不是打破传统的生产关系,而是通过提高生产力促进现有生产关系高效发展。
Gartner将生成式AI列为最有商业前景的人工智能技术。根据其发布的2022年人工智能技术成熟度曲线,预计生
成式AI 2-5内将进入生产成熟期,发展潜力与应用空间巨大:
2025年,生成式AI产生的数据将占到所有数据的10%,而2021年生成式AI产生的数据不到所有数据的1%;
2025年,30%的大型组织出站消息将由生成式AI生成;
2025年,50%的药物发现与研发将使用生成式AI;
2027年,30%的制造商将使用生成式AI提高产品研发效率
跨过恐怖谷:人类对生成式AI的好感度随其拟人程度的增加而增加
恐怖谷效应:1970年由日本机器人专家森政弘提出的关于人类对机器人和非人类物体感觉的假设,随着类似人类 物体的拟人程度增加,人类对其的好感度呈现“增-减-增”的曲线,当类似人类的物体与人类相像到一定程度后,
人类对其好感度会下降呈现一个情感反应的低谷,即恐怖谷,而当其与人类的相似程度继续上升,人类对其的好 感会随之增加。
生成式AI跨过了恐怖谷。随着技术的发展,生成式AI越来越多的能力接近人类甚至超越人类,人们对其不是反感 而是热衷于使用,例如抖音中AI绘画特效使用人数已经超过2700万人,AI会话工具ChatGPT发布5天用户即超百 万,人类对生成式AI的好感正随着其能力的提升、与人类相似程度的提升而增加,说明生成式AI已经成功跨过了恐怖谷。
生成式AI技术演进展望
根据红杉资本的预测:后续基本模型的发展将继续推进生成式AI应用发展,预计2023年文本领域和代码领域的应 用已经成熟。图像/视频/3D/游戏领域的成熟应用仍需要一定的发展时间,2025年以后的应用发展进程仅为推测。
生成式AI应用:娱乐媒体内容制作
当前阶段生成式AI最常见的应用场景为娱乐媒体内容的辅助生产。以文字续写或纠错、文字转语音、文字生成语 音、图像智能编辑、视频智能剪辑等方式替代既有创意产生后的专业性机械劳动,同时通过内容生成满足用户的 娱乐需求或者为其提供创作灵感。
随着生成式AI的不断成熟,部分专业内容生产者将被替代。数据、算力的进一步提升将带来具有更强生成效果的 AI,能够根据用户需求生成个性化定制内容终稿,并且AI生成内容达到专业内容生产者水平且具有独特新颖的创 意,从而替代部分文字作者、翻译人员、插画创作者、配音人员、音乐制作人、视频编辑人员等等。
AIGC:生成式AI在娱乐媒体领域的应用
AIGC(AI-Generated Content)指利用人工智能技术自动生成的内容,是继专业生成内容(PGC)和用户生成
内容(UGC)之后一种新型生成内容的方式。国际上被称为人工智能合成媒体(AI-generated Media或Synthetic media),是通过人工智能算法对数据或媒体进行生产、操作和修改的统称。
AI绘画作品出圈、一级投资活跃,2022年AIGC爆发式发展。
2022年8月,在美国科罗拉多州举办的新兴数字艺 术家竞赛中,参赛者提交AIGC绘画作品《太空歌剧院》获得了此次比赛“数字艺术/数字修饰照片”类别一等奖, 而参赛者没有绘画基础,通过AI绘图软件MidJourney耗时80个小时创作了该作品。
AI绘画技术发展快速,从年初 的技艺生疏到目前能够生成专业级别的图像仅过去几个月的时间,目前国外已有Stable Diffusion Midjourney等多 个成熟的AIGC平台。其中技术领先的AI公司Open AI当前估值或达290亿美元,Stable Diffusion背后的Stability AI 估值也达到10亿美元。
AICG大幅度降低了数字内容生产的成本,打破了数字内容生产受到人类想象能力和知识水平的限制,广泛应用于 文本生成、音频生成、图像生成、视频生成、跨模态生成及游戏领域,其广泛应用能够满足数字经济时代日益增 长的数字内容供给需求。
文本生成:对话机器人、新闻稿撰写广泛应用
文本生成是生成式AI最早应用的领域之一,已经在对话机器人、内容续写、新闻稿撰写、诗歌小说创作等领域具 有广泛的应用。
对话机器人:包括问答型机器人、闲聊型机器人、任务型机器人、知识图谱型机器人、多轮对话机器人,在智能 客服场景中能够显著降低企业人力成本。
新闻稿撰写:在全球范围具有广泛的应用,很多新闻机构使用AI生成稿件,尤其是体育、天气、股市交易变动、 公司业绩报道等结构性新闻报道。自然语言生成公司Automated Insights仅在2014年就产生了10亿篇新闻文章, 每秒可撰写多达2000篇新闻报道,用户包括雅虎、美联社等
文本生成:内容续写、文学创作部分达到专业水平
内容续写:基于给定的文本续写新的内容,续写的内容包括文学创作、商业写作、教学内容等,典型应用有 Google推出的Wordcraft、OpenAI推出的GPT-3.5,GPT-4等。
Wordcraft:2021年由谷歌推出,作者和AI以对话的形式共同编辑故事,支持续写、扩写、改写、生成大纲等 功能,能够极大提升写作效率,激发创作者灵感。
文学创作:2017年微软研发的AI“小冰”出版了人类历史上第一部人工智能诗集《阳光失了玻璃窗》,其中包含 139首现代诗;2018年,AI创作的小说《1 The Road》出版;2022年谷歌子公司DeepMind发布剧本写作AIDramatron,能够从一句话表述的戏剧冲突中生成剧本标题、角色、场景、对话;越来越多的AI文学创作平台进入 公众视野,AI创作的内容包括剧本、诗歌、小说、对联等等。
文本生成:ChatGPT集大成
11月30日,OpenAI发布语言模型ChatGPT,该模型采用对话的形式与人进行交互,可以回答后续问题、承认错误、 挑战不正确的前提、拒绝不适当的请求。
ChatGPT不仅在日常对话、专业问题回答、信息检索、内容续写、文学创作、音乐创作等方面展现出强大的能力, 还具有生成代码、调试代码、为代码生成注释的能力。
ChatGPT发布后5天用户已超百万,而OpenAI之前发布的GPT-3用了将近两年的时间才突破100万用户。
文本生成:以GPT-3和ChatGPT为例的应用及展望
GPT-3于2020年5月发布,能够生成高质量文本,截止2021年3月,已经有超过300个应用程序提供GPT-3 驱动的搜 索、对话、文本完成和其他AI功能,GPT-3平均每天生成45亿字。目前GPT-3已应用于:从客户评论中识别主题并 生成摘要、为虚拟人生成对话对话使其与人自然交流、提高语义搜索的准确率等。
ChatGPT相较于GPT-3具有支持多轮对话、易于修正、人机交互效果更好、更快、更高效等优势,且目前免费使用, 用户已超百万,更适合应用于人工智能客服、搜索引擎、智能客服、虚拟人、代码编程、文学创作等领域。
音频生成:歌曲生成已有商业级模型,应用场景广阔
歌曲生成:AI作词、作曲、编曲等,具体包括由旋律生成歌词、由歌词生成旋律、不同曲风旋律生成、和弦生成、 音乐续写等,可应用于音乐欣赏、游戏音效、实体场景配乐等多个领域。
天工乐府SkyMusic:2022年由昆仑万维推出的商业级作曲AI模型,支持31种语种的歌词生成、多曲风旋律生
成、多轨道编曲、VOCAL生成和智能缩混等,已在全球多个音视频平台发行近20首AI生成歌曲。
Playform AI:与音乐专家合作使用AI续写了贝多芬《第十交响乐》,完成了两个完整的超过20分钟的乐章,
《第十交响乐》于2021年成功由波恩贝多芬管弦乐团演出。
图像生成:快速出圈,多款应用火爆
2022年下半年,AI由文本生成图像快速出圈,多款应用火爆。目前对大众开放的图片生成模型主要包括Stable
Diffusion、OpenAI的DALL-E 2、Midjourney等,三款模型中,仅Stable Diffusion开源,累计使用人数最多,在 全渠道有超1000万用户。
谷歌于2022年五月推出了由文本生成高清图像的模型Imagen,其官网展示了Imagen生成的高清图像,并宣称
Imagen 生成的图像已经全线超越了 DALL-E 2,但该模型尚未对外公开使用。
图像生成:快速出圈,多款应用火爆
由于底层算法和训练数据的不同,Stable Diffusion、Midjourney和DALL-E 2创作的图片画风和效果有所差异。
内容生产环节价值巨大:内容生产者处于产业链核心地位
高质量内容是娱乐及媒体行业的核心。高质量内容为娱乐媒体行业的基础,内容创作者在其中扮演了重要的一环,
为各类媒介带来了用户流量及使用时长的增长。以视频平台为例,IBM 商业价值研究院对 42 个国家或地区将近
21000 名消费者的调查显示,57%的受访者认为收到高质量的专属视频内容是对视频提供商保持忠诚的关键动因。
生成式AI在娱乐媒体领域:不再是改变分发关系,而是升级生产力
决策式AI在娱乐媒体领域的应用集中在内容分发环节,提升分发环节的效率实现了千人千面,而不是对生产力的 提升。 生成式AI能够创作新的内容,改变了传统的娱乐媒体内容由人工生产的方式,带来的生产力的提升与突破。