阿里文娱首次公开!AI 如何对爆款内容未卜先知?


阿里妹导读:文娱内容很难有完整的量化指标体系,内容的复杂性决定了文娱产品的不确定性。我们如何利用AI+大数据能力,建造文娱的内容认知大脑?串联内容全生命周期,实现对内容、流量、宣推等的“未卜先知”,提升对爆款的预测和生产能力?这本《5G+AI 阿里文娱技术实践》会告诉你。

全新电子书《5G+AI 阿里文娱技术实践》正式上线!通过窄宽高清革新、大麦物联网技术、6DoF视频技术等5大板块,带你全面了解阿里文娱独具魅力的思考。点击文末下载链接,即可下载。

一、文娱产业趋势及技术挑战

文娱内容不像商品有完整的量化指标体系,它是一个复杂的实体,它跟意识形态以及用户体验强相关,对内容进行量化评估和衡量是非常困难的。

比如,选角儿。我们不能通过单一指标去衡量一个演员,我们需要综合考量演员的演技、气质、颜值、潜力等与否与某一个角色匹配,并且能生成数据指标,以实现纵横向的对比。另外,导演、主演组盘是否为最优组合,能否成为爆款?这是更加复杂的选择模式问题。今天面临的技术挑战是如何进行知识的抽取、挖掘以及推理,确定什么样的组合是最优解。

除上述两个问题,影片的拍摄过程更是一个庞大的系统工程和艺术创作过程。以《长安十二时辰》为例,该片非群演有约1000人,群演有300到1500人,历时7个月拍摄217天。我们参考软件工程行业,软件工程发展了70年,主要研究三个层面:方法论、过程以及工具,然后是如何将三者组合。软件行业的敏捷开发对于软件工程的质量和效率都有非常大的提升,如何将这些理论应用到内容制作产业,让内容制作敏捷起来?

内容敏捷即知晓过程对结果造成的影响是什么,并快速地调整内容创作过程,让它更敏捷。但内容行业面临的独有特点“延迟满足”,让用户在内容的某一分钟特别嗨,可能来自于前面的30分钟铺垫在那一分钟爆发了,针对内容的这个特点,我们除了要做基本的知识图谱语义的理解之外,还要考虑如何去做有效的对应分析,如何去做对应的知识抽取等问题。

今天这个问题加剧了,比过去还要复杂。在过去的5到10年里,UPGC加上整个内容的生产量极大的发展,用户的消费分层化、多样化。全民爆款越来越少,用户对内容的需求更加个性化。相应于内容生产端,就需要考虑不同用户群的个性化需求。

二、文娱大脑基本框架:内容认知新动力

针对上面几大困难,我们今天在做文娱大脑——优酷北斗星智库来解决。我们将所有的内容形式和用户消费的数据都采集下来,将人工智能的技术手段、业务领域的细分理论做整合融合,构建内容认知框架。

内容认知框架分为两部分,内容和用户。其思路就是心理学发展的基本的思路。

1)内容侧:对内容进行理解,包括外延和内涵。外延就是内容的各种基本属性,比如主创阵容、题材类型等;内涵主要研究内容的戏剧理论和视听语言,围绕制作内容的支撑要素,我们用传统的机器学习方式对内容进行理解,再基于戏剧理论和视听语言构造内容的衡量要素。

2)用户侧:分析用户的观看行为。用户行为来自于用户的心理偏好、心理情绪。用户心理偏好、心理情绪来自于生理构造,基于心理学的五大人格理论和用户的观看行为,构建模型建立左边和右边的连接,从而知道创造什么样的内容,用户会有什么样的感受。

三、贯穿全生命周期的文娱大脑生产力

基于内容认知框架,我们在内容生命周期的每个阶段都做了具体工作:开播前提供内容评估、艺人挖掘和内容情绪挖掘等能力;在早期为内容评估提供有效的数据支撑;在制作阶段提供现场解决方案,比之前更敏捷的反馈机制;同样在播出后也提供数据支持,实现更好的宣发。

1、IP/剧本分析

上图是《长安十二时辰》的分析示例,我们把已有的剧本作为样本,让机器去学习,识别出剧本的所有角色,把角色直接交互的对白、行为识别出来,再进行社团的划分。《长安》剧本最终划分出来几个群体:反恐防暴小分队以张小敬为中心,唐朝核心管理团队以皇上为中心。通过这种方式快速定位整个剧本的人物和人物关系的展开。

2、用户情绪识别与成片情绪挖掘

围绕角色关系,将整个剧本的角色情绪也识别出来,构造成如上的曲线。基于对海量剧本的分析曲线,抽取出各个指标(出镜率、戏份、情绪值等)并形成benchmark,对于之后的每一个剧本进行衡量,相当于对剧本进行一个“体检”。

同样是“体检”的方法,对于《药神》和《长安十二时辰》,我们做了用户情绪的识别、体检的扫描,参考零线的位置。我们发现《药神》几乎都是正向和负向级的,直到最后出现一个正向区间,基本上后期都是以眼泪为主。而《长安十二时辰》的情绪状态比较稳定。对照情绪高低点的具体情节,我们发现,曲线表达的情绪和具体的故事情节是非常相符的。

3、情绪强度预测与网络收视率

然后我们拿更多的方式去验证它的合理性,上图抽取《长安十二时辰》的剧集,每集有两条曲线,蓝线是刚才预测的情绪曲线,黄线是播放指数(表示每一秒钟有多少用户在看),通过两条曲线对比,我们可以发现,两条曲线的相关性比较高的将近60%,情绪的高峰、低谷和用户的观看行为状态是吻合的,由此我们就提供了一种能力,基于这种能力对剧本或影片做情绪扫描,实现对影片热度的未播先知,再对比benchmark,帮助制作者更高效的完成制作。

4、用户情感曲线在技术上是如何实现的?

首先,我们把用户观影情绪的表述,映射到认知计算中常用的二维空间表示,也就是Valence 和Arousal。Valence表示情绪正负极性,Arousal表示情感激烈程度;

其次,基于情绪极性跟强度提供一个预测,这个是我们今年产出的论文。近两年,心理学研究的核心观点是为什么用户会感同身受?这来自于前两年的一个理论——静向神经元,所以我们选择场景、表情、动作以及声音作为基本的模型的输入,对模型参数进行学习。

如上所讲,内容产业有强延迟满足的问题,我们通过两层分析来解决长短期满足的问题,除用户情绪分析,我们也做内容角色的情绪识别。通过图片表情识别模型,识别不同题材类型的影片,可以获得不同角色刻画的人物性格。如2004年的《反贪风暴》,时隔十多年,主创人物形象的脸谱还是正向的。上图显示的负面角色情绪以开心、害怕为主,正面形象以悲伤、生气为主,与负面反派的开心正好相对,正面的人一直很沮丧,是一个有些压抑角色形象。

同样,我们分析角色的每秒情绪,形成角色的正负情绪曲线,部分影片的分析结果曲线如上图,不同题材类型的节目会有不同的情绪密度。所以,你想放松的时候,要看的不一定是喜剧,喜剧其实不一定会放松,因为角色的正负向情绪不停交替,由于延迟满足,大脑负荷非常大,需要做长短记忆,反而很多爱情片对大脑的占用相对低。

角色情绪检测是一个分类问题,所以利用人脸landmark对初始图像做识别,生成densemap作为附加通道,和原始图片RGB三通道拼接合并后作为模型输入,这样可以使densemap对应的关键区域权重更大,更容易让模型捕捉关键区域特征;合成的输入送入到Reduced Xception 网络进行特征提取;在loss方面,我们引入了基于SVM的marge loss,提升各情绪类别的类间差距,提升情绪识别的效果,具体如上图。

基于前面对内容的各种理解产生的各种纬度的内容的量化纬度,我们构建了预测模型,可以提前预测出节目的流量走势,如内容认知框架中所讲的,首先对内容进行量化,然后对内容相应的量化纬度进行提前的预测,为业务决策提供辅助支撑。

最后,分享我对未来趋势的一些见解。在强人工智能尚遥远的情形下,如何结合机器AI和人工经验将是个永恒主题。一是结合符号学派智能和链接学派智能,建设和完善决策引擎,包括结合人工逻辑规则和可学习数据AI,不确定性分析框架和经久不衰的贝叶斯因果决策,以及神经元化的混合智能计算框架。二是量化的心理学研究也越来越重要,如何结合大数据应用价值非常大。这也是阿里文娱大脑探索的方向。

image

image

从优酷窄宽高清革新布局
到大麦物联网的实践之路
从文娱内容认知的AI大脑
到交互式的6DoF视频技术
5G时代来临
如何用新技术提升用户体验?
《5G+AI 阿里文娱技术实践》正式上线!
点击立刻下载


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517455.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Sentinel 1.7.0 发布,支持 Envoy 集群流量控制

流控降级中间件 Sentinel 1.7.0 版本正式发布,引入了 Envoy 集群流量控制支持、properties 文件配置、Consul/Etcd/Spring Cloud Config 动态数据源适配等多项新特性与改进。详细特性列表请参考 Release Notes,欢迎大家使用并提出建议。 下面我们来一起…

RuoYi-Cloud 部署篇_02(windows环境 mysql版本)

文章目录一、模块配置修改1. ruoyi-gateway-dev.yml2. ruoyi-auth-dev.yml3. ruoyi-system-dev.yml4. ruoyi-gen-dev.yml5. ruoyi-job-dev.yml6. ruoyi-file-dev.yml二、后端配置预启动2.1. 配置 idea的 RunDashboard2.2. 运行后端三、部署前端3.1. 安装依赖3.2. 运行前端6.3. …

运维老哥必须知道的Linux系统文件目录组织结构

夫陶公清风千古,余又何人,敢称庶几 文章目录介绍Linux目录结构Linux文件和目录管理绝对路径和相对路径绝对路径相对路径yum包管理介绍 Linux目录结构 💡 Linux文件系统的目录结构为树状结构,其中根目录为一个斜杠:/…

云原生下日志方案的架构设计

上一篇中我们介绍了为什么需要一个日志系统、为什么云原生下的日志系统如此重要以及云原生下日志系统的建设难点,相信DevOps、SRE、运维等同学看了是深有体会的。本篇文章单刀直入,会直接跟大家分享一下如何在云原生的场景下搭建一个灵活、功能强大、可靠…

不知道路由器工作原理?没关系,来这看看!看不懂你捶我 | 原力计划

作者 | 北海以北没有小王头图 | CSDN付费下载自视觉中国来源 | CSDN博客路由器概述首先我们先大致了解一下路由器的大致结构以及工作方式。路由器体系结构路由器体系结构如下图:其中四个重要组成部分依次如下:1. 接入端口将一条输入的物理链路与路由器相…

RuoYi-Cloud 部署篇_03(windows环境 mysql版本)

文章目录一、软件启动1. redis2. nacos3. myqsl二、微服务启动2.1. 认证授权中心启动2.2. 若依网关启动2.3. 系统模块启动2.4. 定时任务模块启动2.5. 监控中心启动2.6. 代码生成模块启动2.7. 前端启动三、测试验证3.1. 系统模块3.2. 定时任务3.3. 代码生成3.4. sentinel控制台3…

闲鱼推荐,让智能计算从云走向端

关键词: 智能推荐、特征工程、特征处理。 术语解释: 机器学习(Machine Learning):是关于在计算机上从数据中产生“模型”(model)的算法;数据集(Data Set):一组记录的集…

mybatis plus实现多表分页条件查询

文章目录前言一、二、如何实现1 配置mybatis plus分页插件2.准备三张表2.1 学生表2.2 老师表2.3 老师和学生Vo表3. 编写SQL语句4. 编写mapper层5. service层6.controller层演示效果【补充】 XML 自定义分页总结前言 没啥可说的 一、 没啥可说的 二、如何实现 1 配置mybatis pl…

神仙在双11晚上,都干了些啥?

11月,阿里巴巴西溪园区夜凉如水,双11作战室内,却有人身着短袖衬衫,只见她屏住呼吸,握紧微微出汗的手心,静静立于数字大屏前,等待今年最重要的一个数据。 距离双11结束,还有1分钟。 …

nginx(windows环境安装)

介绍 Nginx是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like 协议下发行。其特点是占有内存少,并发能力强,事实上nginx的并发能力确实在同类型的网页服务器中表现较好。 文章…

“编程能力差的程序员,90%输在了这点上!”谷歌AI专家:都是瞎努力!

我见过市面上很多的 Python和人工智能的教程和书籍,他们大都这样讲的:先从 Python 人工智能的发展历史开始,介绍的基本语法规则,Python 的 list, dict, tuple 等数据结构,然后再介绍机器学习、深度学习的常用框架等等&…

阿里巴巴的云原生应用开源探索与实践

导读:从拥抱开源、贡献开源、自主开源,到赋能开源,开源已升级为阿里技术战略之一,且正为开发者源源不断地输送切实可见的价值。云原生是阿里开源的重要领域,短短几年,以 K8s 为核心的云原生开源生态迅猛发展…

RuoYi-Vue 部署 Linux环境 若依前后端分离项目(war 包+nginx版本)

文章目录一、软件安装部署1. 安装jdk2. mysql8安装部署3. redis安装4. nginx 安装部署5. Tomcat10 下载和配置 Linux 环境6. 克隆项目二、后端项目2.1. 修改数据库连接2.2. 修改Redis连接信息2.3. 文件路径2.4. 日志存储路径调整2.5. 修改war打包2.6. 编译打包三、前端项目3.1.…

技术直播:讲一个Python编写监控程序的小故事

今年疫情“黑天鹅”事件改变了大家的生活。相信大家都经历过,每天早晨起床第一件事,就是查看数据。这些数据不仅仅是人们对活着的渴望,也是在建立对战胜疫情的决心。那么技术人怎么能通过自己所学的去进行数据监控呢?今天CSDN邀请…

高精地图中地面标识识别技术历程与实践

导读:本文将主要介绍高德在高精地图地面标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求,为高德地图构建高精度地图提供了基础的技术保证。 1.面标识识别 地面标识识别,指在地图道路中识别出各种类型的地面…

RuoYi-Cloud 部署篇_04(windows环境 mysql+nginx版本)

文章目录一、nginx 操作流程1. nginx 安装启动2. nginx 配置3. nginx 重新启动二、前端项目编译2.1. 前端编译打包2.2. 静态复制迁移三、后端项目启动2.1. 我启动了6个服务2.2. 测试验证一、nginx 操作流程 1. nginx 安装启动 nginx(windows环境安装) …

从P4到P9, 在马云家写代码到双11前端PM

阿里妹导读:今年的双11已经是阿里资深前端技术专家舒文来阿里的第11年,从应届生到双11前端PM,他一路升级打怪,实现了岗位上从P4到P9的晋升。这第11届双11顺利结束之际,他把在阿里这些年的成长经历做一个总结和分享&…

在Java虚拟机上班是一种怎样的体验?

来源 | 编程技术宇宙责编| Carol封图 | CSDN 下载自视觉中国本文用知乎体的风格简单介绍了JVM中几个内置线程的工作,希望对大家学习JVM有一点帮助。匿名用户JVM老鸟228 人赞同了该回答利益相关,匿了!JVM公司里面线程众多,派系林立…

微服务架构四大金刚利器

概述 互联网应用发展到今天,从单体应用架构到SOA以及今天的微服务,随着微服务化的不断升级进化,服务和服务之间的稳定性变得越来越重要,分布式系统之所以复杂,主要原因是分布式系统需要考虑到网络的延时和不可靠&…

RuoYi-Cloud 部署篇_01(linux环境 Oracle +nginx版本)

文章目录一、基础准备1. 技术选型2. 源码克隆3. 安装依赖4. 安装oracle5. 安装启动Mysql6. 安装启动Redis7. 创建数据库,执行 SQL脚本文件二、安装与配置 nacos2.1. 下载nacos2.2. 安装 nacos2.3. nacos持久化配置2.4. 执行脚本文件2.5. nacos连接 mysql 配置信息2.…