深圳云栖大会人工智能专场:探索视频+AI,玩转智能视频应用

摘要: 在人工智能时代,AI技术是如何在各行业和领域真正的发挥应用和商业价值,带来产业变革才是关键。在3月28日深圳云栖大会的人工智能专场中,阿里云视频服务技术专家邹娟将带领大家探索熟悉的视频场景中,AI技术如何应用落地,解决实际业务场景中的问题。

众所周知,全民视频时代已经来临,用户的注意力已经从传统的文字、图片向视频转移,相信绝大部分用户的手机中都会有几个点播、直播、短视频的APP。据网络公开数据报告显示,互联网流量70%以上来自视频,未来这个数据将超过90%。

而在人工智能时代,AI技术是如何在各行业和领域真正的发挥应用和商业价值,带来产业变革才是关键。在3月28日深圳云栖大会的人工智能专场中,阿里云视频服务技术专家邹娟将带领大家探索熟悉的视频场景中,AI技术如何应用落地,解决实际业务场景中的问题。

纵观整个视频生命周期,包括视频采集、视频的生产制作、视频播出和被广大的用户所体验这几个环节。实际上在这个过程中,整个视频行业发生了很大的变化,在每一个阶段都从非常专业的参与者转向大众普适的参与。

图片描述

从采集阶段,最开始用专业的摄像机、录像机进行视频采集,转向如今的每个人都是自媒体产生者,用手机来拍摄。在制作阶段,从重量级的非线性编辑软件,到现在短视频APP都标配的特效、滤镜、美颜,都能够在手机端进行基本的视频制作。在播出领域,最开始电视台必须得有一个节目单,到现在用户可以在网站上按需播放点播视频,用手机实现个性化的搜索和观看。在体验这一环,用户从最原始的有线电视同轴电缆单项传输的观看,到现在我们可以去交互、评论、点赞、弹幕等等互动。所以,我们可以看出,从整个视频生命周期中,参与者是发生了巨大的变化,加入视频领域的应用也越来越多。

从下图可以看出,视频和AI的结合已经贯穿了视频生命周期的每一个阶段。

图片描述

那么,AI能为视频行业带来什么呢?

第一, 提升生产效率

AI和采集生产环节结合,是能够有效提高视频生产制作的效率的。传统的编辑是人来做的,当AI和视频采集生产环节结合,我们可以引入智能编辑技术,快速生产视频。天下武功,唯快不破,应用在视频领域也是一样的。设想我们很快的生产视频,第一时间发布到网上,就有机会获得更多的流量。

第二, 规避监管风险

在视频中引入人工智能审核技术,可以缩短视频发布周期,减少了人工审核的干预,并且可以更高效、准确的规避监管风险。

第三, 释放人力 降低成本

因为前两个阶段中,机器和算法做了很多替代人的操作,所以释放人力,并且可以带来成本的降低。

基于达摩院的AI算法,结合视频云团队多年在音视频技术领域的积累,阿里云构建了视频AI能力——视网膜,并将产品功能划分为审核、识别、理解、搜索四个模块。下图中的能力,其实是视频云AI服务的最小单元的基础能力,实际上可以基于这些能力进行组合,像搭积木一样,渗透在视频各个场景当中,形成各类匹配业务的解决方案。

图片描述

在落到实际的场景中,AI又将如何应用呢?

接下来邹娟老师介绍到,采集生产、分发播出、媒资管理是视频生产领域的三大场景,在这三个场景中,阿里云和客户一起成长,深入到客户的实际业务场景中,并结合自身产品规划,推出了视频AI的解决方案。

图片描述

在采集生产的场景中,解决方案支持视频拍摄、字幕、剪辑合成与视频拆分;在视频播出场景,除了常见的视频审核,还有逐渐被大众认知的版权检测,以及在实时播出的过程中对视频中目标进行识别检测;在媒资管理场景中,最经典的是智能编目与智能封面,解决方案中还有基于指纹的去重和视频之间挖掘和整理的能力。

我们可以看到,通过基础AI能力的组合,和结合客户的实际业务场景,阿里云已经提供了一些具体的解决方案,下面选取了其中一些典型场景来介绍具体落地。

第一, 视频采集场景——视频萌拍

市场上非常流行的短视频和拍照的APP中,基本都提供了基于人脸识别的技术的贴纸功能。很多客户希望能拥有丰富的拍摄效果,阿里云在短视频智能端的解决方案上就提供了视频实时的处理功能,内置人脸识别与动态贴纸库,未来还可以付费升级大眼、瘦脸等高级功能。

第二, 视频生产制作场景——精彩集锦

这个是很多客户都拥有的业务场景,可以利用的AI技术特别多。下图左侧的AI技术结合云端视频剪辑能力,就可以做出很多有想象空间的事情。比如将人物出现的时间线连接起来,自动生成人物集锦;再比如经典的体育赛事精彩瞬间,前期的素材整理的工作可以通过AI来自动处理;还有专题制作这个领域应用也十分广泛,比如去年江南的大雪,广电媒体从业者希望能快速的从素材库中找到与雪景相关的视频来生成一个专题视频,利用AI能力,其实就可以根据场景的识别,提取雪景在各个视频当中的位置片段,搭配云端剪辑能力,比较轻松将视频制作出来;同时,影视剧剧集的片花也可以利用智能摘要、智能GIF来形成,一些视频片段可以基于指纹和多模态技术去实现。

图片描述

第三, 视频生产制作场景——ET字幕

还有一个需求量非常大的业务场景是ET字幕,实际上它是基于AI的自动字幕进行新视频创造的功能。首先,传统字幕生产是非常复杂的,首先得有一个团队去把语音转成文字,把时间线拍下来,在多语种情况下,可能还会有翻译团队介入,再把字幕导入到本地编辑软件进行合成。整个过程非常耗费时间和人力。如果利用AI技术,首先我们可以把语音生成文本,文本直接存在对应的有时间,我们也可以将文本翻译成所需的语种。同时,通过云剪辑的工具,对语音识别的结果和人工的结果进行check,人工干预量也远远低于传统的翻译量。这项技术除了可以应用于离线视频之外,也可以运用于会议直播的实时字幕,基于导播台切换多路流的时候,每一路流都可以自动生成字幕,产生互动的效果。ET字幕应用于视频生产制作场景,可以方便用户进行二次视频创作。

第四, 视频生产制作场景——智能拆条

智能拆条有两个好处,第一是加速新闻短视频的发布,第二是把原始的长段视频拆成各个小片段,进入素材库从而丰富媒资系统,更方便制作出新的视频来。

智能拆条是基于AI的多模态信息进行拆条,目前是支持标准新闻形式,非标准的场景可以快速通过补充数据集快速训练来实现。

图片描述

第五,视频分发播出场景——内容审核

进入到视频分发和播出领域,随着国家对于互联网视频的监管的加强,内容审核已经成为非常强烈的需求。最开始的只是鉴黄,到后面的黄、反、暴、恐、都要去鉴别,利用AI技术可以非常快速的鉴别出视频当中不合规的内容。

第六,媒资管理场景——智能编目

我们先来看下传统编目的效率,在电视台做深度编目,一个小时的视频大约需要二到四个小时完成编目,这个视频生产速度目前已经无法达到互联网的要求了。与传统的编目相比,AI技术可以从视频自动分类、视频自动打标、人物识别、语音和OCR识别等,自动生成源数据信息,进入媒资库,结合NLP、分词、语义分析、词性过滤等场景,进入到后续的搜索和推荐的领域。整个过程靠算法驱动,不需要人力,相对于人工处理,AI技术能更彻底地对视频进行结构化处理,标注出每个独立标签的时间线。

通过智能编目的方案组合,可以快速生成最基础的源数据,方便媒资管理。

图片描述

那么用户如何接入视频AI服务呢?

分为三个步骤,首先,用户需要根据自身的业务场景来选择合适的产品进行开通,其次,根据实际需求来选择开通视频AI服务,支持自动处理和手动发起AI任务两种形式,最后是获取AI处理结果,接收AI结果回调或主动查询AI结果。
图片描述

原文链接

干货好文,请关注扫描以下二维码:
图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/522207.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

javaee 中文帮助文档_大牛耗时三天整理的:微服务+Nginx+Kubernetes实战文档和面试题...

前言十年之前,相信大家掌握了Java EE互联网轻量级框架整合开发 SSM框架SpringMVCSpringMyBatis就已经能够轻轻松松找到一份薪资很高的java开发工作了,而如今只会SSM的小伙伴,已经找不到工作了,已经以Spring全家桶、微服务作为基础…

工作流实战_17_flowable 流程实例撤回

由于群里有些朋友对这个flowable还不是很熟悉,师傅(小学生05101)制作一个开源的项目源码,一共大家学习和交流,希望对有帮助,少走弯路 如果有不懂的问题可以入群:633168411 里面都是一些热心肠的人。 项目地址https://g…

arraylist数据5万占内存_2021年北京市高考报名人数会超过5万吗?大数据告诉您结果...

随着新疆维吾尔自治区高考报名最后一个发布,2021年全国各省、市、自治区报名均已经实施并已基本结束。大家关心的问题是,2021年全国高考报名人数会有多少?竞争激烈程度如何?众所周知,2020年全国高考报名人数为1071万人…

你需要熟练运用的12个命令行工具

摘要: 本文简要介绍了当前较为流行的12种对数据科学任务有价值的类Unix操作系统命令行工具:wget,cat,wc,head,tail,find,cut,uniq,awk,grep&#…

使用PyTorch从零开始构建Elman循环神经网络

摘要: 循环神经网络是如何工作的?如何构建一个Elman循环神经网络?在这里,教你手把手创建一个Elman循环神经网络进行简单的序列预测。 本文以最简单的RNNs模型为例:Elman循环神经网络,讲述循环神经网络的工作…

Flowable工作流总结_工作规范流程设计思路

工作规范工作流场景,一般是甲方发起,乙方宣导学习。 文章目录一、工作规范流程图绘制元素二、流程图展示三、工作规范流程图:四、流程说明五、知识补充六、问题思考?一、工作规范流程图绘制元素 绘制元素说明主键(ID)自定义,建议…

K8S精华问答 | CentOS下如何配置主机互信?

作为是Google开源的容器集群管理系。在Docker技术的基础上,为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能,提高了大规模容器集群管理的便捷性。今天,我们就来看看关于k8s的精华问答吧。1Q: Kubernetes集群不能正…

专属微信二维码python制作_如何通过一行代码制作个人专属动态微信二维码?

各位同学好,今天又是一个晴空万里的周末,面对外面这么好的天气,不好好在家学习怎么对得起外面的这个天气。 在逛 Github 的时候,发现了一个好玩的二维码制作的库:https://github.com/sylnsfar/qrcode 。这个库的 star …

主板没有rgb接口怎么接灯_纯白信仰打造RGB主机,四件套提升100%性能-Thermaltake...

没有RGB就没有信仰是当代主机的普遍看法,为了满足用户的需求,不论是主板还是显卡亦或者机箱本身,支持ARGB灯光同步的产品向来最受欢迎。以这个需求出发,一期机箱改造计划就这样开始了。主板、CPU散热不用说不带RGB的都找不到&…

希望我在开始第一个机器学习项目之前就了解的那些事儿

摘要: 一份机器学习过来人的经验清单分享,主要是包含一些关于构建机器学习工作流以及Apache Spark应该注意的一些事项,希望这个清单能够帮助那些正在学习机器学习的相关人员少走一些弯路,节约一些时间。当我们学习任何一个新的内容…

ftp上传文件服务器报550错误_java ftp下载文件,Java 实现ftp上传下载文件

最近项目中需要实现将文件先存放到ftp上,需要的时候再从ftp上下载,做的过程中碰到了问题,发现中文文件名的无法上传到ftp上,ftp上的中文文件名的文件下载不下来,几番折腾,终于搞定了,记录一下备…

揭秘!谷歌云确立领先地位的五大变革

戳蓝字“CSDN云计算”关注我们哦!作者 | Maribel Lopez编译作者 | 风车云马经过十多年的发展,云计算已经从即时容量和降低成本发展为支持创新的基础服务。在云计算的平台即服务(PaaS) 市场,可以应用机器学习和具有认知功能的各种开发工具。今…

MaxComputeSql性能调优

摘要: 转载自xiaorui 部分用户(尤其对外输出)使用MaxCompute(原Odps)时,由于对产品的使用层面和执行层面了解程度不同,导致提交的任务执行时间过长、占用了较多集群资源;严重的会导致失败、不仅需要投入支持同学精力协助解决、也影…

华为卡槽打不开怎么办_17500元!华为5G折叠手机刷屏,有人焦虑连夜开会…

本文经授权转载自澎湃新闻( ID:thepapernews )华为发布首款5G折叠屏手机Mate X,售价1.75万元。2月24日西班牙巴塞罗那华为发布了首款5G折叠屏手机—— 华为Mate X机身尺寸为8英寸不对称外翻折叠这款国产黑科技一出现立刻引发围观登上热搜那它究竟有啥特别的&#xf…

MaxCompute访问TableStore(OTS) 数据

摘要: MaxCompute作为阿里云大数据平台的核心计算组件,承担了集团内外大部分的分布式计算需求。 免费开通大数据服务:https://www.aliyun.com/product/odps 前言 MaxCompute作为阿里云大数据平台的核心计算组件,承担了集团内外大部…

编程吸金榜:你排第几?网友神回应了 !

作为全球知名招聘求职网站Indeed,最近发布了2019年度最佳工作榜单,公布了2019年的最佳行业领域及工作岗位薪酬,在全行业的榜单中,跟程序员相关的岗位有9个!对此,大家纷纷留言表示程序员或成最大赢家&#x…

快速开发工作流_02_集成在线流程设计器

接上一篇:快速开发工作流_01_简单流程案例https://gblfy.blog.csdn.net/article/details/102881983 文章目录七、流程设计器 modeler7.1. 导入war7.2. 重写两个配置类7.3. 添加国际化文件7.4. 资源文件配置7.5. 项目源码七、流程设计器 modeler 7.1. 导入war 解压…

electron 打包把node代理服务打包进去_专题:让C++给node做技术加持(三)编译electron本地模块踩坑记

欢迎来到我的专题文章:《让C给node做技术加持》系列。更多内容,持续更新中,欢迎关注。往期目录:专题:让C给node做技术加持(一)环境搭建,项目运行专题:让C给node做技术加持(二)-NodeJs调用C方法上…

云无边界,阿里云混合云数据同步发布

摘要: 针对不同数据库间数据实时同步难的问题,日前,阿里云宣布推出混合云数据同步一站式解决方案,便于广大云产品用户实现实时数据同步的混合云支持,更为方便的是,该功能让本地Oracle也能实现与云上数据库的…

fs react 使用 保存文件_入门TypeScript编写React

使用 create-react-app 开启 TypeScriptCreate React App 是一个官方支持的创建 React 单页应用程序的CLI,它提供了一个零配置的现代构建设置。当你使用 Create React App 来创建一个新的 TypeScript React 工程时,你可以运行:$ npx create-r…