阿里云黄海宇:窄带高清2.0——让直播更惊艳的魔术

摘要: 2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在视频云论坛上,阿里云视频云高级算法专家黄海宇作了题为《窄带高清2.0——让直播更惊艳的魔术》的主题致辞。

2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在视频云论坛上,阿里云视频云高级算法专家黄海宇作了题为《窄带高清2.0——让直播更惊艳的魔术》的主题致辞。下面为演讲内容:

我是来自阿里云视频云的黄海宇,我目前从事的工作主要是阿里云视频直播相关技术。随着直播的发展,CDN的带宽、CDN的成本以及视频的清晰度已经成为一个非常重要的问题,我的演讲题目是“窄带高清2.0——让直播更惊艳的魔术”。


其实,阿里云早在2015年就已经提出了窄带高清的概念。这个概念提出来以后,很多友商开始引用这个概念,并且也推出了类似服务。

那么,我们当初提出窄带高清的原因是什么?在近两年来,在此基础上又做了哪些发展呢?今天我将给大家分享一下。

大家观看视频时,都希望画质清晰,但实际上,在看互联网直播是,我们更多看到的是比较模糊的视频。那么,我们是否现在没有办法制作高清视频呢?答案是否定的。

上个月,阿里云在深圳云栖大会现场第一次进行了8k直播,舞台的屏幕上显示了从1300公里以外的阿里巴巴杭州园区传输回来的直播图像视频,现场观众清晰地看到了景泰蓝淘公仔的精致画面。但实际的直播业务场景中,用户在做互联网直播的时候,由于网络传输原因,并不能让每位观众都能看到非常清晰的视频,高清晰度的直播的限制主要在网络的带宽上。


构建在阿里云上的一个直播平台调研数据显示,只有16%的用户能够看到超清的视频,54%的用户能够看到高清的视频,30%的用户看不到高清视频。

如果,能把超清码率往高清靠一下的话,是不是更多人就能够看到超清的视频了呢?

实际上,我们也正在向这个方向努力,但这样会带来一个问题,把超清码率往高清靠的时候,对清晰度会有多大影响呢?做视频编解码朋友都会熟悉PSNR的公式,被广泛应用在衡量各种不同编码器的编码质量上,实际上这个公式确实非常客观地描述了一个视频经过视频编码以后信息量的损耗,站在信息论的角度来进行分析的。但实际视频是人眼来看的,人眼对视频的敏感度和视频在编码过程中损失的信息量并不是直接对应的。

窄带高清——人眼主观感受最优为基准的视频编码技术

基于以上讨论,可以引出窄带高清的概念。窄带高清实际上是一套以人眼的主观感受最优为基准的视频编码技术,研究的是在带宽受限情况下,如何追求最佳的视觉感受。

把范围缩小到人眼主观感受,以及带宽受限两个条件时,会发现很多有意思的事情。

首先和现在的编码标准发展趋势是相同的,效果能够叠加。编码器发展时间,差不多每十年,编码器都会发展一代,编码质量会大约节约30%-50%的码率,这个码率的节约是按照PSNR评价标准来做的。但利用窄带高清的技术,把焦点集中在人眼的感受,可以把业界普遍浪费的带宽节省下来,让我们的带宽更多放在人眼感兴趣的地方,可以轻松达到30%的带宽节约,几乎可以平等地媲美一代编码器的进步。因为技术关注点在人眼上,我们可以把业界普遍处理不好的复杂场景做得漂亮,非专业观众一眼就可以看出优势。

窄带高清1.0——两套人眼视觉模型

窄带高清1.0是阿里巴巴在2016年推出的一个版本。在窄带高清1.0的背后隐藏着两个人眼视觉模型:


第一个模型称之为保真度与主观评分值之间的世界模型,横坐标是视频保真度,代表编码出来的制品与原始视频之间信息量差别,纵坐标是人眼对视频的评分,总共是5分。随着编码后视频越来越接近原始视频,人眼对视频的要求是越来越高的,但并不是一条线性的形状,是分成三段曲线,这使得阿里云知道中间这段非常陡峭的区域正是设置比较好码率的地方,在两端比较平坦的地方,加大视频码率,提高视频客观清晰度,实际上并不能带给人眼很好的清晰度。中间稍微把码率提高一点,视频对人眼的感受就完全不一样,每一比特码率都会非常有所值。所以阿里云在设置视频码率时会尽可能选择视频档位在中间的区域。

第二个模型是分辨率与码率的模型。在这个模型中,关注的是同样的码率到底应该设置多少清晰度,或对一个给定的清晰度,应该设定一个怎样的码率。传统视频网站中,通常设置方法,比如480p会设600k,720p设1.2m,超清1080p设2.5m,类似这样一个比较固定的码率设置。实际上每个视频所需要的码率不一样,表达的清晰度也不一样。例如,对于一个运动场景不复杂的教育视频来说, 1080p在的码率也会有非常好的效果。在实践中,我们会根据视频的类型和清晰度,预期选择码率和分辨率,同时根据视频内容做合理的码率分配。

通过传统方法,通常会设一个720p分辨率,码率大概是1m。实际上这个视频表现非常糟糕,鸟叔衬衫上全是马赛克,而且雪花点全部变得模糊。原因是这个视频运动非常复杂,只有1m码率,这种情况下,需要用1m码率去表达1280×720象素,对每一个象素的表现都会非常差,会损失很多象素细节,导致整体效果。

我们做过以后的效果,只用了887k码率,比之前码率节省15%-20%,用的是432p的分辨率,在窄带高清时经常会设置这样的分辨率,追求达到最好的人眼主观感受的效果。

窄带高清2.0——深入微观世界 分析视频细节

窄带高清2.0是阿里云在2017年杭州云栖大会发布的。窄带高清2.0深入到微观层面,分析视频每一个细节,发现这些视频细节对人眼敏感度是怎么样的。引入人眼敏感度模型概念,关注人眼到底会关注哪些细节、忽视哪些细节。对人眼关注的地方会给予更高的码率,甚至会对原始视频进行一些修复,使其更适合人眼观看的体验。对于忽视的地方可以降低一些码率。

从我们主观评测可以发现,基于H.264的窄带高清2.0已经完全超越了x264 veryslow的效果,与x265的veryslow效果相当,通过窄带高清2.0,使得我们可以超越当前编码器,提前进入到下一代编码器。


下面我们看下窄带高清2.0的实战。下图的直播画面中,在聚焦区域,主播的脸、头发,窄带高清2.0的效果会显得更加柔顺。在一些脱焦的区域,窄带高清2.0分配了比较少的码率,完全不会影响人眼对它的主观感觉。


另一个实战场景是游戏直播。枪战类型的游戏直播非常消耗码率,1080p设置2.9m的游戏直播,整体来看会有非常多的马赛克,因为这个视频在2.9m,完全无法表达1080p的象素,窄带高清2.0使用了720p的分辨率,同样2.9m,效果会好得多,另外,窄带高清2.0将人眼比较敏感的文字,纹理做了增强,整个视频看起来更加舒服。

窄带高清2.0可以节约大量的带宽成本,同时也能够提高视频观看流畅度,在高码率时能节省差不多1倍的码率,在低码率时能节省20%-30%,综合可以得到30%以上成本的节约。另外,窄带高清2.0还可以提高清晰度,如果追求的是视频清晰度,可以设置相同的码率。

在通常情况下,视频画质越好带宽费用肯定越高,带宽又是视频服务中占比很高的一项成本,很多开发者都在寻求效果与成本的平衡点。阿里云的窄带高清技术,就可以完美的解决这一难题,这就是云计算技术带来的实际价值体现。

原文链接

干货好文,请关注扫描以下二维码:



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vsftpd:500 OOPS: vsftpd: refusing to run with writable root inside chroot ()错误的解决方法

原vsftpd服务器的系统从centos6.8升级到centos7.2。vsftpd使用yum方式安装,用户采用系统用户登录。由于系统升级到centos7,yum安装的vsftpd版本改变。因此按centos6的设置,登录时报错。配置文件未修改,主要是修改了ftp的主目录权限…

学Python后到底能干什么?网友:我太难了

感觉全世界营销文都在推Python,但是找不到工作的话,又有哪个机构会站出来给我推荐工作?笔者冷静分析多方数据,想跟大家说:关于超越老牌霸主Java,过去几年间Python一直都被寄予厚望。但是事实是虽然上升趋势…

基于PCDN技术的无延时直播方案

摘要: 2018亚太CDN峰会在北京隆重召开,在4月12日上午的运营商论坛中,阿里云边缘计算团队高级技术专家张士波进行了《基于PCDN技术的无延时直播方案》的主题演讲。本文为演讲内容。当大家谈到直播,一般很惊讶于直播近几年来发展的规…

VSFTPD Centos 7.6 _配置篇

接上一篇:企业内部)Centos7.6 源码安装vsftpd https://gblfy.blog.csdn.net/article/details/103491052 文章目录一、常用命令二、 需求案例三、思路分析3.1. 创建用户3.2. 配置3.3. 限制用户活动范围四、coding实战4.1. 家目录调整4.2. 为test设置密码4…

阿里云弹性计算负责人蒋林泉:亿级场景驱动的技术自研之路

戳蓝字“CSDN云计算”关注我们哦!作者 | 刘丹出品 | CSDN云计算(ID:CSDNcloud)近年来随着云计算如火如荼的发展,上云已经成为当前企业的必经路径。但在国内良莠不齐的云服务市场下,云服务器的选型评估长期困…

阿里云容器Kubernetes监控(一) - 资源监控

摘要: 容器通过集装箱式的编译、打包、部署,大大提高了应用的迭代速度。对于架构师而言,容器带来的是分钟级的部署、秒级的伸缩与恢复、一个量级的迭代速度提升、50%左右的基础成本节省。简介容器通过集装箱式的编译、打包、部署&#xff0c…

Kubernetes之路 3 - 解决服务依赖

摘要: 在容器服务的客户群中,一个经常被问起的问题就是如何处理服务间依赖。本文介绍了常见的解决方法来实现服务的依赖检查,还进一步用示例展示了如何利用init container, liveness/readiness探针等技术实现服务健康检查&#xf…

Logtail从入门到精通(一):日志采集杂谈

摘要: 目前logtail已承载阿里云全站、所有云产品服务、全球各Region部署、阿里巴巴集团(淘宝、天猫、菜鸟等)上重要服务的数据采集。每天采集接近百万服务器上数PB的实时数据,对接数千个应用与消费者。什么是日志提到日志&#xf…

互联网大佬马老师于昨日教师节正式卸任,让位现任CEO张勇;华为发布新一代CloudLink视讯解决方案,普惠4K+AI;联通……...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go OPPO Reno2正式发布&#xf…

Logtail从入门到精通(二):开启日志采集之旅

摘要: 为了更好的了解日志采集,这里我们首先对日志采集中遇到的基本概念进行简要的介绍。Logtail相关概念为了更好的了解日志采集,这里我们首先对日志采集中遇到的基本概念进行简要的介绍。概念介绍项目: 项目(Project…

关于SDN的未来,Linux基金会专访阿里云网络大神

摘要: 近日,大家熟知的国际开源组织Linux基金会与阿里云进行了一次访谈。专访了阿里云网络团队掌门人江鹤。江鹤执掌阿里云网络产品线,并负责阿里集团网络虚拟化产品的研发管理工作。在软件定义网络(SDN)和网络功能虚拟…

5G 共建共享,究竟会带来什么影响?

戳蓝字“CSDN云计算”关注我们哦!共建共享真的来了。根据9月9日中国联通发布的公告,中国联通和中国电信正式签署了《5G网络共建共享框架合作协议书》,将在全国范围内合作共建一张5G接入网络。图片来源网络小枣君认为,这一事件对于…

object转float_人工智能-Object Detection API 模型转tflite并验证

最近在用TensorFlow Object Detection API训练目标检测模型,训练好的pb模型大小17.6M,用pb预测效果不错,于是想着如何在手机端运行,查看官网关于tflite的转换,网址:https://github.com/tensorflow/models/b…

Multi Task Learning在工业界如何更胜一筹

摘要: 本文主要介绍多任务学习和单任务学习的对比优势以及在工业界的一些使用。如何从单任务学习转变为多任务学习?怎样使AUC和预估的准确率达到最佳?如何对实时性要求较高的在线应用更加友好?本文将以淘宝实例为大家进行分享多任…

rsync一行代码实现远程文件同步之修改默认22端口

由于需求需要把应用服务器上的日志文件同步到文件服务器上,但是又不能用22端口 文章目录一、应用服务器脚本修改如下二、文件服务器操作三、执行脚本测试四、应用服务器生成ssh key五、文件服务器添加key5.1. 打开.ssh文件夹目录:5.2. 创建authorized_ke…

上云难?TA霸气回应:不要你觉得,一键上云 so easy!

戳蓝字“CSDN云计算”关注我们哦!图片来源网络2019年阿里提出的“All in Cloud”战略以及《全球云计算 IT 基础设施市场预测报告》的数据结果,都在表明企业上云已成不可逆之势;但上云事故接二连三发生似乎又在宣示企业上云之路道阻且长&#…

基于阿里云HiTSDB搭建工业物联网平台实践

摘要: 基于阿里云全面的物联网、云计算与大数据技术搭建云端的企业能源管理物联网平台实现能耗数据采集、统计分析、平衡调度、节能优化等全面的能源管控协同平台。是企业生产运行保障的利器,也是大量企业实现云上管理的实践案例。背景工业企业的能耗占了…

阿里巴巴开源的通用缓存访问框架JetCache介绍

摘要: JetCache是由阿里巴巴开源的通用缓存访问框架,如果你对Spring Cache很熟悉的话,请一定花一点时间了解一下JetCache,它更好用。JetCache可以做类似Spring Cache的注解式缓存,支持TTL、多级缓存、分布式自动刷新&a…

阿里深度学习的“金刚钻”——千亿特征XNN算法及其落地实践

摘要:随着十二点的钟声响起,无数人盯着购物车开启了一年一度的“剁手”之旅。可你有没有想过这购物狂欢的背后是什么支撑起了数据规模如此庞大的计算任务?其实不只是“双十一”,每一个用户的点击和浏览,每一件宝贝的排…

全球唯一:MySQL社区2018年度公司贡献奖颁给阿里云

摘要:在刚刚的Percona Live开源数据库大会上,MySQL社区委员会宣布将2018年度的MySQL社区公司贡献奖(Corporate Contributor Award)唯一颁给阿里云。图中右一为阿里云数据库RDS团队 彭立勋MySQL社区颁发次奖项是为了感谢阿里云多年…