第一个将Palette Mode引入VVC(H.266),阿里云在JVET会议上引起关注

从应用需求出发,帮助标准组织制定出更贴近云端业务需求的标准

视频压缩标准是一个重要且深具挑战的研究方向。从过去的存储到当前的网络带宽,视频标准每一代的更新进步对科技应用都有很大的影响。但同时随着几十年来的发展,视频压缩标准的效率提升也变的越来越困难。为了能够持续推进视频压缩标准的进步,在国际视频标准组织中,各公司的专家通过不断研究和贡献,使得每一代新的标准都能在同样视频质量下达到50%左右的码率降低。可以说现今互联网上能够有这么多影响每一个人生活的视频应用,背后都是因为视频标准组织中这些专家们的付出。

现今视频标准组织主要有三个:

(1) 由ISO/IEC的MPEG和ITU-T的VCEG专家共同组成的JVET,目前正在制定备受瞩目的下一代国际视频编解码标准VVC(未来的H.266)。
(2) 国内的视频标准组织AVS,由中国最强的视频编解码技术专家团队组成,同时该标准也被输出为国际标准IEEE1857。
(3) 世界上第一个由工业界主导并完全不收取专利费用的视频标准组织AOM。

一个视频标准的成功需要具备很多因素:贴近市场需求、先进的技术、以及合理的授权制度。阿里巴巴加入标准会议后,除了贡献技术提案外,更希望从应用需求出发,帮助标准组织制定出更贴近云端业务需求的标准,进而帮助未来标准能在云计算产业顺利落地。阿里云具有最全面的视频应用场景,包含直播、点播、转码、音视频通信、短视频等。不同的应用场景具有不同的需求和技术难点,尤其是随着互联网不断的发展,很多新的应用有与传统视频编解码不一样的需求。阿里云服务众多的互联网客户,希望能够帮助客户将这些需求纳入到标准组织中,使得下一代视频编解码标准在互联网上能有更广泛的应用场景,解决客户实际痛点。

1.屏幕编码的应用与挑战

在现在的互联网应用中,有很多新的应用正在变得越来越重要,如屏幕视频编码。在线上会议中的屏幕共享和共同编辑、线上教育、线上游戏直播、无线投屏以及云端桌面等应用,都需要屏幕视频编码的技术支持。

 

image

 

图1: 屏幕视频的例子

屏幕视频和传统自然视频的特性很不相同,因而在压缩上会面临到非常不一样的挑战。图1是两个屏幕视频的例子。在屏幕视频中,因为画面是电脑渲染出来的,所以包含了很多锐利的物体边界,这些锐利边界含有大量的高频成分,传统的编码工具很难达到有效的压缩。同时,人类视觉对这些锐利边界是非常敏感的,轻微失真所造成的模糊就能很容易被使用者感知到。以互联网屏幕共享的应用作为例子,在这类系统(线上教育和线上会议)中很常遇到的挑战是:当使用者在共享屏幕时,可能同时会有摄像头视频和报告屏幕内容的共享,在有限的网络环境下,使用者的带宽是有限的,摄像头视频或许可以透过降低画面品质来提供稳定的服务,但是一旦加大报告屏幕内容的压缩率,失真会马上导致字体的清晰度下降,这样的用户体验是不能容忍的。

此外,在屏幕共享系统设计中,也会有很多挑战:线上会议中,不断会有使用者随机加入会议,一但有使用者加入会议,系统必须要重新编码帧内编码图像作为视频的起始点,同时考虑到屏幕视频中,帧内编码图像和帧间编码图像的码率差距会非常大,这就造成系统中码率控制设计上的困难。另外,由于屏幕图像渲染的特性和屏幕视频系統的互动要求(如线上游戏和云端桌面),屏幕视频往往需要非常高的帧率(大于30fps),这也更增加了系统设计的挑战。

2.屏幕视频编码的历史

屏幕视频编码研究可以追溯到90年代,ITU-T曾提出Mixed Raster Content (MRC)编码标准。它采用分层编码的方式来解决屏幕视频编码的问题。这样的做法需要配合图像分割的技术,因而增加了系统设计的复杂度。相较之下,另一种较简易的做法是如同H.264/AVC和HEVC/H.265一般,采用以区块为基础的编码方式,针对屏幕视频设计新的编码工具。然而在H.264/AVC制定过程中,屏幕视频编码并没有引起足够的重视,当然这也和当时相关的应用没有大规模兴起有关。

在HEVC/H.265 Main Profile中,针对屏幕内容设计了一种新的编码模式:变换跳过模式(Transform Skip)。这个模式就是针对屏幕视频中锐利的物体边界而设计的。这样的内容经过变换后,在频域引入的大量高频信息反而无法得到有效的压缩,因此变换跳过模式是一种简单而有效的解决方法。在Main Profile的算法框架下,并没有引入太多的复杂度。

HEVC/H.265初版定稿后,针对屏幕视频编码制定了一个标准扩展(HEVC SCC Extension)。在这个标准扩展中采纳了更多屏幕视频编码的技术。其中有两个重要的技术分别是:同帧参考(Current Picture Referencing)和调色盘模式(Palette Mode)。

同帧参考在概念上只是单纯的把帧间预测扩展到可以参考当前帧内已经解码的区域。虽然概念非常简单,但是却能有效的降低码率。因为在屏幕视频中常常会出现重复的内容(例如:英文字母),例如图2。这样的内容在同一帧中可以找到很好的预测,能够有效降低码率。

 

image

 

图2: 同帧参考

屏幕编码另一个重要的新技术是调色盘模式,这个工具能够有效的描述屏幕视频中主要的颜色,并利用这些颜色来编码像素。特别的是,调色盘模式除了可以增进客观质量外,对主观质量也非常有帮助,如之前所介绍的屏幕视频中对字体边界的锐利度的主观要求就非常严。调色盘模式是一个对压缩字体或锐利物体非常有效的工具。图3是简单举例了调色盘模式,左上角是一个需要压缩的屏幕内容。右上角是屏幕像素的统计图,横轴是像素值,纵轴是像素数量。从统计图中可以看到屏幕内容只有三种主要的颜色:蓝、红和浅蓝。我们可以把这三种主要颜色编码入调色盘(图3右下角),并且给每一个主要颜色一个索引值。然后我们利用这些颜色索引值去描述像素。在解码端,解码器先解出调色盘得到三个主要颜色,然后解出每个像素的颜色索引值,最后利用索引值去找到主要颜色来重建像素。研究发现这样的编码工具对屏幕视频编码相当有帮助。

 


image

 

图3: 调色盘(Palette Mode)

3.屏幕视频编码在下一代视频标准中的研究

尽管屏幕编码在过去标准中已经有相关技术支持,但还是有很多技术值得进一步研究。例如:在HEVC SCC定稿后,阿里云视频云高级技术专家睿柯曾经发表过一篇期刊论文,在论文中提出数个技术改进HEVC SCC的调色盘模式和同帧参考,可以在不增加解码复杂度的情况下更进一步降低码率。另外还有一些非常有潜力的研究,例如字串复制(string copy),虽然在上一代标准没有被采纳,但是还是值得继续深入研究。这些技术都有可能为下一代的标准进一步提升屏幕编码的效率。

阿里云在屏幕视频编码技术和应用上有世界领先的团队。由于屏幕视频编码的重要性,阿里云在加入标准组织后,首先积极推动屏幕视频编码的进展。

在今年4月第10次JVET会议时,标准组织成立屏幕视频编码工作组,阿里云担任工作组联席主席。6月中国AVS会议中,阿里云提出提案分析屏幕视频编码的应用需求,引起AVS组织关注,采纳阿里云的提案成为下一代AVS3的需求。7月第11次JVET会议时,阿里云是世界上第一个将Palette Mode引进VVC(未来的H.266)的技术团队,会议中引起广泛关注,JVET标准组织决定成了一个Palette Mode工作组,下次会议专门讨论这个议题,阿里云也担任这个工作组的主席。

随着国际视频标准会议对屏幕编码的关注逐渐增加,相信未来通过各公司专家组的共同努力,下一代标准可以对屏幕编码有更好的技术支持,进而创造出互联网和云端上更多应用,让使用者有更好更方便的体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521277.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kafka集群下载、启动、部署、测试

文章目录一、kafka基础操作1. kafka下载2. 解压3. 重命名4. 在kafka目录下创建 data 数据文件夹5. 修改配置文件6. 配置kafka环境变量7. 刷新环境变量,使之生效二、kafka集群操作2.1. 分发配置好的基础安装包2.2. 登录ly-02服务器,修改配置文件2.3. 登录…

零基础学python难_0基础学python有多难

相对于其他编程语言来说,Python并不是很难,入门简单,容易上手,对于零基础的人来说,入门Python是不难的,但是想要学精学通,则要花费一定的时间和精力。Python是主流的编程语言,应用性…

修改HBase的rowkey设计把应用的QPS从5W提升到50W

摘要: 正确设计Hbase的rowkey可以让你的应用飞起来,前提是你需要了解一些Hbase的存储机制。 UTT是Aliexpress的营销消息运营平台,运营希望促销活动时APP消息推送的QPS达到34W。 UTT刚接入APP消息推送时,QPS只能达到5W&#xff0…

BDTC 2019 | 15场分论坛,10分钟速览,5折票优惠,烧脑模式开启

2019中国大数据技术大会(BDTC)5折优惠票限时抢购啦,学生票仅售599元!扫描上图二维码或登录官网(https://t.csdnimg.cn/KSTh)了解更多最新大会详情。近日,在组委会公布大会部分重磅讲师和前沿议题…

我需要一个高并发的架构,我的系统要改造成微服务吗

摘要: 最近大家都在谈微服务,随着越来越多的在线业务需要提供更大并发的scale-up 和 scale out能力,微服务确实提供了比较好分布式服务的解决方案。 阿里云高级解决方案架构师 杨旭 世界最大混合云的总架构师,4年前,开…

python工作目录_Python目录的基本操作

一、任务描述 本实验任务主要对Python目录进行一些基本操作,通过完成本实验任务,要求学生熟练掌握Python目录的基本操作,并对Python目录的基本操作进行整理并填写工作任务报告。 二、任务目标 1、掌握Python目录的操作 三、任务环境 Ubuntu16…

【建议收藏】数据中心服务器基础知识大全

戳蓝字“CSDN云计算”关注我们哦!作者 | Hardy责编 | 阿秃服务器对每个从事IT工作的人来说并不陌生,但是服务器所涉及的各种知识细节,并非大家都十分清楚,为了让大家深入了解服务器的关键知识点,笔者特意抽时间总结了…

一文了解阿里云CDN HTTP2.0

摘要: 本文由阿里视频云高级技术专家空见撰写,主要介绍HTTP2.0的历史、特性、如何使用和使用之后的性能对比验证。 背景介绍 要了解HTTP2.0,先了解一下HTTP超文本传输协议的历史(HyperText Transfer Protocol)&#…

VMVare 虚拟机使用桥接模式

VMVare 虚拟机使用桥接模式,和物理机使用同一个物理网卡,和物理主机使用同一个段的ip。 文章目录1. VMware 编辑 > 虚拟网络编辑器2. 更改配置3. 编辑名称为VMnet0 的网络4. 编辑虚拟机的网络适配器5. 编辑虚拟机的网络适配器6. 再启动虚拟机1. VMwar…

阿里云基于NVM的持久化高性能Redis数据库

摘要: 背景 Redis作为一款简洁、高效的开源K/V数据库,可以被用于内存缓存、持久化存储等不同场景,大量服务于各类互联网应用。同时也提供了丰富的功能配置,客户可以根据各自业务需求,在读写性能、缓存容量、数据可靠性…

rgss加密文件解包器_Unity AssetBundle高效加密案例分享

这是侑虎科技第585篇文章,感谢作者江鱼供稿。欢迎转发分享,未经作者授权请勿转载。如果您有任何独到的见解或者发现也欢迎联系我们,一起探讨。(QQ群:793972859)作者主页:https://www.zhihu.com/…

阿里云DTS大幅降价,低至400元即可获得实现秒级延迟的数据传输服务

为了释放更多技术红利,进一步普惠广大客户和开发者,阿里云7月上旬宣布数据传输服务(Data Transmission Service,简称DTS) 数据同步功能降价,最高降价幅度高达40%。中国大陆,最低单价低至400元/月,跨境专线同步&#xf…

【又是一波重点】深度解析服务器科普知识 | CSDN博文精选

戳蓝字“CSDN云计算”关注我们哦!作者 | Hardy晗狄转自 | CSDN博客责编 | 阿秃服务器是网络数据的节点和枢纽,是一种高性能计算机,存储、处理网络上80%的数据、信息,负责为网络中的多个客户端用户同时提供信…

Linux下启动/关闭Oracle服务和 oracle监听启动/关闭/查看状态

文章目录一、Linux下启动Oracle 二步曲1)启动监听2)启动数据库实例二、Linux下启动Oracle 实战操作2.1. 登录服务器,切换到oracle用户,或者以oracle用户登录2.2. 打开监听服务2.3. 以SYS用户身份登录Oracle2.4. 通过startup命令启…

【公测中】阿里云发布国内首个大数据双活容灾服务,满足高要求大数据灾备场景

在6月上旬举行的云栖大会上海峰会上,阿里云发布了国内首个大数据集群双活容灾产品-混合云容灾服务下的混合云大数据容灾服务(HDR for Big Data, 简称 HDR-BD),并已经在7月份开始邀测。HDR-BD采用业界领先的数据双向实时复制技术&a…

linux CentOS7 最小化安装环境静默安装Oracle11GR2数据库(安装操作系统环境_01)

文章目录最小化安装 linux CentOS7我使用的镜像包:CentOS-7-x86_64-DVD-1810.iso虚拟机就创建好了 通过方向键选择:install centos 7 回车 直接点击:continue 这里采用自动分区,手动自定义分区请参考 网络设置方式有2种 第一种…

阿里云发布vSphere虚拟机备份服务 ,网络带宽有限条件下依然能有效保护数据

在6月上旬举行的云栖大会上海峰会上,阿里云发布了vSphere虚拟机备份上云服务(HBR for vSphere),并已经在7月份开始邀测。利用混合云备份服务可以将虚拟机镜像备份上云,避免了传统备份方案复杂的软件部署,存…

行!人工智能玩大了!程序员:太扯,阴谋!你怎么看?

人工智能真的玩大了吗?人工智能行业的人才真的“爆发了?”AI程序员究竟怎么样?A与B 薪酬与前景程序员与远方2017年~2018年,是人工智能大火的时候。你会发现,跟朋友聊天不谈人工智能,聊天的bigger都上不去。…

spss 22 0统计分析从入门到精通_「转需」20+统计分析软件使用工具包,一次全搞定...

数据越来越多,使用统计软件对数据进行处理不失为一个减少工作量的好办法。在学习统计时,又怎么能少的了各种分析数据的助手呢?情报站为大家准备了常用统计软件使用工具包,各项常用统计软件课程一次全到手!(领取方式见评…

Pandas/networkx图分析简单入门

摘要: 本文是一篇pandas/networkx图分析入门,对所举的欺诈检测用例进行了简单的图论分析,便于可视化及操作。 对于图论而言,大家或多或少有些了解,数学专业或计算机相关专业的读者可能对其更加清楚。图论中的图像是由若…