5G +边缘计算,优酷如何做云渲染?

作者| 阿里文娱高级技术专家 伊耆

责编 | 屠敏

头图 | CSDN 下载自东方 IC

出品 | CSDN(ID:CSDNnews)

当5G来了,视频还是平面的影像吗,只能静静观看吗?一定不是!现在,你可以像玩游戏一样,参与到视频内容当中,还能体验新的播放形式,比如发AI弹幕、猜剧情、横竖屏随意旋转,立体的观看进球一瞬间,看到屏幕之外的更大画面等等。这背后的技术是如何实现的,未来有哪些新交互方向?

在GMIC智慧文娱技术专场上,阿里文娱高级技术专家伊耆分享了如何利用终端设备的交互特性,结合内容和算法,所实现的新观影模式的探索。同时结合5G网络和边缘计算所做的云渲染技术预研。

主要分为四部分:

  • 一是视频和游戏的共性和差异,如何看待两者?

  • 二是视频场景结合内容、算法探索播放新交互模式

  • 三是结合 5G、边缘计算和立体视觉的云渲染技术

  • 四是未来的思考和总结

为什么做播放交互探索?视频和游戏的共性和差异

为什么要做新交互?其实用户在文娱消费体验上,尤其在视觉体验上,主要集中在两个领域,一是视频,一是游戏。我们在思考切入点时,更多是关注两者之间的共性和差异,寻找结合点。

首先回想一下,你在玩游戏是一种什么样的体验?网上有很多类型的游戏,休闲类、益智类、竞技类等等,我们可以发现游戏的特点是交互性越强,竞技属性越强;交互属性越弱,休闲体验越强。视频的本质相同,在一个纯被动观看的过程中,内容本身会带来感官刺激,但更多体现在休闲上。但随着交互属性的加入,比如当视频引入VR/AR等互动后,其形态也更趋于游戏化,更像是一种休闲类的游戏。也就是视频的“内容属性”与游戏的“交互属性”结合,最终它可能就变成一个像游戏化的视频了,用户会获得比较强的沉浸式的感觉。

 

视频场景结合内容、算法探索播放新交互模式

视频 1

视频 2

参考优酷在互动剧的尝试,我们在播放和交互领域的结合也做了非常多的探索。先看2个视频。视频1是常规的旋转,体验还算顺滑;视频2是加入算法后的策略,在旋转过程中,画面始终是平稳的,甚至用户在横移手机时,可以在屏幕中看到更多的画面,这也是初步尝试。

以旋转的视频为例,形式上看似简单,但它背后也有很多技术点:

1、旋转手机时,不丢失画面中心。我们看视频时,视线往往会聚焦在一个中心人物,或是一个场景中心。当手机旋转,自然也不希望丢失视觉的中心点。所以需要一套算法去识别观影中心点。在此基础上,通过服务链路去打通,将算法和视频画面联合下发到端侧,并将数据和画面进行绑定,同时在用户旋转手机时,通过对手势的监测选择对应的画面中心点,并进行画面的放大、缩小或平移。

2、基于原始的大量数据样本,做算法模型训练,得到对于视频画面区域热度算法的模型。由于视频是一个连续过程,我们需要对镜头的切换做平滑处理,结合算法生成一个原始的算法数据。

3、将算法数据和视频内容做关系绑定,并下发到端侧。这样在端侧就同时具备算法的数据和实际播放的视频数据。在播放进程中,我们需要获取旋转-陀螺仪传感器的输入,也会利用降噪算法过滤躁点,根据用户的旋转角度,结合当前视频画面,将算法数据和画面本身绑定,找到画面中心点,做相应处理,最终渲染到屏幕上。

以上是大致实现思路,在落地过程中,我们也面临不少挑战,最突出的是算法与传统图像处理算法不同。普通的图像处理多是基于单张图片,而视频本身是多帧的,而且每个视频帧间是连续性的。同时在识别过程中,尤其对于运动场景、切换镜头的场景,普通算法的识别焦点是存在偏差的,甚至识别不到,所以我们需要新的处理。

在算法设计上,采用镜头分割方式,区分不同的场景镜头,然后对于每个镜头,我们认为是画面是连续的。这部分,我们结合现有成熟算法,融入自己的技术探索。

首先,在看画面时,人眼睛会聚焦在人脸、人体,这些点的区域热度是比较高的,将些场景样本作为模型训练数据,同时视频本身还有部分字幕,也需要去除、识别和检测的处理。综合这一系列的检测内容,最终把一帧帧画面看成一个连续的轨迹,做聚类,形成一个角色或者是一个热度点的轨迹;集合多个镜头,形成一个视频区域热度算法的数据,然后下发到端侧。

其次,有了算法数据,在端侧更多是如何处理端上传感器,处理算法数据和视频之间的同步问题。

以上是我们现阶段的尝试,同步也在做其他尝试,在不远的未来也会逐步上线,大家很快就体验到。

基于 5G 的云渲染

在现有场景上,算法数据是基于原始视频进行识别,由于中间需要预生产过程,这就局限了它更多是在点播场景中。

如果不做预生产,而在端侧进行,则会产生识别的速度不够,效率底的问题,以及在不一样的交互时,处于实时性的诉求,本身对端侧算力是非常大挑战。结合5G的发展,我们设计出云渲染方案。首先看两个视频:

视频3

视频3在电脑上,可以认为它是一个云端主机,在云端是一个高清画质。而在手机端,用户真正看到画面,只是云端画面的一部分。为什么这样设计?

视频4

视频4是6DoF视频,用户可以通过手势旋转,从各角度看到不一样的视角。

6DoF视频的本质是,用户看到的某些角度的视频,其实是很多角度拼合的画面,用户在选择某一角度时,我们经过截取,提取其中两个画面,通过算法虚拟生成,一个用户观看角度的这么一个画面,然后下发到端侧。

6DoF视频的某一帧,真实画面本身是非常大的画面,8k甚至11k。用户端看到是其中一部分,720p或1080p,其对应的VR场景也类似。

挑战是什么?用户观看VR全景视频时,本质是4k甚至8k视频,但用户在每一个视角上看到的点,可能只有720p甚至更低。想看更高清的画质,就必须提升画面的大小。如果我们希望要看到4k画面,原始画面要达到8k,甚至更高。

8K画面下发到端侧是无法解决问题的。一是芯片的限制,其次还有电量、能耗等。所以我们将终端计算能力放到一个强算力中心上,将用户终端设备变成三部分:手势输入、屏幕输出,计算单元放到远端计算服务器上,它的算力要数倍甚至是几十倍于端上。

基于分布式的前提,输入、计算和输出的传输过程的耗时变短。考虑到未来5G网络、边缘计算的发展,在边缘节点和终端之间的传输速度,加上边缘计算节点的计算耗时,可能要比你在本机输入到本机芯片计算的耗时还要短。

所以,我们设计了一套分布式的云端渲染和实时计算方案。一方面解决交互的方式,大计算量的实时的数据场景。另一方面,借鉴在游戏领域(如云游戏)的思路,以下是设计模型:

1、对于用户的手机终端、VR设备或眼镜类各种设备,因为硬件在不断发展,它的算力会越来越强。但是个别设备算力还比较弱,所以我们希望有实时调度能力。算力强的设备,在端上做;算力弱的设备,在云上做。同时基于用户的手机电量等各方面场景,在边端体系上有一个调度能力。用户端的一个播放行为,其实是从媒资的存储到转码、CDN分发,CDN节点,通过分发服务到手机终端,当用户点击视频,通过对应的时间节点拉取对应的云端视频数据。

2、在云渲染链路上,我们希望用户是通过调度的操作,决定计算逻辑是在端上还是边缘节点上。如果在边缘节点,通过边缘节点去访问中心节点,拉取到数据。当用户再次操作时,通过边缘节点进行相应的交互处理,再下发到端侧。这样从边缘节点到播放终端,是点对点的实时传输的操作。

细化云渲染的整体设计,我将它分为五个部分:边缘服务框架、网络协议、端侧交互引擎、边端调度系统、应用开发工具链。其中边缘服务框架、网络协议、端侧交互引擎如下图所示,分别承担着边缘节点的框架服务能力、网络通信的协议处理、以及终端的交互、渲染引擎。而边端调度系统如上所说,主要是根据用户终端、边缘节点算力等情况合理调度用户的渲染服务是应该在终端处理还是到边缘节点处理。而基于此,我们可以看到,很大程度上服务程序是需要在多平台基础上运行的,所以相应的开发工具链(开发调试IDE、服务部署发布系统等)也是很重要的部分。

在边缘服务上,我们希望搭建一套基础框架,不仅承载现有的渲染服务,未来也可以部署游戏引擎来实现云游戏的服务。由于单个边缘服务节点需要服务多个终端设备,推拉流服务的用户session 管理很重要,并且低延时的推流处理、高性能的渲染服务等都是我们需要突破的重点。同时,由于我们定义的很多场景是基于实时计算和强交互的模式,更像是游戏,上行的数据以操作指令、文本等为主,下行则主要是流媒体数据、算法数据等,而且考虑到时延等问题,优选基于UDP构建的传输协议,同时考虑到网络穿透率的问题,基于TCP的方案会作为基础的兜底策略。而在端侧,重点是低延时的直播播放器,网络协议的客户端实现以及用户上行的指令处理等。

 

未来的思考和总结

始于播放新交互,结合5G和边缘计算,面向云渲染。基于这个链路,未来我们希望的播放新交互是什么样子?

首先,在交互能力上,我们已经将算法和内容做结合,视频内容本质上是导演、演员基于剧情,向用户传递信息。用户观影过程中,是不是可以跟导演、演员或内容之间有联动交互。

其次,如何将这两者之间的信息拉通?就是通过算法结合内容做识别,算法本身去识别内容,再将识别出的内容跟用户看到的内容,在信息上更贴合用户偏好,将更多主动权交给用户,给用户更沉浸式的观影体验。同时因为这种交互的模式,对算法对算力有更高要求,借由5G和边缘计算的发展,打造一个环形体系,实现播放新交互的体系化形态。

以上就是我们对于未来在播放和交互领域的思考。

 

推荐阅读

  • 手把手教你配置VS Code 远程开发工具,工作效率提升N倍

  • 用大白话彻底搞懂 HBase RowKey 详细设计

  • 后端程序员必备:书写高质量SQL的30条建议

  • Go 远超 Python,机器学习人才极度稀缺,全球 16,655 位程序员告诉你这些真相!

  • 任正非谈“狼文化”:华为没有 996,更没有 007

  • 区块链必读“上链”哲学:“胖链下”与“瘦链上”

  • 在商业中,如何与人工智能建立共生关系?

真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517952.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不做会死!互联网时代的企业必定都要实现中台

AI 前线导读: 自 2018 年底以来,伴随着阿里、腾讯、百度、京东等一众互联网巨头的大规模组织架构调整,“中台”的热度陡然攀升。一时间,各大互联网公司纷纷开始跟随建设中台。中台的概念是被阿里带火的,2015 年&#x…

包机制。。

包机制 为了更好的组织类,java提供了包机制,用于区别类的命名空间//本质就是文件夹 包语法格式 package pkj[.pkg[.pkg3...]];一般利用公司域名倒置作为包名:com.boss.xxx 导入包语法 import package1[.package2...].(classname|*);尽量不要…

ETL异构数据源Datax_使用querySql_08

使用说明 当用户配置了这一项之后,DataX系统就会忽略table,column 这些配置型,直接使用这个配置项的内容对数据进行筛选,例 如需要进行多表join后同步数据,使用select a,b from table_a join table_b on table_a.id t…

我被“非结构化数据包围了”,请求支援!

阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%。换句话来说,就是我们都被“非结构化数据”包围了。由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使用成为了难点。如果说结构化数据用详实的方式记录了企…

82年 AI程序员征婚启示火了!年薪百万,女生神回复

最近在某社区,一则程序员征婚启示火了!很多女生在评论区表示“全中”,想交流看看。然后评论区就炸了,有人恶意说yp,有人说看中了楼主的钱。笔者一翻,发现楼主果然无意中透露了百万年薪收入,虽然…

AWS 专家教你使用 Spring Boot 和 DJL ,轻松搭建企业级机器学习微服务!

作者 | Qing Lan,Mikhail Shapirov责编 | Carol封图 | CSDN 下载自视觉中国出品 | CSDN云计算(ID:CSDNcloud)许多AWS云服务的用户,无论是初创企业还是大公司,都在逐步将机器学习 (ML) 和深度学习 (DL) 任务…

【从入门到放弃-ZooKeeper】ZooKeeper入门

前言 ZooKeeper是一个分布式服务协调框架,可以用来维护分布式配置信息、服务注册中心、实现分布式锁等。在Hbase、Hadoop、kafka等项目中都有广泛的应用。随着分布式、微服务的普及,ZooKeeper已经成为我们日常开发工作中无法绕过的一环,本文…

ln: failed to create symbolic link ‘/usr/bin/mysql’: File exists

问题描述: ln -s /usr/local/mysql/bin/mysql /usr/bin 在centos7进行软链接设置的时候,出现了这么问题:问题就是说这个文件已存在, 解决方法:覆盖之前的 ln -sf /usr/local/mysql/bin/mysql /usr/bin

读透《阿里巴巴数据中台实践》,其到底有什么高明之处?

最近阿里巴巴分享了《阿里巴巴数据中台实践》这个PPT(自行搜索原始文章),对于数据中台的始作俑者,还是要怀着巨大的敬意去学习的,因此仔细的研读了,希望能发现一些不一样的东西。 读这些专业的PPT&#xf…

如果你也想做实时数仓…

数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容。 …

华为云战略投入政企市场,发布华为云Stack

2020年5月15日,华为云发布政企战略,并宣布华为云Stack系列新品正式上市。华为云Stack是位于政企客户本地数据中心的云基础设施,能为政企客户提供在云上和本地部署体验一致的云服务。随着政企智能升级进入深水区,华为云将战略投入政…

如何在 Apache Flink 中使用 Python API?

本文根据 Apache Flink 系列直播课程整理而成,由 Apache Flink PMC,阿里巴巴高级技术专家 孙金城 分享。重点为大家介绍 Flink Python API 的现状及未来规划,主要内容包括:Apache Flink Python API 的前世今生和未来发展&#xff…

阿里云HBase Ganos全新升级,推空间、时空、遥感一体化基础云服务

1、HBase Ganos是什么 Ganos是阿里云时空PaaS服务的自研核心引擎。Ganos已作为云数据库时空引擎与数据库平台融合,建立了以自研云原生数据库POALRDB为基础,联合NoSQL大数据平台(Ali-HBASE和X-Pack Spark)的完整时空地理信息云化管…

看完这篇操作系统,和面试官扯皮就没问题了!

作者 | Cxuan责编 | Carol来源 | 程序员 cxuan封图 | CSDN 付费下载于视觉中国1、解释一下什么是操作系统操作系统是运行在计算机上最重要的一种软件,它管理计算机的资源和进程以及所有的硬件和软件。它为计算机硬件和软件提供了一种中间层。通常情况下,…

Linux centos7 安装 MySQL5.7.x

文章目录一、下载安装2. wget 下载方式3. 安装4. 初始化数据库二、修改密码2.1. 修改密码2.2. 修改密码2.3. 允许远程访问2.4. 关闭防火墙2.4. 建立mysql软连接一、下载安装 下载地址:https://dev.mysql.com/downloads/mysql/5.7.html#downloads 下载地址&#xff…

顺序结构,选择结构,反编译

顺序结构 Java基本结构就是顺序结构,除非特别指明,否则就按照顺序一句一句的执行顺序结构是最简单的算法结构任何一个算法都离不开的一种基本算法结构 package com.boss.struct;public class ShunXuDemo {public static void main(String[] args) {Sys…

助力共享经济,芝麻信用背后的技术

近期,CCTV9播放了自制的系列纪录片《大数据时代》,该片是国内首部大数据产业题材纪录片,节目细致而生动地讲述了大数据技术在政府治理、民生服务、数据安全、工业转型、未来生活等方面给我们带来的改变和影响。在第四集中,讲述了芝…

你的项目是否真的需要 DevOps?

DevOps即服务(DevOps-as-a-Service)是一种新兴的开发理念。DevOps作为一种方法,将传统的团队协作转移到开发和运维团队中,通过使用可堆叠的虚拟扩展工具实现自动化。作者 | raghuraji300译者 | Arvin,责编 | 屠敏头图 …

与你同行,才能无障碍

先给大家分享一个笔者的真实故事。前阵子她被诊断得了急性结膜炎,医生切切叮嘱 72 小时里多闭目养神不能目视任何自光源体,“尤其是电脑和手机!”医生特地关照了一句。 她好不容易挪回家,想起一整天未能进食,作为淘宝…

震惊!阿里的程序员竟被一个简单的 SQL 查询难住了!

作者 | 唐磊责编 | Carol来源 | 程序猿石头封图 | CSDN 付费下载于视觉中国最近工作上遇到一个”神奇”的问题,或许对大家有帮助,因此形成本文。问题大概是,我有两个表 TableA,TableB,其中 TableA 表大概百万行级别(存…