音视频采集推流时间戳记录方案

音视频同步更多文章

深入理解音视频pts,dts,time_base以及时间数学公式_视频pts计算-CSDN博客

ffplay音视频同步分析_ffplay 音视频同步-CSDN博客

音视频采集打时间戳设计

实时音视频数据的采集和处理场景。具体来说:

采集阶段:

  • 在音视频数据采集过程中,需要为每一帧数据计算出时间戳。
  • 可以采用"起始时间=系统时间"的方式,计算第一帧的时间戳,后续帧按照固定的帧间隔累加得到。
  • 同时引入动态校正机制,检测累计时间戳与系统时间的偏差,及时修正时间戳。

传输阶段:

  • 将计算好的时间戳与音视频数据一起传输到客户端。

播放阶段:

  • 客户端接收到数据后,先将其缓存一段时间。
  • 然后根据附带的时间戳信息,按照正确的时间顺序进行播放。
  • 客户端可以进一步利用时间戳信息来调整缓冲区,以适应网络环境的变化。

这种时间戳设计方案的核心思路就是:

  1. 在采集端尽量保证时间戳的准确性和稳定性。后续讲解如何设计稳定和准确的方案
  2. 将时间戳信息传输到客户端,利用它来进行缓冲和时间校正。
  3. 通过客户端和服务器端的协作,最终实现音视频数据的平滑播放。

        这是实时音视频领域常用的一种时间戳管理策略,能够很好地应对系统负载变化、小数误差累积等问题。

方案推导

第一方案 直接系统时间模式


初始化 starttime = systime
frameTimeStamp = systime - start time
缺陷:涉及到音频硬件采样不稳定,操作系统调度和网络传输的时间,导致ts准确度不够问题且没用纠正机制。


第二种方案 帧间隔模式


初始化 starttime = systime
frameTimeStamp = current systime - start time
Compute TimeStamp = last FrameTimeStamp + duration

优点:能输出frame duration稳定的音视频时间戳。
缺陷:

  • 系统负载过高时,实际帧采集间隔可能与理论设定不一致。这将导致计算出的时间戳与实际情况不符,影响播放效果。
  • 帧间隔涉及到无限小数时,会随时间累积产生较大的误差。例如预计30帧,通常按帧间隔33毫秒处理,但实际是33.3333333毫秒。累积3333帧(约111秒)就出现1秒的误差。


第三种方案  帧间隔+直接系统时间模式


初始化 starttime = systime                                                        //起始时间=系统时间
frameTimeStamp = current systime - start time                       //第一帧时间戳= 系统时间–起始时间
Compute TimeStamp = last FrameTimeStamp + duration       //后续帧TimeStamp=上一帧时间戳+ 帧间隔

 T = current systime  -  starttime     //当前系统时间 – 起始时间 
if( |Compute TimeStamp - T |  >= duraiton/2 )  Compute TimeStamp  = last FrameTimeStamp

//如果当前帧的计算时间戳(CurrentFrameTS)与系统时间差值(T)的绝对值大于等于一个半帧间隔,那么我们就应该将当前帧的时间戳直接设置为系统时间差值T。 


解决:动态纠正,在第二方案基础上,解决了随着播放帧数,时间戳落后或提前现象。落点值 =  T = current systime  -  starttime     //当前系统时间 – 起始时间。关键点是设置一个合理的校正阈值,这里我们使用了半帧间隔。

优点:能够实时纠正时间戳,只要系统正常运转,就能立即恢复正确的时间戳。

缺陷:帧间隔不均匀,能否正常播放依赖于终端解决方案。 比如,假如音频一帧间隔为24毫秒,被采集的回调时间可能为20 毫秒,28毫秒,27毫秒,21毫秒。

终端解决这个问题,可以从以下几个方面着手:

在客户端使用自适应缓冲机制:

  • 根据实际采集帧率的波动情况,动态调整缓冲区大小,尽量平滑播放。

在服务器端进行帧率转换:

  • 服务器可以对不同帧率的数据进行帧率转换,输出稳定的帧率。
  • 这样可以屏蔽掉客户端设备性能的影响。

使用更加先进的时间戳校正算法:

  • 例如利用机器学习等方法,预测并修正时间戳的偏差。

 

采集时间戳同步问题分析

在使用帧间隔+直接系统模式基础上,发送端时间戳记录:

  • 记录每一帧音视频数据的pts时间戳和pts_duration帧间隔
  • 同时记录相邻帧之间的系统时间间隔 sys_duration
  • 这样可以分析在采集阶段,帧间隔的稳定性

分析发送端时间戳:

  • (1) ptsd(pts_duration)波动大,说明采集帧间隔不稳定,可能是由于系统负载波动等因素引起的
    • ​​​​​​​帧间隔 pts_duration 波动很大,那么意味着每帧数据被实际采集的时间间隔是不稳定的。这通常是由于系统负载波动、硬件性能波动等因素引起的,导致采集过程不够稳定。
  • (2) pts稳定,但sysd(sys_duration)波动大,说明在数据发送过程中,速率不够稳定可能是网络传输过程中出现了抖动.
    • ​​​​​​​这里的 pts 时间戳是相对稳定的,意味着数据在采集端生成时间戳是比较准确的。但是,相邻帧之间的系统时间间隔 sys_duration 却出现了波动,说明在数据发送过程中,速率不够稳定。这种情况通常是由于网络传输过程中出现了抖动,导致实际发送速率不够平滑。
  • (3) sysd和ptsd的值应该较为一致,如果两者差异较大,说明在整个采集-传输过程中存在问题
  • ​​​​​​​比如: [send]audio:1-pts:20ms-ptsd:24ms; sysd=23ms

接收端时间戳记录:

  • 接收到的帧信息包含: 帧序号、pts时间戳、pts_duration帧间隔
  • 同样记录了相邻帧的系统时间间隔 sys_duration

分析接收端时间戳:

  • (1) ptsd(pts_duration)波动大,说明采集帧间隔不稳定
  • (2) pts稳定,但sysd(sys_duration)波动大。说明在数据发送过程中,速率不够稳定
  • 比如: [recv] audio:1-pts:20ms-ptsd:24ms; sysd=23ms 200ms

总结核心思路是:

  • 在发送端和接收端同时记录时间戳信息,包括pts时间戳和系统时间
  • 通过对这些时间戳数据的分析,可以全面诊断出音视频同步过程中的各种问题
    • ptsd异常 采集端的帧间隔不稳定
    • pts稳定下 sysd异常 推流端的数据传输速率不稳定,存在网络传输过程中的抖动。

 

 学习资料分享

0voice · GitHub

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/64533.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

专业140+总分410+南京大学851信号与系统考研经验南大电子信息通信集成电路,真题,大纲。参考书。

本人本科中等211,离保送本校差一点,考研前纠结本校还是追求更高目标,和家人聊了自己的想法,感谢父母对我的支持,坚定报考南大的目标,最终专业851信号与系统140,总分410顺利被南京大学录取&#…

【C++】初识C++之C语言加入光荣的进化(上)

写在前面 本篇笔记作为C的开篇笔记,主要是讲解C关键字(C98)连带一点点(C11)的知识。掌握的C新语法新特性,当然C是兼容C的,我们学习C的那套在C中也是受用。 ps:点我跳转下集 文章目录 写在前面一、命名空间域1.1、命名空间域的定义与使用1.2…

CGAL windows 安装教程

1.下载源代码 CGAL官网下载https://github.com/CGAL/cgal/releases 2.下载boost库 BOOST官网下载https://www.boost.org/ 3.下载 GMP and MPFR 4.配置VS2022 头文件: 库路径 做完以上步骤,可以使用CGAL了!

从0入门自主空中机器人-2-2【无人机硬件选型-PX4篇】

1. 常用资料以及官方网站 无人机飞控PX4用户使用手册(无人机基本设置、地面站使用教程、软硬件搭建等):https://docs.px4.io/main/en/ PX4固件开源地址:https://github.com/PX4/PX4-Autopilot 飞控硬件、数传模块、GPS、分电板等…

GraphRAG 框架哪家强?选择最适合你智能问答系统的框架

GraphRAG 框架哪家强?选择最适合你智能问答系统的框架 点击进入:GraphRAG系列文章-Nano-GraphRAG:打造轻量级医疗诊断助手 点击进入:GraphRAG系列文章-突破传统知识管理瓶颈:LlamaIndex GraphRAG 让企业知识问答更智能…

Mac电脑python多版本环境安装与切换

我当前是python3.9.6环境,需要使用3.9.8环境,通过brew安装3.9.8版本,然后通过pyenv切换环境 步骤 1: 安装 pyenv brew install pyenv brew install pyenv-virtualenv 步骤 2: 安装 Python 3.9.8(使用 pyenv 安装指定版本的 Pyth…

Redis--持久化策略(AOF与RDB)

持久化策略(AOF与RDB) 持久化Redis如何实现数据不丢失?RDB 快照是如何实现的呢?执行时机RDB原理执行快照时,数据能被修改吗? AOF持久化是怎么实现的?AOF原理三种写回策略AOF重写机制 RDB和AOF合…

C高级:思维导图Day2

目录 总览1 总览2 总览1 压缩与解压缩 打包与解包 软连接与硬链接 ubuntu下关机与重启指令 总览2 结束

权限获得第一步

权限获得第一步 下载打开附件 给了一串加密的密文 一般都是用MD5加密,每一段分别解码一下 第一段不行,试一下第二段 这里发现第二段可以解码出来,这应该就是密码了 flag{3617656}

001__VMware软件和ubuntu系统安装(镜像)

[ 基本难度系数 ]:★☆☆☆☆ 一、Vmware软件和Ubuntu系统说明: a、Vmware软件的说明: 官网: 历史版本: 如何下载? b、Ubuntu系统的说明: 4、linux系统的其他版本:红旗(redhat)、dibian、cent…

fiscoBcos中webase平台导出java项目

导出合约为java项目并调用 1. 在webase管理平台上面进行项目的导出 2.将下载好的项目解压并用idea打开,目录结构如下 在resources目录下的abi放的是编译过后的合约方法,bin.ecc放的是以编译过后的智能合约,conf文件夹下面放的是链…

【嵌入式C语言】指针数组结构体

指针与数组 指针与数组指针数组数组指针 多维数组数组名的保存 结构体定义结构体定义结构体变量使用typedef简化结构体声明访问结构体成员结构体内存分配字节对齐位域定义位域位域的限制示例 指针与数组 指针数组和数组指针是两个不同的概念,它们涉及到指针和数组的…

Junit4单元测试快速上手

文章目录 POM依赖引入业务层测试代码Web层测试代码生成测试类文件 在工作中我用的最多的单元测试框架是Junit4。通常在写DAO、Service、Web层代码的时候都会进行单元测试&#xff0c;方便后续编码&#xff0c;前端甩锅。 POM依赖引入 <dependency><groupId>org.spr…

【优选算法】查找总价格为目标值的两个商品(双指针)

算法_云边有个稻草人的博客-CSDN博客 目录 解法一&#xff1a;暴力算法 解法二&#xff1a;双指针(时间复杂度为O&#xff08;N&#xff09;) 【代码编写】 LCR 179. 查找总价格为目标值的两个商品 - 力扣&#xff08;LeetCode&#xff09; 解法一&#xff1a;暴力算法 用…

时空信息平台-API安全措施-下篇:登录鉴权【访问受限】您的请求已被该站点的安全策略拦截。

文章目录 引言I 登录鉴权处理逻辑校验顺序用户状态校验密码校验Token鉴权短信验证码/图形验证码登录设备限制II 服务端发生错误的处理业务返回码处理前端处理业务返回码nginx处理http状态码引言 时空信息平台-API安全措施:上篇(通讯协议的安全措施) https://blog.csdn.net/z…

编译openssl遇到错误Parse errors: No plan found in TAP output的解决方法

在编译openssl时 tar -zxvf openssl-1.1.1p.tar.gz cd openssl-1.1.1p ./config --prefix/usr --openssldir/etc/ssl --shared zlib make make test 遇到错误 Parse errors: No plan found in TAP output 解决方法&#xff1a; yum install perl-Test-Simple

【Linux】进度条

本文中&#xff0c;我们来写一个进度条。 本文大纲&#xff1a; 写一个命令行版的进度条。 1.回车换行 2.缓冲区问题&#xff08;本文不深究&#xff09; ​ 2.1测试代码 3.写一个什么样的进度条&#xff1f; ​ version1 ​ version2 回车换行 这俩不是一个概念&…

UE5材质节点SimpleGrassWind

SimpleGrassWind节点可以模拟树叶扰动&#xff0c;或小草晃动效果 用来做风格化树、风格化草效果很好 主要节点 前三个节点分别用来控制&#xff0c;风强度&#xff0c;风重力&#xff0c;风速度&#xff0c;WPO是世界位置偏移

WeNet:面向生产的流式和非流式端到端语音识别工具包

这篇文章介绍了WeNet&#xff0c;一个面向生产的开源端到端&#xff08;E2E&#xff09;语音识别工具包。WeNet的主要特点和贡献如下&#xff1a; 统一流式和非流式识别&#xff1a;提出了一种名为U2的两阶段框架&#xff0c;能够在单一模型中同时支持流式和非流式语音识别&…

Ubuntu20.04安装Foxit Reader 福昕阅读器

Ubuntu20.04安装Foxit Reader 福昕阅读器 文章目录 Ubuntu20.04安装Foxit Reader 福昕阅读器 先更新一下源 sudo apt update sudo apt upgrade下载Foxit Reader的稳定版本 wget https://cdn01.foxitsoftware.com/pub/foxit/reader/desktop/linux/2.x/2.4/en_us/FoxitReader.e…