NES 模拟器中音画同步问题

背景

模拟器是与游戏和播放器都有相似之处的系统。模拟器与游戏的相似之处,在于都需要一个采集输入–执行逻辑–然后按一定帧率(通常是 60 FPS)把画面显示出来的循环。但是模拟器又需要模拟音频设备,播放音频设备产生的声音样本,这点与播放器相似。与播放器一样,模拟器也要处理音、视频同步问题,但是模拟器的特别之处又导致它与播放器的音、视频同步问题不太一样,解决方案也不一样。

有什么问题?

考虑下面这个渲染循环,初看之下这个循环做了该做的事,好像是没有问题的。

while (keep_running) {next_frame_time = time_now() + 16.667;emu_run_one_frame();audio_play(emu_get_audio_samples());video_render(emu_get_video_frame());sleep_until(next_frame_time);
}

但如果你照着去实现,就会发现存在下列问题。

问题一,噪声

上面的渲染循环对于画面渲染来说可能已经够了,但是对于声音来讲就不够了。人耳是很灵敏的,声音中有一点不连贯都会被人耳察觉。由于 sleep_until 不可能像硬件一样精确,因此可能某一帧 audio_play 送出去的样本就会 “晚点”,一旦样本 “晚点” 声音就会出现不连贯,这时就会听到 “嗞嗞” 声。

为了避免不连贯,通常的做法就是多累积一些声音样本,但这样又会带来第二个问题。

问题二,画面与操作不同步

要累积足够的样本,需要提前缓存足够的帧。虽然音频不出现问题了,但是由于视频帧是提前产生的,所以玩家看到的画面就是过时的,这时玩家再进行操作就太迟了。

这里,我们也可以看到游戏主机模拟器与播放器的不同。游戏主机需要采集玩家的输入,而玩家的输入又与看到的画面有关,因此不能缓存,需要实时。

问题三,音画不同步

除了提前缓存可以避免声音不连贯,将每帧的时间间隔减小也可以避免问题,但这也是一个不可取的方法。

比如将帧间隔时间改为 16 毫秒,则视频帧率为 62.5 FPS,但是音频依然是按原速率播放的,只是噪音没有了而已。这样要不了多久,音频就会明显落后于画面。而且,由于音频样本累积的速度比实际播放速度快,待播放的样本会越来越多,内存的占用量也会慢慢变大!

解法一,修改 APU 实现

声音样本是由模拟的 APU 产生的,观察 APU 的内部结构不难发现,NES 的 APU 可以看作是一个包含 5 个振荡器的 PSG。从 NES 程序的角度看,播放音乐就是在特定的时间顺序对振荡器进行编程,使之产生相应波形。又或者说,播放音乐就是在特定的时间点调用振荡器 API,控制它产生想要的波形。

因此,可以自己实现一些振荡器,把对 APU 的控制翻译成对振荡器的 API 调用:

class APU {/* ... */void write_register(uint16_t addr, uint8_t data) {switch (addr) {case 0x4002:_pulse1.set_freq(/* ... */); // 根据计时器值 data 计算出频率break;/* ... */}}
private:PulseOscillator _pulse1, _pulse2;
};

不过,以上方案需要注意时机问题。因为模拟器一般是一帧一帧地模拟,一帧中,write_register 会被调用多次。原本的 NES 程序对 APU 的控制是很精细的,到模拟器中就会变得粗糙,只能在一帧中对 APU 进行集中式设置。

要达到原本 NES 程序那样的精细程度,需要做到可以在指定的时间点调用振荡器 API。这个时间点怎么计算呢?我们知道,NES CPU 的时钟频率是 1.789773 MHz,而 APU 的时钟频率是 CPU 的一半,约 894.8865 KHz,可以算出一个 APU 时钟周期是 1117.5 ns。如果 CPU 在 APU 时钟 c 的时候写入了 $4002 寄存器,更改了方波通道 1 的频率,那么这个更改就应该在 t0 + c * 1117.5ns 时刻生效(其中,t0 表示 APU 时钟周期 0 的真实时间)。以下是修改过的版本:

class APU {/* ... */void write_register(uint16_t addr, uint8_t data) {switch (addr) {case 0x4002:post_timed_task([](){_pulse1.set_freq(/* ... */);}, now());break;/* ... */}}
private:unsigned long long now() const {return _t0 + (unsigned long long)(_elpased_cycle * 1117.5);}PulseOscillator _pulse1, _pulse2;unsigned long long _t0, _elapsed_cycle;
};

这个方案的缺点我认为是比优点多的,它唯一的优点可能就是没有动到渲染循环,而缺点则主要有以下两点。

首先,是需要额外的工作量。APU 的声音通道已经是振荡器了,为了播放声音,还需要再实现一套振荡器,增加了工作量。此外,post_timed_task 还牵涉到实现定时器、任务队列及多线程的一些东西。

其次,不够精确。前面提到,sleep_until 是不精确的,虽然音画是同步的,但是由于 sleep_until 的误差,会导致整个模拟是有误差的。随着时间增加,误差会越来越大,运行一段时间后,就会发现你的模拟器比市面上的流行模拟器慢很多。音乐听起来也可能不对劲,好像降了调一样。

解法二,改进渲染循环

通过前文的介绍,不难发现,问题的主要原因可以归结为 sleep_until 不精确。事实上,如果边产生样本边播放,再精确都不太够。一定得是先缓存一部分样本,然后赶在样本播放完毕前,送入新的样本。因此,只提高 sleep_until 的精度是不够的,还需要让渲染循环有某种自适应的能力,能够自动调整每帧间隔。要做到这点,可以在 sleep_until 结束后再获取一次时间。如果比预定时间早,下一帧时间可以适当延后;如果晚点,就适当提前一点。虽然思路是这个思路,但是实现上有比获取时间更靠谱的方案,就是计算播放了多少个样本。因为在一帧的时间内,模拟器可能没有产生足够的样本。以采样率 44.1 K 为例,一帧的时间内模拟器应该要产生 735 个样本,但实际上模拟器可能只产生 734 个样本。即使时间间隔弄对了,虽然只有一个样本的差别,但还是会听到恼人的噪音。

基于上面的思路,更新后的渲染循环如下:

constexpr auto sample_interval = 1e3/44100.0; // 采样间隔,毫秒int samples_to_play = 0;
auto t0 = time_now();
auto next_frame_time = t0;while (keep_running) {sleep_until(next_frame_time);auto now = time_now();auto elapsed_time = now - t0;auto samples_played = elapsed_time / sample_interval;t0 = now;// 结合后面,这里可以让下一帧的时间提前大概 2 个样本的时间(约 44 微秒)// 这样就能在样本播放完毕之前送入新的样本samples_to_play -= samples_played + 2;if (samples_to_play < -490) {// 延迟过于严重,魔法数 490 可以自由选择,取决怎么认定 “严重”samples_to_play = 0;}emu_run_one_frame();samples_to_play += emu_get_num_samples();audio_play(emu_get_samples());video_render(emu_get_video());next_frame_time = now + samples_to_play * sample_interval;
}

现在终于有一个堪用的渲染循环了,但是 sleep_until 的误差还是会带来一些问题。如果 sleep_until 的误差太大,导致帧间隔波动明显,画面的不连贯就会被人眼察觉到。sleep_until 最精确的实现方式大概就是如下的忙等,不过也看得出来,这样方式实在不优雅。

void sleep_until(double when) {while (time_now() < when);
}

最节约 CPU 的方式当然就是直接使用系统的 sleep,前面谈到,这种方式误差太大。讲到这里,其实一个可行的方案就呼之欲出了 – 把这两个方案综合一下就能得到一个精度可以接受的 sleep_until 函数了。

void sleep_until(double when) {// 硬编码的误差值,毫秒constexpr auto error = 1.5;auto sleep_time = round(when - time_now() - error);if (sleep_time > 0) {sleep(sleep_time);}while (time_now() < when);
}

如果是在 Windows 平台,还需要额外使用 timeBeginPeriod 函数才能让 sleep 的误差更加可控。

总结

本文探讨了模拟器中的音画同步问题,分析了各个原因,并提供了相应的解决方案。如果读者朋友正在实现模拟器,遇到了同样的问题,希望能有所启发。本文提到的解法二,对于实现游戏循环也是一个参考。

当然,同样的问题不同的人会给出不同的解法。对于本文提到的问题,欢迎读者朋友在评论区留下您的见解与思考。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/617599.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu搭建OpenCV环境(C++)

Ubuntu搭建OpenCV环境(C) 文章目录 Ubuntu搭建OpenCV环境(C)一、环境介绍二、依赖安装三、安装包下载四、opencv安装五、测试 一、环境介绍 虚拟机 &#xff1a;VMware 15.5 OS &#xff1a; Ubuntu 20.04 opencv 版本 &#xff1a; 4.9.0 操作系统安装本文不再赘述&#x…

学习Vue封装的过渡与动画总结

今天学习了Vue封装的过渡与动画&#xff0c;接下来说一下Vue是如何实现的&#xff0c;首先原生的方法是在style元素中给指定元素添加过渡的过渡或动画&#xff0c;但Vue就不需要直接获取到需要过渡或动画的元素&#xff0c;而是使用一个<transition>的标签来包裹住想要过…

py的函数讲解

前言:本章节我们来讲函数&#xff0c;主播略微感觉到有点小难&#xff0c;友友们需要认真看 目录 一.初始函数 1.1关于函数 1.2举例 1.3小结 二.函数的基础语法 2.1关于函数的语法 2.2举例 2.3小结 三.函数的参数 3.1关于函数的参数 3.2举例 3.3小结 四.函数的返回…

Arduino实现简易颜色识别机械臂

机械臂 一 功能原理1 硬件设备2 arduino库3 工作原理 二 代码设计全局参数1 颜色识别2 机械臂转动3 机械臂复位 三 展示效果 一 功能原理 识别出不同颜色的物体&#xff0c;让机械臂进行夹取并放入不同位置。 1 硬件设备 2 arduino库 3 工作原理 二 代码设计 项目重点划分…

如何在 SwiftUI 中实现音频图表

文章目录 前言DataPoint 结构体BarChartView 结构体ContentView 结构体实现协议实现线图总结 前言 在可访问性方面&#xff0c;图表是复杂的事物之一。iOS 15 引入了一项名为“音频图表”的新功能。 下面我们将学习如何通过使用 accessibilityChartDescriptor 视图修饰符为任…

用友NC Cloud IUpdateService接口存在XXE漏洞

免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该文章仅供学习用途使用。 1. 用友NC 简介 微信公众号搜索:南风漏洞复现文库 该…

Shutter Encoder多媒体转换v17.8

软件介绍 多媒体包含种类繁多的各种文件格式&#xff0c;每种格式都有其不同的特征和所谓的“怪癖”。 因此&#xff0c;如果使用多种图像、视频或音频格式&#xff0c;找到一个集中的软件来从一个地方处理所有这些格式可能会非常棘手。 这就是 Shutter Encoder 基本上允许做的…

Go语言使用gosseract 库来进行图像文字识别,识别出来的中文是乱码的?如何解决?

如果您在使用 gosseract 库进行图像文字识别时&#xff0c;得到的中文文字是乱码&#xff0c;可能是因为默认情况下 gosseract 以及 Tesseract 引擎并不支持中文字符的识别。要解决这个问题&#xff0c;您需要进行一些配置和设置。 以下是解决方案的步骤&#xff1a; 1 安装 …

【算法】信使(最短路问题)

题目 战争时期&#xff0c;前线有 n 个哨所&#xff0c;每个哨所可能会与其他若干个哨所之间有通信联系。 信使负责在哨所之间传递信息&#xff0c;当然&#xff0c;这是要花费一定时间的&#xff08;以天为单位&#xff09;。 指挥部设在第一个哨所。 当指挥部下达一个命令…

硬盘重新分区怎么恢复分区之前的文件?

分区是常见的故障&#xff0c;通常由多种原因引起。一方面&#xff0c;硬盘老化或者受到损坏可能会导致分区表出现问题&#xff1b;另一方面&#xff0c;用户误操作&#xff0c;如格式化或分区不当&#xff0c;也可能导致分区丢失。针对此问题&#xff0c;解决方法包括使用专业…

代码仓库gitlab的数据迁移步骤

GitLab数据迁移的具体方法和详细操作如下&#xff1a; 备份源GitLab服务器的数据&#xff1a;你可以使用GitLab自带的备份工具进行备份&#xff0c;执行以下命令进行备份&#xff1a; sudo gitlab-rake gitlab:backup:create安装新的GitLab服务器&#xff1a;在目标服务器上安装…

# C++系列-第3章循环结构-28-累加

在线练习&#xff1a; http://noi.openjudge.cn/ https://www.luogu.com.cn/ 累加 奥运奖牌计数 题目描述 2008 2008 2008 年北京奥运会&#xff0c;A 国的运动员参与了 n n n 天的决赛项目 ( 1 ≤ n ≤ 100 ) (1 \le n \le 100) (1≤n≤100)。现在要统计一下 A 国所获得的…

虚拟机连接(与主机断开连接)U盘的按钮为灰色之解决方法

在WIN11中&#xff0c;虚拟机“连接(与主机断开连接)U盘”选项为灰色&#xff0c;解决方法如下&#xff1a; 1、关闭虚拟机电源&#xff0c;得到下面的界面&#xff1a; 2、根据上述提示&#xff0c;找到虚拟机所在磁盘 3、配置文件属性见下图&#xff1a; 4、使用记事本打开…

JVM工作原理与实战(十四):JDK9及之后的类加载器

专栏导航 JVM工作原理与实战 RabbitMQ入门指南 从零开始了解大数据 目录 专栏导航 前言 一、JDK8及之前的类加载器 二、JDK9及之后的类加载器 1.启动类加载器 2.平台类加载器&#xff08;扩展类加载器&#xff09; 总结 前言 JVM作为Java程序的运行环境&#xff0c;其负…

华为OD机试 - 最长子字符串的长度(二)(Java JS Python C)

题目描述 给你一个字符串 s,字符串 s 首尾相连成一个环形,请你在环中找出 l、o、x 字符都恰好出现了偶数次最长子字符串的长度。 输入描述 输入是一串小写的字母组成的字符串 输出描述 输出是一个整数 备注 1 ≤ s.length ≤ 5 * 10^5s 只包含小写英文字母用例 输入alolob…

《设计模式的艺术》笔记 - 简单工厂模式

介绍 定义一个工厂类&#xff0c;它可以根据参数的不同返回不同类的实例&#xff0c;被创建的实例通常都具有相同的父类。因为在简单工厂模式中用于创建实例的方法是静态方法&#xff0c;因此简单工厂模式又被称为静态工厂方法模式&#xff0c;属于类创建型模式 实现 class Pr…

Nginx——基础配置

和大多数软件一样&#xff0c;Nginx也有自己的配置文件&#xff0c;但它又有很多与众不同的地方&#xff0c;本帖就来揭开Nginx基础配置的面纱。 1、Nginx指令和指令块 了解指令和指令块有助于大家了解配置的上下文&#xff0c;下面是一个配置模板示例&#xff1a; 在这个配…

ElasticSearch 7.x 版本使用 BulkProcessor 实现批量添加数据

ElasticSearch 1、ElasticSearch学习随笔之基础介绍 2、ElasticSearch学习随笔之简单操作 3、ElasticSearch学习随笔之java api 操作 4、ElasticSearch学习随笔之SpringBoot Starter 操作 5、ElasticSearch学习随笔之嵌套操作 6、ElasticSearch学习随笔之分词算法 7、ElasticS…

使用numpy处理图片——缩放图片

缩放图片是让图片丢失部分像素&#xff0c;从而导致图片失真。一种比较简单的方法就是抽取法。比如如果我们要将照片在宽度上缩小50%&#xff0c;则可以在第二维度上每隔2个像素取一个像素来保存&#xff1b;类似的&#xff0c;如果我们希望在高度上缩小50%&#xff0c;则可以在…

AUTO SEG-LOSS SEARCHING METRIC SURROGATES FOR SEMANTIC SEGMENTATION

AUTO SEG-LOSS: 搜索度量替代语义分割 论文链接&#xff1a;https://arxiv.org/abs/2010.07930 项目链接&#xff1a;https://github.com/fundamentalvision/Auto-Seg-Loss ABSTRACT 设计合适的损失函数是训练深度网络的关键。特别是在语义分割领域&#xff0c;针对不同的场…