ESP32 I2S音频总线学习笔记（一）：初识I2S通信与配置基础

文章目录

简介
为什么需要I2S？
关于音频信号
- 采样率
- 分辨率
- 音频声道
怎样使用I2S传输音频？
- 位时钟BCLK
- 字时钟WS
- 串行数据SD
I2S传输模型
I2S通信格式
I2S格式
- 左对齐格式
- 右对齐格式
i2s基本配置
i2s 底层API
- 加载I2S驱动
- 设置I2S使用的引脚
- I2S读取数据
- I2S发送数据
- 卸载I2S驱动
总结

简介

在音频处理领域，I2S是一种广泛使用的通信协议，它专门用于芯片之间的音频数据传输。ESP32 作为一款高性能的微控制器，不仅支持 I2S 通信，还提供了强大的硬件接口和灵活的软件库，使其成为音频项目开发的理想选择。本篇文章将介绍I2S的相关知识和使用ESP32驱动I2S音频设备时比较常用的相关底层API函数。

I2S即Inter-IC Sound，简称I2S，意思是芯片间音频总线，它是由飞利浦开发的一种用于数字音频设备的通信协议，常用于麦克风、扬声器、音频处理器等设备之间的音频数据传输。

为什么需要I2S？

传统的音频设备，像模拟电路，传递的是电压信号，这种方式容易受到干扰，比如噪声或者信号衰减。而数字音频需要传输数据，通常是二进制的“0”和“1”，直接用模拟接口传输会很麻烦。而 I2S就是为了解决这个问题的一种数字音频接口，它让音频数据的传输变得简单、高效、而且抗干扰能力强。使用 I2S可以很方便地把数字音频信号从一个芯片传递到另一个芯片，对于开发者来讲只需要配置好芯片的 I2S 模块，就可以实现数字音频数据的传输了。

关于音频信号

在自然界中音频信号是以模拟量的形式存在的，它是一种随时间连续变化的物理量，为了减少外界的干扰我们需要把它变成数字量，我们一般可以通过一个模数转换器把它变成数字信号（图1），数字信号在计算机或数字设备中以离散的数值形式表示和处理，比如用0和1的组合去表示，这里可以了解下PCM编码，它是一种模拟信号数字化的方法

（图1）

当然我们也能通过一个数模转换器把数字信号还原成模拟信号，以便在扬声器上播放音频（图2）。

（图2）

这样音频信号之间的传递就可以通过数字信号来进行了（图3），可以减少外界对信号的干扰。

（图3）

在音频信号处理和传输中，有三个非常重要的参数决定了音频质量和设备性能：采样率、分辨率和音频声道。

采样率

采样率就是每秒采集声音样本的频率，这个频率越快，采样的数字信号就越接近原始的声音的信号，因为采样的越快，离散数字曲线每个样本值之间的过渡就越接近，曲线就会越平滑。这个过程和录像是类似的，一个是采样光，一个采样振动。我们知道录像其实就是一帧一帧的图像快速播放，这个采样速度很快，我们肉眼分辨不了，看起来就是连续的。如果录像时采样的速度很慢，比如1秒采样3次，那我们就会丢失掉很多画面细节。采集声音的时候也是如此，大家可以想象一下，如果采集频率很慢，听到的声音会是什么样子，会明显感到声音听起来失真不连贯甚至变样。
在这里插入图片描述

在这里插入图片描述

每秒钟采集的音频样本数，常见的有8K、16K、44.1K等，采样率越高，信号还原越精细，一般使用44.1KHz采样频率就可以得到比较高保真的声音。

分辨率

对声音数据采样后，我们将得到一些离散的样本点，那我们在一些数字设备是如何存储这些样本点的呢？我们采样的数据是以二进制的形式存储的，比如对于每一个采样点我们用3位二进制来表示（图4），那么它可以表示的范围就是2^3=8 即8种量化电平信号(图5)，可以简单理解为：每个采样点可以存储 8种情况的声音。如果量化位数越多，根据我们高中学过的排列组合知道，得到的样本值就会越多，那它可以表示自然界声音的细节就越多，或者说能表示的声音就越丰富。

音频数据的量化位数或量化深度，常见的有8bit、16bit、24bit、32bit等，位数越高，信号的动态范围和精细程度越好

（图4）

（图5）

音频声道

分为单声道，双声道，单声道是一种只有一个音频信号通道，所有声音都合并到一个通道中输出，无论是通过一个扬声器还是两个扬声器，听到的声音是完全相同的。双声道分为左声道和右声道，具有两个独立音频通道，左声道和右声道可以传递不同的声音信号，具有空间感和方向感，也就是我们平常说的立体声。

怎样使用I2S传输音频？

使用I2S传输音频的时候，需要用到时钟信号、控制信号以及数据信号(图6)，它们之间是分开传输的。对于标准通信模式下的 I2S 总线主要包含以下几个信号：位时钟BCLK，字时钟WS，串行数据SD。有的时候还需要MCLK：主时钟线，该信号线可选，具体取决于从机，主要用于向 I2S 从机提供参考时钟。
_{(注意这几种信号有几种其它叫法，这里结合英文选择了这几个名称，大家只要在使用能区分就行)}~

图(6)

位时钟BCLK

BCLK（Bit Clock，位时钟）
也叫BCK, SCLK(Serial Clock),对应数字音频的每一位数据，是模块内的同步信号

BCLK 定义了数据传输的速率，用来控制数据的传输节奏。它的频率通常是采样率乘以每个采样的位数再乘以声道数量。例如，对于 44.1kHz 的采样率、16 位双声道音频，BCLK 的频率为 44.1kHz × 16 × 2= 1.4112 MHz。所以对于双声道来说，BCLK的频率=2×采样频率×采样位数。

字时钟WS

WS(Word Select , 字选择时钟)
也叫 LRCLK （Left Right Clock）即左右声道时钟，用于标识当前正在传输的是左声道数据还是右声道数据。对于飞利浦公司定义的I2S标准，当 WS 为低电平时表示左声道，高电平时表示右声道。一个完整的 WS 信号周期包含两个声道的数据（左声道和右声道）

WS 信号的频率等于音频的采样率。
例如，如果音频采样率是 44.1kHz，那么 WS 的频率也是 44.1kHz。

串行数据SD

SD（Serial Data，串行数据）
i2s传输时的音频数据，是用二进制补码表示的，具体数据传输的格式主要包括：I2S格式，左对齐格式，右对齐格式,

每个 BCK 周期会传输一位数据。数据发送端和接收端会根据 BCK 信号的跳变（上升沿或下降沿）同步数据的发送和接收。当 WS 为低电平时，SD 传输左声道数据；当 WS 为高电平时，SD 传输右声道数据。

比如我们传输16 位双声道音频，SD数据为1 0 1 0 1 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 1 0 0 1 1 0 0 0 1 0 0 1

它表示

每个 BCK 周期传输一位音频数据。
当 WS 为低电平时，SD 按位传输左声道的 16 位数据1 0 1 0 1 1 0 1 1 0 0 0 1 0 0 1
当 WS 为高电平时，SD 按位传输右声道的 16 位数据 1 1 0 0 1 0 0 1 1 0 0 0 1 0 0 1，

个人总结

字时钟：高低电平翻转，总线在传输双声道音频 0为左， 1为右，字时钟的频率=采样率
位时钟：串行数据线的信号会在位时钟上升沿被采样，位时钟的频率=2×采样率×采样位数。
串行数据：用二进制补码表示的音频数据，先传输高位，再传输低位，
Tips:字时钟和位时钟都是由主机发送

了解了I2S是如何传输后，我们再来看看他的传输模型和通信格式。

I2S传输模型

I2S通信支持全双工和半双工通信，支持主/从模式。主设备就是发送时钟的，从设备在时钟的控制下发送或者接收数据。

连接到I2S总线的设备可以分为两类：

控制器——控制 SCK 和 WS 信号。
目标设备——接收 SCK 和 WS 信号

总线上只能有一个控制器，但是总线可以有多个目标设备。

音频设备，可以分为三类：

发射器——发送音频信号。
接收器——接收音频信号。
控制器——控制音频信号

这里我们至少需要一个发射器和接收器，控制器是可选的，主要用于向 I2S 从机提供参考时钟

根据I2S总线谁作为控制器，谁作为目标设备，我们可以有三种I2S传输模型：

发射器作为控制器，接收器作为目标设备

发射器作为目标设备，接收器作为控制器

发射器和接收器都作为目标设备，其他I2S控制器作为控制器

总结：三种经典I2S传输模型

I2S通信格式

PCM510xA 支持行业标准的音频数据格式，包括标准 I2S 和左对齐（Left-justified）格式等。
在这里插入图片描述

I2S格式

I2S格式：又称飞利浦格式（图7），数据最高位总是出现在字时钟变化后的第二个位时钟脉冲处（滞后一个位时钟），这种格式下数据MSB的位置是确定的，LSB的位置取决于字长。
在这里插入图片描述

图(7)

左对齐格式

左对齐格式(图8)：数据最高位出现在字时钟变化后的第一个位时钟脉冲处（无滞后位时钟）

图(8)

右对齐格式

右对齐格式：又称日本格式，这种格式和左对齐差不多，只不过整体是靠右对齐的，即数据LSB与WCLK跳变沿对齐。

图(9)

i2s基本配置

①，i2s的时钟使能和GPIO口配置 ②，配置为i2s模式
③，i2s标准，无论有多少位有效数据，即数据的最高位总是出现在WS变化（也就是一帧开始）后的第2个CK脉冲处。
④，i2s数据长度，包括16位，16位扩展（16位数据以32位包发送），24位，32位。 ⑤，设置i2s时钟
⑥，设置i2s空闲状态下时钟电平 ⑦，i2s使能

i2s 底层API

这里我们以ESP32 I2S通信为例，开发环境是Arduino IDE，介绍它的相关底层API，在我们调库的时候下面这些函数会被调用，我们看一下它的实现过程。

加载I2S驱动

函数原型：

esp_err_t i2s_driver_install(i2s_port_t i2s_num, const i2s_config_t *i2s_config, int queue_size, void *i2s_queue)

参数说明：：

i2s_port_t i2s_num：指定使用的 I2S 外设端口。i2s_port_t 是 I2S 外设端口的枚举类型，有两个端口可用：I2S_NUM_0 和 I2S_NUM_1，对应 ESP32 的第一个和第二个 I2S 外设。

typedef enum {I2S_NUM_0 = 0,                 /*!< I2S port 0 */
#if SOC_I2S_NUM > 1I2S_NUM_1 = 1,                 /*!< I2S port 1 */
#endifI2S_NUM_MAX,                   /*!< I2S port max */
} i2s_port_t;

const i2s_config_t * i2s_config : 设置I2S 外设的配置参数。其中i2s_config_t 是一个结构体，定义了 I2S 外设的配置选项，这里我们只看常用的配置选项就可以了，主要包括mode、 sample_rate、bits_per_sample等，如下：

typedef struct {i2s_mode_t              mode;                       /*< 设置 I2S 的工作模式 */uint32_t                sample_rate;                /*!< 设置音频采样率 */i2s_bits_per_sample_t   bits_per_sample;            /*!< 设置采样位数 */i2s_channel_fmt_t       channel_format;             /*!< 设置数据通道格式.*/i2s_comm_format_t       communication_format;       /*!< 设置I2C数据传输格式 */int                     intr_alloc_flags;           /*!< 设置中断相关标志位*/int                     dma_buf_count;  dma缓存个数，            int                     dma_buf_len;                
} i2s_driver_config_t;typedef i2s_driver_config_t i2s_config_t;

int queue_size：数据传输的队列的大小
void * i2s_queue：存放和管理 I2S 传输的数据。

这个函数有一个esp_err_t 的返回值，如果返回ESP_OK表示加载I2S驱动成功。

设置I2S使用的引脚

函数原型：

esp_err_t i2s_set_pin(i2s_port_t i2s_num, const i2s_pin_config_t *pin)

参数说明：

i2s_port_t i2s_num：指定使用的 I2S 外设端口，I2S_NUM_0 或I2S_NUM_1。

i2s_pin_config_t * pin：配置I2S接口的各个引脚，i2s_pin_config_t 是一个结构体，里面是关于I2S引脚，如时钟引脚，左右声道选择引脚，数据输入引脚等引脚的配置。如下：

typedef struct {int mck_io_num;     /*!< MCK in out pin. Note that ESP32 supports setting MCK on GPIO0/GPIO1/GPIO3 only*/int bck_io_num;     /*!< BCK in out pin*/int ws_io_num;      /*!< WS in out pin*/int data_out_num;   /*!< DATA out pin*/int data_in_num;    /*!< DATA in pin*/
} i2s_pin_config_t

I2S读取数据

函数原型：

esp_err_t i2s_read(i2s_port_t i2s_num, void *dest, size_t size, size_t *bytes_read, TickType_t ticks_to_wait);*/用于从 I2S接口读取音频数据

参数说明：
i2s_port_t i2s_num：I2S_NUM_0 或I2S_NUM_1。

void * dest：读取目标数据的缓存区

size_t size：要读取的数据大小，单位是字节

size_t * bytes_read：实际读取到的字节数

TickType_t ticks_to_wait：超时等待时间，因为I2S是按一定频率读取数据的，如果一次传输的数据很多就需要等待，这个参数一般写入portMAX_DELAY 表示无限等待。

如果返回ESP_OK表示I2S读取数据成功。

I2S发送数据

函数原型：

esp_err_t i2s_write(i2s_port_t i2s_num, const void *src, size_t size, size_t *bytes_written, TickType_t ticks_to_wait);*/用于向 I2S 接口写入音频数据

参数说明：
i2s_port_t i2s_num：I2S_NUM_0 或I2S_NUM_1。

const void *src：写入源数据的缓存区

size_t size：要写入的数据大小，单位是字节

size_t *bytes_written：实际写入的字节数

TickType_t ticks_to_wait：超时等待时间，因为I2S是按一定频率发送数据的，如果一次传输的数据很多就需要等待，这个参数一般写入portMAX_DELAY 表示无限等待。

卸载I2S驱动

函数原型：

esp_err_t i2s_driver_uninstall(i2s_port_t i2s_num);

参数说明：
卸载I2S驱动的话我们只需要传入I2S端口就行了。

总结

以上我们介绍了I2S的相关知识和配置的相关函数，下篇文章我们来看一下一个使用ESP32驱动I2S设备的小案例！这系列的文章主要是分享一下本人学习过程的相关知识，如果有错误可以交流学习下！