音视频--AAC编码解析和示例

目录

1:AAC编码介绍

2:AAC格式介绍

3:AAC -ADTS帧组成

4:AAC-ADTS:(adts_fixed_header)格式介绍

5:AAC-ADTS:(adts_variable_header)格式介绍

6:示例代码:


1:AAC编码介绍

        AAC 代表 Advanced Audio Coding,是一种有损音频压缩格式。它由 MPEG-4 标准定义,由 Fraunhofer 公司开发,Dolby、Sony 和 AT&T 是主要的贡献者。AAC 提供了高质量的音频压缩,被广泛用于音乐存储和流媒体传输。

2:AAC格式介绍

AAC主要有下面两个格式:

  1. ADTS(Audio Data Transport Stream):一般用的都是这个格式。ADTS 是 AAC 音频的传输流格式。AAC 音频格式在 MPEG-2 标准(ISO-13318-7 2003)中有定义,并且后来被采用到 MPEG-4 标准中。ADTS 格式的特点是它是一个有同步字的比特流,也就是说每一帧都有头信息,这使得解码可以在流的任何位置开始。因此,ADTS 可以在任意帧解码,与之相反的是,ADIF 只有一个统一的头信息,也就是说它每⼀帧都有头信息。因此必须获取到所有的数据后才能解码。

  2. ADIF(Audio Data Interchange Format):ADIF 是一种音频数据交换格式。它的特点是可以确定地找到音频数据的开始,而不需要在音频数据流中间开始解码。这意味着解码可以从明确定义的起始点开始,通常用于存储在磁盘文件中的音频数据。这个基本用不到

当对音频进行编码时,有时直接编码得到的AAC文件(称为“裸流”)可能无法在个人电脑(PC)或手机上正常播放。这通常是因为这些AAC文件的每一帧缺少了必要的ADTS头信息

为了解决这个问题,需要在AAC原始数据块(即没有ADTS头的音频数据)前添加ADTS头。这样,每个AAC数据块前都会有一个包含必要信息的ADTS头,使得播放器可以正确地识别和播放音频。

添加ADTS头后,原始的AAC数据块就成为了一个完整的ADTS帧。ADTS帧由ADTS头和随后的AAC音频数据组成。ADTS头的长度通常是固定的7或9字节,具体取决于是否包含CRC(循环冗余校验)信息。

3:AAC -ADTS帧组成

        AAC⾳频⽂件的每⼀帧由ADTS Header和AAC Audio Data组成。结构体如 下:

ADTS(Audio Data Transport Stream)头部信息是AAC音频文件中非常重要的一部分,它包含了音频流的元数据,例如采样率,声道,帧⻓度等等,使得解码器能够正确地解析和播放音频。ADTS头部信息通常由7个字节组成,分为两个部分:其⼀为固定头信息,紧接着是可变头信息

  1. adts_fixed_header()(固定头信息:这部分是每个ADTS帧都相同的信息,不随音频内容变化。它包含以下内容:

    • syncword(同步头):总是0xFFF(十六进制),用于识别ADTS帧的开始。
    • ID:表示MPEG的版本,0表示MPEG-4,1表示MPEG-2。
    • Layer:对于AAC来说,这个值总是'00',因为AAC属于MPEG-4的Layer 1。
    • protection_absent:表示是否有CRC(循环冗余校验)存在,1表示没有CRC,0表示有CRC。
    • profile:表示使用的AAC编码配置,如Low Complexity(LC)等。
  2. adts_variable_header()(可变头信息:这部分信息在不同的ADTS帧之间可能会变化,它包含以下内容:

    • sampling_frequency_index:采样率索引,用于查找具体的采样率值。
    • channel_configuration:声道配置,表示音频的声道数,如立体声、5.1声道等。
    • frame_length:ADTS帧的长度,包括ADTS头和AAC原始数据的长度。
    • adts_buffer_fullness:码率信息,用于指示码率是否可变。
    • number_of_raw_data_blocks_in_frame:表示ADTS帧中AAC原始数据块的数量。

ADTS头部的这种结构设计允许解码器快速获取音频流的关键信息,并能够从流中的任意位置开始解码,这使得AAC文件非常适合用于流媒体传输。

在具体实现中,解码器会首先读取固定头信息以确认遇到了一个ADTS帧,然后读取可变头信息以获取必要的解码参数。这样,解码器就可以正确地解析出音频数据并进行播放。

4:AAC-ADTS:(adts_fixed_header)格式介绍

如下图:

  • syncword(同步头):这个字段总是设置为0xFFF,它是一个12位的字段,用于标识ADTS帧的开始。这个同步字是固定的,所有ADTS帧的开始都是这个值,便于解码器识别帧的起始位置。

  • ID:这个字段占用1位,用于区分MPEG的版本。0表示MPEG-4,1表示MPEG-2。由于AAC通常是MPEG-4的一部分,所以这个值通常是0。

  • Layer:这个字段占用2位。对于AAC来说,由于AAC是MPEG-4的一部分,并且是Layer 1的编码,所以这个值总是'00'。

  • protection_absent:这个字段占用1位。它指示了帧中是否存在CRC(循环冗余校验)。如果设置为1,表示没有CRC,如果设置为0,表示存在CRC。CRC用于检测传输过程中的错误。注意这个值是1表示没有校验,0表示有校验

  • profile:这个字段占用2位,用于表示使用的AAC编码配置。例如,如果设置为01,表示使用的是Low Complexity(LC)配置。不同的配置对应不同的编码复杂度和性能。有些芯⽚只⽀持AAC LC 。

其中:

AAC标准定义了不同的Profile,每个Profile支持不同的特性和工具,以适应不同的应用场景和需求。在ADTS头信息中,"Profile"字段用于指示使用的AAC编码配置。

对于MPEG-2 AAC,存在几种不同的Profile,每种都有特定的Audio Object Type(AOT),这些类型定义了编码音频的特定特性。在MPEG-2 AAC中,Profile的值确实是根据AOT的值来确定的,具体规则是:

  • Profile的值等于Audio Object Type的值减去1。

在MPEG-4 AAC中,Profile的概念略有不同,并且包含更多的Profile类型以支持更广泛的应用。但是,基本的思想是相同的:Profile标识了编码器支持的功能集。

MPEG-4 AAC定义类型如下:

接下来看:

sampling_frequency_index:表示使⽤的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。sampling_frequency_index是一个索引值,它用于在一个预定义的采样频率表中查找对应的采样率。在MPEG标准中,这个表是固定的,并且包含了常用的音频采样频率。以下是这个索引表的一个示例:

在ADTS头信息中,sampling_frequency_index通常占用一个4位的字段。这意味着它可以表示从0到15的16个不同的采样频率索引值。根据这个索引值,解码器就可以知道音频数据的采样率是多少,从而正确地进行解码处理。

举个例子,如果sampling_frequency_index的值为3,根据上面的表,我们知道对应的采样率是48000 Hz。这样,解码器就可以按照48000次/秒的频率来重构音频信号。

接下来看:

channel_configuration:用于描述音频流的声道布局或声道数。这个字段对于解码器来说是重要的,因为它决定了音频信号是如何组织的,以及如何通过扬声器或耳机进行播放。

channel_configuration字段通常占用4位,因此可以表示从0到15的16种不同的配置。每种配置对应一种特定的声道布局,以下是一些常见的声道布局及其对应的channel_configuration值:

5:AAC-ADTS:(adts_variable_header)格式介绍

adts_variable_header是AAC音频流中ADTS(Audio Data Transport Stream)头部的可变部分。它提供了关于每个ADTS帧的额外信息,这些信息对于解码器来说是必要的,因为它们描述了音频数据的具体属性。以下是adts_variable_header()中包含的关键字段及其作用:

格式如下:

  1. frame_length: 这个字段占用13位,它定义了一个ADTS帧的总长度,包括ADTS头部和随后的AAC原始数据流。长度的计算方式如下:

    因此,aac_frame_length的计算公式是:

    • 如果protection_absent字段为1(表示没有CRC校验),ADTS头部长度为7字节。
    • 如果protection_absent字段为0(表示有CRC校验),ADTS头部长度为9字节。                                                                                                                               𝑎𝑎𝑐𝑓𝑟𝑎𝑚𝑒𝑙𝑒𝑛𝑔𝑡ℎ=(𝑝𝑟𝑜𝑡𝑒𝑐𝑡𝑖𝑜𝑛𝑎𝑏𝑠𝑒𝑛𝑡==1?7:9)+𝑠𝑖𝑧𝑒(𝐴𝐴𝐶𝐹𝑟𝑎𝑚𝑒)                                      aacf​ramel​ength=(protectiona​bsent==1?7:9)+size(AACFrame)                                         其中size(AACFrame)是AAC原始数据的长度。
  2. adts_buffer_fullness: 这个字段占用11位,表示编码缓冲区的填充度,它用于流式传输中的码率控制。如果这个值是0x7FF,它表示码流是码率可变的。

  3. number_of_raw_data_blocks_in_frame: 这个字段占用2位,表示在ADTS帧中AAC原始数据块的数量。值得注意的是,这个数值是AAC数据块的数量,而不是数据块之后的任何填充字节。因此,如果number_of_raw_data_blocks_in_frame的值为0,它表示ADTS帧中实际上有一个AAC数据块

示例:

第⼀帧的帧头7个字节为:0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC

  1. 0xFF: syncword的第一部分,表示ADTS帧的开始,固定为0xFFF。

  2. 0xF1: 包含ID(MPEG版本标识,这里为0表示MPEG-4)和Layer(这里为00,因为AAC是MPEG-4的一部分)。

  3. 0x4C: 包含protection_absent(这里为0,表示存在CRC校验)和profile(AAC编码配置,这里为01,表示Low Complexity,LC)。

  4. 0x40: 是sampling_frequency_index的一部分,表示采样率的索引。

  5. 0x20: 包含channel_configuration(声道配置)的一部分。

  6. 0xFF: frame_length的高字节。

  7. 0xFC: frame_length的低字节。

分开也就是:

111111111111
0
00
1
01
0011
0
001
0
0
0
0
0000100000111(帧长度)
11111111111
00

以下是对文档中二进制序列的简化解释:

  • 111111111111: 这是syncword的二进制表示,固定为0xFFF,用来标识ADTS帧的开始。
  • 0: 表示ID字段,这里为0,表示MPEG-4。
  • 00: 表示Layer字段,AAC属于MPEG-4 Layer 1,所以这里为00。
  • 1: 表示protection_absent字段,这里为1,表示没有CRC校验。
  • 01: 表示profile字段,这里可能表示AAC LC(Low Complexity)。
  • 0011: 表示sampling_frequency_index字段的一部分。
  • 0: 表示private_bit字段,通常为0。
  • 001: 表示channel_configuration字段的一部分。
  • 0000100000111: 表示frame_length字段,这是二进制形式的帧长度值。

我们可以计算frame_length

帧长度(二进制): 0000100000111

将这个二进制数转换为十进制:

帧长度(十进制): 2^9 + 2^6 + 2^3 + 2^2 + 2^0 = 512 + 64 + 8 + 4 + 1 = 263

所以,第一帧的ADTS帧长度是263个字节,包括7字节的ADTS头和256字节的AAC原始音频数据。这个帧长度包括了ADTS头部和随后的AAC原始数据流,不包括任何填充字节。

//帧长度为13位,使用unsignedint来存储帧长数值
unsigned int getAFrameLength(unsigned char* str) {// 函数开始,接收一个指向无符号字符的指针作为参数,用于计算帧的长度if (!str) {// 检查输入指针是否为空,如果为空则返回0return 0;}unsigned int tmplen = 0;// 声明一个无符号整数型变量tmplen,用于存储帧的长度int f_bit = str[3];int m_bit = str[4];int b_bit = str[5];// 声明三个整数型变量,分别用于存储输入数组中的第4、5、6个字节的值tmplen += (b_bit >> 5);// 将b_bit中的低3位取出,并将其加到tmplen中tmplen += (m_bit << 3);// 将m_bit中的所有位向左移动3位,并将其加到tmplen中tmplen += ((f_bit & 3) << 11);// 将f_bit中的低2位取出,然后将其向左移动11位,并将其加到tmplen中return tmplen;// 返回计算得到的帧长度
}

6:示例代码:

这段代码的主要功能是将一个媒体文件中的AAC音频流提取出来,并在每个AAC数据帧前添加ADTS头部,然后将这些帧写入到一个新的AAC文件中。代码使用了FFmpeg库中的函数来处理媒体文件和Packet。程序首先查找输入媒体文件中的最佳音频流,然后读取每个Packet,如果Packet属于音频流,则在前面添加一个ADTS头部,并将带有ADTS头部的Packet写入到输出文件中

#include <stdio.h>
#include <libavutil/log.h>
#include <libavformat/avio.h>
#include <libavformat/avformat.h>#define ADTS_HEADER_LEN  7; // ADTS头部长度定义为7字节// 采样频率数组,用于根据采样频率索引值查找具体的采样频率
const int sampling_frequencies[] = {96000,  // 0x088200,  // 0x164000,  // 0x248000,  // 0x344100,  // 0x432000,  // 0x524000,  // 0x622050,  // 0x716000,  // 0x812000,  // 0x911025,  // 0xa8000    // 0xb// 0xc d e f是保留的
};// 构建ADTS头部的函数
int adts_header(char * const p_adts_header, const int data_length,const int profile, const int samplerate,const int channels) {int sampling_frequency_index = 3; // 默认使用48000hz采样频率索引int adtsLen = data_length + 7; // ADTS帧总长度,包括AAC数据和ADTS头部// 查找采样频率对应的索引值for(int i = 0; i < sizeof(sampling_frequencies) / sizeof(sampling_frequencies[0]); i++) {if(sampling_frequencies[i] == samplerate) {sampling_frequency_index = i;break;}}if(i >= sizeof(sampling_frequencies) / sizeof(sampling_frequencies[0])) {printf("unsupport samplerate:%d\n", samplerate);return -1; // 如果没有找到对应的采样频率,返回错误}// 填充ADTS头部的固定字段p_adts_header[0] = 0xff; // syncword高8位p_adts_header[1] = 0xf0; // syncword低4位,MPEG版本(这里为MPEG-4 AAC),Layer(AAC是Layer 1)p_adts_header[1] |= (0 << 3);//1bitp_adts_header[1] |= (0 << 1);// 2bitsp_adts_header[1] |= 1; // protection_absent: 表示没有CRC校验// 1bits// 填充ADTS头部的可变字段p_adts_header[2] = (profile)<<6; // profile字段 // 2bitsp_adts_header[2] |= (sampling_frequency_index & 0x0f)<<2; // sampling_frequency_index字段  4bitsp_adts_header[2] |= (0 << 1); // private_bit: 保留位 1bitsp_adts_header[2] |= (channels & 0x04)>>2; // channel_configuration字段高1位p_adts_header[3] = (channels & 0x03)<<6; // channel_configuration字段低2位p_adts_header[3] |= (0 << 5); // original: 保留位 1bitp_adts_header[3] |= (0 << 4); // home: 保留位 1bitp_adts_header[3] |= (0 << 3); // copyright id bit: 保留位 1bitp_adts_header[3] |= (0 << 2); // copyright id start: 保留位 1bitp_adts_header[3] |= ((adtsLen & 0x1800) >> 11); // frame_length字段高2位p_adts_header[4] = (uint8_t)((adtsLen & 0x7f8) >> 3); // frame_length字段中间8位p_adts_header[5] = (uint8_t)((adtsLen & 0x7) << 5); // frame_length字段低3位p_adts_header[5] |= 0x1f; // buffer fullness: 0x7ff,表示码率可变p_adts_header[6] = 0xfc; // buffer fullness: 0x7ff剩余的6位return 0; // 成功返回0
}int main(int argc, char *argv[]) {// 检查参数数量if(argc < 3) {av_log(NULL, AV_LOG_DEBUG, "the count of parameters should be more than three!\n");return -1;}char *in_filename = argv[1]; // 输入文件路径char *aac_filename = argv[2]; // 输出文件路径FILE *aac_fd = fopen(aac_filename, "wb"); // 打开输出文件if (!aac_fd) {av_log(NULL, AV_LOG_DEBUG, "Could not open destination file %s\n", aac_filename);return -1;}// 设置FFmpeg日志级别av_log_set_level(AV_LOG_DEBUG);// 打开输入媒体文件AVFormatContext *ifmt_ctx = NULL;int ret = avformat_open_input(&ifmt_ctx, in_filename, NULL, NULL);if (ret < 0) {char errors[1024];av_strerror(ret, errors, 1024);av_log(NULL, AV_LOG_DEBUG, "Could not open source file: %s, %d(%s)\n", in_filename, ret, errors);fclose(aac_fd);return -1;}// 获取媒体流信息if (avformat_find_stream_info(ifmt_ctx, NULL) < 0) {char errors[1024];av_log(NULL, AV_LOG_DEBUG, "failed to find stream information\n");fclose(aac_fd);return -1;}// 打印媒体文件格式信息av_dump_format(ifmt_ctx, 0, in_filename, 0);// 寻找音频流的索引int audio_index = av_find_best_stream(ifmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0);if (audio_index < 0) {av_log(NULL, AV_LOG_DEBUG, "Could not find audio stream in input file %s\n", in_filename);goto failed;}// 打印AAC配置信息printf("audio profile:%d, FF_PROFILE_AAC_LOW:%d\n", ifmt_ctx->streams[audio_index]->codecpar->profile, FF_PROFILE_AAC_LOW);// 检查是否为AAC编码的音频流if (ifmt_ctx->streams[audio_index]->codecpar->codec_id != AV_CODEC_ID_AAC) {printf("the media file no contain AAC stream, it's codec_id is %d\n", ifmt_ctx->streams[audio_index]->codecpar->codec_id);goto failed;}AVPacket pkt;av_init_packet(&pkt); // 初始化Packet// 读取输入文件的Packet并写入AAC文件while (av_read_frame(ifmt_ctx, &pkt) >= 0) {if (pkt.stream_index == audio_index) {char adts_header_buf[7] = {0};// 调用函数生成ADTS头部adts_header(adts_header_buf, pkt.size,ifmt_ctx->streams[audio_index]->codecpar->profile,ifmt_ctx->streams[audio_index]->codecpar->sample_rate,ifmt_ctx->streams[audio_index]->codecpar->channels);// 写入ADTS头部fwrite(adts_header_buf, 1, 7, aac_fd);// 写入AAC数据int len = fwrite(pkt.data, 1, pkt.size, aac_fd);if (len != pkt.size) {av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n", len, pkt.size);}}av_packet_unref(&pkt); // 释放Packet资源}failed:// 关闭输入文件和输出文件if (ifmt_ctx) {avformat_close_input(&ifmt_ctx);}if (aac_fd) {fclose(aac_fd);}return 0; // 程序正常退出
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/10611.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言收尾 预处理相关知识

一. 预处理详解 1.1 预定义符号 FILE //进行编译的源文件LINE //文件当前的行号DATE //文件被编译的日期TIME //文件被编译的时间FUNCTION //文件当前所在的函数STDC //如果编译器遵循ANSI C标准&#xff0c;其值为1&#xff0c;否则未定义 这些预定义符号都是语言内置的 我们…

类和对象中篇

类的六个默认成员函数 如果一个类中什么成员都没有&#xff0c;简称为空类。空类中什么都没有吗&#xff1f;并不是的&#xff0c;任何一个类在我们不写的情况下&#xff0c;都会自动生成下面6个默认成员函数 ①初始化和清理&#xff1a;构造函数和析构函数 ②拷贝复制&#x…

Linux——信号量

什么是信号量&#xff1f; 信号量是用来用于同步和互斥的。其实就是一个计数器&#xff0c;进行PV操作&#xff0c;其中P操作就是让计数器–&#xff0c;V操作就是让计数器。 从物理上说明信号量的P、V操作的含义。 P(S)表示申请一个资源&#xff0c;S.value>0表示有资源可…

OBS插件--复合模糊

复合模糊 复合是一款滤镜插件&#xff0c;支持多种模糊类型和多种蒙版效果。支持模糊源的部分显示区域&#xff0c;可以反选区域进行模糊&#xff0c;这个功能对于场景部分区域需要遮盖非常实用。 下面截图演示下操作步骤&#xff1a; 首先&#xff0c;打开 OBS直播助手 在…

【Unity 鼠标输入检测】

Unity 鼠标输入检测 Unity提供了多种方法来检测和处理鼠标输入&#xff0c;允许开发者在游戏中实现对鼠标移动、点击和滚轮滚动的响应。以下是一些基本的鼠标输入检测方法&#xff1a; 1. Input.mousePosition 这个属性返回当前鼠标指针的屏幕坐标。坐标是以像素为单位的&…

【吊打面试官系列】Java高并发篇 - 同步方法和同步块,哪个是更好的选择?

大家好&#xff0c;我是锋哥。今天分享关于 【同步方法和同步块&#xff0c;哪个是更好的选择&#xff1f;】面试题&#xff0c;希望对大家有帮助&#xff1b; 同步方法和同步块&#xff0c;哪个是更好的选择&#xff1f; 同步块是更好的选择&#xff0c;因为它不会锁住整个对象…

临近空间相关概念

临近空间概念 距地 20KM-100KM 的临近空间位于内外层空间之中&#xff0c;也称为 超高空、近空间、亚轨道等。 特点就是&#xff1a;纵跨 非电离层和电离层、空气稀薄&#xff0c;存在 臭氧、紫外、辐射等特殊环境 存在 重力波、行星波、大气放电等特殊现象。 临近空间高速飞…

##15 探索高级数据增强技术以提高模型泛化能力

文章目录 前言数据增强的重要性常见的数据增强技术高级数据增强技术在PyTorch中实现数据增强结论 前言 在深度学习领域&#xff0c;数据增强是一种有效的技术&#xff0c;它可以通过在原始数据上应用一系列变换来生成新的训练样本&#xff0c;从而增加数据的多样性&#xff0c…

前端 | 易混词卡片切换

文章目录 &#x1f4da;实现效果&#x1f4da;模块实现解析&#x1f407;html&#x1f407;css&#x1f407;javascript &#x1f4da;实现效果 绘制单词卡片效果&#xff0c;实现点击左半部分上翻&#xff0c;点击右半部分下翻。 &#x1f4da;模块实现解析 &#x1f407;…

品鉴中的个人风格:如何形成自己与众不同的红酒品鉴体验

品鉴云仓酒庄雷盛红酒不仅是一种感官体验&#xff0c;更是一种个人风格的展现。每个人都有自己与众不同的品味和偏好&#xff0c;通过品鉴红酒&#xff0c;我们可以形成自己与众不同的红酒品鉴体验。 要形成自己与众不同的红酒品鉴体验&#xff0c;首先需要勇于尝试不同类型的红…

C++语法之在谈const与模版参数

最近一直在复习C的语法&#xff0c;感觉遇到了不少问题&#xff0c;或许是之前没想的这么深。废话不说&#xff0c;开始说正事。 一、再谈const 有些朋友可能有些疑问&#xff0c;不就是const吗&#xff1f;我知道&#xff0c;const可以给非const赋值&#xff0c;反过来不行&…

通过mvn archetype 创建一个spring boot start 工程

mvn archetype https://maven.apache.org/archetype/index.html 遇到的问题 对于想自定义一个spring-boot-start的同学,比如 Springboot自定义Starter启动器 整个过程很繁琐。 定义属性开关增加 spring boot test start插件定义自动装载 spring.factories or org.springfra…

javax.net.ssl.SSLException: Received fatal alert: protocol_version已经解决

起因&#xff1a; 在帮别人讲解项目时&#xff0c;将项目的tomcat配置完&#xff0c;点击运行后&#xff0c;报错&#xff0c;信息如标题。 解决办法&#xff1a; 在csdn百度问题&#xff0c;得到的方法主要有几个&#xff1a; 1.jdk要配置在1.8以上&#xff1b; 2.数据库地…

Stable Diffusion是什么?

目录 一、Stable Diffusion是什么&#xff1f; 二、Stable Diffusion的基本原理 三、Stable Diffusion有哪些运用领域&#xff1f; 一、Stable Diffusion是什么&#xff1f; Stable Diffusion是一个先进的人工智能图像生成模型&#xff0c;它能够根据文本描述创造出高质量的图…

信息检索(36):ConTextual Masked Auto-Encoder for Dense Passage Retrieval

ConTextual Masked Auto-Encoder for Dense Passage Retrieval 标题摘要1 引言2 相关工作3 方法3.1 初步&#xff1a;屏蔽自动编码3.2 CoT-MAE&#xff1a;上下文屏蔽自动编码器3.3 密集通道检索的微调 4 实验4.1 预训练4.2 微调4.3 主要结果 5 分析5.1 与蒸馏检索器的比较5.2 …

网络运维故障排错思路!!!!!(稳了!!!)

1 网络排错的必备条件 为什么要先讲必备条件&#xff1f;因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上&#xff0c;而是一套系统的方法&#xff0c;如果没有这些条件&#xff0c;我真的不能保证下面讲的这些你可以听得懂&#xff0c;并且能运用到实际当中&a…

Unity值类型和引用类型

我们都知道C#编程语言中&#xff0c;数据类型被分为了两种&#xff1a; 值类型引用类型 那么什么是值类型&#xff1f;什么是引用类型呢&#xff1f;它们的区别又是什么&#xff1f; 为了搞清楚这些问题&#xff0c;我们先列举一下我们开发中会碰到的值类型和引用类型。 常…

【AI+老照片焕新】母亲节用AI把时间的印记变成暖心礼物

想念是一张泛黄的照片&#xff0c;藏在抽屉里的笑容&#xff0c;总是那么亲切。今天是母亲节&#xff0c;是不是想给妈妈来点不一样的惊喜&#xff1f;用AI技术&#xff0c;把那些老照片瞬间焕新&#xff0c;让妈妈的青春记忆重放光华&#xff01; 想象一下&#xff0c;妈妈年…

如何根据招聘信息打造完美简历

如何根据招聘信息打造完美简历 招聘信息分析简历调整策略个性化与关键词结语 在求职过程中&#xff0c;简历是第一块敲门砖。它不仅展示了你的专业技能和工作经验&#xff0c;还体现了你对所申请职位的理解和热情。然而&#xff0c;如何从招聘信息中提炼关键点&#xff0c;打造…

scrapy的入门

今天我们先学习一下scrapy的入门,Scrapy是一个快速的高层次的网页爬取和网页抓取框架&#xff0c;用于爬取网站并从页面中提取结构化的数据。 1. scrapy的概念和流程 1.1 scrapy的概念 我们先来了解一下scrapy的概念,什么是scrapy: Scrapy是一个Python编写的开源网络爬虫框架…