复制粘贴(Ctrl+C/V)作为现代打工人日常办公的必备生存技能,想必大家都非常熟悉。但你知道吗,其实SSD自身也能进行这个非常实用的操作。可能有的读者要说了:这有什么稀奇,复制粘贴这么简单的功能,能实现不是很正常吗?这句话对,但也不完全正确,其中原因,正是我们今天介绍的主角:Copy Command。
功能介绍
当数据需要生成一个独立副本时,复制粘贴往往是最直接的处理方式,具象到存储设备来说,就是一次A地址读取+B地址写入的组合动作,简单来说也是Copy Command的含义。可就是这样一套看似简单的操作,为什么直到NVMe 2.0才被推出呢?在这之前,相应功能又要怎么去实现呢?
其实,Copy Command的重点并不在于它所实现的最终结果,而在于它实现方式的差异。在规范推出这个命令之前,Copy功能的实现其实是由Host“手动操作”的。简单说,就是Host在自己的Buffer(如电脑的内存)留出一定空间,然后先从源数据地址读取数据内容到Host Buffer,再从Host Buffer搬移到目标地址中去。其流程如下图所示:
然而就是这几步看似不起眼的操作,却涵盖了很多不必要的开销,这就好比我从上海出发前往苏州,但却不得不先绕道北京,然后再前往苏州,整个过程中多余的路程都是没有必要的资源浪费。而当这种开销被规模放大后,就会对体验带来不利影响。
相比较,Copy Command就简单了很多,Host只需要把Command发给SSD Controller,后续事情便不再需要Host参与,全部交由SSD执行,直接省略了在前端接口进行“内耗”的所有过程。它和DMA(Direct Memory Access)有着异曲同工之妙,无需Host亲自下场,只需给出数据搬移的参数和命令,便可以去执行其它事情。当Copy完成后,SSD Controller会把Command Status回传Host来告知成功与否。
如上图所示,当使用Copy Command命令后,整个操作简洁了很多,我们也终于可以直接“从上海前往苏州”了。接下来,我们一起看看协议细节。
协议细节和释义
根据协议定义,Copy Command可以从多个不连续的源数据逻辑地址范围拷贝数据,但是目标地址必须是能够容纳总拷贝数据量的一段连续的逻辑地址范围。同时,Copy Command目前只支持在同一个命名空间内进行数据拷贝。
每一段源数据在拷贝到目标LBA中时,其排布顺序应和源数据实例列表中的先后顺序保持一致,如下图所示,Range 0中的数据应从目标LBA地址的起始地址开始写入,Range 1中的数据则需要紧邻Range 0。拷贝操作中,读和写操作可以顺序执行,也可以并行执行。
如果使用Copy Command所在的命名空间启用了“端到端数据保护”功能,则在命令的读/写操作过程中,都会使用保护信息进行处理。其处理方式和常规读/写完全相同,示意流程如下,在此不做展开。
如果Copy Command中的读操作试图访问一个未分配或者未写入的逻辑块,则命令可以选择反馈该情况并终止操作,或读取全0x00/0xFF值以及相应的保护信息。
当命令完成时,控制器会把指明命令完成状态的完成队列实例发送到相关联的I/O完成队列中去。如果命令完成失败,则完成队列实例的Dword 0将会显示编号最小的拷贝失败的源数据范围实例。
字段释义
控制器应当在Identify Controller data structure(控制器认证数据结构)的Copy Descriptor Formats Supported(拷贝描述符格式支持)字段指明自己所支持的Source Range Entries Descriptor formats(源数据范围实例描述符格式)。
Copy Command所提供的信息,其实是一串用于记录单个或多个需要被复制的源数据的LBA范围列表,它们一起描述了哪些数据需要被写入到以SDLBA作为起始地址的目标LBA范围。Copy Command主要涉及到Command Dword 2,3,10,11,12,13,14,15等字段。
**Dword 2、Dword 3和Dword 14:**它们共同指定了可变长度的Logical Block Storage Tag (LBST)以及Initial Logical Block Reference Tag (ILBRT),它们在拷贝操作的写入操作阶段会派上用场。如果命名空间在格式化时没有启用“端到端信息保护”功能,则这些字段的内容将被控制器忽略。
**Dword 10和Dword 11:**这两个字段组合构成了一个64-Bit的地址,该地址指定了拷贝操作写入时所使用的目标逻辑地址的起始地址,即Starting Destination LBA (SDLBA)。
**Dword 12:**规定了Copy Command执行过程中所涉及的数据校验等内容。如端到端数据保护PI的校验;控制器在发送Copy命令完成前,应确保Data与Metadata均已经写入到NVM(非易失存储介质)中等等。需要指出的是,如果命名空间被格式化为带有16b Guard保护信息,则一个Copy Command中可以存在最多128条需要拷贝的源数据LBA范围;如果命名空间被格式化为带有32b或64b Guard保护信息,需要拷贝的源数据LBA范围数量则减少至102条。
此外,对于Copy Command,它的一些字段值还会受到Identify Namespace data structure(命名空间认证数据结构)中相关字段的限制。如单个源数据的最大长度(Maximum Single Source Range Length,MSSRL),单个Copy Command可以拷贝的最大数据量(Maximum Copy Length,MCL),单个Copy Command支持的拷贝的最大源数据的数量(Maximum Source Range Count,MSRC)。如果任何一个上述字段对应的命令参数大于允许的最大值,则Copy Command需要以“超出命令大小限制”作为命令返回状态码被终止。一些其它可能存在的错误状态信息,如PI校验失败、写入目标地址是只读属性等等。
总体而言,对于同一个命名空间内的数据搬移操作,使用新的NVMe Copy Command显然有着巨大的效率优势。尽管该命令目前还不能跨命名空间乃至跨硬盘使用,但我们相信,随着未来闪存技术的持续发展,定会有更多更加好用的功能推出,现有功能也将得到进一步完善与加强。
我们也将在PBlaze7 7940系列企业级PCIe 5.0 SSD上面首次搭载该技术,让高性能NVMe SSD的潜力得到进一步释放,持续优化用户的使用体验,提高生产效率,为客户创造更高价值!