PCIE协议-1

1. PCIe结构拓扑

一个结构由点对点的链路组成,这些链路将一组组件互相连接 - 图1-2展示了一个结构拓扑示例。该图展示了一个称为层级结构的单一结构实例,由一个根复合体(Root Complex, RC)、多个端点(I/O设备)、一个交换机以及一个PCI Express到PCI/PCI-X桥接器组成,所有这些都通过PCI Express链路互相连接。

1.1 根复合体

  • 根复合体(RC)表示输入/输出(I/O)层级结构的根,它连接了CPU/内存子系统和I/O。如图1-2所示,一个RC可能支持一个或多个PCI Express端口。每个接口定义了一个单独的层级域。每个层级域可能由单个端点组成,或者包含一个或多个交换机组件和端点的子层级结构。
  • 通过RC在层级域之间路由对等事务的能力是可选的,并且取决于具体实现。例如,一个实现可能在根复合体内部整合一个真实或虚拟的交换机,以软件透明的方式启用完整的对等支持。与交换机的规则不同,RC通常被允许在层级域之间路由对等事务时将数据包分割成更小的数据包(如下所述例外),例如,将一个具有256字节有效载荷的单个数据包分割成两个各具有128字节有效载荷的数据包。由此产生的数据包将受到本规范中包含的数据包形成规则的约束(例如,Max_Payload_Size(最大有效载荷大小)、Read Completion Boundary(读完成边界,RCB)等)。组件设计者应注意,将数据包分割成更小的数据包可能会带来负面的性能影响,特别是对于寻址PCI Express到PCI/PCI-X桥接器后面设备的事务。
  • 例外:支持对等路由Vendor_Defined Messages(供应商定义消息)的RC不得将Vendor_Defined Message数据包分割成小于128字节边界的小包,除非在128字节边界处(即,除了最后一个数据包外,所有生成的数据包的长度必须是128字节的整数倍),以保持跨PCI Express到PCI/PCI-X桥接器转发消息的能力。
  • RC必须作为请求者支持生成配置请求。
  • 允许RC作为请求者支持生成I/O请求。
  • 允许RC向选定的根端口生成到地址80h和84h I/O请求,而不考虑该根端口的PCI桥I/O解码配置;建议仅在特别需要时才启用此机制。
  • RC作为完成者不允许支持锁定语义。
  • RC作为请求者允许支持生成锁定请求。

1.2 端点

端点指的是一种可以作为PCI Express事务的请求者或完成者的功能,它可以代表自己,也可以代表一个不同的非PCI Express设备(除了PCI设备或主机CPU之外),例如,一个连接PCI Express的GPU controller或一个PCI Express到USB的host controller。端点被分类为传统型、PCI Express型,或根复合体集成端点(RCiEPs)。

1.2.1 传统端点规则

  • 传统端点必须是一个具有type0配置空间头标的功能。
  • 传统端点作为完成者必须支持配置请求。
  • 传统端点作为完成者可以支持I/O请求。

              ---允许传统端点接收到地址80h和84h的I/O请求,而不考虑该端点的I/O解码配置。

  • 传统端点可以生成I/O请求。
  • 如果设备的支持该需求的传统软件要求,传统端点可以作为完成者支持锁定内存语义。
  • 传统端点不得发出锁定请求。
  • 传统端点可以实现扩展配置空间能力,但软件可能会忽略这些能力。
  • 作为内存事务请求者运行的传统端点不要求能够生成4GB或更大的地址。
  • 如果请求中断资源,传统端点需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现了MSI,传统端点可以支持MSI能力结构的32位或64位消息地址版本。
  • 传统端点支持为请求内存资源的基地址寄存器(BAR)32位寻址。
  • 传统端点必须出现在由根复合体(Root Complex)发起的层级域之一中。

1.2.2 PCI Express端点规则

  • PCI Express端点必须是一个具有type0配置空间头标的功能。
  • PCI Express端点作为完成者必须支持配置请求。
  • PCI Express端点不能依赖操作系统通过基址寄存器(BAR)声明的I/O资源分配。
  • PCI Express端点不得生成I/O请求
  • PCI Express端点作为完成者不得支持锁定请求,也不得作为请求者生成锁定请求。符合PCI Express标准的软件驱动程序和应用程序必须根据该要求编写,以防止在访问PCI Express端点时使用锁定语义。
  • 作为内存事务请求者运行的PCI Express端点要求能够生成大于4GB的地址。
  • 如果请求中断资源,PCI Express端点需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现MSI,PCI Express端点必须支持MSI能力结构的64位消息地址版本。
  • 通过BAR请求内存资源的PCI Express端点必须设置BAR的可预取位,除非该范围包含具有读取副作用的位置,或者该功能在该位置不容忍写合并。
  • 对于设置了可预取位的所有BAR,PCI Express端点必须支持64位寻址。对于所有没有设置可预取位的BAR,允许使用32位寻址。
  • BAR请求的最小内存地址范围是128字节
  • PCI Express端点必须出现在根复合体发起的层级域之一中。

1.2.3 根复合体集成端点规则

  • 根复合体集成端点(RCiEP)是在包含根端口的根复合体的内部逻辑上实现的。
  • RCiEP必须是一个具有类型type0配置空间头标的功能。
  • RCiEP作为完成者必须支持配置请求。
  • RCiEP不得通过基址寄存器(BAR)声明要求I/O资源
  • RCiEP不得生成I/O请求
  • RCiEP不得作为完成者支持锁定请求,也不得作为请求者生成它们。符合PCI Express标准的软件驱动程序和应用程序必须编写,以防止在访问RCiEP时使用锁定语义。
  • 作为内存事务请求者运行的RCiEP需要能够生成等于或大于主机作为完成者能够处理的地址。
  • 如果请求中断资源,RCiEP需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现了MSI,RCiEP可以支持MSI能力结构的32位或64位消息地址版本。
  • RCiEP可以支持通过基址寄存器请求内存资源的32位寻址。

1.3 Switch

Switch被定义为多个虚拟PCI到PCI桥接设备的逻辑集合,如图1-3所示。所有Switch都遵循以下基本规则:

  • Switch在配置软件中表现为两个或更多的逻辑PCI至PCI桥接。
  • Switch使用PCI桥接机制转发事务;例如,基于地址的路由。
  • 除了本文档中注明的例外情况,一个Switch必须能够在任何一组端口之间转发所有类型的事务层数据包(TLPs)。

  • 锁定请求必须按照第6.5节中的规定得到支持。Switch不必支持下游端口作为锁定请求的发起端口。
  • 每个启用的Switch端口必须遵守本文档中所述的流量控制规范。
  • Switch不允许将一个数据包分割成更小的数据包,例如,一个具有256字节有效载荷的单个数据包不得被分成两个各128字节有效载荷的数据包。
  • 在Switch的入口端口(入站链路)之间进行仲裁时,可以在同一个虚拟通道上发生争用时使用轮询或加权轮询。
  • 端点(由type0配置空间头标表示)在Switch的内部总线上,作为虚拟PCI至PCI桥接的对等体,必须不出现在配置软件中,这些虚拟桥接代表Switch的下游端口。

1.4 根复合体事件收集器

  • 根复合体事件收集器提供支持,用于终止来自RCiEPs(根复合体集成端点)的错误和PME(电源管理事件)消息。
  • 根复合体事件收集器必须遵循所有RCiEP的规则。
  • 根复合体事件收集器不需要解码任何内存或I/O资源。
  • 根复合体事件收集器通过其设备/端口类型值被识别。
  • 根复合体事件收集器具有基类08h、子类07h和编程接口00h。
  • 根复合体事件收集器位于根复合体中的总线上。允许多个根复合体事件收集器位于单个总线上。
  • 根复合体事件收集器通过根复合体事件收集器端点关联扩展功能明确声明支持的RCiEPs。
  • 根复合体事件收集器是可选的。

1.5 PCI Express到PCI/PCI-X桥接器

  • PCI Express到PCI/PCI-X桥接器提供PCI Express结构和PCI/PCI-X层级之间的连接。

2. 发现、配置和操作的硬/软件模型

PCI/PCIe硬件/软件模型包括了架构构建,这些构建对于发现、配置和使用一个功能(Function)是必要的,而不需要特定于功能的知识。关键要素包括:

  • 一个配置模型,它为系统软件提供了一种手段,用以发现系统中可用的硬件功能。
  • 执行基本资源分配的机制,用于可寻址资源,如内存空间和中断。
  • 启用/禁用控制,用于功能对接收请求的响应,以及发起请求。
  • 定义良好的排序和流量控制模型,以支持硬件/软件接口的一致和健壮实现(健壮指的是容错性,稳定性,可靠性,可维护性,可扩展性好)。

PCI Express配置模型支持两种机制:

  • PCI兼容配置机制:PCI兼容机制支持与传统PCI感知操作系统及其相应的总线枚举和配置软件100%的二进制兼容性。

  • PCI Express增强配置机制:提供增强机制是为了增加可用配置空间的大小,并优化访问机制。

每个PCI Express(PCIe)链路都通过一个虚拟的PCI到PCI桥接结构映射,并且与一个逻辑的PCI总线相关联。这个虚拟的PCI到PCI桥接结构可能是PCI Express根复杂端口的一部分,一个Switch上行端口,或者一个Switch下行端口。根端口是一个虚拟的PCI到PCI桥接结构,它从一个PCI Express根复合体开始一个PCI Express层次结构域。设备被映射到配置空间中,以便每个设备都会响应特定的设备编号。

3.PCI Express分层概述

本文档根据三个独立的逻辑层次来指定架构:事务层、数据链路层和物理层。每一层都分为两个部分:一个处理外发(待传输)信息的部分,以及一个处理内入(已接收)信息的部分,如图1-4所示。

这种分层定义的基本目标是促进读者对规范的理解。请注意,这种分层并不意味着特定的PCI Express实现。

PCI Express 使用数据包来在组件之间通信。数据包在事务层和数据链路层中形成,携带信息从发送组件传输到接收组件。随着传输的数据包流经其他层,它们会根据这些层处理数据包所需的额外信息进行扩展。在接收端,会发生相反的过程,数据包从它们的物理层表示形式转换为数据链路层表示形式,最终(对于事务层数据包)转换为可以由接收设备的事务层处理的形式。图 1-5 显示了事务级数据包信息通过各层的概念性流程。 

注意,为了链路管理的目的,两个数据链路层(连接到同一链路)之间支持一种更简单的数据包通信形式。 

3.1 事务层

架构的上层是事务层。事务层的主要职责是组装和拆解事务层数据包(TLPs)。TLPs 用于通信事务,例如读写以及某些类型的事件。事务层还负责管理基于信用的TLPs流量控制。

每个需要响应数据包的请求数据包都实现为分割事务。每个数据包都有一个唯一的标识符,使得响应数据包能够被正确地导向正确的发起者。数据包格式支持根据不同事务类型(内存、I/O、配置和消息)的不同寻址形式。数据包还可能具有诸如无监听(No Snoop)、松散排序(Relaxed Ordering)和基于ID的排序(ID-Based Ordering,IDO)等属性。

事务层支持四种地址空间:它包括三个PCI地址空间(内存、I/O和配置),并增加了消息空间。本规范使用消息空间来支持所有先前的边带信号,例如中断、电源管理请求等,作为带内消息事务。你可以将PCI Express消息事务视为“虚拟线”,因为它们的效果是消除了目前在平台实现中使用的广泛边带信号。

3.2 数据链路层

架构中的中间层是数据链路层,充当事务层和物理层之间的中间媒介。数据链路层的主要职责包括链路管理和数据完整性,包括错误检测和错误校正。

数据链路层的传输端接受事务层组装的TLPs,计算并应用数据保护代码和TLP序列号,并将它们提交给物理层以在链路上传输。 接收数据链路层负责检查接收到的TLPs的完整性,并将它们提交给事务层进行进一步处理。在检测到TLP错误时,这一层负责请求重新传输TLPs,直到信息被正确接收,或确定链路已失败。

数据链路层还生成并消耗用于链路管理功能的包。为了区分事务层(TLP)使用的包,当提到在数据链路层生成和消耗的包时,将使用“数据链路层包(DLLP)”这个术语。

3.3 物理层

物理层包括所有用于接口操作的电路,包括驱动器和输入缓冲器、并行到串行和串行到并行转换、PLL(相位锁定环)和阻抗匹配电路。它还包括与接口初始化和维护相关的逻辑功能。物理层以特定于实现的格式与数据链路层交换信息。这一层负责将从数据链路层接收到的信息转换为适当的串行格式,并以与连接在链路另一端的设备兼容的频率和宽度通过PCI Express链路传输。

PCI Express架构有“钩子”来支持通过速度升级和先进的编码技术来支持未来的性能提升。未来的速率、编码技术或介质可能只影响物理层。

3.4 层功能和服务

3.4.1 事务层服务

在生成和接收事务层数据包(TLPs)的过程中,事务层与其在链路另一端的互补事务层交换流量控制信息。它还负责支持软件和硬件发起的电源管理。

初始化和配置功能要求事务层:

  • 存储由处理器或管理设备生成的链路配置信息
  • 存储由物理层硬件协商生成的链路能力,包括宽度和操作频率

事务层的数据包生成和处理服务要求它:

  • 从设备的核心应用层请求生成TLPs
  • 将接收到的请求TLPs转换为设备核心应用层的请求
  • 将接收到的完成数据包转换为有效载荷或状态信息,可交付给核心应用层
  • 检测不支持的TLPs并调用适当的机制来处理它们
  • 如果支持端到端数据完整性,生成端到端数据完整性CRC(ECRC)并相应更新TLP头标

流量控制服务:

  • 事务层跟踪跨链路的TLPs流控制信用量。
  • 事务信用状态定期使用数据链路层的传输服务传输给远程事务层。
  • 远程流量控制信息用于控制TLP传输。

排序规则:

  • 符合PCI/PCI-X兼容的生产者/消费者排序模型
  • 支持松散排序的扩展
  • 支持基于ID排序的扩展

电源管理服务:

  • 通过系统软件指定的机制进行软件控制的电源管理。
  • 硬件控制的自主电源管理在全速电源状态下最小化功耗。

虚拟通道和流量类别:

  • 提供虚拟通道机制(VC)和流量类别(TC)识别的组合,以支持不同服务和对某些类别应用程序的QoS(服务质量)支持。
  • 虚通道:虚通道提供了一种手段,通过链路的共同物理资源支持多个独立的逻辑数据流。从概念上讲,这涉及将不同的数据流多路复用到单个物理链路上。
  • 流量类别:流量类别是事务层数据包的一个标签,它在通过整个结构时未经修改地端到端传输。在结构内的每个服务点(例如,Switch)上,流量类别标签被用来应用合适的服务策略。每个流量类别标签定义了一个独特的排序域——对于包含不同流量类别标签的数据包,不提供排序保证。

3.4.2 数据链路层服务

数据链路层负责与链路对面的对应方可靠地交换信息。

初始化和电源管理服务:

  • 接受来自事务层的电源状态请求并传达给物理层
  • 向事务层传达 激活/重置/断开连接/电源管理状态

数据保护、错误检查和重试服务:

  • CRC(循环冗余校验)生成
  • 用于数据链路层级重试的传输TLP存储
  • 错误检查
  • TLP确认和重试消息
  • 错误指示用于错误报告和记录

3.4.3 物理层服务

接口初始化、维护控制和状态跟踪:

  • 重置/热插拔控制/状态
  • 接口电源管理
  • 宽度和通道映射协调
  • 通道极性反转

符号和特殊有序集生成:

  • 8b/10b 编码/解码
  • 内嵌时钟调整和对齐

符号传输和对齐:

  • 传输电路
  • 接收电路
  • 接收端的弹性缓冲器
  • 接收端多通道去偏差(对于宽度 > 1)

系统可测试性(DFT)支持特性:

  • 合规模式
  • 修改的合规测试

3.4.4 层间接口

3.4.4.1 事务层/数据链路层接口

事务层到数据链路层接口提供:

  • 要通过链路发送的字节或多字节数据
  1. 本地TLP(事务层数据包)传输握手机制
  2. TLP边界信息
  • 链路请求的电源状态

数据链路层到事务接口提供:

  • 从PCI Express链路接收的字节或多字节数据
  • 接收字节的TLP帧信息
  • 链路的实际电源状态
  • 链路状态信息
3.4.4.2 数据链路层/物理层接口

数据链路层到物理接口层提供:

  • 要通过链路发送的字节或多字节宽数据
  1. 数据传输握手机制
  2. 字节的TLP(事务层数据包)和DLLP(数据链路层数据包)边界信息
  • 链路请求的电源状态

物理层到数据链路层接口提供:

  • 从PCI Express链路接收的字节或多字节宽数据
  • 数据的TLP和DLLP帧信息
  • 物理层检测到的错误指示
  • 链路的实际电源状态
  • 连接状态信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/7519.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu20部署3d高斯

3d高斯的链接:https://github.com/graphdeco-inria/gaussian-splatting 系统环境 ubuntu20的系统环境,打算只运行训练的代码,而不去进行麻烦的可视化,可视化直接在windows上用他们预编译好的exe去可视化。(因为看的很…

暗区突围pc端资格发放了吗 暗区突围pc测试资格怎么获取

暗区突围pc端资格发放了吗 暗区突围pc测试资格怎么获取 暗区突围是一款很火爆的第一人称射击网游,现在终于要上线PC端啦!小伙伴们是不是已经迫不及待想要体验电脑上的硬核射击快感了?暗区突围pc端资格已经陆续发放,想要参与PC端…

TC8002D 是一颗带关断模式的音频功放IC

一、一般概述 TC8002D是一颗带关断模式的音频功放IC。在5V输入电压下工作时,负载(3Ω)上的平均功率 为3 W,且失真度不超过10%。而对于手提设备而言,当VDD作用于关断端时,TC8002D将会进入关断模式,此时的功耗极…

探索淘宝API接口对接(属性规格丨sku价格丨详情图丨优惠券等):打造智能电商解决方案

一、引言 随着电子商务的快速发展,越来越多的企业和开发者希望通过自动化和智能化的方式接入电商平台,以实现更高效的数据交互和业务流程。淘宝作为中国最大的电商平台之一,其提供的API接口成为了众多企业和开发者关注的焦点。本文将探讨淘宝…

【spring】Bean的生命周期回调函数和Bean的循环依赖

目录 1、Bean的生命周期 2、Bean的生命周期回调函数 2.1、初始化的生命周期回调 2.2、销毁的生命周期回调 3、Bean的循环依赖 1、Bean的生命周期 spring的bean的生命周期主要是创建bean的过程,一个bean的生命周期主要是4个步骤:实例化,…

视频剪辑图文实例:一键操作,轻松实现视频批量片头片尾减时

视频剪辑是现代媒体制作中不可或缺的一环,而批量处理视频更是许多专业人士和爱好者的常见需求。在剪辑过程中,调整视频的片头片尾时长可以显著提升视频的质量和观感。本文将通过图文实例的方式,向您展示如何一键操作,轻松实现视频…

直播录屏怎么录?分享3种方法

随着网络直播的兴起,直播录屏已成为众多网友记录精彩瞬间、分享有趣内容的重要工具。直播录屏不仅能帮助我们回顾和保存直播中的精彩片段,还能为创作者提供更多的素材和灵感。 本文将为大家介绍3种直播录屏的方法,帮助大家能够更好地利用这一…

【IEEE独立出版|往届均已成功检索】ISPDS 2024诚邀投稿参会

第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024) 2024 5th International Conference on Information Science, Parallel and Distributed Systems 2024年5月31-6月2日 | 中国广州NEWS:会议已在格林威治大学官网上线会议已经上线到…

学术咸鱼入门指南(2)

巧用思维导图阅读文献 化整为零:读文献,从拆分文章的结构开始 大家在初步接触自己学科的论文时,要了解清楚基本的范式,日后读起来就比较顺了。 科研论文的第一部分,是文章的标题,摘要和关键词&#xff0…

【MySQL】连接查询(JOIN 关键字)—— 图文详解:内连接、外连接、左连接、左外连接、右连接、右外连接

文章目录 连接查询驱动表连接查询分类 内连接(INNER JOIN)内连接 —— 等值连接内连接 —— 自然连接(NATURAL JOIN)内连接 —— 交叉连接(笛卡尔积) 外连接(OUTER JOIN)外连接 ——…

nodejs里面的 http 模块介绍和使用

Node.js的HTTP模块是一个核心模块,它提供了很多功能来创建HTTP服务器和发送HTTP请求。 http.Server是一个基于事件的http服务器,内部是由c实现的,接口是由JavaScript封装。 http.request是一个http客户端工具。 用户向服务器发送数据。 创…

嵌入式RTOS面试题目

用过哪些嵌入式操作系统?使⽤RTOS和裸机代码开发有什么区别(优缺点)? 之前的⼀个项⽬是采⽤裸机代码开发的,写起来还⾏,通过状态机来管理业务逻辑和各种外设。 但是随着外设的增加,任务之间的…

CSDN我的创作纪念日128天||不忘初心|努力上进|勇往直前

机缘 Hello,大家好,我是景天,其实很早之前我就加入到了CSND的大军,但那是我还是个小白,经常回来CSND汲取养料,就这样慢慢的来提升自己,强大自己。经过多年的学习,积累与总结&#x…

Davinci工程开发方法论

基本概念 Flash Driver是下载到RAM里面的bin文件 Boot Manager是ROM上启动运行的第一个实例,可以是独立的bin文件,可以是集成在FBL里面。 Bootloader存储在ROM里面的bin文件 Demo Appl一个示例模板,用来跳转到Bootloader的,也是一…

本地的git仓库和远程仓库

文章目录 1. 远程创建仓库2. 关联远程和本地代码3. 推送本地分支到远程 1. 远程创建仓库 2. 关联远程和本地代码 上面创建完后会得到一个git仓库的链接,有SSH或者http的 http://gitlab.xxxxx.local:18080/xxxxx/dvr_avm.git ssh://gitgitlab.xxxxx.local:10022/xx…

220V转18V500mA非隔离恒压WT5113

220V转18V500mA非隔离恒压WT5113 亲爱的朋友们,你们是否在为如何提高电源方案而烦恼呢?今天我给大家带来了一款芯片,WT5113宽输出范围非隔离交直流转换芯片,它可是电源方案中的得力助手哦! 这款芯片拥有220V降12V、2…

Mujoco210和Mujoco-py在 Ubuntu22.04 下的安装

mujoco和mujoco-py的关系:mujoco是一个物理引擎,主要应用于强化学习和最优化控制领域。mujoco-py是mujoco编程的 Python 接口,由OpenAI Gym开发,可以使用mujoco_py方便地调用mujoco的API。 mujoco官网: https://mujoco…

国产中间件概述

1、什么是中间件? 1.1、基本概念 定义:中间件,英文名为 Middleware,是独立的系统级软件,连接操作系统层和应用程序层,将不同操作系统提供应用的接口标准化、协议统一化,屏蔽具体操作的细节。位置:居于各类应用与操作系统之间,在操作系统、网络和数据库之上,应用软件…

Linux(openEuler、CentOS8)企业内网主备DNS服务器搭建

本实验环境为openEuler系统<以server方式安装>&#xff08;CentOS类似&#xff0c;可参考本文&#xff09; 知识点 什么是DNS&#xff1a;DNS服务器&#xff0c;即域名服务器&#xff08;Domain Name Server&#xff09;&#xff0c;是进行域名和与之相对应的IP地址转换…

24年最新AI数字人简单混剪

24年最新AI数字人简单混剪 网盘自动获取 链接&#xff1a;https://pan.baidu.com/s/1lpzKPim76qettahxvxtjaQ?pwd0b8x 提取码&#xff1a;0b8x