CHI dataless 传输——CHI(4)

上篇介绍了read的操作类型,本篇我们来介绍一下dataless

目录

一、dataless操作概览

二、Non-CMO (Non-Cache Maintenance Operation)

1、CleanUnique

2、StashOnce and StashOnceSep

3、Evict

三、CMO (Cache Maintenance Operation)


一、dataless操作概览

名称(non-CMO)

描述

CleanUnique

snoopable地址区域的请求,将Requestercache line状态更改为“Unique”,以便对该cache line执行写操作。对其他的mastercache clean,并且invalid,其他cache line dirty的数据需要写入main memory

MakeUnique

CleanUnique,但是dirty cacheline直接丢弃。

Evict

用于告诉ICN,该RN-F不再缓存这个cacheline(类似于CPU知会HNF某一条cacheline已经被逐出了,本地已经没有了)

StashOnceUnique, StashOnceSepUnique

snoopable地址区域的请求,以尝试将被寻址的cacheline移动到目标缓存,以使目标能够存储该行。被寻址的RN可以按照ReadUnique来处理

StashOnceShared, StashOnceSepShared.

同上,被寻址的RN可以按照ReadNotSharedDirty 来处理

名称 (CMO)

描述

CleanShared

snoopable地址区域的请求,有缓存副本都更改为非dirty状态,并且任何dirty副本都会写回main memory

CleanSharedPersist

同上,但是dirty数据写入PoP(Point of Persistence ). PoP是内存系统中的一个点,当系统电源断开时,会保持对内存的写入,当电源恢复时,会可靠的恢复对内存的写入

CleanSharedPersistSep

同上,但是对requester需要有2responseComp response 表示请求到达HNPersist response表示请求已到达PoP

CleanInvalid

requesterI态时才能发此请求, 将拥有此 cacheline 副本invalidatedirty的写回main memory

MakeInvalid

同上,dirty的丢弃

CleanSharedPersistSep 的功能与leanSharedPersist 类似,但需要对请求者进行两个单独的响应:

1、Comp 响应,表明请求已达到一致性点(PoC),并且可以在请求者处消除危险。

2、持久响应,表明请求已到达PoP 或最终目的地。

PoC (Point of Coherence) : A point at which all agents that can access memory are guaranteed to see the same copy of a memory location. In a typical CHI based system it is the HN-F in the interconnect.

保证所有可以访问内存的代理都能看到内存位置的相同副本的点。 在典型的基于 CHI 的系统中,它是互连中的 HN-F

Dataless transaction可分为Non-CMO (Non-Cache Maintenance Operation) CMO (Cache Maintenance Operation)

第一个表为non-CMO的操作,第二个表为CMO操作

二、Non-CMO (Non-Cache Maintenance Operation)

支持的操作有:

CleanUnique

MakeUnique

• Evict.

StashOnceUnique, StashOnceSepUnique.

StashOnceShared, StashOnceSepShared.

步骤如下:

1、The Requester sends a Snoopable Read request on the REQ channel 

2、The Completer returns the read data and any associated transaction response with the CompData opcode on the RDAT channel

3、Requester must return an acknowledgement, using the CompAck opcode on the SRSP channel to indicate that the transaction has completed. 

non-CMO的操作本文会举3个例子:CleanUnique、StashOnceShared、Evict

1、CleanUnique

CleanUnique : CleanUnique是将其他的mastercache clean,并且invalid,只保留当前mastercache(此cache可以是clean,也可以是dirty); 其他cache line dirty数据需要写入main memory

1、RN-F1 has the cache line in SD state and responds to the snoop with a snoop response with data and PD asserted.

2、HN-F waits for all snoop responses and then sends a Comp_UC response to the Requester.

3、HN-F sends a Write request to update memory with the data received from RN-F1.

SnpRespData_I_PD后缀为PD,PD ( pass dirty ) 表示更新内存的责任已传递给请求者或 ICN。只能为带有数据的 Snoop 响应声明 Pass Dirty

Comp_UC : CleanUnique MakeUniquecomp response

MakeUnique相比cleanunique,没有写入main memory的操作,且不管其他cacheline的状态,dirtys数据会丢弃

2、StashOnce and StashOnceSep

Cache stashing机制可将数据存在系统中特定cache中,确保data靠近使用的节点,因此可以提高系统性能。Cache stashing只支持Snoopable memory空间。

相关的操作有:

StashOnceUnique,

• StashOnceSepUnique.

StashOnceShared,

• StashOnceSepShared.

步骤如下:

1、RN在REQ channnel发送request

2、ICN返回 comp response

3、如果是StashOnceSep requestHome返回StashDone响应,表示request已经被保序

4、Home还可以选择是否在SNP channelsnoop 目标RN-F

5、目标RN-F发送SnpResp响应,可以选择是否包含DataPull DataPull =0b001表示响应包含读请求

6、如果DataPull =0b001,则Home发送CompData响应

7、目标RN-F收到CompData后,返回CompAck

Datapull[2:0]==0b001 : Inclusion of Data Pull in the Snoop response(Snoop 响应中包含数据拉取)

Data Pull. Indicates the inclusion of an implied Read request in the Data response. (数据拉取。 指示在数据响应中包含隐含的读取请求)

DataPull只能等于0b0000b001

Comp : Completer接受已经请求,并且不会发送RetryAck相应

StashDone : 后续对于同一内存位置的transaction,该transaction是可被观察到的(保序)

StashOnce的四种操作的区别在于:

• Sends StashOnce∗Unique to Home if the stashed cache line is to be modified.

如果要修改stash的缓存行,则将 StashOnce*Unique 发送到 Home

• Sends StashOnce∗Shared to Home if the stashed cache line is not to be modified.

如果不修改stash的缓存行,则将StashOnce*Shared 发送到Home

• Sends StashOnceSep only if the Requester is capable of handling the StashDone response.

仅当请求者能够处理StashDone 响应时才发送StashOnceSep

• The StashOnce∗ requests provide a Stash target when the data is to be stashed in a peer cache.

当数据要存储在对等缓存中时,StashOnce* 请求提供存储目标。

• The StashOnce∗ requests do not provide a Stash target when the data is to be allocated to the next level cache.

当数据要分配到下一级缓存时,StashOnce* 请求不提供Stash 目标。

StashOnceShared为例

1、RN sends a StashOnceShared request to HN-F with the Stash target identified as RN-F1.

2、HN-F sends a Comp response after establishing processing order for the received request that is guaranteeing the request is processed before a request to the same address 

此响应是为了保序(该处理request要优先于后续任何request对该地址的请求)

3、HN-F sends a SnpStashShared snoop to RN-F1, and a ReadNoSnp request to SN-F to fetch Data.

4、RN-F1 sends SnpResp_I_Read response to HN-F.

5、HN-F treats the Read request from RN-F1 as a ReadNotSharedDirty, and sends a combined CompData to RN-F1.

6、 RN-F1 sends CompAck to HN-F to complete the Read transaction.

该操作的目的是,将SN中指定地址的数据,搬到RN-F1。但是在搬运前,要先对RN-F1进行snoop,判断RN-F1是否已经具有该数据

Snpresp_i_Read, 表示当前stateinvalid的,同时带有read操作,要pull data;

SnpStashShared
Snoop request recommending that the Snoopee obtains a copy of the cache line in a Shared state:
• Permitted to be sent to only one RN-F. 只能发送给RN-F
• This specification recommends not sending the snoop if the cache line is cached at the target. 如果
cache line就在target中,则建议不发送snoop
• The Snoopee must not return data with the Snoop response. 该
snoop不能返回数据
• Permits the Snoop response to include a Data Pull. 该
snoopresponse允许包含Data Pull
• Must not change the cache line state at the Snoopee. 不能改变被
snoopcache line状态

The responses that include Data Pull are:
SnpResp_I_Read.
SnpRespData_I_Read.
SnpRespData_I_PD_Read.
SnpRespDataPtl_I_PD_Read.

3、Evict

告诉HN, 当前RN中的这条cacheline不再进行缓存;类似于CPU知会HNF某一条cacheline已经被逐出了,本地已经没有了;

RN在发送请求之前,会先将状态调整到 I

Evict

        --告诉HN, 当前RN中的这条cacheline不再进行缓存;

        --类似于CPU知会HNF某一条cacheline已经被逐出了,本地已经没有了;

        --RN在发送之前,会先将状态调整到I;

三、CMO (Cache Maintenance Operation)

支持的操作有:

CleanShared

CleanSharedPersist

CleanSharedPersistSep

CleanInvalid.  • MakeInvalid.

步骤如下:

1、The Requester sends a request on the REQ channel

2、The Completer returns a Comp response on the CRSP channel.

3、For the CleanSharedPersistSep transaction the Completer also returns a Persist response to the Requester. The Completer is permitted to combine the Comp and Persist responses into a single CompPersist response.

CleanSharedPersistSep为例:

要求所有CPUdirty数据都写回主存

In this example of CleanSharedPersistSep transaction flow, the Point of Persistence (PoP) is at the SN-F.

1、RN-F1 has the cache line in SC state. RN-F1 responds to the snoop with a snoop response without data.

2、HN-F waits for all snoop responses and then sends a Comp_SC response to the Requester.

3、HN-F sends a CleanSharedPersistSep request to SN-F, only after completing the writing back of all snooped Dirty data, if any, to the SN-F. SN-F responds to the request with Comp

4、SNF sends a Persist response to RN-F0 to indicate that the request has reached the PoP, and data from any prior writes to the same location is pushed to the PoP 

PoP (Point of Persistence) : 系统中用于持久性存储的特定位置或机制。它表示数据在系统中的存储状态,以确保数据在断电或重启后仍然可用。通常是将易失性存储(如cache)复制到非易失性存储(如硬盘

图中,Comp_UC反映了其他master中该cache line的状态

Comp_UC

        1、表明该cache line副本在Requester中至高可以为UC状态(即可以是UCUCESCI)。

        2、不过MakeReadUnique/CleanUnique这两个“Upgrade”的请求则有所差异,SD收到Comp_UC后进入UD状态。这在下文关于MakeReadUnique的描述中可以再次看到。

相应的response还有:

Comp_I

        表明该cache line副本在Requester中最终需为I状态。

Comp_SC

        表明该cache line副本在Requester中至高可以为SC状态(即可以是SCI)。

Comp_UD_PD

        表明将更新Memory的责任传递给Requester,该cache line副本在Requester中至高可以为UD状态(即可以是UDSD)。

对于CleanShared,可能会收到Comp_UCComp_SCComp_ICleanShared用于将其他副本的dirty数据写回,并不会无效化其他副本,所以收到response后缓存行状态不改变。

对于CleanUnique,只会收到Comp_UC。收到时处于I状态(出现I状态的原因是发出CleanUnique后被invalid),则进入UCE;收到时处于SC状态,则进入UC状态;收到时处于SD,则进入UD状态。

对于MakeUnique,只会收到Comp_UC。由于其写一整行,所以最终进入UD状态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/14621.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

忍の摸头之术游戏娱乐源码

本资源提供给大家学习及参考研究借鉴美工之用,请勿用于商业和非法用途,无任何技术支持! 忍の摸头之术游戏娱乐源码,抖音上面非常火的摸头杀画面,看得我眼花缭乱,源码拿去玩吧; 目录说明 忍の摸头之术:域…

轻松同步:将照片从三星手机传输到iPad的简便方法

概括 想要在新 iPad 上查看三星照片吗?但是,如果您不知道如何将照片从三星手机传输到 iPad,则无法在 iPad 上查看图片。为此,本文分享了 7 个有用的方法,以便您可以使用它们在不同操作系统之间轻松发送照片。现在&…

EfficientSAM分割对象后求其中图像中的高

1 分割对象 EfficientSAM https://github.com/yformer/EfficientSAM 2 计算在图像中最高点即y值最小点 import os import cv2def read_images(folder_path):image_files [f for f in os.listdir(folder_path) iff.endswith(".jpg") or f.endswith(".png&quo…

虚拟化技术[1]之服务器虚拟化

文章目录 虚拟化技术简介数据中心虚拟化 服务器虚拟化服务器虚拟化层次寄居虚拟化裸机虚拟化VMM无法直接捕获特权指令解决方案 服务器虚拟化底层实现CPU虚拟化内存虚拟化I/O设备虚拟化 虚拟机迁移虚拟机动态迁移迁移内容:内存迁移迁移内容:网络资源迁移迁…

小短片创作-组装场景(一)

1、项目基础设置 通过第三人称模板,创建1个项目 1.自动曝光:关闭,因为要做专业的小短片,曝光需要手动控制。 2.扩展自动曝光中的默认亮度范围:启用 3.全局光照系统:选择屏幕空间光照(SSGI&am…

Transformer详解常见面试问题

文章目录 1. 各模块解决1.1 输入部分1.2 多头注意力(作者使用8个头)1.3 残差和LayerNorm1.4 Decoder部分 2.Transformer经典问题2.1 tranformer为何使用多头注意力机制?2.2 Transformer相比CNN的优缺点2.3 Encoder和decoder的区别&#xff1f…

Spring中RestTemplate用法

系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 RestTemplate 是从…

自编译frida得一些记录

frida编译 这个过程坑肯定很多 但是只要大方向对得,解决掉每个小错误达到目的就ok得 # 就是想自己把frida代码done下来改一改 然后看看git clone gitgithub.com:frida/frida.git git fetch git checkout 14.1.3# 下载node包管理工具 apt install nvm nvm install …

Web Speech API(1)—— SpeechRecognition

Web Speech API 使你能够将语音数据合并到 Web 应用程序中。Web Speech API 有两个部分:SpeechSynthesis 语音合成(文本到语音 TTS)和 SpeechRecognition 语音识别(异步语音识别)。 SpeechRecognition 语音识别通过 S…

axios案例应用

1、Spring概述 Spring 是分层的 Java SE/EE 应用 full-stack 轻量级开源框架,以 IoC(Inverse Of Control: 反转控制)和 AOP(Aspect Oriented Programming:面向切面编程)为内核,提供了展现层 Spring MVC 和持久层。Spring JDBC 以及业务层事务管理等众多…

day16|二叉树的属性

相关题目 ● 104.二叉树的最大深度 559.n叉树的最大深度 ● 111.二叉树的最小深度 ● 222.完全二叉树的节点个数 二叉树的深度与高度 如图, 二叉树的深度表示:任意一个叶子节点到根节点的距离,是从上往下计数的,因此使用前序遍历…

2024年甘肃特岗教师招聘报名流程,速速查收哦!

2024年甘肃特岗教师招聘报名流程,速速查收哦!

python-鸡兔同笼问题:已知鸡和兔的总头数与总脚数。求笼中鸡和兔各几只?

【问题描述】典型的鸡兔同笼问题。 【输入形式】输入总头数和总脚数两个实数:h,f 【输出形式】笼中鸡和兔的个数:x,y 【样例输入】16 40 【样例输出】鸡12只,兔4只 【样例说明】输入输出必须保证格式正确。…

AI大模型探索之路-训练篇25:ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库

系列篇章💥 AI大模型探索之路-训练篇1:大语言模型微调基础认知 AI大模型探索之路-训练篇2:大语言模型预训练基础认知 AI大模型探索之路-训练篇3:大语言模型全景解读 AI大模型探索之路-训练篇4:大语言模型训练数据集概…

CS西电高悦计网课设——校园网设计

校园网设计 一,需求分析 所有主机可以访问外网 主机可以通过域名访问Web服务器 为网络配置静态或者动态路由 图书馆主机通过DHCP自动获取IP参数 为办公楼划分VLAN 为所有设备分配合适的IP地址和子网掩码,IP地址的第二个字节使用学号的后两位。 二…

ESP32 实现获取天气情况

按照小安派AiPi-Eyes天气站思路,在ESP32 S3上实现获取天气情况。 一、在ESP32 S3实现 1、main.c 建立2个TASK void app_main(void) {//lvgl初始化xTaskCreate(guiTask, "guiTask", 1024 * 6, NULL, 5, NULL);//wifi初始化、socket、json处理taskcustom_…

ES6之数值的扩展

1. 数值的扩展 1.1. 二进制和八进制字面量表示:1.2. 数值判断方法: 1.2.1. Number.isFinite() 检查一个值是否为有限的数值。1.2.2. Number.isNaN() 更准确地检测NaN值。1.2.3. 传统的全局方法 isFinite() 和 isNaN() 的区别 1.3. 数值转换方法:1.4. 整数检查与精度: 1.4.1. Nu…

防火墙技术基础篇:解析防火墙的网络隔离机制

防火墙技术基础篇:解析防火墙的网络隔离机制 网络安全在现代社会中扮演着重要的角色,保护网络系统、用户和数据免受未经授权的访问、破坏和窃取。个人、企业和国家都需要加强网络安全意识,采取有效措施保护自身的网络安全。随着网络攻击手段…

【QT八股文】系列之篇章2 | QT的信号与槽机制及通讯流程

【QT八股文】系列之篇章2 | QT的信号与槽机制及通讯流程 前言2. 信号与槽信号与槽机制介绍/本质/原理,什么是Qt信号与槽机制?如何在Qt中使用?信号与槽机制原理,解析流程Qt信号槽的调用流程信号与槽机制的优缺点信号与槽机制需要注…

web自动化之PO模式

PO模式 1、为什么需要PO思想? 首先我们观察和思考一下,目前我们写的作业脚本的问题: 元素定位和操作动 作写到一起了,这就就会用导致一个问题: UI的页面元素比较容易变化的,所以元素定位和脚本操作写到一…