LLVM AliasAnalysis别名分析 TBAA TypeBasedAliasAnalysis

一、什么是别名分析

Alias Analysis (又名 Pointer Analysis)是用于确定两个指针是否指向内存中的同一对象,这里有很多不同的别名分析算法,分为几种类型:流敏感vs流非敏感、上下文敏感vs上下文非敏感、域敏感vs域非敏感、基于一致性的vs基于子集的。传统的别名分析用于回答must、may、no的问题,也即两个指针总是指向同一对象,可能指向同一对象以及绝不会指向同一对象。(SSA—静态单一赋值,将同一变量名用多个名表示,被赋值的变量名不会重复,便于寻找变量的产生与使用点)。 

二、别名分析有什么用

有这样一个例子:

int foo (int __attribute__((address_space(0)))* a,int __attribute__((address_space(1)))* b) {*a = 42;*b = 20;return *a;
}

__attribute__ 指示符指定 a 是一个i32*的地址,b 是一个i32 addrspace(1)*的地址,生成ir如下:

define i32 @foo(i32* nocapture %0, i32 addrspace(1)* nocapture %1) local_unnamed_addr #0 {store i32 42, i32* %0, align 4, !tbaa !10store i32 20, i32 addrspace(1)* %1, align 4, !tbaa !10%3 = load i32, i32* %0, align 4, !tbaa !10ret i32 %3
}

我们先忽略指令后边的!tbaa这个metadata信息,这个之后会讲到。这个是clang在O2的场景下生成的IR。现在需要对于函数foo进行进一步的优化,去掉不必要的load:

define i32 @foo(i32* nocapture %0, i32 addrspace(1)* nocapture %1) local_unnamed_addr #0 {store i32 42, i32* %0, align 4, !tbaa !10store i32 20, i32 addrspace(1)* %1, align 4, !tbaa !10ret i32 42
}

但是这个优化有一个前提,就是a和b不能别名,不然可能会有错误:

int i = 0;
int result = foo(&i, &i);

以上可以看到,以上调用会使a和b别名,本应该返回20,结果因为优化的缘故返回了42,导致错误。所以编译器只有确定两个指针不会产生别名时,才能进行以上优化。这个就是别名分析的作用的一个小例子。

三、当前LLVM内置的别名分析

当前LLVM内置使用了多种别名分析,我们这里简单介绍下。

3.1 -basic-aa

  • 不同全局变量、栈分配和堆分配之间永远不会发生别名冲突。 这意味着,如果两个指针分别指向全局变量、栈分配和堆分配,那么它们一定指向不同的内存位置。
  • 全局变量、栈分配和堆分配永远不会与空指针发生别名冲突。 这意味着,指向全局变量、栈分配和堆分配的指针一定指向有效的内存地址,而不是空指针。
  • 结构体的不同成员之间不会发生别名冲突。 也就是说,指向结构体不同成员的指针一定指向不同的内存位置。
  • 具有静态不同的下标的数组索引不会发生别名冲突。 例如,a[0] 和 a[1] 指向不同的内存位置,因此它们不会发生别名冲突。
  • 许多常见的标准 C 库函数不会访问内存或者只读内存。 这意味着,如果一个指针指向由这些函数返回的内存位置,那么它不会与其他指针发生别名冲突。
  • 显然指向常量全局变量的指针具有 "pointToConstantMemory" 属性。 这意味着,指向常量全局变量的指针永远不会被修改,因此不会发生别名冲突。
  • 如果函数调用从未将栈分配的变量传递到函数外部,那么该函数调用不会修改或引用这些变量。 这意味着,在函数内部创建的自动数组不会与其他指针发生别名冲突。

3.2 -typebased-aa(tbaa)

这个就是我们在上边的那个IR中看到的metadata信息,这里是基于类型的别名分析。我们先看一个简单的C++的例子。

#include <cstdio>
using namespace std;struct tests {int size;int *arr;tests(int _size, int *_arr) : size(_size), arr(_arr) {}__attribute__((noinline)) void dump() {for (int i = 0; i < size; ++i) {printf("%d ", arr[i]);}printf("\n");}
};int main() {int arr1[5] = { 1, 2, 3, 4, 5 };int arr2[3] = { 6, 7, 8 };tests t(5, arr1);t.dump();printf("\n");return 0;
}

生成的IR如下所示,这里我截取了关键部分的IR:

; i32:size i32*:arr
%struct.tests = type { i32, i32* }define i32 @main() local_unnamed_addr #0 {%1 = alloca [5 x i32], align 4%2 = alloca %struct.tests, align 8%3 = bitcast [5 x i32]* %1 to i8*call void @llvm.lifetime.start.p0i8(i64 20, i8* nonnull %3) #6call void @llvm.memcpy.p0i8.p0i8.i64(i8* noundef nonnull align 4 dereferenceable(20) %3, i8* noundef nonnull align 4 dereferenceable(20) bitcast ([5 x i32]* @__const.main.arr1 to i8*), i64 20, i1 false)%4 = bitcast %struct.tests* %2 to i8*call void @llvm.lifetime.start.p0i8(i64 16, i8* nonnull %4) #6%5 = getelementptr inbounds [5 x i32], [5 x i32]* %1, i64 0, i64 0%6 = getelementptr inbounds %struct.tests, %struct.tests* %2, i64 0, i32 0; 存size到struct中store i32 5, i32* %6, align 8, !tbaa !10%7 = getelementptr inbounds %struct.tests, %struct.tests* %2, i64 0, i32 1; 存arr到struct中store i32* %5, i32** %7, align 8, !tbaa !16call void @_ZN5tests4dumpEv(%struct.tests* nonnull %2)%8 = call i32 @putchar(i32 10)call void @llvm.lifetime.end.p0i8(i64 16, i8* nonnull %4) #6call void @llvm.lifetime.end.p0i8(i64 20, i8* nonnull %3) #6ret i32 0
}!10 = !{!11, !12, i64 0}
!11 = !{!"_ZTS5tests", !12, i64 0, !15, i64 8}
!12 = !{!"int", !13, i64 0}
!13 = !{!"omnipotent char", !14, i64 0}
!14 = !{!"Simple C++ TBAA"}
!15 = !{!"any pointer", !13, i64 0}
!16 = !{!11, !15, i64 8}
!17 = !{!12, !12, i64 0}

我们先看一下tbaa的结构,tbaa存的主要是类型信息,概括一下就是三个数据,我们当前处理的base的类型是什么,我们当前获取到的实际类型是什么,这个实际类型在base中的偏移是多少。我们可以看存arr的这条store指令是16这条metadata,其中11就是base类型也就是test,11中存了test类型的layout,然后16中的15就是获取到的类型,对于store指令也就是%5的类型是个指针,也就与15的类型相匹配,最终的这些类型都会指向13和14这两条公共父节点,这样其实构成了一个树状结构。然后16中的第三个操作数是8表示arr在test偏移为8的位置,同时我们在树上找test这个节点能看到偏移8对应的是15这条,也与16的实际类型相一致。这个就是tbaa的一个例子,其实就是构成了一个类型树。

基于类型我们能够判断出来一些别名关系,例如:

  • 如果a和b具有公共的子类型,但是a和b相互之间都不是对方的sub type,那么a和b是noalias的。
  • 判断两个类型是否具有重叠关系,不具有的话那肯定是noalias的;如果具有重叠关系的话再根据offset判断是否是处理的相同memory处的内容
  • 等等

3.3 -globalsmodres-aa

此pass针对未“占用地址”的internal的全局变量实现了简单的上下文敏感的 mod/ref 和别名分析。如果全局变量的地址未被占用,则此过程知道没有指针为全局变量的别名。此过程还会跟踪它知道永远不会访问内存或永远不会读取内存的函数。这允许某些优化(例如 GVN)完全消除调用指令。

此过程的真正强大之处在于它为调用指令提供了上下文敏感的 mod/ref 信息。这允许优化器知道对函数的调用不会破坏或读取全局变量的值,从而可以消除加载和存储。

此过程的范围有些有限(仅支持非地址占用的全局变量),但分析速度非常快。

3.4 -steens-aa

-steens-aa 过程实现了著名的“Steensgaard 算法”的变体,用于过程间别名分析。Steensgaard 算法是一种基于统一、不区分流、不区分上下文和不区分字段的别名分析,并且可扩展性极强(有效线性时间)。

LLVM -steens-aa 过程使用数据结构分析框架实现了 Steensgaard 算法的“推测性字段敏感”版本。这使其比标准算法具有更高的精度,同时保持了出色的分析可扩展性。

-steens-aa 在可选的“poolalloc”模块中可用。它不是 LLVM 核心的一部分。

3.5 -ds-aa

-ds-aa 实现了完整的数据结构分析算法。数据结构分析是一种基于模块化统一、不区分流、上下文敏感和推测字段敏感的别名分析,并且可扩展性也相当高,通常为 O(n * log(n))。

此算法能够响应各种别名分析查询,并且还可以提供上下文敏感的 mod/ref 信息。迄今为止尚未实现的唯一主要功能是对必须别名信息的支持。

-ds-aa在可选的“poolalloc”模块中可用。它不是 LLVM 核心的一部分。

3.6 -scev-aa

-scev-aa 通过将 AliasAnalysis 查询转换为 ScalarEvolution 查询来实现 AliasAnalysis 查询。与其他别名分析相比,这使其对 getelementptr 指令和循环感应变量的理解更加完整。

四、依赖于别名分析的几个优化

4.1 -adce

-adce这个pass全称是Aggressive Dead Code Elimination,是用于死代码消除的一个pass, 过程使用 AliasAnalysis 接口删除那些没有副作用且未使用的函数调用。

4.2 -licm

-licm这个pass全称是Loop Invariant Code Motion,实现了各种循环不变代码外提的相关优化。它使用 AliasAnalysis 接口进行几种不同的转换:

  • 如果循环中没有修改已加载内存的指令,则使可以将加载指令提出循环。
  • 它将不写入内存且循环不变的函数调用提出循环。
  • 它使用别名信息将加载并存储在循环中的内存对象提升到寄存器中。如果已加载/存储的内存位置没有别名,则可以执行此操作。

4.3 -argpromotion

-argpromotion 过程将按引用传递的参数提升为按值传递。特别是,如果仅从中加载指针参数,则将加载的值而不是地址传递给函数。此过程使用别名信息来确保从参数指针加载的值在函数入口和任何指针加载之间不会被修改。

4.4 -gvn,-memcpyopt,-dse

这些pass使用 AliasAnalysis 信息来分析store和load相关的指令。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/37981.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单片机学习(16)--直流电机驱动

直流电机驱动 15.1直流电机驱动基础知识1.直流电机介绍2.电机驱动电路3.PWM介绍 15.2LED呼吸灯和直流电机调速1.LED呼吸灯代码2.直流电机调速&#xff08;1&#xff09;产生PWM的方法&#xff08;2&#xff09;工程目录&#xff08;3&#xff09;main.c函数 15.1直流电机驱动基…

isdecimal()方法——判断字符串是否只包含十进制字符

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 语法参考 isdecimal()方法用于检查字符串是否只包含十进制字符。这种方法只适用于unicode对象。 注意&#xff1a;定义一个十进制字符串&#xff0c…

linux高级编程(进程)(2)

父子进程的关系&#xff1a; 子进程是父进程的副本。子进程获得父进程数据段&#xff0c;堆&#xff0c;栈&#xff0c;正文段共享。&#xff08;子分配了一块新的内存&#xff0c;但是代码段指向父进程&#xff0c;也就是说不论几个子进程都只有一个code段&#xff09; …

SpringCloud中复制模块然后粘贴,文件图标缺少蓝色方块

再maven中点击&#xff0b;号&#xff0c;把当前pom文件交给maven管理即可

RabbitMq的基础及springAmqp的使用

RabbitMq 官网:RabbitMQ: One broker to queue them all | RabbitMQ 什么是MQ&#xff1f; mq就是消息队列&#xff0c;消息队列遵循这先入先出原则。一般用来解决应用解耦&#xff0c;异步消息&#xff0c;流量削峰等问题&#xff0c;实现高性能&#xff0c;高可用&#xf…

容器技术-docker2

容器化技术Docker Docker介绍 官网&#xff1a; docker.io docker.com 公司名称&#xff1a;原名dotCloud 14年改名为docker 容器产品&#xff1a;docker 16年已经被更名为Moby docker-hub docker.io docker容器历史 和虚拟机一样&#xff0c;容器技术也是一种资源隔…

java基于ssm+jsp 二手手机回收平台系统

1前台首页功能模块 二手手机回收平台系统&#xff0c;在系统首页可以查看首页、手机商城、新闻资讯、我的、跳转到后台、购物车等内容&#xff0c;如图1所示。 图1前台首页功能界面图 用户注册&#xff0c;在用户注册页面可以填写账号、密码、姓名、手机、邮箱、照片、地址、…

深度解析RocketMq源码-消息推送、持久化、消费全流程

1.绪论 前面的几篇文章都剖析了broker的存储文件。那么生产者发送一条消息到达broker过后是如何处理的&#xff0c;这条消息结果什么处理过后&#xff0c;消费者才能够消费这条消息。接下来&#xff0c;带我们将仔细剖析一下一条消息从生产者生产消息&#xff0c;到到达broker…

在线字节大端序小端序转换器

具体请前往&#xff1a;在线字节大端序小端序转换器

操作系统期末复习真题四

一、前言&#x1f680;&#x1f680;&#x1f680; 小郑在刷题的过程中帮大家整理了一些常见的考试题目&#xff0c;以及易于遗忘的知识点&#xff0c;希望对大家有所帮助。 二、正文☀️☀️☀️ 1.OS的不确定性是指(ABC)。 A.程序的运行次序不确定 B.程序多次运行的时间不…

独立开发者系列(13)——示例理解面向对象与过程

专业术语晦涩难懂&#xff0c;特别是当你没有写过稍微大点的系统的时候&#xff0c;你要理解这里面的区别很难。 从最简单的早期我们学习开始&#xff0c;我们除了练习hello world掌握了入门函数之后&#xff0c;基本都再练习算法。比如水仙花数的获取&#xff0c;冒泡排序&…

Redis的使用和原理

目录 1.初识Redis 1.1 Redis是什么&#xff1f; 1.2 Redis的特性 1.2.1 速度快 1.2.2 基于键值对的数据结构服务器 1.2.3 丰富的功能 1.2.4 简单稳定 1.2.5 持久化 1.2.6 主从复制 1.2.7 高可用和分布式 1.3 Redis的使用场景 1.3.1 缓存 1.3.2 排行榜系统 1.3.3 计数器应用 1.3…

【计算机网络】HTTPS——更安全的HTTP通信(个人笔记)

学习日期&#xff1a;2024.6.26 内容摘要&#xff1a;HTTPS存在的意义、特点和工作方式 HTTP的缺点——易窃听、伪装、篡改 在Web及网络基础中&#xff0c;我们已经知道了网页是怎么打开的&#xff0c;HTTP确实是一个相当优秀和方便的协议&#xff0c;但HTTP也有很多不足&…

【操作系统期末速成】 EP04 | 学习笔记(基于五道口一只鸭)

文章目录 一、前言&#x1f680;&#x1f680;&#x1f680;二、正文&#xff1a;☀️☀️☀️2.1 考点七&#xff1a;进程通信2.2 考点八&#xff1a;线程的概念2.3 考点九&#xff1a;处理机调度的概念及原则2.4 考点十&#xff1a;调度方式与调度算法 一、前言&#x1f680;…

排序(冒泡排序、选择排序、插入排序、希尔排序)-->深度剖析(一)

欢迎来到我的Blog&#xff0c;点击关注哦&#x1f495; 前言 排序是一种基本的数据处理操作&#xff0c;它涉及将一系列项目重新排列&#xff0c;以便按照指定的标准&#xff08;通常是数值大小&#xff09;进行排序。在C语言中&#xff0c;排序算法是用来对元素进行排序的一系…

FPGA 690T NVME高速存储设计

高速存储设计会有各种需求的考虑&#xff0c;那么对应的方案也不完全相同&#xff0c;这篇文章出一期纯FPGA实现的高速存储方案。用纯fpga实现高速存储板卡有易国产化&#xff0c;功耗低和体积小等特点&#xff0c;缺点就是灵活性不是很强&#xff0c;实现标准ext4和nfs文件系统…

计算机的错误计算(十六)

摘要 计算机的错误计算&#xff08;十五&#xff09;中历史事件给我们的启示或警示。 计算机的错误计算&#xff08;十五&#xff09;介绍了历史上发生的一些事件。从这些事件我们可以得到一些启示或警示。 若不是油气平台的沉没&#xff0c;设计者会得出精度低了吗&#x…

信息盲盒系统设计

信息盲盒系统是一种结合了随机性和趣味性的信息传递和接收方式&#xff0c;类似于实体盲盒的概念&#xff0c;但在数字领域应用。这种系统通常用于增加用户参与度、提升用户体验或作为营销策略的一部分。设计一个信息盲盒系统需要考虑以下几个关键要素&#xff1a; 1. 定义目标…

数据仓库建模基础理论-01-为什么需要数据建模?

一、什么是数据模型&#xff1f; 数据模型是数据库的基础结构&#xff0c;用于描述和组织数据的方式。 它不仅是数据库的底层结构&#xff0c;还是一个概念性工具&#xff0c;帮助理解数据的含义和关系。 数据模型包括数据本身、数据之间的关系、数据的语义&#xff08;含义和…

C++ | Leetcode C++题解之第206题反转链表

题目&#xff1a; 题解&#xff1a; class Solution { public:ListNode* reverseList(ListNode* head) {if (!head || !head->next) {return head;}ListNode* newHead reverseList(head->next);head->next->next head;head->next nullptr;return newHead;} …