获取iOS任意线程调用堆栈(四)符号化实战

转载自:http://blog.csdn.net/jasonblog/article/details/49909209

1. 相关API和数据结构

由于我们在上面回溯线程调用栈拿到的是一组地址,所以这里进行符号化的输入输出应该分别是地址和符号,接口设计类似如下:

- (NSString *)symbolicateAddress:(uintptr_t)addr;

不过在实际操作中,我们需要依赖于dyld相关方法和数据结构:

/** Structure filled in by dladdr().*/
typedef struct dl_info {const char      *dli_fname;     /* Pathname of shared object */void            *dli_fbase;     /* Base address of shared object */const char      *dli_sname;     /* Name of nearest symbol */void            *dli_saddr;     /* Address of nearest symbol */
} Dl_info;_dyld_image_count() returns the current number of images mapped in by dyld. Note that using this count to iterate all images is not thread safe, because another thread may be adding or removing images dur-ing duringing the iteration.     
_dyld_get_image_header() returns a pointer to the mach header of the image indexed by image_index.  If image_index is out of range, NULL is returned.     
_dyld_get_image_vmaddr_slide() returns the virtural memory address slide amount of the image indexed by image_index. If image_index is out of range zero is returned.     
_dyld_get_image_name() returns the name of the image indexed by image_index. The C-string continues to be owned by dyld and should not deleted.  If image_index is out of range NULL is returned.
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26

又为了要判断此次解析是否成功,所以接口设计演变为:

bool jdy_symbolicateAddress(const uintptr_t addr, Dl_info *info)

Dl_info用来填充解析的结果。

2. 算法思路

对一个地址进行符号化解析说起来也是比较直接的,就是找到地址所属的内存镜像,然后定位该镜像中的符号表,最后从符号表中匹配目标地址的符号。

mach_o_segments

(图片来源于苹果官方文档)

以下思路是描述一个大致的方向,并没有涵盖具体的细节,比如基于ASLR的偏移量:

// 基于ASLR的偏移量https://en.wikipedia.org/wiki/Address_space_layout_randomization
/*** When the dynamic linker loads an image, * the image must be mapped into the virtual address space of the process at an unoccupied address.* The dynamic linker accomplishes this by adding a value "the virtual memory slide amount" to the base address of the image.
*/
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

2.1 寻找包含地址的目标镜像

通过遍历每个段,判断目标地址是否落在该段包含的范围内:

/** The segment load command indicates that a part of this file is to be* mapped into the task's address space.  The size of this segment in memory,* vmsize, maybe equal to or larger than the amount to map from this file,* filesize.  The file is mapped starting at fileoff to the beginning of* the segment in memory, vmaddr.  The rest of the memory of the segment,* if any, is allocated zero fill on demand.  The segment's maximum virtual* memory protection and initial virtual memory protection are specified* by the maxprot and initprot fields.  If the segment has sections then the* section structures directly follow the segment command and their size is* reflected in cmdsize.*/
struct segment_command { /* for 32-bit architectures */uint32_t    cmd;        /* LC_SEGMENT */uint32_t    cmdsize;    /* includes sizeof section structs */char        segname[16];    /* segment name */uint32_t    vmaddr;     /* memory address of this segment */uint32_t    vmsize;     /* memory size of this segment */uint32_t    fileoff;    /* file offset of this segment */uint32_t    filesize;   /* amount to map from the file */vm_prot_t   maxprot;    /* maximum VM protection */vm_prot_t   initprot;   /* initial VM protection */uint32_t    nsects;     /* number of sections in segment */uint32_t    flags;      /* flags */
};/*** @brief 判断某个segment_command是否包含addr这个地址,基于segment的虚拟地址和段大小来判断*/
bool jdy_segmentContainsAddress(const struct load_command *cmdPtr, const uintptr_t addr) {if (cmdPtr->cmd == LC_SEGMENT) {struct segment_command *segPtr = (struct segment_command *)cmdPtr;if (addr >= segPtr->vmaddr && addr < (segPtr->vmaddr + segPtr->vmsize)) {
            return true;}    }}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36

这样一来,我们就可以找到包含目标地址的镜像文件了。

2.2 定位目标镜像的符号表

由于符号的收集和符号表的创建贯穿着编译和链接阶段,这里就不展开了,而是只要确定除了代码段_TEXT和数据段DATA外,还有个_LINKEDIT段包含符号表:

The __LINKEDIT segment contains raw data used by the dynamic linker, such as symbol, string, and relocation table entries.

所以现在我们需要先定位到__LINKEDIT段,同样摘自苹果官方文档:

Segments and sections are normally accessed by name. Segments, by convention, are named using all uppercase letters preceded by two underscores (for example, _TEXT); sections should be named using all lowercase letters preceded by two underscores (for example, _text). This naming convention is standard, although not required for the tools to operate correctly.

我们通过遍历每个段,比较段名称是否和__LINKEDIT相同:

usr/include/mach-o/loader.h
#define SEG_LINKEDIT    "__LINKEDIT"
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3

接着来找符号表:

/*** 摘自《The Mac Hacker's Handbook》:* The LC_SYMTAB load command describes where to find the string and symbol tables within the __LINKEDIT segment.  * The offsets given are file offsets, so you subtract the file offset of the __LINKEDIT segment to obtain the virtual memory offset of the string and symbol tables.  * Adding the virtual memory offset to the virtual-memory address where the __LINKEDIT segment is loaded will give you the in-memory location of the string and sym- bol tables.*/
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

也就是说,我们需要结合__LINKEDIT segment_command(见上面结构描述)和LC_SYMTAB load_command(见下面结构描述)来定位符号表:

/** The symtab_command contains the offsets and sizes of the link-edit 4.3BSD* "stab" style symbol table information as described in the header files* <nlist.h> and <stab.h>.*/
struct symtab_command {uint32_t    cmd;        /* LC_SYMTAB */uint32_t    cmdsize;    /* sizeof(struct symtab_command) */uint32_t    symoff;     /* symbol table offset */uint32_t    nsyms;      /* number of symbol table entries */uint32_t    stroff;     /* string table offset */uint32_t    strsize;    /* string table size in bytes */
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

如上述引用描述,LC_SYMTAB和_LINKEDIT中的偏移量都是文件偏移量,所以要获得内存中符号表和字符串表的地址,我们先将LC_SYMTAB的symoff和stroff分别减去LINKEDIT的fileoff得到虚拟地址偏移量,然后再加上_LINKEDIT的vmoffset得到虚拟地址。当然,要得到最终的实际内存地址,还需要加上基于ASLR的偏移量。

2.3 在符号表中寻找和目标地址最匹配的符号

终于找到符号表了,写到这里有点小累,直接贴下代码:

/*** @brief 在指定的符号表中为地址匹配最合适的符号,这里的地址需要减去vmaddr_slide*/
const JDY_SymbolTableEntry *jdy_findBestMatchSymbolForAddress(uintptr_t addr,JDY_SymbolTableEntry *symbolTable,uint32_t nsyms) {// 1. addr >= symbol.value; 因为addr是某个函数中的一条指令地址,它应该大于等于这个函数的入口地址,也就是对应符号的值;// 2. symbol.value is nearest to addr; 离指令地址addr更近的函数入口地址,才是更准确的匹配项;const JDY_SymbolTableEntry *nearestSymbol = NULL;uintptr_t currentDistance = UINT32_MAX;for (uint32_t symIndex = 0; symIndex < nsyms; symIndex++) {uintptr_t symbolValue = symbolTable[symIndex].n_value;if (symbolValue > 0) {uintptr_t symbolDistance = addr - symbolValue;if (symbolValue <= addr && symbolDistance <= currentDistance) {currentDistance = symbolDistance;nearestSymbol = symbolTable + symIndex;}}}return nearestSymbol;
}/** This is the symbol table entry structure for 64-bit architectures.*/
struct nlist_64 {union {uint32_t  n_strx; /* index into the string table */} n_un;uint8_t n_type;        /* type flag, see below */uint8_t n_sect;        /* section number or NO_SECT */uint16_t n_desc;       /* see <mach-o/stab.h> */uint64_t n_value;      /* value of this symbol (or stab offset) */
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40

找到匹配的nlist结构后,我们可以通过.n_un.n_strx来定位字符串表中相应的符号名。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/499868.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

获取iOS任意线程调用堆栈(五)完整实现:BSBacktraceLogger

转载自&#xff1a;https://toutiao.io/posts/aveig6/preview BSBacktraceLogger 是一个轻量级的框架&#xff0c;可以获取任意线程的调用栈&#xff0c;开源在我的 GitHub&#xff0c;建议下载下来结合本文阅读。 我们知道 NSThread 有一个类方法 callstackSymbols 可以获取调…

Mac电脑如何彻底删除清除数据?CleanMyMac X软件更专业

虽然不用杀毒&#xff0c;但是日常的清理还是有必要的&#xff0c;特别是卸载一些软件会有残留&#xff0c;可以用命令mdfind来找&#xff0c;然后删&#xff0c;这里给新手用户推荐一款应用clean my mac x&#xff0c;定期清理一下&#xff0c;不用的时候关掉就可以。 CleanM…

Git的思想和基本工作原理

转载自&#xff1a;http://www.nowamagic.net/academy/detail/48160210# 在开始学习 Git 的时候&#xff0c;请不要尝试把各种概念和其他版本控制系统&#xff08;诸如 Subversion 和 Perforce 等&#xff09;相比拟&#xff0c;否则容易混淆每个操作的实际意义。Git 在保存和处…

kafka入门:简介、使用场景、设计原理、主要配置及集群搭建

本文转自&#xff1a;http://www.aboutyun.com/thread-9341-1-1.html一、入门1、简介Kafka is a distributed,partitioned,replicated commit logservice。它提供了类似于JMS的特性&#xff0c;但是在设计实现上完全不同&#xff0c;此外它并不是JMS规范的实现。kafka对消息保存…

深入理解Hadoop集群和网络

云计算和Hadoop中网络是讨论得相对比较少的领域。本文原文由Dell企业技术专家Brad Hedlund撰写&#xff0c;他曾在思科工作多年&#xff0c;专长是数据中心、云网络等。文章素材基于作者自己的研究、实验和Cloudera的培训资料。 本文将着重于讨论Hadoop集群的体系结构和方法&am…

iOS中WebKit框架应用与解析

一、引言 在iOS8之前&#xff0c;在应用中嵌入网页通常需要使用UIWebView这样一个类&#xff0c;这个类通过URL或者HTML文件来加载网页视图&#xff0c;功能十分有限&#xff0c;只能作为辅助嵌入原生应用程序中。虽然UIWebView也可以做原生与JavaScript交互的相关处理&#xf…

六、区块链主流共识算法浅析

转自&#xff1a;http://www.cocoachina.com/cms/wap.php?actionarticle&id22240。 一、概述&#xff1a; 1.工作量证明&#xff08;Proof of Work&#xff09;&#xff1a; 通过所有节点的工作量竞争来达成一致。竞争的是运算力。 2.权益证明&#xff08;Proof of S…

七、区块链如何运用merkle tree验证交易真实性

转载自&#xff1a;https://www.tangshuang.net/4117.html 本文假设你已经知道区块链中merkle tree的原理&#xff0c;现在搞明白具体怎么来实现交易真实性验证。 Merkle Tree 这个小节简述一下merkle的原理。简单说&#xff0c;merkle tree就是一个hash二叉树&#xff0c;父…

java基础 --- Arrays.asList():返回指定数组支持的固定大小列表

Arrays.asList()&#xff1a;返回指定数组支持的固定大小列表 首先看下这个方法的源码注释&#xff0c;注意第一句&#xff0c;Returns a fixed-size list backed by the specified array.&#xff0c; 意思就是&#xff1a;返回指定数组支持的固定大小列表 所以&#xff1a;…

Notepad++中的UTF-8无BOM格式编码

Notepad中&#xff0c;关于utf-8的编码格式&#xff0c;有两种&#xff1a;以UTF-8无BOM格式编码和以UTF-8格式编码。 很容易给人一种错觉&#xff0c;第一反应会选择以UTF-8格式编码&#xff0c;感觉这种就是平时所说的UTF-8&#xff0c;然而这种编码是默认带BOM的&#xff0…

Java 线程状态---WAITING(部分转载)

看到一篇关于写线程waiting状态的文章&#xff0c;感觉很生动有趣&#xff0c;转过来保存下。 总结&#xff1a; waiting这个状态&#xff0c;就是等待&#xff0c;明确了等待&#xff0c;就不会抢资源了。 一个线程A在拿到锁但不满足执行条件的时候&#xff0c;需要另一个线…

服务端高并发分布式架构演进之路(转载,图画的好)

这个文章基本上从单机版到最终版&#xff0c;经历了加缓存&#xff0c;加机器&#xff0c;高可用&#xff0c;分布式&#xff0c;最后到云等过程&#xff0c;其实我一直想总结一套类似的东西&#xff0c;没想到有人已经先弄出来了&#xff0c;那就不重复造轮子了&#xff0c;而…

限流算法(漏桶算法、令牌桶算法)对比

限流算法&#xff08;漏桶算法、令牌桶算法&#xff09; 漏桶算法&#xff1a; 有个桶&#xff0c;比如最大能进2个单位的水&#xff08;请求&#xff09;&#xff0c;桶底有个洞&#xff0c;每个单位的水都会在桶里待3秒后漏下去。 那么这个桶就可以同时处理2个单位的水。 如…

mongodb 索引详解

使用springboot连接mongodb的时候&#xff0c;涉及到索引的使用 举例&#xff1a; Document(collection"book") //注释的是复合索引 //CompoundIndexes( // { // CompoundIndex(name "复合索引名字",def "{字段01:1,字段02:…

mongodb数据库,批量插入性能测试记录

spring boot 框架下&#xff0c;操作mongodb数据库 maven&#xff1a;spring-data-mongodb:2.1.3.RELEASE mongo数据库用的是本地的mongo&#xff0c;所以环境不一样&#xff0c;可能结果不一样。但趋势应该是一样的。 测试保证每次批量插入时&#xff0c;库里的数据量都是一…

[转载] --- 数据库基本知识

里面的很多点&#xff0c;我之前都总结过&#xff0c;但是感觉这篇把这些都连起来了&#xff0c;总结的挺好&#xff0c;转载保存一下 【从入门到入土】令人脱发的数据库底层设计前言 说到数据库这个词&#xff0c;我只能用爱恨交加这个词来形容它。两年前在自己还单纯懵懂的时…

spring-boot发送邮件失败 AuthenticationFailedException: 535 Authentication Failed

发送邮件失败&#xff0c;平时一直是好的&#xff0c;突然有天开始失败了&#xff0c;最后是发现邮箱密码失效了。。。 有的邮箱&#xff0c;需要定期更改密码。

互联网广告行业(01)------ 初识了解DSP、SSP、ADX

最近有幸接触到公司的一个实时竞价系统&#xff0c;也算是公司的核心系统之一了&#xff0c;增加了很多新的知识&#xff0c;可能有点乱&#xff0c;先总结一波&#xff1a; 广告行业&#xff0c;先介绍概念 广告主&#xff1a;需要打广告的站点&#xff0c;一般就是卖东西的…

互联网广告行业(02)------OpenRTB(实时竞价)规范解读

RTB&#xff1a;(Real Time Bidding实时竞价)&#xff0c;RTB是一种广告交易的方式 OpenRTB&#xff1a;简单理解就是一个行业规范&#xff0c;是一个为了促进RTB方式广告的标准&#xff0c;有对应的api文档&#xff0c;大家都按照这个规范去传参数&#xff0c;那么发送方和接收…

[go]---从java到go(01)---基础与入门上手

为什么用go&#xff0c;就是为了快速响应并且高并发。 一样的逻辑&#xff0c;用java也能实现&#xff0c;但用go可能就比java快点。 如果你很熟练java了&#xff0c;那么学习go就会很快。 go的社区环境相比java没那么大&#xff0c;但一般问题都足够了。 go是谷歌出品&#xf…