调试实战 —— dll 加载失败之全局变量初始化篇

前言

最近项目里总是遇到 dll 加载不上的问题,原因各种各样。今天先总结一个虽然不是项目中实际遇到的问题,但是却非常经典的问题。其它几种问题,后续慢慢总结。

示例代码包含一个 exe 工程,两个 dll 工程。exe 会加载两个 dll 并调用它们的导出函数(GetCallCount),结果只有一个 dll 的导出函数被成功调用。会是什么原因呢?

现象

运行效果如下图:

run_result

通过 dumpbin 已经确认两个 dll 都有名为 GetCallCount 的函数。但是只有一个调用成功了,另外一个却调用失败。

dumpbin-exports

使用 process explorer 观察 dll 加载情况,发现只加载了一个 dll,没发现另外一个 dll

loaded_dll

对于这个问题,如果我们使用 procmon 观察整个加载过程,看到的都是 Success。如下图:

procmon-trace

说明,加载正常,在本地找到了这个文件,并正确的映射到内存空间中了。但为什么在进程中观察不到这个 dll 呢?是时候上调试器了。

上调试器

直接在 vs 中按 F5 启动,果然中断到 vs 中了。

exception-and-call-stack

从上图右侧部分,我们可以看到完整的调用栈。

这里简单介绍下相关代码。在 GlobalVariableInitializeOrder.cpp 的第 15 行调用了 HMODULE hDll2 = LoadLibraryA("GlobalVariableInitializeOrderDll2.dll"); 加载对应的模块。

Common\Test2.cpp 的第 10 行定义了全局变量 CTest2 g_t2;,问题就出在这个全局变量的初始化代码中。

从上图左侧部分,我们可以得知错误代码是 0xc0000005,内存访问异常。访问的地址是 0x00000004,对应的指令位置是 0x001EA6DB

invalid-eax

从上图中的反汇编看,确实是挂在了 001EA6DB mov eax,dword ptr [eax]。因为 eax 的值是 4,我们需要查明 eax 为什么的值是 4。相信很多小伙伴都知道,eax 用来保存函数调用的返回值。我们可以把注意力集中到 0x001EA6D6 处的 call 指令了,调用的是成员函数 _Root()

查看 vs 提供的源码,如下:

_Nodeptr& _Root() const
{ // return root of nonmutable treereturn (this->_Parent(this->_Myhead));
}

我们可以发现 _Root() 内部简单的调用了 _Parent() 函数,并把 this->_Myhead 当作参数传递过去了。再查看下 _Parent() 函数的源码,如下:

static _Nodepref _Parent(_Nodeptr _Pnode)
{ // return reference to parent pointer in nodereturn ((_Nodepref)_Pnode->_Parent);
}

务必注意: _Parent() 的返回值类型是 _Nodepref,返回的是引用(最后三个字母 ref 已经说明了一切)!相当于返回的是 _Pnode->_Parent 的地址!我们可以查看 _Nodepref 的定义:typedef _Nodeptr& _Nodepref;

所以 _Root() 函数相当于 &(this->_Myhead->_Parent)。我们来观察下 this 的值。

watch-this-value

可以看到 _Myhead 的值是 0,类型是 std::_Tree_node<...>

我们再看下 _Tree_node 的定义:

template<class _Value_type, class _Voidptr>
struct _Tree_node
{_Voidptr _Left;     // offset: 0x0_Voidptr _Parent;   // offset: 0x4_Voidptr _Right;    // offset: 0x8char _Color;        // offset: 0xCchar _Isnil;        // offset: 0xD_Value_type _Myval; // offset: 0x10private:_Tree_node& operator=(const _Tree_node&);
};

_Tree_node 的定义可知, _Parent 的偏移是 4 (因为是 32 位的程序,如果是 64 位,那么是 8)。

综上,地址 001EA6D6 处的 call 指令反回了 4。接下来的两条指令是把返回值赋给局部变量 _Nodeptr _Pnode。但是在执行第一条汇编指令  mov eax,dword ptr [eax] 时就挂了,因为 eax 的值是 4,正常情况下访问 0x00000004 处的值当然会挂掉了。

至此,我们知道了崩溃的直接原因——访问非法地址。但是根本原因是什么呢?为什么 _Myhead0 呢?我猜测是因为 map 还没有初始化。但是该如何证实这个猜测呢?

继续深入

CTest2 的构造函数里调用的是 CTest1::GetMap()GetMap() 内部会返回 CTest1 的静态变量 static std::map<std::string, std::string> s_manager; 的引用。

如果能证明在 CTest2::g_t2 初始化时,CTest1::s_manager 还没初始化,那么我们就证实了我们的猜测。

我想到两个办法:

  1. 在  map 的构造函数中输出一条日志。在调用 g_t2 的构造函数时,查看是否有我们在 map 中新加的日志。

  2. 明确每个全局变量的初始化顺序。

第一种方法比较简单,直接修改 vs 提供的源码即可,注意修改只读属性。本文以第 2 种方法为例展开。

全局变量初始化简介

本小节根据上面的调用栈简单的介绍全局变量的初始化过程(只介绍我们关心的部分)。

不知道各位小伙伴儿是否记得上面的调用栈。切换到 8 号栈帧,如下图:

__DllMainCRTStartup-call-_CRT_INIT

可以发现,在 __DllMainCRTStartup() 函数中,当 dwReason == DLL_PROCESS_ATTACH 或者 dwReason == DLL_THREAD_ATTACH 的时候,会调用 _CRT_INIT() 函数。_CRT_INIT() 会执行运行时库的初始化相关功能,比如,初始化全局变量。然后才会调用用户提供的 DllMain() 函数。

继续切换到 7 号栈帧,如下图:

crt_init

通过注释可知,_initterm() 是在调用 C++ constructors

我们继续切换到 6 号栈帧,如下图:

_initterm

根据注释猜测,应该是在依次调用每个全局变量的初始化函数。pfbegin 指向了保存全局变量初始化函数的表格的起始位置,pfend 指向最后一个有效位置的下一个位置,跟标准库中的容器多么相似啊。如果 *pfbegin 的值不为 0,说明表格对应的位置有有效的初始化函数,需要调用,否则就跳过。

vs 中,我们想遍历出这个表格的内容有些费劲。是时候请 windbg 出场了。

windbg 出场

在使用 windbg 之前一定要设置好符号路径,否则很多内容看不到。

使用 windbg 打开要运行的程序,在命令窗口输入 bm GlobalVariableInitializeOrderDll2!_CRT_INIT ,埋伏好断点后执行 g 命令继续运行。

set-breakpoint-by-bm

很快,就中断到我们设置好的断点处了。在调用 _initterm() 的地方设置好断点,执行 g 命令(也可以和 vs 一样按 F5),断下来后,单步进入 _initterm() 函数,执行 dv 查看局部变量。

single-step-to-initterm

从输出结果可知,pfbegin = 0x001f6000pfend = 0x001f6250。然后我们就可以用强悍的 dps 来查看pfbeginpfend 之间的内容了。在命令窗口执行,dps 0x001f6000 0x001f6250。因为有很多空项,这里只截取中间部分。

dps-0x001f6000-0x001f6250

我们可以很明显的看到,g_t2的构造函数在前,s_manager 的构造函数在后。

至此,已经证实了我们之前的猜想。

对比强化

因为工程 GlobalVariableInitializeOrderDll1 和工程 GlobalVariableInitializeOrderDll2 代码一模一样,只有一点点的不同,就是这一点不同导致了一个 dll 可以正常使用,另外一个却不能正常使用。

我们可以用相同的手法观察 GlobalVariableInitializeOrderDll1.dll 的初始化过程。

在命令窗口输入 bm GlobalVariableInitializeOrderDll1!_CRT_INIT;g ,埋伏好断点后运行起来。再次中断后,使用相同的办法进入_initterm() 函数,通过 dv 命令得到 pfbegin = 0x10026000pfend = 0x10026250 的值,然后执行 dps 0x10026000 0x10026250,如下图(同样有很多空项,只截取了中间部分):

我们发现,s_manager 的构造函数在前,g_t2的构造函数在后。

修复

我们应该从根本上消除对全局变量的依赖,只需要把 s_manager 放到 GetMap() 中就可以了。

static std::map<std::string, std::string>& GetMap()
{static std::map<std::string, std::string> s_manager;return s_manager;
}

但有时候,由于各种各样的原因,我们不能消除这种依赖。我们还可以调整全局变量的初始化顺序。只要有办法让 g_t2s_manager 之后再初始化就可以了。对比两个 dll 工程文件,我们发现有一处关键的不同点。

difference-of-project1-2

在能正常加载的 dll 对应的工程中, Test1.cpp, Test2.cpp 出现的顺序是 Test1.cpp, Test2.cpp,在不能正常加载的 dll 对应的工程中,出现的顺序是 Test2.cpp, Test1.cpp。调整 dll2.vcxproj 中的文件顺序和 dll1.vcxproj 一样,再次编译运行,一切顺利。

success

动手实战

强烈建议你也动手实战一番,毕竟纸上来的终觉浅。如果你也想动手实战,可以下载完整的工程文件,使用 vs2013 编译运行即可。如果没装 vs2013,也可以手动改成其它版本的 vs

完整的测试工程下载链接:

百度云 链接: https://pan.baidu.com/s/1gW1dZsNYZoo0s_rfaO2Jzg 提取码: 7irh

CSDN 链接:https://download.csdn.net/download/xiaoyanilw/12405380

总结

  • 永远不要让一个全局变量依赖另外一个全局变量。

  • 全局变量是在 DllMain 或者 main 函数执行前进行初始化的。

  • 在 32 位程序中,一般使用 eax 保存函数的返回值。

  • dps 命令可以按地址遍历给定范围的内容。

  • dv 命令可以查看局部变量和参数。

参考资料

如果有小伙伴儿对全局变量初始化感兴趣,可以参考以下几篇文档:

https://docs.microsoft.com/en-us/cpp/c-runtime-library/crt-initialization?redirectedfrom=MSDN&view=vs-2019

http://www.cppblog.com/xlshcn/archive/2007/12/07/37088.html

http://bytepointer.com/resources/pietrek_libctiny_2001.htm

需要你的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/309655.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MongoDB副本集

参考&#xff1a;https://www.cnblogs.com/littleatp/p/8562842.html https://www.cnblogs.com/ilifeilong/p/14347008.html MongoDB副本集 MongoDB副本集是由一组Mongod实例&#xff08;进程&#xff09;组成&#xff0c;包含一个Primary节点和多个Secondary节点。客户端的所…

博客系统知多少:揭秘那些不为人知的学问(一)

点击上方蓝字关注“汪宇杰博客”导语在我们生活的年代&#xff0c;博客并不稀奇&#xff0c;甚至可以说是随处可见。从最早的搜狐、新浪博客&#xff0c;再到每个人都曾记录青春的 QQ 空间&#xff0c;再到现在的 Vlog 与 Plog&#xff0c;似乎拥有一个自己的博客并不是什么难事…

MongoDB 分片

MongoDB 分片 高数据量&#xff08;消耗内存&#xff09;和高吞吐量&#xff08;消耗CPU&#xff09;的数据库应用会对单机的性能造成较大压力&#xff0c;为了解决这些问题&#xff0c;一般采用两种方法&#xff1a;水平扩展&#xff08;将数据集分布在多个服务器上&#xff…

How many ways HDU - 1978(记忆化搜索关于求多少种方式模板)

题目&#xff1a; 这是一个简单的生存游戏&#xff0c;你控制一个机器人从一个棋盘的起始点(1,1)走到棋盘的终点(n,m)。游戏的规则描述如下&#xff1a; 1.机器人一开始在棋盘的起始点并有起始点所标有的能量。 2.机器人只能向右或者向下走&#xff0c;并且每走一步消耗一单位…

Sql Server之旅——第七站 复合索引和include索引到底有多大区别?

索引和锁&#xff0c;这两个主题对我们开发工程师来说&#xff0c;非常的重要。。。只有理解了这两个主题&#xff0c;我们才能写出高质量的sql语句&#xff0c;在之前的博客中&#xff0c;我所说的索引都是单列索引。。。当然数据库不可能只认单列索引&#xff0c;还有我这篇的…

掌握了Docker Layer Caching才敢自称精通Dockerfile

长话短说&#xff1a;本次原创将向您展示在Docker中使用Layer Cache以加快镜像构建。“这个话题的初衷在于&#xff1a;应用打包过程是很慢的(下载并安装框架&第三方依赖包、生成assets)&#xff0c;这个过程在Docker中也不能避免。About Layer Caching in DockerDocker使…

How Many Answers Are Wrong HDU - 3038(带权并查集)

题意&#xff1a; TT写一个数列&#xff0c;现在TT会选择一个区间&#xff0c;然后让FF计算这个区间里面所有数的和&#xff0c;FF准备捉弄一下TT&#xff0c;有时候她会故意计算出来一个错的答案&#xff0c;当然TT也比较聪明&#xff0c;他会发现这个答案跟以前的答案会有冲…

ASP.NET Core on K8s学习之旅(14)Ingress灰度发布

【云原生】| 作者/Edison Zhou这是恰童鞋骚年的第236篇原创文章上一篇介绍了Ingress的基本概念和Nginx Ingress的基本配置和使用&#xff0c;然后我还录了一个快速分享小视频介绍了一下蓝绿发布和灰度发布策略的基本概念&#xff0c;本篇介绍一下如何实战使用Nginx Ingress实现…

[汇编语言]实验:应用更灵活的寻址方式来定位内存地址

实验内容: &#xff08;1&#xff09;将datasg段中每个单词的头一个字母改成大写字母。 datasg段中的数据为: &#xff08;2&#xff09; 将datasg段中每个单词的字母改成大写字母。 datasg段中的数据为: ibm dec dos vax …

你需要了解操作系统发展历程

本文我们大概回顾计算机操作系统发展历程&#xff0c;这里不会记录关于操作系统的完整历史记录&#xff0c;只是记录那些里程碑事件&#xff0c;看看各位接触计算机时&#xff0c;操作系统发展正处于哪个年代起初没有操作系统&#xff0c;没有编程语言或编译器&#xff0c;甚至…

基于 abp vNext 和 .NET Core 开发博客项目 - 使用Redis缓存数据

上一篇文章完成了项目的全局异常处理和日志记录。在日志记录中使用的静态方法有人指出写法不是很优雅&#xff0c;遂优化一下上一篇中日志记录的方法&#xff0c;具体操作如下&#xff1a;在.ToolKits层中新建扩展方法Log4NetExtensions.cs。//Log4NetExtensions.cs using log4…

第一讲 工作区和GOPATH

此为 《极客时间&Go语言核心36讲》 个人笔记&#xff0c;具体课程详见极客时间官网。 Table of Contents generated with DocToc 第一讲 工作区和GOPATH 1. 环境变量配置2. 配置GOPATH的意义 2.1 Go语言源码的组织方式2.2 源码安装后的结果&#xff08;归档文件、可执行文…

开发大会上,前微软CEO放出的狠话!.NET开发随时起飞,你准备好了吗?

“开发者&#xff0c;开发者&#xff0c;开发者&#xff0c;开发者”&#xff0c;微软前任CEO史蒂夫鲍尔默(Steve Ballmer)用这种略带疯狂、又唱又跳的方式表达他对开发者的热爱。不夸张的说&#xff0c;相比二十年前那个如日中天的巨无霸微软&#xff0c;现在的微软比以往任何…

程序员过关斩将--为微服务撸一个简约而不简单的配置中心

点击上方蓝字 关注我们毫不犹豫的说&#xff0c;现代高速发展的互联网造就了一批又一批的网络红人&#xff0c;这一批批网红又极大的催生了特定平台的一大波流量&#xff0c;但是留给了程序员却是一地鸡毛&#xff0c;无论是运维还是开发&#xff0c;每天都会担心服务器崩溃&a…

Just a Hook HDU - 1698(查询区间求和+最基础模板)

题意&#xff1a; 给你一个1~n的区间&#xff0c;起始区间内均为1&#xff0c;然后对子区间进行值更新&#xff0c;最后求区间和。 题目&#xff1a; In the game of DotA, Pudge’s meat hook is actually the most horrible thing for most of the heroes. The hook is ma…