记一次 .NET 某资讯论坛 CPU爆高分析

大概有11天没发文了,真的不是因为懒,本想前几天抽空写,不知道为啥最近求助的朋友比较多,一天都能拿到2-3个求助dump,晚上回来就是一顿分析,有点意思的是大多朋友自己都分析了几遍或者公司多年的牛皮藓问题,真的是心太累,不过也好,累那是走上坡路😂😂😂。

再回到正题,在一个月前,有位朋友wx找到我,他最近也在学习如何分析dump,可能经验不是很丰富,分析不下去了,截图如下:

c590f36082b27a463514d65332f7be0b.png

虽然dump中的问题千奇百怪,但如果要汇成大类,还是有一些规律可循的,比如:gc频繁触发,大量锁 等等,详细汇总可以观摩我的星球,好了,既然分析不下去,那就上 windbg。

二:Windbg 分析

1. 查看CPU利用率

既然报过来说cpu过高,我得用数据验证下不是,老命令 !tp

0:057> !tp
CPU utilization: 100%
Worker Thread: Total: 51 Running: 30 Idle: 0 MaxLimit: 400 MinLimit: 4
Work Request in Queue: 11Unknown Function: 6a0bbb30  Context: 1b4ca258Unknown Function: 6a0bbb30  Context: 1b4ca618Unknown Function: 6a0bbb30  Context: 1b4ca758Unknown Function: 6a0bbb30  Context: 1cb88d60Unknown Function: 6a0bbb30  Context: 1b4ca798Unknown Function: 6a0bbb30  Context: 1b5a54d0AsyncTimerCallbackCompletion TimerInfo@01f6e530Unknown Function: 6a0bbb30  Context: 1b5a5a50Unknown Function: 6a0bbb30  Context: 1cb892a0Unknown Function: 6a0bbb30  Context: 1b4ca8d8Unknown Function: 6a0bbb30  Context: 1cb88da0
--------------------------------------
Number of Timers: 1
--------------------------------------
Completion Port Thread:Total: 1 Free: 1 MaxFree: 8 CurrentLimit: 1 MaxLimit: 400 MinLimit: 4

我去,cpu打满了,对了,这里稍微提醒下, CPU utilization: 100% 指的是当前机器而不是程序,言外之意就是当机器的CPU 100% 时,并不一定是你所dump的程序造成的。

2. 是否为 GC 触发

面对这陌生的dump,先进行一些经验性排查,比如说是否为 GC 触发导致? 那怎么去验证这个假设呢?为了让结果更准确一点,用 !t -special 导出线程列表,看看是否有 GC SuspendEE 字样。

0:057> !t -special
ThreadCount:      109
UnstartedThread:  0
BackgroundThread: 74
PendingThread:    0
DeadThread:       35
Hosted Runtime:   noOSID Special thread type14 2594 DbgHelper 15 2be4 GC SuspendEE 16  dc4 GC 17 2404 GC 18  bb4 GC 19 2498 Finalizer 20 312c ProfilingAPIAttach 21  858 Timer 22 3a78 ADUnloadHelper 27 290c GC 28 2e24 GC 29 28b0 GC 30 1e64 GC 38 3b24 ThreadpoolWorker ...90 2948 Gate

从输出看,尼玛果然有,那就表明确实是GC触发所致,如果你还不相信的话,可以参考下 coreclr 源码。

size_t
GCHeap::GarbageCollectGeneration(unsigned int gen, gc_reason reason)
{dprintf (2, ("triggered a GC!"));gc_heap::gc_started = TRUE;{init_sync_log_stats();#ifndef MULTIPLE_HEAPScooperative_mode = gc_heap::enable_preemptive ();dprintf (2, ("Suspending EE"));BEGIN_TIMING(suspend_ee_during_log);GCToEEInterface::SuspendEE(SUSPEND_FOR_GC);END_TIMING(suspend_ee_during_log);gc_heap::proceed_with_gc_p = gc_heap::should_proceed_with_gc();gc_heap::disable_preemptive (cooperative_mode);if (gc_heap::proceed_with_gc_p)pGenGCHeap->settings.init_mechanisms();elsegc_heap::update_collection_counts_for_no_gc();#endif //!MULTIPLE_HEAPS}
}

看到上面的 SuspendEE 的吗,它的全称就是 Suspend CLR Execute Engine,接下来我们用 ~*e !dumpstack 看看哪一个线程触发了 CLR 中的 GarbageCollectGeneration 方法。

9dfcab3fdc16301a72429fce5cafd2b7.png

从图中可以看到是 53 号线程触发了,切到53号线程后换用 !clrstack

9d6dd5179b13bce914e136ed002dd78e.png

从线程栈看,程序做了一个 XXX.GetAll() 操作,一看这名字就蛮恐怖的,接下来我们再看看这块源码,到底做了什么操作,简化后的源码如下:

public static List<xxxx> GetAll(){string text = "xxxProperty_GetAll";SqlDatabase val = new SqlDatabase(m_strConnectionString);xxxPropertyTreeInfo xxxPropertyTreeInfo = null;List<xxxPropertieInfo> list = new List<xxxPropertieInfo>();DbCommand storedProcCommand = ((Database)val).GetStoredProcCommand(text);using (IDataReader reader = ((Database)val).ExecuteReader(storedProcCommand)){while (DataBase.DataReaderMoveNext(reader)){xxxPropertyTreeInfo = new xxxPropertyTreeInfo();xxxPropertyTreeInfo.LoadDataReader(reader);list.Add(xxxPropertyTreeInfo);}}return list;}public virtual void LoadDataReader(MethodBase method, object obj, IDataReader reader){Hashtable hashtable = new Hashtable();for (int i = 0; i < reader.FieldCount; i++){hashtable.Add(reader.GetName(i).ToLower(), reader.GetValue(i));}Hashtable fieldProperties = GetFieldProperties(method, FieldType.DBField);foreach (object key in fieldProperties.Keys){PropertyInfo p = (PropertyInfo)fieldProperties[key];object v = null;if (hashtable.Contains(key)){v = hashtable[key];}if (v != null){SetPropertieValue(ref obj, ref p, ref v);}}}

从源码逻辑看:它执行了一个存储过程 xxxProperty_GetAll , 然后把获取到数据的 reader 和 xxxPropertyTreeInfo 做了一个 mapping 映射,在映射的过程中触发了GC。

3. 是否为数据过大导致?

按照以往经验,应该是从数据库中获取了过多数据导致,那本次dump是不是呢?要想寻找答案, 先用 !dso 命令导出线程栈所有变量,然后用 !do xxx 查看 List<xxxPropertieInfo> list 的size,如下图所示:

9e62fff7429670d534513bc7f85b0461.png

从图中看,这个size并不大,那为什么会导致gc频繁触发呢?就算做了 反射 产生了很多的小对象,应该也没多大影响哈。。。这又让我陷入了沉思。。。

4. 寻找问题根源

经过一顿查找,我发现了几个疑点。

  1. 有24个线程正在执行 XXX.GetALL() 方法。

0758d360cfdb4dcbbd5aa3d25eda7079.png
  1. 托管堆中发现了 123 个 list,大的size 也有 1298,所以合计起来也不小哈。。。

0:053> !dumpheap -mt 1b9eadd0Address       MT     Size
02572a9c 1b9eadd0       24     
026eca58 1b9eadd0       24     
0273d2a0 1b9eadd0       24 
...Statistics:MT    Count    TotalSize Class Name
1b9eadd0      123         2952 System.Collections.Generic.List`1[[xxxPropertieInfo, xxx.Model]]0:053> !DumpObj /d 28261894
Name:        System.Collections.Generic.List`1[[xxxPropertieInfo, xxx.Model]]
MethodTable: 1b9eadd0
EEClass:     6e2c6f8c
Size:        24(0x18) bytes
File:        C:\Windows\Microsoft.Net\assembly\GAC_32\mscorlib\v4.0_4.0.0.0__b77a5c561934e089\mscorlib.dll
Fields:MT    Field   Offset                 Type VT     Attr    Value Name
6e6ff32c  4001891        4     System.__Canon[]  0 instance 23710638 _items
6e6f1bc0  4001892        c         System.Int32  1 instance     1298 _size
6e6f1bc0  4001893       10         System.Int32  1 instance     1298 _version
6e6f0100  4001894        8        System.Object  0 instance 00000000 _syncRoot
6e6ff32c  4001895        4     System.__Canon[]  0   static  <no information>
  1. 程序是 32bit

从内存地址就能判断当前程序是 32bit,这就意味着它的 segment 段会很小,也就意味着更多的GC回收。

三:总结

本次事故是由于:

  1. 多个线程频繁重复的调用 size=1298 的 GetALL() 方法。

  2. 使用低效的 反射方式 进行model映射,映射过程中产生了不少的小对象。

  3. 过小的 segment (32M)

三者结合造成GC频繁的触发。

改进方法也很简单。

  • 最简单粗暴的方法:将数据库的查询结果缓存一份。

  • 稍微正规一点方法:用 Dapper 替换低效的 手工反射,将程序改成 64bit 。

和朋友沟通了解,采用了第一种方法,终于把 CPU 摁下去了,一切都恢复了平静!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/296450.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

内存调试技巧

内存调试技巧 2007 年 6 月 21 日 本文将带您了解一些良好的和内存相关的编码实践&#xff0c;以将内存错误保持在控制范围内。内存错误是 C 和 C 编程的祸根&#xff1a;它们很普遍&#xff0c;认识其严重性已有二十多年&#xff0c;但始终没有彻底解决&#xff0c;它们可能严…

CSS中的!important属性用法

由于IE并不严格执行W3C标准&#xff0c; 而又几乎垄断了浏览器市场。 所以作为一名合格的网站制作人员&#xff0c; 必须要针对不同的浏览器进行微调。 实现不同浏览器之间兼容的方法有很多&#xff0c; 比如利用JS探测用户的浏览器类型&#xff0c;从而调用不同的样式表。 或者…

java中equals和==的区别

值类型是存储在内存中的堆栈&#xff08;以后简称栈&#xff09;&#xff0c;而引用类型的变量在栈中仅仅是存储引用类型变量的地址&#xff0c;而其本身则存储在堆中。操作比较的是两个变量的值是否相等&#xff0c;对于引用型变量表示的是两个变量在堆中存储的地址是否相同&a…

数学课本上的几大变态之处

全世界只有3.14 % 的人关注了爆炸吧知识数学课本上的几大变态--完--

使用Redis set 解决数据的唯一性问题

前言最近遇到一个问题&#xff0c;就是接收第三方数据的时候&#xff0c;类似这种直播数据&#xff0c;由于业务的缘故&#xff0c;导致对方给的数据每次都是全量的&#xff0c;而且请求很频繁&#xff0c;有时候一秒好几十次。直播数据一般都是刷刷刷的&#xff0c;这个大家或…

mysql集群从节点无法启动_一次galera cluster集群故障节点无法启动问题排查

现象环境&#xff1a;Server version: 10.0.25-MariaDB-wsrep MariaDB Server, wsrep_25.13.raf7f02e配置文件&#xff1a;[rootnode-23 mariadb]# more /etc/my.cnf[mysqld]server_id3bind_address node-23port 3306datadir/var/lib/mysqllog-error/var/log/mariadb/mariadb…

DbVisualizer 8 解决中文乱码问题

DbVisualizer 8 解决中文乱码问题 原文http://blog.chinaunix.net/uid-26640696-id-3128544.html 在SQL Commander中&#xff0c;sql语句中如果有中文&#xff0c;显示是‘口口口’。解决办法如下&#xff1a; 在Tools->tool Properties->General->Appearance->Fon…

webform 页面传值的方法总结

ASP.NET页面之间传递值的几种方式 页面传值是学习asp.net初期都会面临的一个问题&#xff0c;总的来说有页面传值、存储对象传值、ajax、类、model、表单等。但是一般来说&#xff0c;常用的较简单有QueryString&#xff0c;Session&#xff0c;Cookies&#xff0c;Application…

【转】Android编程点滴(14) -- Android中资源文件夹res/raw和assets的使用

*res/raw和assets的相同点&#xff1a; 1.两者目录下的文件在打包后会原封不动的保存在apk包中&#xff0c;不会被编译成二进制。 *res/raw和assets的不同点&#xff1a;1.res/raw中的文件会被映射到R.java文件中&#xff0c;访问的时候直接使用资源ID即R.id.filename&#xff…

iNeuOS工业互联网操作系统,智慧用电测控应用案例

目 录1. 概述... 22. 系统部署结构... 23. 用电测控终端... 34. 系统应用介绍... 61. 概述通过物联网技术对引发电气火灾的主要因素(导线温度、电流和漏电流等)进行不间断的数据跟踪与统计分析&#xff0c;实时发现电气线路和用电设备存在的安全隐…

mysql 修改库的校对集_mysql数据库的基本操作(增删改查、字符集、校对集)

MySQL数据库概述MySQL数据库是经典的关系型数据库管理系统&#xff0c;MySQL 是最流行的关系型数据库管理系统之一&#xff0c;在 WEB 应用方面&#xff0c;MySQL是最好的 RDBMS (Relational Database Management System&#xff0c;关系数据库管理系统) 应用软件。MySQL是一款…

出现了!豆瓣最高9.9分,2020年最值得看的美剧!你居然还没看过?【内附资源】...

全世界只有3.14 % 的人关注了爆炸吧知识在调性普遍黄暴烧脑的美剧大流中&#xff0c;《This is us》没有大牌主演&#xff0c;没有炫酷特效&#xff0c;却让观众集体沦陷&#xff0c;被称为5年难得一见的美剧。有人说&#xff0c;这是「有生之年看过的最温柔的美剧」。但它取得…

静态注册BroadcastReceiver内部类

先看代码&#xff1a; [java] view plaincopy public class ZonePicker { public static class SetDefaultTimeZone extends BroadcastReceiver{ Override public void onReceive(Context context, Intent intent) { // TODO Auto-gener…

Excel VBA - Workbook对象

来源&#xff1a;http://blog.csdn.net/alexbnlee/article/details/6911204 Workbooks(1).Name Workbooks(1).FullName 工作簿地址加名字 Workbooks(1).Path 工作簿地址 Workbooks(1).Close SaveChanges:False 关闭工作簿&#xff0c;并且不保存 Workbooks.Open ThisW…

C# 修改配置文件进行窗体logo切换

01—前言&#xff1a;题外的话大家可能发现这个号现在原创越来越少了&#xff0c;其实小编并没有放弃持续更新&#xff0c;只是把一手原创放到了 【dotnet编程大全】这个号了&#xff0c;那个号目前原创主要更新的是wpf mvvm方面的知识&#xff0c;框架用的Caliburn.Micro&…

数学有趣地超乎你的想象

全世界只有3.14 % 的人关注了爆炸吧知识说起数学你是拒绝还是喜欢看完这一组&#xff0c;对于数学他的震撼、霸气、美来感受下哇1三角形内角和为1802多边形外角和为360&#xff08;图来源于可乐学习&#xff09;3怎样将一个正三角形剪拼成正方形&#xff1f;4怎样把两正方形剪拼…

bitset 运算

C提供bits类&#xff0c;支持位向量的操作。 引入头文件bitset &#xff1a; #include <bitset> 定义bitset变量 bitset<位向量长度><变量名>&#xff1b; 默认变量所有位都被初始化为0 有两种初始化方式 用一个无符号整数作参数&#xff0c;bitset前N位将被…

phpcms2008常用函数

{$head[title]} 页面标题&#xff0c;用法&#xff1a; <title>{$head[title]}-{$PHPCMS[sitename]}</title> {$PHPCMS[sitename]} 网站名称 用法&#xff1a;<title>{$head[title]}-{$PHPCMS[sitename]}</title> {$head[keywords]} 关键字 用法&#…

“”和“” java

“>>”算术右移运算符, 表示带符号右移&#xff0c;它使用最高位填充移位后左侧的空位。右移的结果为&#xff1a;每移一位&#xff0c;第一个操作数被2除一次&#xff0c;移动的次数由第二个操作数确定。按二进制形式把所有的数字向右移动对应巍峨位数&#xff0c;低位移…

使用C#像google/zx一样编写脚本

google/zxzx是谷歌开源的一个能够帮助开发者快速编写脚本的工具&#xff0c;它使用JavaScript作为编程语言。示例脚本如下&#xff1a;#!/usr/bin/env zxawait $cat package.json | grep namelet branch await $git branch --show-current await $dep deploy --branch${branch…