如何解决Binder泄漏问题

作者:王小二C  2019/09/06

前言

[011]一个看似是系统问题的应用问题的解决过程[1]中我们解决了一个注册过多的BroadcastReceiver导致的某一次发送广播失败的问题。我这边遇到了一个类似的问题,但是我用了一个可能网络上从来没有提出过的方法,解决了这个问题,写下这个文章记录一下,如果三年前的我肯定想不出这种解决手段。

问题

简单看了一下log,发现和[011]一个看似是系统问题的应用问题的解决过程[2]的root cause是一样的,还是在这次发广播的Binder通信中无法申请足够的buffer。

1143 1297 W BroadcastQueue: Can't deliver broadcast to com.android.systemui (pid 2107). Crashing it.	
1143 1297 W BroadcastQueue: Failure sending broadcast Intent { act=android.intent.action.BATTERY_CHANGED flg=0x60000010 (has extras) } 	
1143 1297 W BroadcastQueue: android.os.DeadObjectException: Transaction failed on small parcel; remote process probably died	
1143 1297 W BroadcastQueue: at android.os.BinderProxy.transactNative(Native Method)	
1143 1297 W BroadcastQueue: at android.os.BinderProxy.transact(Binder.java:1129)	
1143 1297 W BroadcastQueue: at android.app.IApplicationThread$Stub$Proxy.scheduleRegisteredReceiver(IApplicationThread.java:1237)	
1143 1297 W BroadcastQueue: at com.android.server.am.BroadcastQueue.performReceiveLocked(BroadcastQueue.java:496)	
1143 1297 W BroadcastQueue: at com.android.server.am.BroadcastQueue.deliverToRegisteredReceiverLocked(BroadcastQueue.java:715)	
1143 1297 W BroadcastQueue: at com.android.server.am.BroadcastQueue.processNextBroadcastLocked(BroadcastQueue.java:875)	
1143 1297 W BroadcastQueue: at com.android.server.am.BroadcastQueue.processNextBroadcast(BroadcastQueue.java:834)	
1143 1297 W BroadcastQueue: at com.android.server.am.BroadcastQueue$BroadcastHandler.handleMessage(BroadcastQueue.java:172)	
1143 1297 W BroadcastQueue: at android.os.Handler.dispatchMessage(Handler.java:106)	
1143 1297 W BroadcastQueue: at android.os.Looper.loop(Looper.java:193)	
1143 1297 W BroadcastQueue: at android.os.HandlerThread.run(HandlerThread.java:65)	
1143 1297 W BroadcastQueue: at com.android.server.ServiceThread.run(ServiceThread.java:44)	
1143 1297 W BroadcastQueue: Can't deliver broadcast to com.android.systemui (pid 2107). Crashing it.

初步分析

首先我按照之前解决问题的思路,看systemui是否注册了过多的BATTERY_CHANGED的广播,但是排查了好多遍代码,好像systemui并没有注册过多的广播,这条路走不通。

查看内存信息

通过反复的测试,我发现systemui中存在大量的Local Binder,这个代表systemui创建了2207个Binder的Server端,这明显是不正常的。

** MEMINFO in pid 2558 [com.android.systemui] **	Objects	Views:     4976         ViewRootImpl:        5	AppContexts:      201           Activities:        1	Assets:       21        AssetManagers:        0	Local Binders:     2207        Proxy Binders:      267	Parcel memory:       91         Parcel count:      434	Death Recipients:      196      OpenSSL Sockets:        0	WebViews:        0

如果找到Binder对象莫名增长的原因?

方案1:抓Hprof的文件

通过抓Hprof的文件,想查看Binder这个类的引用名,发现都是临时变量,并没有引用名,这条路走不通。

方案2:纯看代码

由于这个模块不是我负责的,我也不是特别熟悉,这条路也走不通

重要发现

正当我一筹莫展的时候,同事发现反复进行某个操作的时候,会导致Binder增加,这个给了我一些线索,这个时候其实如果去反复看这个操作的代码,我相信肯定可以找到原因,但是这个也只是把大海捞针变成了游泳池捞针,还是挺费时间的,对于代码不熟悉的我来说,这个难度有点大。

#这样的Binder对象对系统有威胁吗?假如我按照以下的代码,创建多个Binder对象,其实对系统没有威胁,因为这样子的Binder对象并不会在Binder驱动中创建Binder Node,说白了就是一个普通类,其他进程并不会持有这个Binder的BinderProxy对象。

while(true) {	Binder binder = new Binder();	
}

怎么的Binder对象对系统有威胁?

首先我们可以确认,systemui创建的Binder对象肯定是匿名的Binder对象,匿名的Binder对象只有通过Binder的接口传递的时候才会创建Binder Node,这样子才有威胁。既然要通过Binder的接口,必定要走以下代码,所以我在下面加了这个Debug Log,我前面所说的关键方法,这个Debug Log。

Parcel.java	
public final void writeStrongBinder(IBinder val) {	if(Binder.getCallingUid() == 10049) {//10049是systemui的uid	android.util.Log.v("kobewang", "writeStrongBinder", new Exception("kobewang"));	}	nativeWriteStrongBinder(mNativePtr, val);	
}

发现了异常的log

从下面的异常堆栈,发现一个问题不管是addCallback,还是removeCallback,都会调用registerSoftApCallback,这不是明显的错误了吗,不应该是removeCallback调用unregisterSoftApCallback才对嘛。

kobewang: writeStrongBinder	
kobewang: java.lang.Exception: kobewang	
kobewang:     at android.os.Parcel.writeStrongBinder(Parcel.java:738)	
kobewang:     at android.net.wifi.IWifiManager$Stub$Proxy.registerSoftApCallback(IWifiManager.java:2341)	
kobewang:     at android.net.wifi.WifiManager.registerSoftApCallback(WifiManager.java:2664)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.updateWifiStateListeners(HotspotControllerImpl.java:128)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.addCallback(HotspotControllerImpl.java:94)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.addCallback(HotspotControllerImpl.java:35)	
kobewang:     at com.android.systemui.qs.tiles.HotspotTile.handleSetListening(HotspotTile.java:84)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl.handleSetListeningInternal(QSTileImpl.java:401)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl.access$700(QSTileImpl.java:70)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl$H.handleMessage(QSTileImpl.java:544)	
kobewang:     at android.os.Handler.dispatchMessage(Handler.java:106)	
kobewang:     at android.os.Looper.loop(Looper.java:193)	
kobewang:     at android.os.HandlerThread.run(HandlerThread.java:65)	
kobewang: writeStrongBinder	
kobewang: java.lang.Exception: kobewang	
kobewang:     at android.os.Parcel.writeStrongBinder(Parcel.java:738)	
kobewang:     at android.net.wifi.IWifiManager$Stub$Proxy.registerSoftApCallback(IWifiManager.java:2341)	
kobewang:     at android.net.wifi.WifiManager.registerSoftApCallback(WifiManager.java:2664)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.updateWifiStateListeners(HotspotControllerImpl.java:128)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.removeCallback(HotspotControllerImpl.java:105)	
kobewang:     at com.android.systemui.statusbar.policy.HotspotControllerImpl.removeCallback(HotspotControllerImpl.java:35)	
kobewang:     at com.android.systemui.qs.tiles.HotspotTile.handleSetListening(HotspotTile.java:88)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl.handleSetListeningInternal(QSTileImpl.java:407)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl.access$700(QSTileImpl.java:70)	
kobewang:     at com.android.systemui.qs.tileimpl.QSTileImpl$H.handleMessage(QSTileImpl.java:544)	
kobewang:     at android.os.Handler.dispatchMessage(Handler.java:106)	
kobewang:     at android.os.Looper.loop(Looper.java:193)	
kobewang:     at android.os.HandlerThread.run(HandlerThread.java:65)

代码分析

从代码中可以发现removeCallback方法中updateWifiStateListeners(!mCallbacks.isEmpty());是有问题的。他这样子写代码会导致removeCallback,最后走的也是registerSoftApCallback。

frameworks/base/packages/SystemUI/src/com/android/systemui/statusbar/policy/HotspotControllerImpl.java	@Override	public void addCallback(Callback callback) {	synchronized (mCallbacks) {	if (callback == null || mCallbacks.contains(callback)) return;	if (DEBUG) Log.d(TAG, "addCallback " + callback);	mCallbacks.add(callback);	updateWifiStateListeners(!mCallbacks.isEmpty());	}	}	@Override	public void removeCallback(Callback callback) {	if (callback == null) return;	if (DEBUG) Log.d(TAG, "removeCallback " + callback);	synchronized (mCallbacks) {	mCallbacks.remove(callback);	//问题点:如果mCallbacks永远存在一个callback,	//那么!mCallbacks.isEmpty()就永远是true。	updateWifiStateListeners(!mCallbacks.isEmpty());	}	}	private void updateWifiStateListeners(boolean shouldListen) {	mWifiStateReceiver.setListening(shouldListen);	if (shouldListen) {	//永远只会走registerSoftApCallback	mWifiManager.registerSoftApCallback(	this,	Dependency.get(Dependency.MAIN_HANDLER));	} else {	mWifiManager.unregisterSoftApCallback(this);	}	}

查看了registerSoftApCallback的代码,发现这个接口,会创建不止一个Binder对象,而是两个Binder对象,一个Binder,一个SoftApCallbackProxy。

    public void registerSoftApCallback(@NonNull SoftApCallback callback,	@Nullable Handler handler) {	if (callback == null) throw new IllegalArgumentException("callback cannot be null");	Log.v(TAG, "registerSoftApCallback: callback=" + callback + ", handler=" + handler);	Looper looper = (handler == null) ? mContext.getMainLooper() : handler.getLooper();	Binder binder = new Binder();//一个binder对象	try {	//SoftApCallbackProxy也是一个Binder对象	mService.registerSoftApCallback(binder, new SoftApCallbackProxy(looper, callback),	callback.hashCode());	} catch (RemoteException e) {	throw e.rethrowFromSystemServer();	}	}

总结

其实这是一个android 9.0的原生bug,所以有时候谷歌工程师也会犯错误,那如果来解决这个问题,其实这个问题已经在android 10上被谷歌工程师修复了,修复的方式,由于保密协议,我无法贴出android 10的代码,等代码正式释放了,你们可以看看如何修复这个问题,当然你们自己也可以想想如何解决这个bug,其实也不是特别难。

PS

经过解决了两个Binder申请buffer失败的问题,我觉得最近几年持续不断的研究Binder驱动是非常值得的,换做2年前的我,可能就会和测试扯皮了,让他monitor这些问题,然后然后最后无法复现或者低概率,这个bug就被close掉了。当然我现在还会遇到一些低概率input ANR难以解决的问题,以我现在的水平,还是无法解决这类问题,我相信在我不断的学习之下,肯定最后会被我攻克的。

应用开发的建议

1.register和unregister一定要成对出现

2.对于注册callback到system_server进程,一定要注意,因为一般这种callback就是一个binder对象,所以最好注册一次,如果多处代码需要注册这个callback,请在通过你的应用层注册一个callbackmanager到system_server,然后其他callback,都注册到你的callbackmanager,这样子system_server和你的应用跨进程通信就只需要一次。

References

[1] [011]一个看似是系统问题的应用问题的解决过程: /p/160290f38ee9

640?wx_fmt=jpeg

扫码或长按关注

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/468446.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker-compose实战——Django+PostgreSQL

今天我们来用docker-compose 快速安装一个DjangoPostgreSQL的开发环境。 Compose简介 Compose 定位是“defining and running complex applications with Docker”,前身是 Fig,兼容 Fig 的模板文件。 Dockerfile 可以让用户管理一个单独的应用容器&#…

终于赢球了

感谢老将易建联我们要承认一个事实,阿联是这届男篮里面的老将,是唯一一个80后球员,很多人不了解老将意味着什么,很多打篮球的人都有一个感觉,在高中时代的时候,打球的时候经常在天上飞来飞去不觉得累&#…

Zookeeper原理和实战开发经典视频教程 百度云网盘下载

Zookeeper原理和实战开发 经典视频教程 百度云网盘下载 资源下载地址:http://pan.baidu.com/s/1o7ZjPeM 密码:r5yf 转载于:https://www.cnblogs.com/heitaok/p/6979781.html

C语言大神进来看看这个题目

之前一个读者给我发的一个题目,我大概看了下,题目的难度还是比较大的,而且考察的内容也比较多,可能在实际项目上使用比较少,估计十几年的老码农都没有用过,但是在看大神的代码的时候,就特别考验…

qq浏览器主页_安卓浏览器哪家强?这些小众好用的手机浏览器你知道吗

前言无论手机还是电脑,浏览器都可以说是最重要的软件之一了。最流行的 Chrome 和 Firefox,国内常见的还有 UC、QQ、360 浏览器等。手机上可供选择的优秀浏览器还有很多,这次就推荐些其他的小众但是也很好用的安卓手机浏览器。安卓手机浏览器推…

ms access to mysql_Access转MySQL工具

Bullzip MS Access To MySQL是一个Access转MySQL工具,可以帮助用户把MS Access数据库中的内容转到MySQL数据库中,支持全部转换以及有选择的转换,支持命令行,非常适合有Access转MySQL需求的数据库维护人员使用。Bullzip MS Access …

_一文让你透彻理解Linux的SOCKET编程(含实例解析)

1. 网络中进程之间如何通信进 程通信的概念最初来源于单机系统。由于每个进程都在自己的地址范围内运行,为保证两个相互通信的进程之间既互不干扰又协调一致工作,操作系统为进程通信提供了相应设施,如UNIX BSD有:管道(…

老师好

今天是教师节,今年楠哥也上幼儿园了,以后估计会经常跟老师有接触,我楼上的一个邻居,叫老莫,跟我的关系很好,有钱,又有儿有女,大女儿现在已经上小学了,每天上班的时候&…

Linux 下的推迟执行

准备中秋节说个活动,评论文章点赞排名,用心评论哦,前5名获得每人 19 心意红包。感谢大家的支持我最近在用freertos,想让一个任务在某个时间后再执行,找了一圈,竟然没有这样才处理机制,因为也是新…

js 获得明天0点时间戳_js实现一个简单钟表动画(javascript+html5 canvas)

自己学生时代的代码,发现还保存着,今天拿出来分享下。用js和html5 canvas对象实现一个简单钟表程序主要用到的就是h5的canvas对象canvas对象本人也不是很熟,大致看了几个常用的方法,难免有不足之处,仅是练习所用。实现…

mysql 根据当前时间戳_mysql timestamp类型 根据当前时间戳更新

注意到这个是因为一次事故。一个简单的操作记录表,只记录了一个操作人,操作时间,操作结果。当时为了演示效果,在生产环境中去修改,创建数据。一顿操作猛如虎之后发现,所有改过的数据的创建时间都变成了当前…

设置拖拽事件,获取拖拽内容

设置dragEnter 设置DragDrop using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.Threading.Tasks; using…

笔记本电脑锁_2020年双11有哪些值得选购的笔记本电脑?(全能本/便携高性能笔记本电脑/设计本)...

(本文于2020年10月22日更新)本文章会不定期更新,保证文章的时效性和准确性,可点赞或收藏本文章,这样在需要的时候可以找到啦。文章推荐产品较多,按价位排序,篇幅较长,可按键盘CtrlF快…

300来行代码实现最小Linux文件系统

Linux作为一个类UNIX系统,其文件系统保留了原始UNIX文件系统的表象形式,它看起来是这个样子:rootname-VirtualBox:/# lsbin boot cdrom dev etc home lib lib64 lostfound media mnt opt proc root run sbin snap srv sys …

淘宝怎么多个订单一起付款_淘宝未付款订单如何催付?

淘宝未付款订单如何催付?很多人只认为运营就是技巧,其实客服也是需要技巧的,客服也是关键的数据支撑。一个好的客服团队,能够很好地提高转化率、客单价、复购率,有效的降低退款率、纠纷等售后问题。今天和大家分享一下…

爱大姚,恨男篮

先祝姚明生日快乐2019年9月12日。是中国篮协主席、CBA董事长姚明39岁的生日,时间已经过去几天了,当时铺天盖地的都是其他的热点新闻,很多人,包括我也忘记了这个大个子已经39岁了,看着中国男篮的惨败,很想冲…

Linux 内核系统架构

描述Linux内核的文章已经有上亿字了但是对于初学者,还是应该多学习多看,毕竟上亿字不能一下子就明白的。即使看了所有的Linux 内核文章,估计也还不是很明白,这时候,还是需要fucking the code.28年前(1991年8月26日)Lin…

gif透明背景动画_如何利用premiere制作GIF动态图片

GIF制作流程(也可以用此教程把视频变成GIF动图)作者:益红一、导出设计文件将要做动画的文件在ps里面导出 (透明图层用PNG)(也可以将合适的视频片段作为素材)二、在PR里面新建项目打开 Adobe premiere选择 新建项目找到新建项目 — 命名 —设置合适的项目 位置-点击浏…

离职了

这是我毕业后的第一份工作...面试时,HR小姐姐告诉我...然鹅...我入职之后才发现:对标阿里的只有加班强度对标华为的只有狼性文化对标百度的,额,没有对标百度同事们有的住在海淀区、有的住在朝阳区,作为刚毕业的一枚“穷…

windows7官方原版_如何下载微软原版操作系统、办公软件

如何下载微软原版操作系统、办公软件?简介:微软操作系统从MS-DOS到Windows XP,Windows 7,Windows 8,再到现在的Windows 10 ,一代比一代强,每代都有自己的特点。现在我们能从官网上下载到的只有W…