Android13 针对low memory killer内存调优

引入概念

在旧版本的安卓系统中,当触发lmk(low memory killer)的时候一般认为就是内存不足导致,但是随着安卓版本的增加lmk的判断标准已经不仅仅是内存剩余大小,io,cpu同样会做评判,从而保证设备性能。这里引入的概念就是psi(Pressure Stall Information)压力失速信息,用来检测内存压力,这样能够更全面的保证我们的内存性能,提高设备反应速度。

Android 10 及更高版本支持新的 lmkd 模式,它使用内核压力失速信息 (PSI) 监视器来检测内存压力。上游内核中的 PSI 补丁程序集(已向后移植到 4.9 和 4.14 内核)可测量由于内存不足导致任务延迟的时间。由于这些延迟会直接影响用户体验,因此它们代表了确定内存压力严重性的便捷指标。上游内核还包括 PSI 监视器,这类监视器允许特权用户空间进程(例如 lmkd)指定这些延迟的阈值,并在突破阈值时从内核订阅事件。

PSI 监视器与 vmpressure 信号

由于 vmpressure 信号(由内核生成,用于检测内存压力并由 lmkd 使用)通常包含大量误报,因此 lmkd 必须执行过滤以确定是否真的存在内存压力。这会导致不必要的 lmkd 唤醒并使用额外的计算资源。使用 PSI 监视器可以实现更精确的内存压力检测,并最大限度地减少过滤开销。

使用 PSI 监视器

如需使用 PSI 监视器(而不是 vmpressure 事件),请配置 ro.lmk.use_psi 属性。默认值为 true,这会以 PSI 监视器作为 lmkd 内存压力检测的默认机制。由于 PSI 监视器需要内核支持,因此内核必须包含 PSI 向后移植补丁程序,并在启用 PSI 支持 (CONFIG_PSI=y) 的情况下进行编译。

为何舍弃原始内核LMK策略

内核中 LMK 驱动程序的缺点

由于存在大量问题,Android 弃用了 LMK 驱动程序,问题包括:

  • 对于低内存设备,必须主动进行调整,即便如此,在处理涉及支持大文件的活跃页面缓存的工作负载时,其性能也较差。性能不良会导致出现抖动,但不会终止。
  • LMK 内核驱动程序依赖于可用内存限制,不会根据内存压力进行扩缩。
  • 由于设计的严格性,合作伙伴通常会自定义该驱动程序,使其可以在自己的设备上使用。
  • LMK 驱动程序已挂接到 Slab Shrinker API,该 API 并非为了执行繁重操作(例如搜索并终止目标)而设计,这类操作会导致 vmscan 进程变慢。

用户空间 lmkd

用户空间 lmkd 可实现与内核中的驱动程序相同的功能,但它使用现有的内核机制检测和评估内存压力。这些机制包括使用内核生成的 vmpressure 事件或压力失速信息 (PSI) 监视器来获取关于内存压力水平的通知,以及使用内存 cgroup 功能限制根据进程的重要性分配给每个进程的内存资源。

在 Android 10 中使用用户空间 lmkd

在 Android 9 及更高版本中,用户空间 lmkd 会在未检测到内核中的 LMK 驱动程序时激活。由于用户空间 lmkd 要求内核支持内存 cgroup,因此必须使用以下配置设置编译内核:

CONFIG_ANDROID_LOW_MEMORY_KILLER=n
CONFIG_MEMCG=y
CONFIG_MEMCG_SWAP=y

终止策略

用户空间 lmkd 支持基于以下各项的终止策略:vmpressure 事件或 PSI 监视器、其严重性以及交换利用率等其他提示。低内存设备和高性能设备的终止策略有所不同:

  • 对于内存不足的设备,一般情况下,系统会选择承受较大的内存压力。
  • 对于高性能设备,如果出现内存压力,则会视为异常情况,应及时修复,以免影响整体性能。

您可以使用 ro.config.low_ram 属性配置终止策略。如需了解详情,请参阅低 RAM 配置。

用户空间 lmkd 还支持一种旧模式,在该模式下,它使用与内核中的 LMK 驱动程序相同的策略(即可用内存和文件缓存阈值)做出终止决策。要启用旧模式,请将 ro.lmk.use_minfree_levels 属性设置为 true

配置 lmkd

使用以下属性为特定设备配置 lmkd

属性使用默认
ro.config.low_ram指定设备是低内存设备还是高性能设备。false
ro.lmk.use_psi使用 PSI 监视器(而不是 vmpressure 事件)。true
ro.lmk.use_minfree_levels使用可用内存和文件缓存阈值来做出进程终止决策(即与内核中的 LMK 驱动程序的功能一致)。false
ro.lmk.low在低 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。1001
(停用)
ro.lmk.medium在中等 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。800
(已缓存或非必要服务)
ro.lmk.critical在临界 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。0
(任何进程)
ro.lmk.critical_upgrade支持升级到临界水平。false
ro.lmk.upgrade_pressure由于系统交换次数过多,将在该水平执行水平升级的 mem_pressure 上限。100
(停用)
ro.lmk.downgrade_pressure由于仍有足够的可用内存,将在该水平忽略 vmpressure 事件的 mem_pressure 下限。100
(停用)
ro.lmk.kill_heaviest_task终止符合条件的最繁重任务(最佳决策)与终止符合条件的任何任务(快速决策)。true
ro.lmk.kill_timeout_ms从某次终止后到其他终止完成之前的持续时间(以毫秒为单位)。0
(停用)
ro.lmk.debug启用 lmkd 调试日志。false

注意mem_pressure = 内存使用量/RAM_and_swap 使用量(以百分比的形式表示)。

设备配置示例:

PRODUCT_PROPERTY_OVERRIDES += \ro.lmk.low=1001 \ro.lmk.medium=800 \ro.lmk.critical=0 \ro.lmk.critical_upgrade=false \ro.lmk.upgrade_pressure=100 \ro.lmk.downgrade_pressure=100 \ro.lmk.kill_heaviest_task=true

Android 11 中的用户空间 lmkd

Android 11 通过引入新的终止策略改进了 lmkd。该终止策略使用 PSI 机制来执行 Android 10 中引入的内存压力检测。Android 11 中的 lmkd 会根据内存资源使用情况和抖动来防止出现内存不足和性能下降。这一终止策略取代了以前的策略,可同时用于高性能设备和低内存 (Android Go) 设备。

内核要求

对于 Android 11 设备,lmkd 需要以下内核功能:

  • 添加 PSI 补丁程序并启用 PSI(Android 通用内核 4.9、4.14 和 4.19 中提供向后移植)。
  • 添加 PIDFD 支持补丁程序(Android 通用内核 4.9、4.14 和 4.19 中提供向后移植)。
  • 对于低内存设备,添加内存 cgroup。

必须使用以下配置设置编译内核:

CONFIG_PSI=y

在 Android 11 中配置 lmkd

Android 11 中的内存终止策略支持下面列出的调节旋钮和默认值。这些功能在高性能设备和低内存设备上都可使用。

属性使用默认
高性能低内存
ro.lmk.psi_partial_stall_ms部分 PSI 失速阈值(以毫秒为单位),用于触发内存不足通知。如果设备收到内存压力通知的时间太晚,可以降低此值以在较早的时间触发通知。如果在不必要的情况下触发了内存压力通知,请提高此值以降低设备对噪声的敏感度。70200
ro.lmk.psi_complete_stall_ms完全 PSI 失速阈值(以毫秒为单位),用于触发关键内存通知。如果设备收到关键内存压力通知的时间太晚,可以降低该值以在较早的时间触发通知。如果在不必要的情况下触发了关键内存压力通知,可以提高该值以降低设备对噪声的敏感度。700
ro.lmk.thrashing_limit工作集 refault 数量的上限,以占具有文件支持的页面缓存总大小的百分比表示。如果工作集 refault 的数量超过该值,则视为系统对其页面缓存造成抖动。如果设备性能在内存压力期间受到影响,请降低该值以限制抖动。如果因抖动原因而导致设备性能不必要地降低,请提高该值以允许更多抖动。10030
ro.lmk.thrashing_limit_decay抖动阈值衰减,以占在系统无法恢复时(甚至是终止后)用于降低阈值的原始阈值的百分比表示。如果持续抖动导致不必要的终止,请降低该值。如果终止后对持续抖动的响应速度过慢,请提高该值。1050
ro.lmk.swap_util_max最大交换内存量,以占可交换内存总量的百分比表示。如果交换的内存量超过此上限,则表示系统在交换了其大部分可交换内存后仍然存在压力。 当内存压力是由不可交换内存的分配导致时,就可能会发生这种情况,原因在于大部分可交换内存已经交换,所以无法通过交换来缓解这一压力。默认值为 100,这实际上会停用此检查。如果设备的性能在交换利用率较高且可用交换水平未降至 ro.lmk.swap_free_low_percentage 的内存压力期间受到影响,请降低该值以限制交换利用率。100100

以下旧的调节旋钮也可用于新的终止策略。

属性使用默认
高性能低内存
ro.lmk.swap_free_low_percentage可用交换水平,以占总交换空间的百分比表示。“lmkd”使用该值作为阈值来判断何时将系统视为交换空间不足。如果“lmkd”因交换空间过多而终止,请降低该百分比。如果“lmkd”终止得太晚,从而导致 OOM 终止,请提高该百分比。2010
ro.lmk.debug这会启用“lmkd”调试日志。在调节时启用调试。false

问题实例

客户做重启压测,发现重启过程中概率出现应用被杀情况。本次被杀应用为launcher,对应log如下:

02-04 11:02:19.762 D/lowmemorykiller(  440): critical pressure event triggered
02-04 11:02:19.763 D/lowmemorykiller(  440): nr_free_pages: 39252 nr_inactive_file: 216786 nr_active_file: 84889 workingset_refault: 0 pgscan_kswapd: 199494 pgscan_direct: 0 pgscan_direct_throttle: 0 init_pgscan_direct: 0 init_pgscan_kswapd: 0 base_file_lru: 0 init_ws_refault: 0 free_swap: 393151 total_swap: 393215 swap_free_percentage: 99%
02-04 11:02:19.763 D/lowmemorykiller(  440): pgskip deltas: DMA: -1DMA32: 0 Normal: 0 High: -1 Movable: 0
02-04 11:02:19.763 D/lowmemorykiller(  440): reclaim: 1 in_compaction : 0
02-04 11:02:19.763 E/lowmemorykiller(  440): zoneinfo_parse_node per-node stats not found in zone DMA32; moving to next zone
02-04 11:02:19.763 E/lowmemorykiller(  440): calc_zone_watermarks pgskip_deltas_val: 0 pgskip_deltas[PGSKIP_IDX(i++)]: 0
02-04 11:02:19.763 D/lowmemorykiller(  440): Zone: 0 nr_free_pages: 38701 min: 18432 low: 25249 high: 32066 present: 778880 nr_cma_free: 207 max_protection: 0
02-04 11:02:19.763 D/lowmemorykiller(  440): Zone: 1 nr_free_pages: 0 min: 0 low: 0 high: 0 present: 0 nr_cma_free: 0 max_protection: 0
02-04 11:02:19.763 D/lowmemorykiller(  440): Aggregate wmarks: min: 18432 low: 100996 high: 128264 (nr_free - nr_cma_free): 38494 wbf_effective: 4
02-04 11:02:19.763 D/lowmemorykiller(  440): smallest wmark breached: high free_pages: 38494 cached_pages_considered_free: 0 breached_wm_level: 128264
02-04 11:02:19.763 D/lowmemorykiller(  440): nr_free_pages: 38701 Cached: 301751 Unevictable: 1712 Shmem: 985 mlocked: 1711 SwapCached: 0 active_anon: 522 inactive_anon: 141235cma_free: 207
02-04 11:02:19.765 E/ThermalEngine( 2896): parse_cooling_devices: Added cooling device: pause-cpu7 with cdev id:13
02-04 11:02:19.766 I/lowmemorykiller(  440): Kill 'com.android.launcher3' (2671), uid 10091, oom_score_adj 100 to free 102928kB rss, 0kB swap; reason: critical pressure and device is low on memory
02-04 11:02:19.766 E/ThermalEngine( 2896): parse_cooling_devices: Added cooling device: ufs with cdev id:1
02-04 11:02:19.766 I/killinfo(  440): [2671,10091,100,50,102928,1,2726892,154804,1207004,0,9144,3940,6848,6844,1572860,1572604,2088,564940,339556,867144,87576,174144,26928,57000,0,0,828,0,23977,0,0,0,66404,0,0,0.180000,0.180000,6.140000,2.280000,23.650000]
 

通过log来看触发的是critical pressure event。

通过lmk源码排查如下:

system\memory\lmkd\lmkd.cpp

通过注释可以知道,这是因为内存回收太慢导致。这里控制是通过监听kernel里的epoll事件,然后做相关判断进行进程的kill,这里代表了内存失速,由于我们3g内存其实也并不是很宽裕,需要经常回收内存,通过killinfo我们可以看到psi最后一项达到了23.650000证明cpu压力很大,证明系统回收内存压力较大,我们通过修改

ro.lmk.psi_scrit_complete_stall_ms来延长反应时间增大到400ms,从而解决此问题,下一篇文章将会详细分解lmk相关代码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/693427.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue实现列表自动无缝滚动列表

大家好,今天给大家分享的知识是vue基于vue-seamless-scroll实现自动无缝滚动列表 一、实现自动滚动 最近在开发过程中遇到一个问题,就是需要实现自动滚动列表,效果图如下 就是这样一个列表在自动循环展示。在这里我是运用的 vue-seamless-sc…

HTTP的详细介绍

目录 一、HTTP 相关概念 二、HTTP请求访问的完整过程 1、 建立连接 2、 接收请求 3、 处理请求 3.1 常见的HTTP方法 3.2 GET和POST比较 4、访问资源 5、构建响应报文 6、发送响应报文 7、记录日志 三、HTTP安装组成 1、常见http 服务器程序 2、apache介绍和特点 …

专转本的三道难关

道阻且长,路途中的艰辛只有亲身经历过转本的人才能感同身受,这三道难关也是每个升本人都会经历的。尤其是最后一个(o(╥﹏╥)o)!!! 01 选择大于努力 很多人想专转本都是为了圆本科的梦&a…

redis的缓存穿透,缓存并发,缓存雪崩,缓存问题及解决方案

缓存穿透 问题原因 解决方案 缓存并发 缓存雪崩 缓存失效时间设置一致导致的。 解决方案: 1)方案一 2)方案二 如何设计一个缓存策略,缓存热点数据?

实现RAG管道中的上下文压缩和过滤

每日推荐一篇专注于解决实际问题的外文,精准翻译并深入解读其要点,助力读者培养实际问题解决和代码动手的能力。 欢迎关注公众号(NLP Research),及时查看最新内容 原文标题:Implement Contextual Compression And Filtering In RAG Pipeline 原文地址:https://medium.…

新版AI系统ChatGPT源码支持GPT-4/支持AI绘画去授权

源码获取方式 搜一搜:万能工具箱合集 点击资源库直接进去获取源码即可 如果没看到就是待更新,会陆续更新上 新版AI系统ChatGPT网站源码支持GPT-4/支持AI绘画/Prompt应用/MJ绘画源码/PCH5端/免授权,支持关联上下文,意间绘画模型…

[极客挑战2019]HTTP

这道题考察的是http请求头字段的含义和使用; 具体如下 Referer:来源地址 User-Agent:客户端配置信息:浏览器类型、版本、系统类型等 X-Forwarded-For:代理地址,即数据发出的地址 开始解题:(对我这初学者真的烧脑&a…

Qt应用-视频播放器实例

本文讲解Qt视频播放器应用实例。 实现功能 视频的播放暂停、拖动进度控制,声音控制播放列表控制播放区域的暂停控制,全屏控制等。 界面设计 <?xml version="1.0" encoding="UTF-8"?> <ui version="4.0"><class>frmVide…

深度学习在时间序列预测的总结和未来方向分析

2023年是大语言模型和稳定扩散的一年&#xff0c;时间序列领域虽然没有那么大的成就&#xff0c;但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transformer和Patch transformer)的改进&#xff0c;还出现了将…

压缩感知(Compressed Sensing)的MATLAB仿真实现

在前一篇文章&#xff1a;正交匹配追踪&#xff08;Orthogonal Matching Pursuit, OMP&#xff09;的MATLAB实现中&#xff0c;我们介绍了针对稀疏信号进行压缩感知的MATLAB仿真。 本篇我们介绍一下针对的是原始的非稀疏信号&#xff0c;看看如何进行处理。 本文中&#xff0c;…

读懂2024年数字孪生发展新趋势!十大权威白皮书放送!

2024年&#xff0c;数字孪生 该往哪些方向走&#xff1f; 新技术的不断涌现 又会带来怎样的行业变迁 …… 在开工之际&#xff0c;我们整理了 51WORLD主导、参编的 十大权威数字孪生白皮书、行业报告 以及产业优秀案例集 分享给想要提升自我的朋友们 读完这些 上面看似…

不止提升免疫力?NMN或可预防、缓解支原体肺炎造成的肺部损伤

近期&#xff0c;全国多地进入呼吸道疾病高发季&#xff0c;支原体肺炎等相关话题频频登上各大热搜榜。 发烧、咳嗽、嗓子疼、肺炎……支原体肺炎的战线拉得挺长&#xff0c;过年了都还有不少人纷纷中招&#xff1a;发热、咳嗽&#xff0c;来来回回拖了一两周才好&#xff0c;…

JavaScript 设计模式之组合模式

组合模式 在我们日常中肯呢个会将一个表单用这种模式来创建 const Car function () { } Car.prototype.getName function () { throw new Error("需要重写该方法") } Car.prototype.getPrice function () {throw new Error("需要重写该方法") } const…

突破性创新:OpenAI推出Sora视频模型,预示视频制作技术的未来已到来!

一、前言 此页面上的所有视频均由 Sora 直接生成&#xff0c;未经修改。 OpenAI - Sora is an AI model that can create realistic and imaginative scenes from text instructions. 2024 年 2 月 16 日&#xff0c;OpenAI 发布 AI 视频模型 Sora&#xff0c;60 秒的一镜到底…

XML Map 端口进阶篇——常用关键字和格式化器详解

XML Map 端口是用于在不同XML之间建立关系映射的工具&#xff0c;允许通过拖拽操作实现源XML和目标 XML之间的数据字段映射&#xff0c;除此之外&#xff0c;XML Map 端口还提供了其它丰富多彩的功能&#xff0c;使用户能够更加灵活和高效的处理XML 数据映射任务&#xff0c;让…

以程序员的视角,看前后端分离的是否必要?

Hello&#xff0c;我是贝格前端工场&#xff0c;本篇分享一个老生常谈的话题&#xff0c;前后端分离是必然趋势&#xff0c;但也是要区分具体的场景&#xff0c;欢迎探讨&#xff0c;关注&#xff0c;有前端开发需求可以私信我&#xff0c;上车了。 一、什么是前后端分离和不分…

Bert-VITS-2 效果挺好的声音克隆工具

持中日英三语训练和推理。内置干声分离&#xff0c;切割和标注工具&#xff0c;开箱即用。请点下载量右边的符号查看镜像所对应的具体版本号。 教程地址&#xff1a; sjj​​​​​​​CodeWithGPU | 能复现才是好算法CodeWithGPU | GitHub AI算法复现社区&#xff0c;能复现…

分享一个背英语单词的方法

目录 前言 乱序记忆法 结语 前言 这是我现在正在用的背单词方法&#xff0c;我觉得是不错的&#xff0c;分享一下&#xff0c;希望对你有帮助。也欢迎评论点赞哟。 乱序记忆法 这种方法需要我们准备好纸&#xff0c;是需要我们动笔的。我坚持认为&#xff0c;动笔去记单词的…

人工智能专题: Sora,世界模拟器的视频生成器

今天分享的是人工智能系列深度研究报告&#xff1a;《人工智能专题&#xff1a; Sora&#xff0c;世界模拟器的视频生成器》。 &#xff08;报告出品方&#xff1a;华泰证券&#xff09; 报告共计&#xff1a;16页 来源&#xff1a;人工智能学派 Sora 能做什么&#xff1f;…

苍穹外卖——第一天nginx

放到全是英文路径的打不开 到安装路径进入cmd&#xff0c;输入nginx -t nginx: the configuration file E:\Astudy\nginx-1.20.2/conf/nginx.conf syntax is ok nginx: [emerg] bind() to 0.0.0.0:80 failed (10013: An attempt was made to access a socket in a way forbid…