OpenHarmony 资源调度之内存管理源码分析

作者:张守忠

1 内存管理简介

内存管理部件位于全局资源调度管控子系统中,基于应用的生命周期状态,更新进程回收优先级列表,通过内存回收、查杀等手段管理系统内存,保障内存供给。

1.1 内存管理框架

内存管理部件主要基于事件触发回收优先级更新,并基于回收优先级管理内存回收和查杀,其框架如下所示(下图虚线右侧为本部件),主要分为如下几个模块:

图 1 框架图

1、事件管理模块:统筹管理本部件所要对外响应的事件。主要功能为调用其他子系统提供的接口注册事件监听,并将事件通知到回收优先级管理模块、回收策略模块和查杀策略模块。

2、回收优先级管理模块:基于事件管理模块的应用和用户的事件通知,给出进程的回收和查杀的先后顺序列表,并向回收策略和查杀策略提供查询此列表的接口。

3、回收策略模块:根据回收优先级列表,调整回收内存水线、文件页/匿名页回收比例、压缩/换出比例等回收参数,以及协调不同回收机制协同工作,保障内存中低负载下的供给性能。

4、查杀策略模块:作为回收的逻辑末端,根据回收优先级列表,保障内存重负载下的内存供给。

5、Kernel接口管控模块:负责将回收参数、查杀等管控命令下发到Kernel。

6、内存特性配置:读取回收策略模块、查杀策略模块等需要的配置文件。

1.2 ESWAP简介

ESWAP(Enhanced SWAP)是 OpenHarmony 针对传统linux内存优化问题提供的一套完善的内存解决方案,结合内存压缩和内存交换技术,定制了一套合理高效的调度管理策略,使压缩和交换两者的工作能够高效且平衡。ESWAP 基于关联性的数据聚合技术及上层指导策略,将内存划分为不同的分组进行管理,通过回收优先级来区分不同分组下内存的活跃程度,优先压缩、换出较不活跃的内存数据,以提升数据交换性能,减少冲击。ESWAP 解决方案在全局资源调度子系统中增加了一个系统资源调度模块,通过向账户子系统订阅本地账户的变化来感知当前的账户状态和内存状态,然后根据账户状态给各个账户设置不同的回收优先级、设置目标可用内存量、设置压缩和换出的比例等参数,并将这些参数下发给 ZSWAPD。ZSWAPD 会依据回收优先级判断回收的先后顺序;依据目标可用内存量和当前可用内存量的差值决定回收的量;依据压缩和换出的比例来决定压缩和换出的量,从而实现在达成内存扩展效果前提下的性能和功耗平衡。 ESWAP方案涉及的关键技术:

  • 定制的ZRAM和交换分区,ESWAP 结合内存压缩和内存交换技术,提供了自定义新增存储分区作为内存交换分区的能力,并在内核中创建了一个常驻进程 ZSWAPD,用于将 ZRAM 压缩后的匿名页加密换出到 ESWAP 存储分区中,从而能完全地空出一块可用内存,以此来达到维持 Memavailable 水线的目标。同时,ESWAP 模块还可以记录每个匿名页的冷热特征信息,并将这些数据通过关联性、冷热顺序进行相应的存放,使 ESWAP 交换区中连续存放的匿名页具有时间和空间局部性。因此在匿名页换入时,可以将交换区中的相邻匿名页一并读入 ZRAM,以此来保证数据的存取速度,提升 IO 性能。

  • 动态的内存回收机制,提供了一种额外的内存回收机制 ZSWAPD,并创建了“buffer”来作为衡量当前系统内存能力的指标。buffer 指的是当前系统能提供的最大可用内存。ZSWAPD 会根据 buffer 量以及上文所述的各种策略,来对匿名页进行压缩换出以回收。

  • 灵活的内存回收策略,基于 Memcg 分组进行了回收策略的增强,使用回收优先级来指导 ZSWAPD 回收的先后顺序。上层可以根据需要,通过灵活地配置交换策略,控制RAM、ZRAM、ESWAP 三个模块中存储的比例,避免频繁换入换出带来的负面影响。

1.3 PSI简介

PSI (Pressure Stall Information)  是 Facebook 在 2018 年开源的一套解决重要计算集群管理问题的 Linux 内核组件和相关工具中重要的资源度量工具,它提供了一种实时检测系统资源竞争程度的方法,以竞争等待时间的方式呈现,简单而准确地供用户以及资源调度者进行决策。PSI 软件结构图如下所示:

图 2 PSI软件结构图对上,PSI 模块通过文件系统节点向用户空间开放两种形态的接口。一种是系统级别的接口,即输出整个系统级别的资源压力信息。另外一种是结合 control group,进行更精细化的分组。对下,PSI 模块通过在内存管理模块以及调度器模块中插桩,我们可以跟踪每一个任务由于 memory、io 以及 CPU 资源而进入等待状态的信息。例如系统中处于 iowait 状态的 task 数目、由于等待 memory 资源而处于阻塞状态的任务数目。基于 task 维度的信息,PSI 模块会将其汇聚成 PSI group 上的 per cpu 维度的时间信息。例如该cpu上部分任务由于等待 IO 操作而阻塞的时间长度(CPU 并没有浪费,还有其他任务在执行)。PSI group 还会设定一个固定的周期去计算该采样周期内核的当前 psi 值(基于该 group 的 per cpu 时间统计信息)。为了避免 PSI 值的抖动,实际上上层应用通过系统调用获取某个 PSI group 的压力值的时候会上报近期一段时间值的滑动平均值。

1.3.1 PSI用户接口定义

每类资源的压力信息都通过 proc 文件系统的独立文件来提供,路径为 /proc/pressure/ – cpu, memory, and io.其中 CPU 压力信息格式如下:some avg10=2.98 avg60=2.81 avg300=1.41 total=268109926memory 和 io 格式如下:some avg10=0.30 avg60=0.12 avg300=0.02 total=4170757full avg10=0.12 avg60=0.05 avg300=0.01 total=1856503avg10、avg60、avg300 分别代表 10s、60s、300s 的时间周期内的阻塞时间百分比。total 是总累计时间,以毫秒为单位some 这一行,代表至少有一个任务在某个资源上阻塞的时间占比,full 这一行,代表所有的非idle任务同时被阻塞的时间占比,这期间 cpu 被完全浪费,会带来严重的性能问题。

2 关键实现

2.1 内存管理服务初始化

内存管理服务运行在进程memmgrservice中,在进程拉起时调用内存管理服务初始化程序,其初始化工作主要包括:配置文件解析、回收优先级初始化、更新账户优先级、回收策略初始化和各类监听事件注册,时序图如下:

2.2 回收优先级更新

回收优先级的更新涉及多个事件的触发,Account状态变化、应用状态变化、屏幕状态变化、电源状态等通用事件。

2.3 PSI上报事件处理

图 3 初始化时序图

系统能力注册在文件res_sched_service_ability.cpp中调用宏"REGISTER_SYSTEM_ABILITY_BY_ID"注册系统能力ResSchedServiceAbility

namespace OHOS {
namespace ResourceSchedule {
REGISTER_SYSTEM_ABILITY_BY_ID(ResSchedServiceAbility, RES_SCHED_SYS_ABILITY_ID, true);

系统能力初始化系统能力初始化分为资源调度管理初始化、系统服务发布、cpu分组调度初始化、注册监听的SA四个子过程。

void ResSchedServiceAbility::OnStart()
{ResSchedMgr::GetInstance().Init();if (!service_) {try {service_ = new ResSchedService();} catch(const std::bad_alloc &e) {RESSCHED_LOGE("ResSchedServiceAbility:: new ResSchedService failed.");}}if (!Publish(service_)) {RESSCHED_LOGE("ResSchedServiceAbility:: Register service failed.");}CgroupSchedInit();AddSystemAbilityListener(APP_MGR_SERVICE_ID);AddSystemAbilityListener(WINDOW_MANAGER_SERVICE_ID);AddSystemAbilityListener(BACKGROUND_TASK_MANAGER_SERVICE_ID);RESSCHED_LOGI("ResSchedServiceAbility ::OnStart.");
}

资源调度管理初始化过程主要包括frame_aware和socperf两个的插件加载及函数指针获取,eventHandler对象创建。插件so库的路径配置在xml文件"res_sched_plugin_switch.xml"中。

cpu分组调度初始化主要分为supervisor、cgroupHandler和cgroupAdjuster三个子模块的初始化。

void SchedController::Init()
{ChronoScope cs("Init SchedController.");// Init supervisor which contains cached data for ccgroup controller.InitSupervisor();// Init cgroup handler threadInitCgroupHandler();// Init cgroup adjuster threadInitCgroupAdjuster();
}

注册监听的SA调用SA框架提供的接口完成监听SA的注册, 目前监听了三个SA,分别是应用管理服务(id: APP_MGR_SERVICE_ID)、窗口管理服务(id: WINDOW_MANAGER_SERVICE_ID)和后台任务管理服务(id: BACKGROUND_TASK_MANAGER_SERVICE_ID).

bool SystemAbility::AddSystemAbilityListener(int32_t systemAbilityId)
{HILOGD(TAG, "SA:%{public}d, listenerSA:%{public}d", systemAbilityId, saId_);return LocalAbilityManager::GetInstance().AddSystemAbilityListener(systemAbilityId, saId_);
}
​
bool LocalAbilityManager::AddSystemAbilityListener(int32_t systemAbilityId, int32_t listenerSaId)
{...auto samgrProxy = SystemAbilityManagerClient::GetInstance().GetSystemAbilityManager();if (samgrProxy == nullptr) {HILOGE(TAG, "failed to get samgrProxy");return false;}
​{...auto& listenerSaIdList = listenerMap_[systemAbilityId];auto iter = std::find_if(listenerSaIdList.begin(), listenerSaIdList.end(), [listenerSaId](int32_t SaId) {return SaId == listenerSaId;});if (iter == listenerSaIdList.end()) {listenerSaIdList.emplace_back(listenerSaId);}...}
​int32_t ret = samgrProxy->SubscribeSystemAbility(systemAbilityId, GetSystemAbilityStatusChange());if (ret) {HILOGE(TAG, "failed to subscribe sa:%{public}d, process name:%{public}s", systemAbilityId,Str16ToStr8(procName_).c_str());return false;}return true;
}

2.3 绘帧信息收集流程

图 4 绘帧信息收集资源调度时序图
绘帧信息收集主要根据场景分为输入子系统手势变化等的感知调度,ace子系统的窗口变化等的感知调度,图形子系统的渲染、动画感知调度。图4描述的是BeginListFling、BeginFlushBuild、Render三个绘帧信息资源调度时序图,其他的流程类似,不一一列举。绘帧信息收集资源调度的最终是通过内核接口ioctrl写关联线程组"/dev/sched_rtg_ctrl", 包括线程加入、移除关联线程组,设置关联线程组的属性等等。

2.4 帧感知调度流程

  • 被监听的SA的相关属性或状态变化,调用订阅的对象接口进行响应。

  • 该对象通过eventHandler机制在event runner线程中调整进程组, 通过进程间通讯IPC通知资源调度服务进程。cgroup处理窗口焦点的eventHandler回调函数
void CgroupEventHandler::HandleFocusedWindow(uint32_t windowId, uint64_t abilityToken,WindowType windowType, uint64_t displayId, int32_t pid, int32_t uid)
{...supervisor_->focusedApp_ = app;SchedController::GetInstance().AdjustAllProcessGroup(*(app.get()), AdjustSource::ADJS_FOCUSED_WINDOW);}payload["bundleName"] = app->name_;ResSchedUtils::GetInstance().ReportDataInProcess(ResType::RES_TYPE_WINDOW_FOCUS, 0, payload);
}
调整进程组
void SchedController::AdjustAllProcessGroup(Application &app, AdjustSource source)
{...cgAdjuster_->AdjustAllProcessGroup(app, source);
}
​
void CgroupAdjuster::AdjustProcessGroup(Application &app, ProcessRecord &pr, AdjustSource source)
{CGS_LOGI("%{public}s for %{public}d, source : %{public}d", __func__, pr.GetPid(), source);ComputeProcessGroup(app, pr, source);ApplyProcessGroup(app, pr);
}
​
void CgroupAdjuster::ComputeProcessGroup(Application &app, ProcessRecord &pr, AdjustSource source)
{SchedPolicy group = SchedPolicy::SP_DEFAULT;...
​if (group == SchedPolicy::SP_BACKGROUND && pr.runningContinuousTask_) {group = SchedPolicy::SP_FOREGROUND; // move background key task to fg}
​pr.setSchedGroup_ = group;}
}
​
void CgroupAdjuster::ApplyProcessGroup(Application &app, ProcessRecord &pr)
{ChronoScope cs("ApplyProcessGroup");if (pr.curSchedGroup_ != pr.setSchedGroup_) {pid_t pid = pr.GetPid();int ret = CgroupSetting::SetThreadGroupSchedPolicy(pid, (int)pr.setSchedGroup_);if (ret != 0) {CGS_LOGE("%{public}s set %{public}d to group %{public}d failed, ret=%{public}d!",__func__, pid, pr.setSchedGroup_, ret);return;}...}
}

通过进程间通讯IPC通知资源调度服务进程

void ResSchedClient::ReportDataInProcess(uint32_t resType, int64_t value, const Json::Value& payload)
{RESSCHED_LOGI("ResSchedClient::ReportDataInProcess receive resType = %{public}u, value = %{public}lld.",resType, value);ResSchedMgr::GetInstance().ReportData(resType, value, payload);
}
​
void ResSchedServiceProxy::ReportData(uint32_t resType, int64_t value, const Json::Value& payload)
{...error = Remote()->SendRequest(IResSchedService::REPORT_DATA, data, reply, option);if (error != NO_ERROR) {RESSCHED_LOGE("Send request error: %{public}d", error);return;}RESSCHED_LOGD("ResSchedServiceProxy::ReportData success.");
}
​
int ResSchedServiceStub::OnRemoteRequest(uint32_t code, MessageParcel &data,MessageParcel &reply, MessageOption &option)
{auto uid = IPCSkeleton::GetCallingUid();RESSCHED_LOGD("ResSchedServiceStub::OnRemoteRequest, code = %{public}u, flags = %{public}d,"" uid = %{public}d", code, option.GetFlags(), uid);
​auto itFunc = funcMap_.find(code);if (itFunc != funcMap_.end()) {auto requestFunc = itFunc->second;if (requestFunc) {return requestFunc(data, reply);}}return IPCObjectStub::OnRemoteRequest(code, data, reply, option);
}
  • 资源调度服务进程收到信息后,根据资源调度类型分发任务给frame_aware和socperf两个插件分别进行处理。

  • frame_aware插件主要负责关联线程组的操作,ioctrl操作的文件是"/dev/sched_rtg_ctrl"

  • socperf主要负责cpu频率的修改,操作文件是"/dev/cpuctl"和"/dev/cpuset"

总结

本文主要介绍了智能感知调度模块的主要类关系、初始化流程、绘帧信息调度流程和帧感知调度流程并贴出相关主要代码,为开发人员维护和扩展功能提供参考。

为了能让大家更好的学习鸿蒙(HarmonyOS NEXT)开发技术,这边特意整理了《鸿蒙开发学习手册》(共计890页),希望对大家有所帮助:https://qr21.cn/FV7h05

《鸿蒙开发学习手册》:

如何快速入门:https://qr21.cn/FV7h05

  1. 基本概念
  2. 构建第一个ArkTS应用
  3. ……

开发基础知识:https://qr21.cn/FV7h05

  1. 应用基础知识
  2. 配置文件
  3. 应用数据管理
  4. 应用安全管理
  5. 应用隐私保护
  6. 三方应用调用管控机制
  7. 资源分类与访问
  8. 学习ArkTS语言
  9. ……

基于ArkTS 开发:https://qr21.cn/FV7h05

  1. Ability开发
  2. UI开发
  3. 公共事件与通知
  4. 窗口管理
  5. 媒体
  6. 安全
  7. 网络与链接
  8. 电话服务
  9. 数据管理
  10. 后台任务(Background Task)管理
  11. 设备管理
  12. 设备使用信息统计
  13. DFX
  14. 国际化开发
  15. 折叠屏系列
  16. ……

鸿蒙开发面试真题(含参考答案):https://qr18.cn/F781PH

鸿蒙开发面试大盘集篇(共计319页):https://qr18.cn/F781PH

1.项目开发必备面试题
2.性能优化方向
3.架构方向
4.鸿蒙开发系统底层方向
5.鸿蒙音视频开发方向
6.鸿蒙车载开发方向
7.鸿蒙南向开发方向

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/810372.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外贸开发信必知技巧:高回复率不再是梦

外贸行业在Zoho的客户群体中占比较高。因为我们的国际化背景、丰富的产品组合、多语言多币种跨时区、高性价比等特点,成为外贸企业开展业务的选择。在和外贸客户沟通中,发现无论是外贸大拿还是新手小白,大家遇到一个共同的问题——发出去的开…

抖音上阳哥的视频号带货推荐靠谱吗?

在抖音这个短视频平台的广阔天地里,阳哥以其独到的眼光和精准的推荐,成为了众多粉丝心中的带货指南。不同于一些网红直接进行视频号带货,阳哥更多地是以一个推荐人的身份出现,为粉丝们筛选并推荐优质的带货内容。那么,…

python——列表(list)

概念 列表一般使用在一次性存储多个数据 语法 lst[数据1,数据2,.....]方法 #mermaid-svg-flVxgVdpSqFaZyrF {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-flVxgVdpSqFaZyrF .error-icon{…

图像版PDF文件OCR识别转换为文本的3款免费工具软件

图像版PDF文件里面都是图片,要先通过OCR技术识别出文本,然后才能进行进一步处理编辑。下面是3个免费的PDF文件OCR识别软件工具: ●简可信PDF批量识别工具 简可信PDF批量识别工具是一款专门用于将PDF文件进行批量OCR(光学字符识别…

ObjectiveC-第一部分-基础入门-学习导航

专题地址:MacOS一站式程序开发系列专题 第一部分:基础入门学习导航 OSX-01-Mac OS应用开发概述:简单介绍下MacOS生态、Xcode使用以及使用Xcode创建app的方法OSX-02-Mac OS应用开发系列课程大纲和章节内容设计:介绍下此系列专题的文章内容组织形式以及此系列专题的覆盖内容…

虚假贸易防控:国资委74号文解读,技术人员如何建防?

官.网地址:合合TextIn - 合合信息旗下OCR云服务产品 2023年12月,国资委发布《关于规范中央企业贸易管理严禁各类虚假贸易的通知》(国资发财评规[2023]74号),提出“十不准”,严禁央企开展各类虚假贸易业务…

Vue 引入config.js后别的js访问不到window对象下的属性

Vue项目里,我们项目配置的请求服务器地址都是在public里config.js里,如下例: 然后在index.html里引入config.js,如下图: 这里要注意的是,script的src要写上<%= BASE_URL %>,代码如下: <!DOCTYPE html> <html><head><meta charset="…

NCBI 数据下载

网上介绍的那几种直接下载NCBI数据的方法大都下载速度很慢&#xff0c;但是EBI (European Bioinformatics Institute) 下载很快&#xff0c;而且它的数据库和NCBI是共享的&#xff0c;所以我们可以直接从 EBI 下载。 1 、 确定要下载的 SRA 编号&#xff1b; 2 、 EBI (https…

探索点云与KD-Tree配对的方法

比较点云是处理和分析点云数据的关键步骤。然而,由于各个扫描之间固有的差异,无法进行逐点比较。因此,点云分析的第一步也是主要步骤是将点配对以进行有意义的比较。 配对点是区分表面变形和运动分析的关键任务。这个过程不仅为变形分析提供了见解,还使我们能够通过比较不…

华为海思数字芯片设计笔试第五套

声明 下面的题目作答都是自己认为正确的答案&#xff0c;并非官方答案&#xff0c;如果有不同的意见&#xff0c;可以评论区交流。 这些题目也是笔者从各个地方收集的&#xff0c;感觉有些题目答案并不正确&#xff0c;所以在个别题目会给出自己的见解&#xff0c;欢迎大家讨论…

鼠标灵敏度怎么调,鼠标灵敏度怎么调最稳

鼠标和键盘是操作计算机过程中使用最频繁的设备之一&#xff0c;用电脑的时&#xff0c;我敢说你一定离不开鼠标。有些用户发现鼠标不太好用&#xff0c;尤其是在游戏时&#xff0c;总觉得鼠标移动太慢了。另外&#xff0c;如果你感觉鼠标按键失灵、鼠标单击变双击以及反应迟钝…

装机指导。

everything winrar snipaste cmake git tortoisegit tortoisesvn inno setup vs2022 安装的时候注意sdk路径一定要默认&#xff01;&#xff01; 否则你会发现在你的sdk安装路径的根盘符下会多出一个Windows Kits&#xff0c;强迫症接受不了 默认的会跟已有的装在一起…

69787987

c语言中的小小白-CSDN博客c语言中的小小白关注算法,c,c语言,贪心算法,链表,mysql,动态规划,后端,线性回归,数据结构,排序算法领域.https://blog.csdn.net/bhbcdxb123?spm1001.2014.3001.5343 给大家分享一句我很喜欢我话&#xff1a; 知不足而奋进&#xff0c;望远山而前行&am…

Matlab|基于蒙特卡洛的风电功率/光伏功率场景生成方法

目录 主要内容 部分代码 结果一览 下载链接 主要内容 该模型主要用于风电功率和光伏功率场景生成与缩减&#xff0c;利用多元高斯分布构建时间相关性&#xff0c;并采用蒙特卡洛方法进行仿真&#xff0c;风电功率采用Weibull分布&#xff0c;光伏功率采用Beta分布…

Linux使用Linpack测试

安装HPL之前需要配置好&#xff1a; 1.GCC/Fortran77 编译器 2.BLAS/CBLAS/ATLAS 库 3.MPICH 并行环境 1.GCC/Fortran77 编译器 gfortran -v gcc -v #检查环境&#xff0c;若没有安装 yum install gcc yum install gcc-gfortran2.安装向量和矩阵运算库函数 BLAS/CBLAS/ATLAS…

「seata」分布式事务seata部署及应用

「seata」分布式事务seata部署及应用 seata 版本一、部署seata服务1、配置config.txt文件中的属性值2、为seata服务单独创建一个nacos命名空间3、利用脚本上传配置文件到nacos4、配置seata服务的application.yml6、执行数据库脚本5、使用脚本启动seata服务 二、配置并启动微服务…

SCI一区 | Matlab实现INFO-TCN-BiGRU-Attention向量加权算法优化时间卷积双向门控循环单元注意力机制多变量时间序列预测

SCI一区 | Matlab实现INFO-TCN-BiGRU-Attention向量加权算法优化时间卷积双向门控循环单元注意力机制多变量时间序列预测 目录 SCI一区 | Matlab实现INFO-TCN-BiGRU-Attention向量加权算法优化时间卷积双向门控循环单元注意力机制多变量时间序列预测预测效果基本介绍模型描述程…

【提纲挈领】学会提问题,你就是那个年薪百万元的提示词工程师!LLM时代,如何提问题成为关键技能!多图说明!

【提纲挈领】学会提问题&#xff0c;你就是那个年薪百万元的提示词工程师&#xff01;LLM时代&#xff0c;如何提问题成为关键技能&#xff01;多图说明&#xff01; 一、会提问题的重要性二、提示词工程师三、如何提问3.1 提示词框架——BROKE原则3.1.1 打个比方3.1.2 举个实例…

品牌发言稿怎么写?媒介盒子分享

品牌发言稿的重要性不言而喻&#xff0c;它不仅代表着品牌形象&#xff0c;更是沟通品牌与消费者、合作伙伴的桥梁。如何撰写一篇高质量的品牌发言稿&#xff0c;成为许多品牌关注的焦点。今天媒介盒子来和大家聊聊&#xff1a;品牌发言稿怎么写。 一、 发言稿写作技巧 1.结构…