ARM 性能分析工具:Streamline

文章目录

  • 1. 前言
  • 2. 安装
    • 2.1 在 Host 安装 `Arm Performance Studio`
    • 2.2 在 ARM 目标平台安装 `gatord`
  • 3. 使用
    • 3.1 离线方式
    • 3.2 在线方式
    • 3.3 添加符号表
  • 4. 参考资料

1. 前言

限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺。

2. 安装

Streamline 分为两大部分:

  • gatord
  • Arm Performance Studio

gatord 运行于目标 ARM 平台,负责性能数据采样;而 Arm Performance Studio 运行于 Host (如 Windows/Linux/MacOS 等),负责性能采样数据分析

本文以【运行于 Windows 主机 Arm Performance Studio + 运行于 ARMv8 平台的 gatord 】组合为例进行说明。

2.1 在 Host 安装 Arm Performance Studio

到 https://developer.arm.com/Tools%20and%20Software/Arm%20Performance%20Studio#Downloads 处下载 Arm Performance StudioWindows 版本进行安装:

在这里插入图片描述

当然,读者也完全可以下载 LinuxmacOS 版本进行安装,只是笔者用 Windows 版本进行演示。

2.2 在 ARM 目标平台安装 gatord

按 Set up your target 完成 gatord 运行环境的检验和安装。

首先检验 gatord 运行环境,Linux 需开启 CONFIG_PROFILING 配置:

# zcat /proc/config.gz | grep CONFIG_PROFILING
CONFIG_PROFILING=y

Arm Performance Studio 安装完成后,在路径 <install_directory>\streamline\bin\linux 包含有预编译的 gatord 程序,其源码在路径 <install_directory>\streamline\gator\daemon 下。将 gatord 程序拷贝到目标 ARM 平台,并增加可执行权限

# chmod +x gatord
# ./gatord -h
Streamline Data Recorder v9.5.1 (Build d0e2706)
Copyright (c) 2010-2025 Arm Limited. All rights reserved.Streamline has 2 modes of operation. Daemon mode (the default), and local
capture mode, which will capture to disk and then exit. To enable local capture
mode specify an output directory with --output.* Arguments available to all modes:-h|--help                             This help page-c|--config-xml <config_xml>          Specify path and filename of theconfiguration XML. In daemon mode thelist of counters will be written tothis file. In local capture mode thelist of counters will be read from thisfile.-e|--events-xml <events_xml>          Specify path and filename of the eventsXML to use
......

如果预编译gatord 无法在目标 ARM 平台上运行,可到 gatord 处下载源码自行编译。

3. 使用

Streamline 的使用可以有两种方式:

1. 离线方式
2. 在线方式

离线方式gatord 进行性能数据采样,并将采样数据存放在 ARM 目标机器本地存储上,结束采样后再将性能数据采样文件拷贝到 Host (Windows/Linux/macOS),然后导入到 Arm Performance Studio 进行分析。

在线方式也是 gatord 进行性能数据采样,但不同于离线方式的是,性能数据采样实时的通过 ADB网络传递给 Host (Windows/Linux/macOS) 一侧的 Arm Performance Studio 并存放,结束采样后 Arm Performance Studio 再进行分析。

接下来分别对离线在线两种方式加以说明。不管是离线还是在线方式,都要先准备一个测试程序。按 Compile your application 编译一个应用程序,拷贝到目标 ARM 机器,并添加可执行权限

3.1 离线方式

首先在目标 ARM 机器启动 gatord 和 应用测试程序:

# ./gatord -o profile.apc &
# ./test_app &

一段时间后,停止应用程序和 gatord

# killall test_app
# killall gatord

将采样数据文件夹 profile.apc 拷贝到 WindowsArm Performance Studio 的指定目录下:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

然后启动 Arm Performance Studio,并导入数据:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

然后启动分析,这需要一点时间:

在这里插入图片描述
在这里插入图片描述

分析完成如下图:

在这里插入图片描述

可以标签栏 Timeline,Call Paths,Functions 等查看不同的分析数据,也可以选择指定进程的分析数据。

3.2 在线方式

# ./gatord &
[1] 2584
Streamline Data Recorder v9.5.1 (Build d0e2706)
Copyright (c) 2010-2025 Arm Limited. All rights reserved.Gator ready
# ./test_app &

WindowsArm Performance Studio,选择 TCP 方式:

在这里插入图片描述

并点击 Start capture 按钮开始捕捉,出现如下画面:

在这里插入图片描述

停止测试应用程序和 gatord

# killall test_app
# killall gatord

在这里插入图片描述

Arm Performance Studio 将自动停止捕捉并开始分析数据,分析完后的画面如下:

在这里插入图片描述

3.3 添加符号表

默认解析是看不到任何符号信息的,要按需导入。在采样数据上点击右键:

在这里插入图片描述
在这里插入图片描述

点击按钮 在这里插入图片描述 添加需要的符号文件,如上图中的 vmlinux 等,然后点击 Analyze 按钮,分析后的数据就可以看到符号信息了:

在这里插入图片描述

Streamline 功能很多很强大,更多关于 Streamline 的用法,可参考 ARM 官方文档 。

4. 参考资料

[1] Arm Streamline Target Setup Guide for Linux
R

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/76684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React: hook相当于函数吗?

一、Hook 是一个函数&#xff0c;但不仅仅是函数 函数的本质 Hook 确实是一个 JavaScript 函数&#xff0c;例如 useState、useEffect 或自定义 Hook 都是函数。它们可以接受参数&#xff08;如初始状态值或依赖项数组&#xff09;&#xff0c;并返回结果&#xff08;如状态值和…

Android学习总结之算法篇三(排序)

归并排序原理 归并排序&#xff08;Merge Sort&#xff09;是一种采用分治法&#xff08;Divide and Conquer&#xff09;的排序算法&#xff0c;其基本思想是将一个大问题分解为多个小问题&#xff0c;分别解决这些小问题&#xff0c;然后将小问题的解合并起来得到原问题的解…

Python列表(List)深度解析

列表(List)是Python中最基础且强大的数据结构之一&#xff0c;但它的底层实现和特性远比表面看起来复杂。本文将深入探讨列表的各个方面。 1. 列表基础特性 1.1 可变序列类型 lst [1, 2, 3] lst[1] 20 # 可变性1.2 异构容器 mixed [1, "hello", 3.14, [1, 2]…

Java基础-设计模式详解

摘要&#xff1a;设计模式是软件工程中解决常见问题的经典方案。本文结合Java语言特性&#xff0c;深入解析常用设计模式的核心思想、实现方式及实际应用场景&#xff0c;帮助开发者提升代码质量和可维护性。 一、设计模式概述 1.1 什么是设计模式&#xff1f; 设计模式&…

Docker 构建镜像异常报错解决

报错一&#xff1a; # 启动 SSH Agent eval $(ssh-agent -s)# 添加私钥到 agent (替换为你的实际密钥路径) ssh-add ~/.ssh/id_ed25519# 验证密钥已加载 ssh-add -L# 查看 SSH_AUTH_SOCK 是否设置 echo $SSH_AUTH_SOCK # 应输出类似&#xff1a;/tmp/ssh-XXXXXX/agent.XXXX# 显…

动态规划似包非包系列一>组合总和IIV

目录 题目分析&#xff1a;状态表示&#xff1a;状态转移方程&#xff1a;初始化填表顺序返回值&#xff1a;代码呈现&#xff1a; 题目分析&#xff1a; 状态表示&#xff1a; 状态转移方程&#xff1a; 初始化填表顺序返回值&#xff1a; 代码呈现&#xff1a; class Soluti…

Linux下调试器gdb_cgdb使用

文章目录 一、样例代码二、使用watchset var确定问题原因条件断点 一、样例代码 #include <stdio.h>int Sum(int s, int e) {int result 0;int i;for(i s; i < e; i){result i;}return result; }int main() {int start 1;int end 100;printf("I will begin…

JSON Crack:简化数据可视化的参数编辑器

简介 在当今数据驱动的世界中&#xff0c;JSON&#xff08;JavaScript Object Notation&#xff09;作为一种轻量级的数据交换格式&#xff0c;广泛应用于各种开发和数据分析场景。然而&#xff0c;复杂的JSON数据往往难以阅读和理解&#xff0c;特别是在数据量庞大时&#xf…

PostgreSQL 删除数据库

PostgreSQL 删除数据库 概述 PostgreSQL 是一款功能强大的开源关系型数据库管理系统&#xff0c;它提供了丰富的功能和强大的性能。在数据库管理过程中&#xff0c;有时需要删除不再需要的数据库&#xff0c;以释放资源或进行数据库维护。本文将详细介绍如何在 PostgreSQL 中…

Linux内核物理内存组织结构

一、系统调用sys_mmap 系统调用mmap用来创建内存映射&#xff0c;把创建内存映射主要的工作委托给do_mmap函数&#xff0c;内核源码文件处理&#xff1a;mm/mmap.c 二、系统调用sys_munmap 1、vma find_vma (mm, start); // 根据起始地址找到要删除的第一个虚拟内存区域 vma 2…

Mac强制解锁APP或文件夹

当Mac安装过火绒企业版、云安全访问服务之类的APP需要卸载的时候&#xff0c;会发现需要管理员密码&#xff0c;正常的卸载流程走不下去&#xff0c;直接删除APP&#xff0c;会提示“不能完成此操作&#xff0c;xxx已锁定”的信息&#xff0c;此处就记录一下如何关闭锁定状态&a…

Mixed Content: The page at https://xxx was loaded over HTTPS

一、核心原因分析 Mixed Content 警告是由于 HTTPS 页面中引用了 HTTP 协议的资源(如脚本、图片、iframe 等),导致浏览器因安全策略阻止加载这些非加密内容。HTTP 资源可能被中间人攻击篡改,破坏 HTTPS 页面的整体安全性。 二、推荐解决方案 1. 强制资源升级为 HTTPS •…

ARXML文件解析-1

目录 1 摘要2 ARXML文件2.1 作用及典型应用场景2.2 **ARXML文件的结构树**2.3 TAG&#xff08;XML元素&#xff09;2.4 ARXML文件关键元素解析2.4.1 XML声明与处理指令2.4.2 XML注释2.4.3 ADMIN-DATA元素2.4.3 语言相关元素2.4.5 AR-PACKAGE体系结构2.4.6. 数据转换框架2.4.7 S…

[ISP 3A ] AE的常用算法分析

&#x1f4cc; 自动曝光&#xff08;AE, Auto Exposure&#xff09;解析 自动曝光&#xff08;AE&#xff09;是相机通过调节 曝光参数&#xff08;增益、快门时间、光圈等&#xff09;来确保拍摄出的图像亮度适宜的算法。AE 需要根据环境光线变化自动调整曝光&#xff0c;以避…

大模型学习二:DeepSeek R1+蒸馏模型组本地部署与调用

一、说明 DeepSeek R1蒸馏模型组是基于DeepSeek-R1模型体系&#xff0c;通过知识蒸馏技术优化形成的系列模型&#xff0c;旨在平衡性能与效率。 1、技术路径与核心能力 基础架构与训练方法‌ ‌DeepSeek-R1-Zero‌&#xff1a;通过强化学习&#xff08;RL&#xff09;训练&…

STM32入门学习笔记(持续更新)

b站江协科技资料 通过网盘分享的文件&#xff1a;STM32入门教程资料 链接: https://pan.baidu.com/s/1-rOi83sUK8CqUNsHQuvxew?pwd8krh 提取码: 8krh LED灯闪烁0402 #include "stm32f10x.h" // Device header #include "Delay.h"int m…

企业安全——FIPs

0x00 前言 先来看一道题目。这道题目涉及到的就是道德规范和互联网相关内容&#xff0c;本文会对相关内容进行描述和整理。 正确答案是&#xff1a;D 注意FIPs的主要目的是为了限制&#xff0c;也就是针对数据的守则。 0x01 RFC 1087 1989年1月 互联网架构委员会 IAB 发布了…

【Linux系统编程】进程概念,进程状态

目录 一&#xff0c;操作系统&#xff08;Operator System&#xff09; 1-1概念 1-2设计操作系统的目的 1-3核心功能 1-4系统调用和库函数概念 二&#xff0c;进程&#xff08;Process&#xff09; 2-1进程概念与基本操作 2-2task_struct结构体内容 2-3查看进程 2-4通…

基于TradingView和CTPBee的自动化期货交易系统实现

引言 在量化交易领域&#xff0c;TradingView因其强大的技术分析工具和丰富的指标库而广受欢迎&#xff0c;但是其不支持国内期货自动化交易&#xff0c;CTPBee则是一个优秀的国产Python期货交易接口。本文将介绍如何将两者结合&#xff0c;实现一个完整的自动化交易系统。 本…

初始ARM

ARM最基础的组成单元。 最小系统&#xff1a;能系统能够正常工作的最少器件构成的系统 。 一、CPU基础定义 ALU&#xff08;运算单元&#xff09;&#xff1a; 负责执行算术和逻辑运算&#xff0c;是处理器的核心部分。 寄存器&#xff08;R0, R1, R12&#xff09;&#xff…