Intel性能分析工具Vtune安装和使用简介

一、介绍

Intel Vtune profiler是用于串行和多线程应用程序的性能分析工具,可以帮助软件开发人员对应用程序的性能问题进行分析,支持包括linux和windows在内的多种操作系统。主要功能包括:

  • 性能分析:可以对应用程序进行深入的性能分析,帮助用户了解应用程序在不同的硬件和软件环境下的运行情况。
  • 热点检测:可以识别出程序中的热点部分,指导开发者进行优化。
  • 性能瓶颈分析:通过分析CPU、内存、IO等各个方面的性能,帮助确定应用程序的性能瓶颈。
  • 多线程分析:对于多线程应用程序,能够分析线程的运行状况,包括线程的同步、竞争和死锁等问题。

二、安装

tee > /tmp/oneAPI.repo << EOF
[oneAPI]
name=Intel® oneAPI repository
baseurl=https://yum.repos.intel.com/oneapi
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://yum.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB
EOF

将oneAPI.repo移动到/etc/yum.repos.d目录中,执行

yum install intel-oneapi-vtune

安装vtune工具

如果是使用root用户进行安装的,安装完成后,默认的安装目录是在/opt/intel/oneapi/vtune中,执行

source /opt/intel/oneapi/vtune/latest/env/vars.sh

之后就可以在命令行界面中使用vtune命令了。

为了验证vtune profiler是否能够正确使用以及在安装过程中是否存在某些未知问题,可以运行安装包中的一个自动测试脚本,此脚本会运行对一个示例应用程序的分析

运行如下命令:

sh /opt/intel/oneapi/vtune/latest/bin64/vtune-self-checker.sh

此脚本会运行几分钟进行必要的信息收集,如果一切正常会产生对应的输出。

三、使用

3.1 默认测试用例使用

在vtuned中自带了一个测试用例matrix,目录位于/opt/intel/oneapi/vtune/latest/samples/en/C++/matrix

在vtune的welcome界面点击New Project创建一个新的项目

在Project name栏输入项目名称(自定义),Location输入项目存放路径(任意)

项目创建完成自动进入Configure Analysis目录,Where选择Local Host(默认),Launch Application->Application处选择二进制文件的位置,也可以使用进程pid或者进行整系统的监测,修改WHAT的类型即可

我们这里是/opt/intel/oneapi/vtune/latest/samples/en/C++/matrix,点击start按钮

vtune自动执行分析操作

执行完成后会输出summary

右上部分是一些基本的衡量指标,中间部分是可以进行进一步分析的方向,其中标红是推荐进行分析的方向。

接下来可对应用程序进行性能瓶颈分析,优化,然后再次执行性能分析工作来判断性能是否提升。

下一步分析方向有以下几个点:

算法分析:

热点分析用来查找代码花费时间最多的位置。

异常监测识别频繁重复代码中的性能异常问题。

内存消耗分析分析应用进程的内存消耗情况,仅适用于linux。

微架构分析:

微架构识别CPU流水线中的性能瓶颈。

内存访问分析应用程序的内存,查看CPU的缓存和主存使用情况。

并行性分析:

线程分析线程的并行度,定位并发度低的原因以及代码中的串行瓶颈。

HPC性能分析计算密集型应用程序如何使用CPU、内存和FPU的资源。

IO分析:

分析IO系统、总显得利用率

加速单元:

GPU offload分析应用程序是否存在GPU限制。

GPU热点分析GPU绑定的应用程序执行效率低的问题

CPU/FPGC分析FPGA的利用率

平台分析:

系统概述识别限制性能的平台因素

Platform Profiler手机较长时间内满负荷运行的系统数据

3.2 测试用例分析

matrix用例的功能是一个矩阵乘法器。

可以选择以下任意一种乘法核进行运算,需要在multiply.h头文件中对MULTIPLY的宏定义进行修改然后重新通过make编译程序。

multiply0:最基本的单线程实现

multiply1:最基本的多线程实现

multiply2:使用循环交换和向量化进行优化的实现(使用了编译器的向量选项)

multiply3:使用了cache blocking和data align的优化

multiply4:使用了matrix transposition和loop unrolling的优化

multiply5:使用Intel MKL优化

线程使用方式:线程模型使用系统自定义的,linux上是pthreads,windows上是win32 threads,OpenMP线程模型也可以使用。

修改线程模型:windows上选择使用Release,Release_OMP或者Release_MKL配置

linux上在Makefile文件中修改PARAMODEL为USE_THR,USE_OMP或者USE_MKL

矩阵属性:默认情况下矩阵的大小是2048,如果需要增大matrix的大小可以在multiply.h中重新定义MAXTHREADS的值,需要确保这个值是线程的倍数。默认情况下执行线程数目等于CPU cores的数目,可以修改MAXTHREADS来修改线程数。

vtune自带的测试用例matrix.c文件(在/opt/intel/oneapi/vtune/latest/samples/en/C++/matrix/src目录下)需要修改

#include

修改为

#include

否则会报出找不到gettimeofday的错误

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/824987.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单片机入门还能从51开始吗?

选择从51单片机开始入门还是直接学习基于ARM核或RISC核的单片机&#xff0c;取决于学习目标、项目需求以及个人兴趣。每种单片机都有其特定的优势和应用场景&#xff0c;了解它们的特点可以帮助你做出更合适的选择。 首先&#xff0c;我们说一下51单片机的优势&#xff1a; 成熟…

网络安全:绕过 MSF 的一次渗透测试

这次渗透的主站是 一个 Discuz!3.4 的搭建 违法招 piao 网站&#xff0c; 配置有宝塔 WAF 用 Discuz!ML 3.X 的漏洞进行攻击&#xff0c;但是没有成功 发现主站外链会有一个发卡网&#xff0c;引导人们来这充值&#xff0c;是 某某发卡网&#xff0c;而且域名指向也是主站的 ip…

数据库服务的运行与登录

打开数据库服务 数据库服务: SQL Server(MSSQLServer) 运行在服务器端的应用程序, 提供数据的存储 / 处理和事务等在使用DBMS的客户端之前必须首先打开该服务 客户端连接到服务器 关于客户端 / 服务器端的说明 客户端 : 数据库管理系统(DBMS), 应用程序服务器端 : 安装的数据…

L1-8 刮刮彩票

“刮刮彩票”是一款网络游戏里面的一个小游戏。如图所示&#xff1a; 每次游戏玩家会拿到一张彩票&#xff0c;上面会有 9 个数字&#xff0c;分别为数字 1 到数字 9&#xff0c;数字各不重复&#xff0c;并以 33 的“九宫格”形式排布在彩票上。 在游戏开始时能看见一个位置上…

「不羁联盟/XDefiant」4月20号开启服务器测试,游戏预下载安装教程

XDefiant》开启Alpha测试&#xff0c;这是一款免费游玩的快节奏 FPS 竞技游戏&#xff0c;可选择特色阵营&#xff0c;搭配个性化的装备&#xff0c;体验 6v6 对抗或是线性游戏模式。高品质射击竞技端游XDefiant以6v6双边对抗为核心&#xff0c;对局模式分为区域与线性两大类&a…

视频基础学习五——视频编码基础二(编码参数帧、GOP、码率等)

系列文章目录 视频基础学习一——色立体、三原色以及像素 视频基础学习二——图像深度与格式&#xff08;RGB与YUV&#xff09; 视频基础学习三——视频帧率、码率与分辨率 视频基础学习四——视频编码基础一&#xff08;冗余信息&#xff09; 视频基础学习五——视频编码基础…

【智能算法】花朵授粉算法(FPA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2012年&#xff0c;Yang等人受到自然界花朵授粉过程启发&#xff0c;提出了鸭群算法&#xff08;Flower Pollination Algorithm, FPA&#xff09;。 2.算法原理 2.1算法思想 FPA基于自然界花朵授…

三步教你怎么把icloud照片恢复至iphone!

“我手机里面照片被优化后&#xff0c;然后不小心把所有被优化的模糊照片从手机中删除了&#xff0c;但是iCloud还有&#xff0c;我应该怎样把iCloud的照片重新放回手机&#xff1f;谢谢。” 在使用iPhone时&#xff0c;iCloud照片库是一个非常方便的功能&#xff0c;它允许你在…

pnpm - Failed to resolve loader: cache-loader. You may need to install it.

起因 工作原因需要研究 vue-grid-layout 的源码&#xff0c;于是下载到本地。因为我习惯使用 pnpm&#xff0c;所以直接用 pnpm i 安装依赖&#xff0c;npm run serve 启动失败。折腾了一番没成功。 看到源码里有 yarn.lock&#xff0c;于是重新用 yarn install 安装依赖&…

使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像

使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像 文章目录 使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像一、前言二、具体步骤1、启动SD的api设置2、unity 创建生图脚本3、Unity 生图交互配置步骤 1: 创建sdControl步骤2&#xff1a;生成后图片画布步骤3&…

Groovy程序设计-【第一部分Groovy起步】-02-面向Java开发者的Groovy

前言&#xff1a; 知识点记录来源于【Groovy程序设计】一书中&#xff0c;本文仅作知识点记录供日后使用查询&#xff0c;不做教程使用。 groovy支持java语法&#xff0c;并且保留了java的语义&#xff0c;所以我们可以随心所欲的混用两种语言。 1.从Java到Groovy 先看一个…

从「宏大叙事」到「生活叙事」,小红书品牌种草的的“正确姿势”

不同于抖音和微博&#xff0c;在小红书上&#xff0c;品牌营销的基调应该是怎样的&#xff1f;品牌怎样与小红书用户对话&#xff1f;什么样的内容&#xff0c;才能走进小红书用户的心中&#xff1f;本期&#xff0c;小编将带大家洞察品牌在小红书营销的“正确姿势”。从「小美…

Table表格(关于个人介绍与图片)

展开行&#xff1a; <el-table :data"gainData" :border"gainParentBorder" style"width: 100%"><el-table-column type"expand"><template #default"props"><div m"4"><h3>工作经…

百度文心一言:官方开放API开发基础

目录 一、模型介绍 1.1主要预置模型介绍 1.2 计费单价 二、前置条件 2.1 创建应用获取 Access Key 与 Secret Key 2.2 设置Access Key 与 Secret Key 三、基于千帆SDK开发 3.1 Maven引入SDK 3.2 代码实现 3.3 运行代码 一、模型介绍 文心一言&#xff08;英文名&…

Java实现生成中间带图标的二维码

Java实现生成中间带图标的二维码 生成Base64格式的二维码&#xff0c;返回html渲染 package your.package;import com.google.zxing.*; import com.google.zxing.client.j2se.MatrixToImageWriter; import com.google.zxing.common.BitMatrix; import com.google.zxing.qrcod…

DSPE-PEG-TPP 磷脂聚乙二醇-磷酸三苯酯 靶向线粒体纳米颗粒药物递送系统

DSPE-PEG-TPP 磷脂聚乙二醇-磷酸三苯酯 靶向线粒体纳米颗粒药物递送系统 【中文名称】磷脂-聚乙二醇-磷酸三苯酯 【英文名称】DSPE-PEG-TPP 【结 构】 【品 牌】碳水科技&#xff08;Tanshtech&#xff09; 【纯 度】95%以上 【保 存】-20℃ 【规 格】50mg,…

数字工厂系统的开发

数字工厂系统&#xff08;Digital Factory System&#xff0c;DFS&#xff09;是基于数字孪生技术&#xff08;Digital Twin Technology&#xff09;和信息物理融合系统&#xff08;Cyber-Physical System&#xff0c;CPS&#xff09;构建的&#xff0c;用于仿真、分析和优化制…

密码学 | 承诺:基本概念

目录 正文 1 承诺的交互 2 承诺的属性 3 硬币抛掷问题 3.1 朴素版方案 3.2 承诺版方案 &#x1f951;源自&#xff1a;https://en.wikipedia.org/wiki/Commitment_scheme &#x1f951;写在前面&#xff1a;英文的承诺是 commitment scheme&#xff0c;否则很难进行…

网络爬虫入门

爬虫&#xff08;也被称为网络爬虫或网络蜘蛛&#xff09;是一种自动化程序&#xff0c;它可以在互联网上自动抓取数据。爬虫的基本工作原理通常包括以下几个步骤&#xff1a;发送请求&#xff1a;爬虫向目标网站发送HTTP请求&#xff0c;请求网页内容。接收响应&#xff1a;爬…

根据 Figma 设计稿自动生成 Python GUI | 开源日报 No.221

ParthJadhav/Tkinter-Designer Stars: 8.0k License: BSD-3-Clause Tkinter-Designer 是一个用于快速创建 Python GUI 的工具&#xff0c;通过使用 Figma 设计软件&#xff0c;可以轻松地生成美观的 Tkinter GUI。 主要功能和优势包括&#xff1a; 拖放界面设计比手写代码更快…