我们一起聊聊 Go 性能工具

从开发到部署的整个过程都离不开基本的负载测试和性能剖析。利用 Go 的 pprof 和跟踪工具,开发人员可以深入了解性能瓶颈、CPU 使用率和内存分配情况。

在开发过程中,从一开始到应用程序的推出都充满了挑战,而负载测试则是其中至关重要的一项工作。这一阶段不仅仅是走过场,而是要进行严格的评估,确保应用程序的性能符合预期。在测试过程中发现性能不佳或意外瓶颈是常见的障碍,但这也是改进的关键时刻。

有了合适的剖析工具,开发人员就能迅速从诊断过渡到有针对性的改进,避免漫无目的的故障排除带来的隐患。这种简化的方法不仅节省了宝贵的开发时间,还强调了负载测试和剖析作为追求最佳应用程序性能不可或缺的工具的重要性。

Go 从一开始就配备了出色的工具,帮助开发人员进行负载测试。在参与过使用 Elixir 的项目后,Erlang 中大量的性能测量工具给我留下了深刻印象,而 Go 提供的工具同样令人印象深刻。本文将探讨如何使用这些工具。

  • pprof
  • trace

pprof

pprof 是 Go 专用的剖析器,可轻松确定 CPU 时间用在哪里,内存分配在哪里。获取配置文件的方法因命令行应用程序和网络应用程序而异。

cpu pprof

对于 CPU 剖析,可在感兴趣的代码段前后调用 pprof.StartCPUProfile() 和 pprof.StopCPUProfile(),并将输出保存到指定文件(在示例中为 $TMPDIR)。

复制

package mainimport ("fmt""os""path""runtime/pprof"
)func main() {// Create a file to save the measurement resultsfname := path.Join(os.TempDir(), "cpuprofile.out")cpuFile, err := os.Create(fname)if err != nil {fmt.Println(err)return}// Conduct the measurement pprof.StartCPUProfile(cpuFile)defer pprof.StopCPUProfile()// Perform a heavy operation
}

执行上述代码并生成 cpuprofile.out 输出后,可以将其加载到 pprof 中查看剖析信息。

复制

> go tool pprof /pathtotmpdir/cpuprofile.out   
Type: cpu
Time: Dec 17, 2022 at 7:40am (JST)
Duration: 606.44ms, Total samples = 390ms (64.31%)
Entering interactive mode (type "help" for commands, "o" for options)
(pprof)

运行提供的代码并将输出加载到 pprof 中,可以检查配置文件信息。输入 "top "可显示十大耗时条目。

复制

(pprof) top
Showing nodes accounting for 390ms, 100% of 390ms totalflat  flat%   sum%        cum   cum%380ms 97.44% 97.44%      390ms   100%  main.Prime (inline)10ms  2.56%   100%       10ms  2.56%  runtime.asyncPreempt0     0%   100%      390ms   100%  main.main0     0%   100%      390ms   100%  runtime.main
(pprof)

-cum选项可检索每个函数的累计时间。

复制

(pprof) top -cum
Showing nodes accounting for 390ms, 100% of 390ms totalflat  flat%   sum%        cum   cum%380ms 97.44% 97.44%      390ms   100%  main.Prime (inline)0     0% 97.44%      390ms   100%  main.main0     0% 97.44%      390ms   100%  runtime.main10ms  2.56%   100%       10ms  2.56%  runtime.asyncPreempt
(pprof)

list命令显示了功能的使用时间。

复制

(pprof) list main.Prime
Total: 390ms
ROUTINE ======================== main.Prime in /Users/username/dev/mastering-Go-3rd/ch11/blog/clacpuprofile.go380ms      390ms (flat, cum)   100% of Total.          .     26:   }.          .     27:   fmt.Println("Total primes:", total).          .     28:}.          .     29:.          .     30:func Prime(n int) bool {120ms      130ms     31:   for i := 2; i < n; i++ {260ms      260ms     32:           if (n % i) == 0 {.          .     33:                   return false.          .     34:           }.          .     35:   }.          .     36:   return true.          .     37:}
(pprof)

http pprof

对于网络应用程序,导入 net/http/pprof 会收集可在 /debug/pprof 端点访问的配置文件信息。

复制

package main
import ("net/http""net/http/pprof"
)
func NewHttpServer(addr string) *http.Server {httpsrv := newHttpServer()r := mux.NewRouter()r.HandleFunc("/", httpsrv.handleFoo).Methods("POST")r.HandleFunc("/", httpsrv.handleBar).Methods("GET")r.HandleFunc("/debug/pprof/", pprof.Index)r.HandleFunc("/debug/pprof/cmdline", pprof.Cmdline)r.HandleFunc("/debug/pprof/profile", pprof.Profile)r.HandleFunc("/debug/pprof/symbol", pprof.Symbol)r.HandleFunc("/debug/pprof/trace", pprof.Trace)srv := server.NewHttpServer(":8080")log.Fatal(srv.ListenAndServe())
}

http pprof 支持与 CPU pprof 类似的配置文件检查命令,即使在应用程序停止后也能对配置文件进行检查。

复制

> go tool pprof http://localhost:8080/debug/pprof/profile
Fetching profile over HTTP from http://localhost:8080/debug/pprof/profile
Saved profile in /Users/username/pprof/pprof.samples.cpu.002.pb.gz
Type: cpu
Time: Feb 8, 2023 at 11:12pm (JST)
Duration: 30s, Total samples = 270ms (  0.9%)
Entering interactive mode (type "help" for commands, "o" for options)
(pprof) top
Showing nodes accounting for 270ms, 100% of 270ms total
Showing top 10 nodes out of 67flat  flat%   sum%        cum   cum%90ms 33.33% 33.33%       90ms 33.33%  syscall.syscall80ms 29.63% 62.96%       80ms 29.63%  runtime.pthread_cond_signal50ms 18.52% 81.48%       50ms 18.52%  runtime.kevent30ms 11.11% 92.59%       30ms 11.11%  runtime.pthread_cond_wait20ms  7.41%   100%       20ms  7.41%  syscall.syscall60     0%   100%       10ms  3.70%  bufio.(*Reader).Peek0     0%   100%       20ms  7.41%  bufio.(*Reader).ReadLine0     0%   100%       20ms  7.41%  bufio.(*Reader).ReadSlice0     0%   100%       30ms 11.11%  bufio.(*Reader).fill0     0%   100%       30ms 11.11%  bufio.(*Writer).Flush

复制

go tool pprof -http :9402 /Users/username/pprof/pprof.samples.cpu.002.pb.gz

在我们的项目中,我们经常通过 k8s 上的端口转发访问配置文件信息。

复制

kubectl port-forward -n $namespace localhost 8080:8000
# This allows access at localhost:8000/debug/pprof/profile

callgraph

除了 CLI 验证外,您还可以使用 Web 界面在浏览器中查看调用图(这非常棒)。在与之前相同的命令中添加 -http 选项即可。您还可以下载并指定配置文件以供审查。

复制

> go tool pprof -http :8888 http://localhost:8080/debug/pprof/profile
Fetching profile over HTTP from http://localhost:8080/debug/pprof/profile
Saved profile in /Users/username/pprof/pprof.samples.cpu.004.pb.gz
Serving web UI on http://localhost:8888

有了调用图,您就可以快速了解程序正在调用哪些进程。

图片

图片

火焰图

火焰图直观显示应用程序花费的时间,可点击框架深入检查方法。

图片

图片

您可以点击每个帧,进一步检查方法内部的内容

检测内存泄漏

通过比较改进前和改进后的配置文件,大大方便了内存泄漏的检测,从而方便了泄漏解决方案的识别和验证。

复制

# before improvement
noglob curl -s http://localhost:8080/debug/pprof/profile > /tmp/profile-before.prof# after improvement
noglob curl -s http://localhost:8080/debug/pprof/profile > /tmp/profile-after.prof# Check the difference before and after
go tool pprof -http: 8000 --diff_base /tmp/profile-before.prof /tmp/profile-after.prof

对于内存泄漏调查,可以指定堆配置文件集合。

复制

go tool pprof http://localhost:8080/debug/pprof/heap?secnotallow=10# Continue processing for a fixed period before retrieving again
go tool pprof http://localhost:8080/debug/pprof/heap?secnotallow=10# Check the difference (can also be viewed in the web interface with the -http option)
go tool pprof --diff_base=/Users/username/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.001.pb.gz /Users/username/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.002.pb.gz (pprof) top
Showing nodes accounting for 12.92GB, 295.37% of 4.38GB total
Dropped 2 nodes (cum <= 0.02GB)flat  flat%   sum%        cum   cum%12.92GB 295.37% 295.37%    12.93GB 295.56%  main.main0     0% 295.37%    12.93GB 295.56%  runtime.main
(pprof) top 20
Showing nodes accounting for 12.92GB, 295.37% of 4.38GB total
Dropped 2 nodes (cum <= 0.02GB)flat  flat%   sum%        cum   cum%12.92GB 295.37% 295.37%    12.93GB 295.56%  main.main0     0% 295.37%    12.93GB 295.56%  runtime.main
(pprof) list main.
Total: 4.38GB
ROUTINE ======================== main.main in /Users/username/dev/proglog/cmd/server/main.go12.92GB    12.93GB (flat, cum) 295.56% of Total.          .     15:

trace

trace 可让用户深入了解运行时如何调度 goroutine,为调查争用问题或 GC 问题提供有关堆、操作系统线程数和 goroutine 状态的宝贵数据。在命令行应用程序中可通过 runtime/trace 软件包访问,在网络应用程序中可通过 net/http 软件包访问。

复制

# fetch trace with executing web application
noglob curl http://localhost:8080/debug/pprof/trace?secnotallow=10 > /tmp/pprof.trace
# chech the trace
go tool trace /tmp/pprof.trace

总结

总而言之,从开发到部署的整个过程都离不开基本的负载测试和性能剖析。利用 Go 的 pprof 和跟踪工具,开发人员可以深入了解性能瓶颈、CPU 使用率和内存分配情况。

可视化调用图和火焰图的功能进一步帮助找出效率低下的问题,从而进行精确的优化。利用这些工具不仅能加强调试过程,还能显著提高应用程序的性能。采用这些方法对于确保我们的应用程序稳健高效、随时满足实际需求至关重要。

另外,作为开发者,我们需要保持好奇心和学习热情,不断探索新的技术,只有这样,我们才能在这个快速发展的时代中立于不败之地。低代码也是一个值得我们深入探索的领域,让我们拭目以待,它将给前端世界带来怎样的变革。

介绍一款程序员都应该知道的软件JNPF快速开发平台,很多人都尝试用过它,它是功能的集大成者,任何信息化系统都可以基于它开发出来。

JNPF 可以实现应用从创建、配置、开发、测试到发布、运维、升级等完整生命周期的管理。减少了传统应用程序的代码编写量,通过图形化、可视化的界面,以拖放组件的方式,即可快速生成应用程序的产品,大幅降低了开发企业管理类软件的难度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/26979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kettle 数据抽取工具使用教程:从入门到实战

一、简介 Kettle 是 Pentaho Data Integration (PDI) 的一个组成部分&#xff0c;是一个开源的数据集成工具。它被广泛用于数据的抽取、转换和加载 (ETL) 过程。Kettle 提供了一个易于使用的图形界面&#xff0c;可以轻松设计和执行 ETL 流程。 github 源码地址&#xff1a;ht…

postman教程-19-mock测试

上一小节我们学习了Postman接口参数化方法&#xff0c;本小节我们讲解一下Postman mock测试的方法。 一、什么叫mock测试 mock测试就是在测试过程中&#xff0c;对某些不容易构造或者不容易获取的对象&#xff0c;用一个虚拟的对象来创建以便于测试的一种测试方法&#xff0c…

chatgpt 生成的 左侧导航功能的网页

目录 一、左侧导航 1、效果如下&#xff1a; 2、代码如下&#xff1a; 3、技术点&#xff1a; 1)、箭头居中 2)、导航区域 3)、导航隐藏时&#xff0c;正文重新居中 4)、设置视口高度 这是用chatgpt生成的网页&#xff0c;其实&#xff0c;不是一下子就生成了满足需求的…

Syncovery:跨平台高效文件备份与同步的得力助手

在数字化时代&#xff0c;数据安全与文件同步已成为个人及企业不可或缺的需求。Syncovery作为一款专为Mac和Windows用户设计的文件备份和同步工具&#xff0c;凭借其高效、安全和易用的特点&#xff0c;赢得了广泛赞誉。 一、强大备份功能 Syncovery支持多种备份方案和数据格…

LeetCode 119.杨辉三角 II

1.题目要求如图所示: 示例 1:输入: rowIndex 3 输出: [1,3,3,1]示例 2:输入: rowIndex 0 输出: [1]示例 3:输入: rowIndex 1 输出: [1,1]先用malloc函数创造一个二维数组&#xff0c;变成杨辉三角&#xff0c;然后再用一维数组找到所指的那一行: /*** Note: The returned…

java使用多线程导出数据至excel

大量数据导出 问题 如果数据量较大&#xff0c;那么使用 Apache POI 导出数据可能会导致OOM或者到处时间较长。 解决方案 使用多线程同时导出多个excel&#xff0c;缩短接口响应时间 代码示例 public void test () {List<Test> tests testMapper.selectAll(); // 查…

labelme安装(通过anaconda)

1.下载安装anaconda 2.安装完成后打开&#xff0c;在环境页里面创建环境 选择3.6.13版本&#xff0c;然后运行 3.安装labelme pip install labelme -i https://pypi.tuna.tsinghua.edu.cn/simple 使用上面命令加速一下 4.labelme打开并标注 总结&#xff1a;现在版本越来越多…

中小学一级教师相当于什么级别的职称

你知道吗&#xff1f;当你一步步攀登职称的阶梯&#xff0c;达到中小学一级教师的荣誉时&#xff0c;你究竟站在了哪个高度&#xff1f;一级教师不仅是一个职称的标签&#xff0c;更是对你专业能力的认可。 中小学教师的职称体系&#xff0c;就像一幅层次分明的画卷&#xff0c…

Blender:渲染输出

渲染输出界面 渲染设置界面&#xff1a; 输出设置界面&#xff1a; 输出文件格式 【文档】 视频导出格式&#xff1a; AVI JPEG 使用JPEG压缩的AVI。有损&#xff0c;能得到更小的文件&#xff0c;但大小无法与编解码器的压缩算法得到的文件相比。JPEG 压缩也是数字摄像机使用…

知识图谱的应用---新零售

文章目录 新零售知识图谱构建过程典型应用 新零售 新零售&#xff0c;即个人、企业以互联网为依托&#xff0c;通过运用大数据、人工智能等先进技术手段并运用心理学知识&#xff0c;对商品的生产、流通与销售过程进行升级改造&#xff0c;进而重塑业态结构与生态圈&#xff0c…

精准定位,智慧提纯:高级数据提取策略

在数据驱动的时代&#xff0c;高级数据提取策略成为企业决策、科学研究以及各类项目成功的关键。数据提取&#xff0c;不仅仅是简单地收集信息&#xff0c;而是需要精准定位目标数据&#xff0c;并通过智慧提纯方法&#xff0c;从海量数据中提取出有价值、有深度的信息。本文将…

Redis之线程IO模型

引言 Redis是个单线程程序&#xff01;这点必须铭记。除了Redis之外&#xff0c;Node.js也是单线程&#xff0c;Nginx也是单线程&#xff0c;但是他们都是服务器高性能的典范。 Redis单线程为什么能够这么快&#xff01; 因为他所有的数据都在内存中&#xff0c;所有的运算都…

【制作100个unity游戏之29】使用unity复刻经典游戏《愤怒的小鸟》(完结,附带项目源码)

最终效果 文章目录 最终效果前言素材下载简单搭建环境控制小鸟生成弹簧 限制小鸟的控制范围弹簧线的显示隐藏飞行新增木头木头销毁不同血量的木头状态配置更多物品爆炸效果创建敌人的小猪创建多个小鸟循环游戏结束相机跟随加分特效不同定义技能的鸟加速鸟回旋鸟爆炸鸟效果 轨迹…

小学生作文辅导杂志小学生作文辅导杂志社小学生作文辅导编辑部2024年第2期目录

写法导引 创意引航&#xff0c;笔墨生辉——小学语文习作教学中的创新思维训练 杜娟; 3-5 陶行知“小先生制”教育思想在小学作文练习中的应用探索 张淑勤; 6-8 新课程标准视域下小学语文习作教学策略探析 任真真; 9-11 即时作文&#xff1a;开辟小学习作教学的…

Spring Boot集成 Spring Retry 实现容错重试机制并附源码

&#x1f604; 19年之后由于某些原因断更了三年&#xff0c;23年重新扬帆起航&#xff0c;推出更多优质博文&#xff0c;希望大家多多支持&#xff5e; &#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有坚忍不拔之志 &#x1f390; 个人CSND主页——Mi…

MATLAB神经网络---激活层

非线性变换的目的 非线性变换的目的是为神经网络引入一些非线性特征&#xff0c;使其训练出一些符合各种曲线或各种特征的模型。 换句话来说&#xff0c;如果模型都是直线特征的话&#xff0c;它的泛化能力会不够好。 目录 深度学习层列表 - MATLAB & Simulink - MathWo…

初识MySQL数据库

目录 一、了解数据库 1.数据库的相关概念 2.数据库系统发展史 3.主流数据库产品 二、数据库分类 1.关系数据库 2.非关系型数据库 三、mysql的yum安装与源码编译安装 1.源码编译安装mysql 2.yum安装 mysql5.7 四、MySQL数据类型 1.常用的数据类型 五、查看数据库…

高性能8位单片机 CA51M151,1T 8051内核 / 内置12位ADC / 16 位PWM / 支持触摸 / 8K MTP

CA51M151 系列芯片是基于 1T 8051 内核的 8 位微控制器&#xff0c;不仅保留了传统 8051 芯片的基本特性&#xff0c;通常情况下运行速度比传统的 8051 芯片快 10 倍&#xff0c;性能更加优越。芯片内置 8 KB MTP 程序存储器&#xff0c;256Byte 内部RAM&#xff0c;512Byte 外…

持绪电商:开一家抖音网店大概多久才能做起来

在数字化浪潮的推动下&#xff0c;抖音不仅是年轻人喜爱的短视频平台&#xff0c;更成为电商的新阵地。不少创业者和品牌纷纷入驻&#xff0c;希望能借力抖音的流量红利实现快速成长。但开设一家抖音网店并使其蓬勃发展&#xff0c;并非一朝一夕之事&#xff0c;它需要策略、耐…

植物大战僵尸(杂交版)最新版V2.1来袭!

【新手指导】最新版v2.1来袭 1.闪退怎么办&#xff1f; 答:窗口模式可以解决大部分问题。输入法转换成英文也可以。最后一种办法管理员运行&#xff0c;再后台可运行&#xff0c;即便不是窗口也不会闪退&#xff0c;亲测有效 2.哪里下载&#xff1f; 答&#xff1a;夸克网盘htt…