如何用sysbench做好IO性能测试

sysbench 是一个非常经典的综合性能测试工具,通常都用它来做数据库的性能压测,但也可以用来做CPU,IO的性能测试。而对于IO测试,不是很推荐sysbench,倒不是说它有错误,工具本身没有任何问题,它的测试方法导致测试的数据会让人有些困惑:性能数据到底是不是这样呢,跟云厂商承诺的性能有关系嘛。一般我们都用FIO来进行性能测试,云厂商都推荐用FIO进行性能测试,通过FIO性能测试,都能轻易达到云厂商承诺的性能。

插曲:关于sysbench的版本,现在主要有0.4.12和1.0.
版本。截止2006年sysbench好长时间没有发展,2017年之前都是用旧版本0.4.12(所以网上一搜一大堆文章都是0.4.
的教程),然后作者估计修了几个bug,变成0.5版本,然后就跟过去做了告别,从2017重新开发了一个新版本sysbench 1.0.*,这里讲述的性能测试都是用了最新版。

1. sysbench fileio测试

言归正传,sysbench怎么做IO的性能测试呢,sysbench fileio help,参数如下:

#/usr/local/sysbench_1/bin/sysbench fileio help
sysbench 1.0.9 (using bundled LuaJIT 2.1.0-beta2)fileio options:--file-num=N              number of files to create [128]--file-block-size=N       block size to use in all IO operations [16384]--file-total-size=SIZE    total size of files to create [2G]--file-test-mode=STRING   test mode {seqwr, seqrewr, seqrd, rndrd, rndwr, rndrw}--file-io-mode=STRING     file operations mode {sync,async,mmap} [sync]--file-async-backlog=N    number of asynchronous operatons to queue per thread [128]--file-extra-flags=STRING additional flags to use on opening files {sync,dsync,direct} []--file-fsync-freq=N       do fsync() after this number of requests (0 - don't use fsync()) [100]--file-fsync-all[=on|off] do fsync() after each write operation [off]--file-fsync-end[=on|off] do fsync() at the end of test [on]--file-fsync-mode=STRING  which method to use for synchronization {fsync, fdatasync} [fsync]--file-merged-requests=N  merge at most this number of IO requests if possible (0 - don't merge) [0]--file-rw-ratio=N         reads/writes ratio for combined test [1.5]复制代码

sysbench的性能测试都需要做prepare,run,cleanup这三步,准备数据,跑测试,删除数据。那下面就开始实战:
客户用2C4G的vm,挂载120G的SSD云盘做了性能测试,测试命令如下:

cd /mnt/vdb  #一定要到你测试的磁盘目录下执行,否则可能测试系统盘了
sysbench fileio --file-total-size=15G --file-test-mode=rndrw --time=300 --max-requests=0 prepare
sysbench fileio --file-total-size=15G --file-test-mode=rndrw --time=300 --max-requests=0 run
sysbench fileio --file-total-size=15G --file-test-mode=rndrw --time=300 --max-requests=0 cleanup复制代码

结果如下:

File operations:reads/s:                      2183.76writes/s:                     1455.84fsyncs/s:                     4658.67Throughput:read, MiB/s:                  34.12written, MiB/s:               22.75General statistics:total time:                          300.0030stotal number of events:              2489528Latency (ms):min:                                  0.00avg:                                  0.12max:                                204.0495th percentile:                      0.35sum:                             298857.30Threads fairness:events (avg/stddev):           2489528.0000/0.00execution time (avg/stddev):   298.8573/0.00复制代码

随机读写性能好像不咋地,换算IOPS为(34.12+22.75)*1024/16.384=3554.375,与宣称的5400IOPS有很大差距。眼尖的人肯定发现只有2个核,去遍历128个文件,好像会降低效率,于是定制file-num去做了系列测试,测试结果如下:

file-num1248163264128
read(MB/s)57.5157.357.3657.3355.1247.7241.1134.12
write(MB/s)38.3438.238.2438.2236.7531.8127.422.75

明显可以看到,默认测试方法会导致性能下降,文件数设置为1达到最大性能。
那file-num=128与file-num=1的区别是测试文件从128个变成1个,但是总文件大小都是15G,都是随机读写,按理性能应该是一致的,区别是会在多个文件之间切换读写,那么可能会导致中断增加和上下文切换开销增大。通过vmstat命令得到了验证:
file-num=128的vmstat输出是这样的:

file-num=1的vmstat输出是这样的:

从上面两个图可以看出file-num=1的时候上下文切换只有8500左右比file-num=128的时候24800小多了,in(中断)也少太多了。减少了中断和上下文切换开销,吞吐能力显著提升了。
再做了一个实验,同样磁盘大小,改成挂载到8C的vm下,改成8线程进行测试,得到如下数据:

file-num1248163264128
read(MB/s)253.08209.86193.38159.73117.9886.7867.3951.98
write(MB/s)168.72139.9128.92106.4978.6657.8544.9334.65

可以得出同样的结论,file-num=1可以得到最好的性能,理由如上。

2. 与fio测试的比较

单进程下,file-num=1换算到IOPS为(57.51+38.34)*1024/16.384=5990.625,这好像超过我们的IOPS设置限定了。通过fio是怎么测得这个IOPS的呢:

fio -direct=1 -iodepth=128 -rw=randrw -ioengine=libaio -bs=4k -size=1G -numjobs=1 -runtime=1000 -group_reporting -filename=iotest -name=randrw_test复制代码

通过阅读源代码,发现很多不同:

  1. 一个是通过libaio,一个是通过pwrite/pread。libaio的性能是非常强劲的,详情可以参考文章。
    即使ioengine=psync,这个engine的读写方法是pread和pwrite,但是整个实现也是不一致的。
  2. fio测试的时候direct=1,就是每次都写入磁盘,而sysbench默认file-fsync-freq=100,也就是完成100次操作才会有一个fsync操作,这种操作涉及系统缓存。

3. 深入一步

上节认为操作系统干扰以及io读写方式的差异,造成了测试数据的不一致。深入去研究了下源代码,其实sysbench的作者是提倡用libaio,代码里面大量地运用了宏定义,如:

/* 异步写的截取代码 */
#ifdef HAVE_LIBAIOelse if (file_io_mode == FILE_IO_MODE_ASYNC){/* Use asynchronous write */io_prep_pwrite(&iocb, fd, buf, count, offset);if (file_submit_or_wait(&iocb, FILE_OP_TYPE_WRITE, count, thread_id))return 0;return count;}
#endif复制代码

那怎么启用这个宏呢,默认就是启用这个宏的。
启用这个宏后,执行sysbench fileio help,会发现有这一项:--file-async-backlog=N number of asynchronous operatons to queue per thread [128],说明HAVE_LIBAIO这个宏确实生效了。
既然sysbench默认有libaio后,那整个测试方法需要调整:

# --file-extra-flags=direct 文件读写模式改成direct
# --file-io-mode=async 确保libaio起效
# --file-fsync-freq=0 不需要执行fsync
sysbench fileio --file-total-size=15G --file-test-mode=rndrw --time=300 --max-requests=0 --file-io-mode=async --file-extra-flags=direct  --file-num=1 --file-rw-ratio=1 --file-fsync-freq=0 run复制代码

得到测试结果如下:

对于FIO命令也进行了调整,把bs调整成16k,其他不变,还是达到上限5400。测试结果如下:

可以看到sysbench测试的效果与fio的测试效果完全一致!
不过个人还是推荐FIO来做IO的性能测试。

转载于:https://juejin.im/post/5c1c9ce5e51d451ffd254011

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/388814.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

XCode、Objective-C、Cocoa 说的是几样东西

大部分有一点其他平台开发基础的初学者看到XCode,第一感想是磨拳擦掌,看到 Interface Builder之后,第一感想是跃跃欲试,而看到Objective-C的语法,第一感想就变成就望而却步了。好吧,我是在说我自己。 如果…

java http2_探索HTTP/2: HTTP 2协议简述(原)

探索HTTP/2: HTTP/2协议简述HTTP/2的协议包含着两个RFC:Hypertext Transfer Protocol Version 2 (RFC7540),即HTTP/2;HPACK: Header Compression for HTTP/2 (RFC7541),即HPACK。RFC7540描述了HTTP/2的语义,RFC7541则描…

错误处理

错误处理: 许多系统调用和函数在失败后,会在失败时设置外部变量errno的值来指明失败原因。许多不同的函数库都把这个变量作为报告错误的标准方法。程序必须在函数报告出错后立刻检查errno变量,因为它可能被下一个函数调用所覆盖&#xff…

Android类库介绍

Android类库介绍 GPhone开发包Android SDK含了很多丰富的类库: android.util 涉及系统底层的辅助类库 android.os 提供了系统服务、消息传输、IPC管道 android.graphics GPhone图形库,包含了文本显示、输入输出、文字样式 android.database 包含底层的AP…

递归函数基例和链条_链条和叉子

递归函数基例和链条因果推论 (Causal Inference) This is the fifth post on the series we work our way through “Causal Inference In Statistics” a nice Primer co-authored by Judea Pearl himself.这是本系列的第五篇文章,我们通过“因果统计推断”一书进行…

前端技能拾遗

本文主要是对自己前端知识遗漏点的总结和归纳,希望对大家有用,会持续更新的~ 解释语言和编译型语言 解释型语言与编译型语言的区别翻译时间的不同。 编译型语言在程序执行之前,有一个单独的编译过程,将程序翻译成机器语言&#xf…

java lock 信号_java各种锁(ReentrantLock,Semaphore,CountDownLatch)的实现原理

先放结论:主要是实现AbstractQueuedSynchronizer中进入和退出函数,控制不同的进入和退出条件,实现适用于各种场景下的锁。JAVA中对于线程的同步提供了多种锁机制,比较著名的有可重入锁ReentrantLock,信号量机制Semapho…

Intent.ACTION_MAIN

1 Intent.ACTION_MAIN String: android.intent.action.MAIN 标识Activity为一个程序的开始。比较常用。 Input:nothing Output:nothing 例如&#xff1a; 1 <activity android:name".Main"android:label"string/app_name">2 <intent-filter…

足球预测_预测足球热

足球预测By Aditya Pethe通过阿蒂亚皮特(Aditya Pethe) From September to January every year, football takes over America. Games dominate TV Sunday and Monday nights, and my brother tears his hair out each week over his consistently underperforming fantasy te…

C#的特性Attribute

一、什么是特性 特性是用于在运行时传递程序中各种元素&#xff08;比如类、方法、结构、枚举、组件等&#xff09;的行为信息的声明性标签&#xff0c;这个标签可以有多个。您可以通过使用特性向程序添加声明性信息。一个声明性标签是通过放置在它所应用的元素前面的方括号&am…

java 技能鉴定_JAVA试题-技能鉴定

一、单选题1.以下创建了几个对象( B)String A,B,CA"a";B"b":AAB;StringBuffer Dnew StringBuffer("abc");DD.append("567");A.6B.4C.3D.52.关于以下程序段&#xff0c;正确的说法是( C )1&#xff0e;String s1“a”“b”;2&#xff0…

ADD_SHORTCUT_ACTION

String ADD_SHORTCUT_ACTION 动作&#xff1a;在系统中添加一个快捷方式。. “android.intent.action.ADD_SHORTCUT”   String ALL_APPS_ACTION 动作&#xff1a;列举所有可用的应用。   输入&#xff1a;无。 “android.intent.action.ALL_APPS”   String ALTERNATIVE…

python3中朴素贝叶斯_贝叶斯统计:Python中从零开始的都会都市

python3中朴素贝叶斯你在这里 (You are here) If you’re reading this, odds are: (1) you’re interested in bayesian statistics but (2) you have no idea how Markov Chain Monte Carlo (MCMC) sampling methods work, and (3) you realize that all but the simplest, t…

java映射的概念_Java 反射 概念理解

文章来源:http://hollischuang.gitee.io/tobetopjavaer/#/basics/java-basic/reflection反射反射机制指的是程序在运行时能够获取自身的信息。在java中&#xff0c;只要给定类的名字&#xff0c;那么就可以通过反射机制来获得类的所有属性和方法。反射有什么作用在运行时判断任…

【转载】移动端布局概念总结

布局准备工作及布局思想及概念: 一个显示器&#xff08;pc端显示器 及 手机屏显示器&#xff09;&#xff0c;既有物理像素&#xff0c;又有独立像素&#xff08;独立像素也叫作css像素&#xff0c;用于前端人员使用&#xff09;&#xff1b; -->重要 首先确定设计稿的尺寸…

深入浅出:HTTP/2

上篇文章深入浅出&#xff1a;5G和HTTP里给自己挖了一根深坑&#xff0c;说是要写一篇关于HTTP/2的文章&#xff0c;今天来还账了。 本文分为以下几个部分&#xff1a; HTTP/2的背景HTTP/2的特点HTTP/2的协议分析HTTP/2的支持 HTTP/2简介 HTTP/2主要是为了解决现HTTP 1.1性能不…

画了个Android

画了个Android 今晚瞎折腾&#xff0c;闲着没事画了个机器人——android&#xff0c;浪费了一个晚上的时间。画这丫还真不容易&#xff0c;为那些坐标&#xff0c;差点砸了键盘&#xff0c;好在最后画出个有模有样的&#xff0c;心稍安。 下面来看看画这么个机器人需要些什么东…

数据治理 主数据 元数据_我们对数据治理的误解

数据治理 主数据 元数据Data governance is top of mind for many of my customers, particularly in light of GDPR, CCPA, COVID-19, and any number of other acronyms that speak to the increasing importance of data management when it comes to protecting user data.…

mysql 选择前4个_mysql从4个表中选择

不要认为GROUP BY是必需的 . 虽然如果一个孩子有2个父记录&#xff0c;你可能想用它来将2个父母分组到一行 - 但不确定这是否是你的要求 . 因为如果一个孩子有2个父母&#xff0c;那么将为该孩子返回的父母是未定义的 .假设所有孩子都有父母&#xff0c;所有父母都会有姓&#…

提高机器学习质量的想法_如何提高机器学习的数据质量?

提高机器学习质量的想法The ultimate goal of every data scientist or Machine Learning evangelist is to create a better model with higher predictive accuracy. However, in the pursuit of fine-tuning hyperparameters or improving modeling algorithms, data might …