Go-知识测试-性能测试
- 1. 定义
- 2. 例子
- 3. testing.common 测试基础数据
- 4. testing.TB 接口
- 5. 关键函数
- 5.1 testing.runBenchmarks
- 5.2 testing.B.runN
- 5.3 testing.B.StartTimer
- 5.4 testing.B.StopTimer
- 5.5 testing.B.ResetTimer
- 5.6 testing.B.Run
- 5.7 testing.B.run1
- 5.8 testing.B.run
- 5.9 processBench
- 5.10 tetsing.B.doBench
- 5.11 testing.B.launch
- 5.12 testing.B.SetBytes
- 6. 数据统计
建议先看:https://blog.csdn.net/a18792721831/article/details/140062769
Go-知识测试-工作机制
1. 定义
性能测试会执行多次,然后计算平均耗时。
性能测试要保证测试文件以_test.go
结尾。
测试方法必须以BenchmarkXxx
开头。
测试文件可以与源码处于同一目录,也可以处于单独的目录。
2. 例子
在创建切片的时候,可以指定容量,也可以不指定容量。假设可以提前知道数据的长度,就可以在创建切片的时候,预分配存储空间,避免多次拷贝。
函数如下:
func MakeWithout(n int) []int {var s []intfor i := 0; i < n; i++ {s = append(s, i)}return s
}func MakeWith(n int) []int {s := make([]int, n)for i := 0; i < n; i++ {s = append(s, i)}return s
}
接着使用性能测试,看看上面两个函数的性能差距有多大
func BenchmarkMakeWithout(b *testing.B) {for i := 0; i < b.N; i++ {MakeWithout(1000)}
}func BenchmarkMakeWith(b *testing.B) {for i := 0; i < b.N; i++ {MakeWith(1000)}
}
先来个小容量的,n=1000
使用go test -v -bench=.
执行性能测试,-v 表示控制台输出结果,-bench表示执行性能测试,-bench=.表示使用.作为正则,也就是执行全部的性能测试
通过输出可以知道 Without 执行了 403447 次,平均每次 2596 纳秒
With 执行了 329895次,平均每次 3357 纳秒
也就是说,在1000的容量下,预先分配反而慢。我猜测是显式调用make花费了时间。
加大容量,n=1000_0000
预分配比较快了,平均每次26.7毫秒
3. testing.common 测试基础数据
每个性能测试都有一个入参t *testing.B
,结构定义如下:
type B struct {common // 与 testing.T 共享的 testing.common ,负责记录日志、状态等importPath string // 包含基准的包的导入路径context *benchContextN int // 目标代码执行次数,不需要用户了解具体值,会自动调整previousN int // 上一次运行中的迭代次数previousDuration time.Duration // 上次运行的总持续时间benchFunc func(b *B) // 性能测试函数benchTime benchTimeFlag // 性能测试函数最少执行的时间,默认为1sbytes int64 // 每次迭代处理的字节数missingBytes bool // 其中一个子基准标记没有设置字节。timerOn bool // 是否已开始计时 showAllocResult boolresult BenchmarkResult // 测试结果parallelism int // RunParallel创建并行性*GOMAXPROCS goroutines// memStats的初始状态。Mallocs和MemStats。TotalAlloc。startAllocs uint64 // 计时开始时堆中分配的对象总数startBytes uint64 // 计时开始时堆中分配的字节总数// 运行后此测试的净总数。netAllocs uint64 // 计时结束时,堆中增加的对象总数netBytes uint64 // 计时结束时,堆中增加的字节总数// ReportMetric收集的额外指标。extra map[string]float64
}
T 组合了 common 类型
// common包含T和B之间的公共元素,以及
// 捕获常见的方法,如Errorf。
type common struct {mu sync.RWMutex // 保卫这群田地output []byte // 测试或基准测试生成的输出。w io.Writer // 对于flushToParent。ran bool // 执行了测试或基准测试(或其中一个子测试)。failed bool // 测试或基准测试失败。skipped bool // 已跳过测试或基准测试。done bool // 测试已完成,所有子测试均已完成。helperPCs map[uintptr]struct{} // 写入文件/行信息时要跳过的函数helperNames map[string]struct{} // helperPC转换为函数名cleanups []func() // 测试结束时要调用的可选函数cleanupName string // 清除函数的名称。cleanupPc []uintptr // 调用Cleanup的点处的堆栈跟踪。finished bool // 测试功能已完成。chatty *chattyPrinter // 如果设置了chatty标志,则为chattyPrinter的副本。bench bool // 当前测试是否为基准测试。hasSub int32 // 以原子形式书写。raceErrors int // 测试过程中检测到的种族数。runner string // 运行测试的tRunner的函数名称。parent *commonlevel int // 测试或基准的嵌套深度。creator []uintptr // 如果级别>0,则堆栈跟踪父级调用t.Run的点。name string // 测试或基准的名称。start time.Time // 时间测试或基准测试已启动duration time.Durationbarrier chan bool // 为了发出平行子测验的信号,他们可以开始。signal chan bool // 发出测试完成的信号。sub []*T // 要并行运行的子测试的队列。tempDirMu sync.MutextempDir stringtempDirErr errortempDirSeq int32
}
每个测试均对应一个 testing.common
,不仅记录了测试函数的基础信息(比如名字),还管理了测试的执行过程和测试结果。
testing.commong
是单元测试,性能测试和模糊测试的基础。
通过继承共同的结构,保证了各种测试的行为一致,降低使用的门槛。
4. testing.TB 接口
testing.common 实现的接口为 testing.TB,单元测试和性能测试通过该接口获取基础能力。
type TB interface {Cleanup(func()) // 清理Error(args ...interface{}) // 表示测试失败+记录日志Errorf(format string, args ...interface{}) // 格式化表示测试失败+记录日志Fail() // 表示测试失败FailNow() // 标记测试失败+结束当前测试Failed() bool // 查询结果Fatal(args ...interface{}) // 标记测试失败+记录日志+结束当前测试Fatalf(format string, args ...interface{}) // 格式化标记测试失败+记录日志+结束当前测试Helper() // 标记测试为 Helper (避免打印当前代码行号)Log(args ...interface{}) // 记录日志Logf(format string, args ...interface{}) // 格式化 记录日志Name() string // 查询测试名Setenv(key, value string) // 设置环境变量Skip(args ...interface{}) // 记录日志+跳过测试SkipNow() // 跳过测试Skipf(format string, args ...interface{}) // 格式化记录日志+跳过测试Skipped() bool // 查询测试是否被跳过TempDir() string // 返回一个临时目录//阻止用户实现的私有方法//接口,因此将来不会添加//违反Go 1兼容性。private()
}
5. 关键函数
5.1 testing.runBenchmarks
runBenchmarks负责创建name=Main的Benchmark作为启动case
在testing.B.runN中执行testing.B.Run
5.2 testing.B.runN
在runN中启动定时器,然后执行benchFunc
性能测试中,执行多少次,也时由runN中设置的
5.3 testing.B.StartTimer
StartTimer负责启动计时并初始化内存相关计数,测试执行时会自动调用(name=Main的testing.B启动),一般不需要用户启动
func (b *B) StartTimer() {if !b.timerOn {runtime.ReadMemStats(&memStats) // 读取当前堆内存分配信息b.startAllocs = memStats.Mallocs // 记录当前堆内存分配的对象数b.startBytes = memStats.TotalAlloc // 记录当前堆内存分配的字节数b.start = time.Now() // 记录测试启动时间b.timerOn = true // 标记计时标志}
}
5.4 testing.B.StopTimer
StopTimer负责停止计时,并累加相应的统计值:
func (b *B) StopTimer() {if b.timerOn {b.duration += time.Since(b.start) // 累加测试耗时runtime.ReadMemStats(&memStats) // 读取当前堆内存分配信息b.netAllocs += memStats.Mallocs - b.startAllocs // 累加对北村分配的对象数b.netBytes += memStats.TotalAlloc - b.startBytes // 累加堆内存分配的字节数b.timerOn = false // 标记计时标志}
}
5.5 testing.B.ResetTimer
ResetTime用于重置计时器,相应地也会把其他统计值也重置:
func (b *B) ResetTimer() {if b.timerOn {runtime.ReadMemStats(&memStats) // 读取当前堆内存分配信息b.startAllocs = memStats.Mallocs // 记录当前堆内存分配的对象数b.startBytes = memStats.TotalAlloc // 记录当前堆内存分配的字节数b.start = time.Now() // 记录测试启动时间}b.duration = 0 // 清空耗时b.netAllocs = 0 // 清空内存分配的对象数b.netBytes = 0 // 清空内存分配的字节数
}
ResetTimer必将常用,比如在一个测试中,初始化部分耗时比较长,初始化后再开始计时
5.6 testing.B.Run
func (b *B) Run(name string, f func(b *B)) bool {// 是否有子测试atomic.StoreInt32(&b.hasSub, 1)// 加锁benchmarkLock.Unlock()// 延迟解锁defer benchmarkLock.Lock()// 获取 name等信息benchName, ok, partial := b.name, true, false// name 进行匹配if b.context != nil {benchName, ok, partial = b.context.match.fullName(&b.common, name)}// 匹配失败,结束if !ok {return true}var pc [maxStackLen]uintptrn := runtime.Callers(2, pc[:])// 新建子测试数据结构sub := &B{common: common{signal: make(chan bool),name: benchName,parent: &b.common,level: b.level + 1,creator: pc[:n],w: b.w,chatty: b.chatty,bench: true,},importPath: b.importPath,benchFunc: f,benchTime: b.benchTime,context: b.context,}// 是否并发if partial {atomic.StoreInt32(&sub.hasSub, 1)}// 输出日志信息if b.chatty != nil {labelsOnce.Do(func() {fmt.Printf("goos: %s\n", runtime.GOOS)fmt.Printf("goarch: %s\n", runtime.GOARCH)if b.importPath != "" {fmt.Printf("pkg: %s\n", b.importPath)}if cpu := sysinfo.CPU.Name(); cpu != "" {fmt.Printf("cpu: %s\n", cpu)}})fmt.Println(benchName)}// 先执行一次子测试,如果子测试不出错且子测试没有子测试则继续执行runif sub.run1() {// run 中决定了要执行多少次runNsub.run()}// 累加统计结果到父测试中b.add(sub.result)return !sub.failed
}
所有的测试都是先使用run1方法执行一次,然后在决定要不要继续迭代。
测试结果实际上以最后一次迭代的数据为准,最后一次迭代往往B.N更大,测试准确性相对更高。
5.7 testing.B.run1
在 run1中,调用runN的时候,传入1,表示执行一次BenchmarkXxx方法,统计执行一次的耗时。
5.8 testing.B.run
func (b *B) run() {// 打印额外的统计信息labelsOnce.Do(func() {fmt.Fprintf(b.w, "goos: %s\n", runtime.GOOS)fmt.Fprintf(b.w, "goarch: %s\n", runtime.GOARCH)if b.importPath != "" {fmt.Fprintf(b.w, "pkg: %s\n", b.importPath)}if cpu := sysinfo.CPU.Name(); cpu != "" {fmt.Fprintf(b.w, "cpu: %s\n", cpu)}})// 如果是子测试,那么此时子测试还未执行run1,在 processBench中会对子测试创建一个B,然后执行run1,接着执行 doBenchif b.context != nil {// Running go test --test.benchb.context.processBench(b) // Must call doBench.} else {// Running func Benchmark.b.doBench()}
}
5.9 processBench
执行子测试的doBench
5.10 tetsing.B.doBench
func (b *B) doBench() BenchmarkResult {go b.launch() // goroutine 执行 launch 结束<-b.signalreturn b.result
}
5.11 testing.B.launch
func (b *B) launch() {// 延迟调用通知父测试结束defer func() {b.signal <- true}()// 如果用户指定了,那么按照用户指定的执行if b.benchTime.n > 0 {b.runN(b.benchTime.n)} else {// 获取默认的时间间隔,默认为1sd := b.benchTime.d// 最少执行 b.benchTime(默认为1s)时间,最多执行1e9次for n := int64(1); !b.failed && b.duration < d && n < 1e9; {last := n// 获取1秒的纳秒数goalns := d.Nanoseconds()// 获取上一次执行次数,1次prevIters := int64(b.N)// 获取上一次执行时间// 执行 run 之前需要执行一次 run1 也就是说 prevIters 是第一次执行的耗时prevns := b.duration.Nanoseconds()if prevns <= 0 {// Round up, to avoid div by zero.prevns = 1}// goalns * prevIters 上次执行持续了多少纳秒// prevns 上次执行一次的耗时// n 表示上次执行多少次 n = goalns * prevIters / prevns// 先增长 20% , n = 1.2nn += n / 5// 不能增加过快,如果 20% 比100倍还大,那么取小值n = min(n, 100*last)// 并且至少增加1次n = max(n, last+1)// 不能超过 1e9n = min(n, 1e9)// 启动执行b.runN(int(n))// 执行完成后,进行下一次循环}}// 统计结果b.result = BenchmarkResult{b.N, b.duration, b.bytes, b.netAllocs, b.netBytes, b.extra}
}
在不考虑程序出错,而且用户没有主动停止测试的场景下,每个测试至少执行b.benchTime长的时间(秒),默认为1s.
先执行一遍,看看用户代码执行一次需要花多长时间,如果时间比较短,那么B.N需要足够大,才可以测试更准确。
如果时间比较长,那么B.N需要足够少,否则测试效率比较慢。
n = goalns * prevIters / prevns ,如果 prevns比较少,那么n就会从一个比较大的值开始循环
如果prevns比较大,那么n就会以一个比较小的值开始循环,直到单批次超过1秒。
5.12 testing.B.SetBytes
这个函数用来设置单词迭代处理的字节数,一旦设置了这个字节数,那么输出报告中奖出现 xx MB/s 的信息。
用来表示待测函数处理字节的性能,待测函数每次处理多少字节只有用户知道,所以需要用户设置。
比如:
func MakeWithout(n int) []int {var s []intfor i := 0; i < n; i++ {s = append(s, i)}return s
}func MakeWith(n int) []int {s := make([]int, n)for i := 0; i < n; i++ {s = append(s, i)}return s
}func BenchmarkMakeWithout(b *testing.B) {b.SetBytes(1024)for i := 0; i < b.N; i++ {MakeWithout(1000)}
}func BenchmarkMakeWith(b *testing.B) {b.SetBytes(1024)for i := 0; i < b.N; i++ {MakeWith(1000)}
}
执行结果
6. 数据统计
在测试开始时,会把当前内存值记录下来:
也就是记入testing.B.startAllocs和testing.B.startBytes,测试结束后,会用最终内存值与开始时的内存相减,
得到净增加的内存值,并记入testing.B.netAllocs和testing.B.netBytes中。
每个测试结束后,会吧结果保存到BenchmarkResult中
type BenchmarkResult struct {N int // 用户代码执行的次数T time.Duration // 测试耗时Bytes int64 // 用户代码每次处理的字节数,SetBytes设置的值MemAllocs uint64 // 内存对象净增加值MemBytes uint64 // 内存字节净增加值// 附加信息Extra map[string]float64
}
最终统计时,只需要把净增加值除以N就能得到每次新增多少内存。