本文是“.NET Conf China 2022”上我的一个分享,这里更细化的分享出来。
分享分为四个部分:
制定指示
设计应用
正确测试
性能优化
高性能:不一定是架构出来的,但一定是优化出来的。
制定指标-收集
首先把项目中的热路径API和核心API找出来,然后分析每个API是CPU密集型的,还是内存密集型的,以供在后面测试参考或对API的判断。
制定指标-制定
TPS=并发线程*1000/ART,这是TPS和平均响应时间的公式。这里的表格相对完整,作为开发的性能测试,有时也可以只要求响应时间和TPS。或要求TPS和P95,P99。有时成功率很敏感,不管发性能怎么样,成功率必须100%,这是根据业务的类型要求的,特别是和钱有关的请求,要求都比较高。
某API指标
指标名称
指标值
业务指标
TPS(2C2G)
2000
响应时间
ART
10
P95
12
P99
15
成功率
100%
并发线程
20
稳定性指标
压力持续时间
>=8h
压力阈值
CPU <80%,TPS≈2000
内存泄露
无
TPS波动
<5%
应用资源(2C2G)
MEM
<2G
CPU最大使用率
<90%
DB资源(8C8G)
MEM
<8G
CPU最大使用率
<90%
缓存(1C1G)
MEM
<80%
CPU最大使用率
<90%
设计应用-通用设计
开发人员要了解通用状态下的设备情况,比如CPU的缓存,内存,硬盘之间的关系,比如速度是在依次减少,成本在降低。还要了解各种网络协速度,I/O的速度,以及使用各种数据库的速度通常的阈值是什么样的。
提升性能的两个法宝:用缓存和用Queue,缓存可以让使用数据速度更快,Queue可以分隔复杂业务,让吞吐量更高,合理有效的使用两种技术可以很大的提升性能。
设计应用-.NET体系
使用异步:Demo
//同步方法
app.MapGet("/sync", () =>
{using (var con = new MySqlConnection(connectionString)){var result = con.Query<int>("select sleep(6)");Console.WriteLine($"sync:{DateTime.Now}");return result;}
});
//异步方法,没有CancellationToken
app.MapGet("/async", async () =>
{using (var con = new MySqlConnection(connectionString)){var result = await con.QueryAsync<int>("select sleep(6)");Console.WriteLine($"sync:{DateTime.Now}");return result;}
});
//异步,有CancellationToken
app.MapGet("/asyncwithtoken", async (CancellationToken token) =>
{using (var con = new MySqlConnection(connectionString)){var result = await con.QueryAsync<int>(new CommandDefinition("select sleep(6)", cancellationToken: token));Console.WriteLine($"sync:{DateTime.Now}");return result;}
});
通过postman请求三个api,然后取消,会发现前两个api始终会执行完成,并输出时间;第三个会在取消后停止响应。
正确使用异步,可以有效地提升服务端的资源使用状况。
谨防阻塞:
记一次性能故障排查
桂素伟,公众号:桂迹记一次性能故障排查
大集合化整为零:用最正确的集合来处理数据,不要在集中存放大量数据,这样不管对内存或之后的运算,造成负担。同时要从业务层次评估计集合的最大上限。
避免在Host生成文件
再记一次Memory Leak分析
桂素伟,公众号:桂迹再记一次Memory Leak分析
复杂方法要比对:
using BenchmarkDotNet.Attributes;
using BenchmarkDotNet.Jobs;
using BenchmarkDotNet.Running;
using PerformanceDemo;
using System.Collections.Generic;
using System.Xml.Linq;var summary = BenchmarkRunner.Run(typeof(CustomTypeTest));public class CustomTypeTest
{ [Benchmark][Arguments(2000)]public Dictionary<string, SBook> GetBook1(int count){var sbookDic = new Dictionary<string, SBook>();for (var i = 0; i <= count; i++){sbookDic.Add($"张{i}丰", new SBook(){Id = i,Name = "C#从入门到精通",Author = $"张{i}丰",Title = "C#1.0",Description = "这是一本书"});}return sbookDic;}[Benchmark][Arguments(2000)]public Dictionary<string, Book> GetBook2(int count){var bookDic = new Dictionary<string, Book>();for (var i = 0; i <= count; i++){bookDic.Add($"张{i}丰", new Book(){Id = i,Name = "C#从入门到精通",Author = $"张{i}丰",Title = "C#1.0",Description = "这是一本书"});}return bookDic;}[Benchmark][Arguments(2000)]public List<Book> GetBook3(int count){var bookList = new List<Book>();for (var i = 0; i <= count; i++){bookList.Add(new Book{Id = i,Name = "C#从入门到精通",Author = $"张{i}丰",Title = "C#1.0",Description = "这是一本书"});}return bookList;}[Benchmark][Arguments(2000)]public List<SBook> GetBook4(int count){var sbookList = new List<SBook>();for (var i = 0; i <= count; i++){sbookList.Add(new SBook{Id = i,Name = "C#从入门到精通",Author = $"张{i}丰",Title = "C#1.0",Description = "这是一本书"});}return sbookList;}
}
public class Book
{public int Id { get; set; }public string Name { get; set; }public string Description { get; set; }public string Title { get; set; }public string Author { get; set; }
}
public struct SBook
{public int Id { get; set; }public string Name { get; set; }public string Description { get; set; }public string Title { get; set; }public string Author { get; set; }
}
下面是比较结果:
让每个API轻巧快速
有一颗追求性能的心——关注.NET版本
关于在开发层次的性能注意事项有很多,这是根据不同的项目,使用不同的类库决定的,上面只是我性能化化中的几个代表性场景。
设计应用-发布
配置:GC方式 工作站方式,服务器方式:CPU使用率比内存更重要,服务器GC性能更好;内存利用率较高而 CPU 使用率相对较低,工作站 GC 性能更高。
发布方式:默认和R2R首次请求时间和体积不同
普通模式 | R2R模式 | AOT模式 | |
大小 | 29.8 MB | 62.2 MB | 19.5M |
首次请求用时 | 360ms | 90ms | 20ms |
正确测试
测性能的正确姿势
尽量与生产环境一致
要有监控,通过监控数据对比发现问题
不要打满资源:CPU<90%,内存少于最大值
让子弹多飞会儿,观察内存是有什么不一样
遇到问题借助工具
dotnet-dump
dotnet-counters
前人经验也很宝贵
https://learn.microsoft.com/zh-cn/dotnet/core/diagnostics/
性能优化
减少响应时间:
优化&简化流程
优化调用链路上的函数
把关系数据库操作转成缓存操作
用BenchmarkDotNet
提升TPS:
优先降低性能测中的较高资源
让应用性能是线性的,可以轻松地通过扩容来提升TPS
经过上面的分享,可以得出:
高性能:一定不是架构出来的,但一定是优化出来的。