目录
1交易应用介绍
2系统挑战及应对
3优雅降级思路
4心得总结
交易应用介绍
购物袋
下单
确认订单
系统挑战及应对
挑战
• 高并发
• 低时延
• 容量有限
• 多外部系统协力&下单信息准确
目标
• 不挂掉
– 不因为容量原因导致网站瘫痪
– 自身的容量
– 后端系统的容量
问题
• 高压力情况下,有限的容量为什么不能处 理有限的请求?
– IO瓶颈
– 数据热点
– 线程模型
– 排队
– 超时
应对
思路
主动拒绝
• 减少系统内的排队
• 尽可能早地拒绝
优雅降级
• 应用分业务做服务拒绝
• 业务分功能点做服务拒绝
优雅降级思路
• 优雅降级,我们需要知道什么? – 业务优先级
• 根据业务目标,哪些业务是不重要的 – 每个业务所包含的功能点(包括分支功能点)
• 根据业务目标,哪些功能点是不重要的 – 每个功能点所关联的外部系统容量
• 某点出现瓶颈的时候,停掉该功能点,能否减少 该点的压力
监控指标
• 需要监控什么? – 流量(proactive)
• 到该应用的流量
• 该应用调用其它系统(包括db、tair等)的流量
• 每个应用流量监控粒度 – 分目标(来源)应用,分接口、分业务,分功能点 – 汇聚&钻取 – 其它指标(reactive)
• RT • Load、CPU、mem、network、disk、…
Tmalleye监控
• 核心功能 – 实时,分业务获取应用的第一手资料
• 并发度
• qps
• rt
• 访问次数统计
– 控制
• 按比例的降级开关控制(手工开关+阈值开关)
• 弹性更好的跨业务容量隔离
交易降级方案
交易降级预案
心得总结