简介
Hystrix是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。
"断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。
导包:
<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
降级熔断限流理论
服务降级(fallback)
当请求的处理超过预期等待时间或报错时,将该服务降级不进行处理,返回一个友好提示
服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback
服务熔断 circuitBreaker
类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示。
服务的降级 -> 进而熔断 -> 恢复调用链路
服务限流
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟N个,有序进行。
服务降级
服务端降级:
-
在启动类上加入注解@EnableCircuitBreaker
-
在业务方法上加入注解:@HystrixCommand表明出错的条件以及出错时兜底的方法。这里设定超时时间为3s
@HystrixCommand(fallbackMethod = "paymentInfo_TimeOutHandler",commandProperties = {@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="3000")})public String paymentInfo_TimeOut(Integer id){int timeNum=5;try {TimeUnit.SECONDS.sleep(timeNum);} catch (InterruptedException e) {throw new RuntimeException(e);}return "线程池"+Thread.currentThread().getName()+"paymentInfo_timeOUT id:"+id+"耗时"+timeNum;}public String paymentInfo_TimeOutHandler(Integer id){return "线程池"+Thread.currentThread().getName()+"paymentInfo_timeOUTHandler 服务出错了!!!";}
客户端服务降级:一般常用在客户端
- 在主启动类上加入@EnableHystrix注解。因为客户端一般与OpenFeign一起调用,OpenFeign注解包含了EnableCircuitBreaker注解。
- 在controller业务方法上加入相关注解
@GetMapping("/consumer/payment/hystrix/timeout/{id}")@HystrixCommand(fallbackMethod = "paymentInfo_TimeOutHandler",commandProperties = {@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="1500")})public String paymentInfo_timeOUT(@PathVariable("id") Integer id){String s = paymentHystrixService.paymentInfo_timeOUT(id);return s;}public String paymentInfo_TimeOutHandler(@PathVariable("id") Integer id){return "我是消费者80,对方支付系统繁忙,请稍后再试";}
全局类定制服务降级
在类上加入注解@DefaultProperties配置defaultFallback全局降级方法。
方法上加入@HystrixCommand则调用全局降级方法,指定fallbackMethod则调用指定降级方法。
@DefaultProperties(defaultFallback = "payment_Global_FallbackMethod",commandProperties = {@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="1500")
})
public class OrderHystrixController {@Resourceprivate PaymentHystrixService paymentHystrixService;//调用paymentInfo_TimeOutHandler降级方法@GetMapping("/consumer/payment/hystrix/ok/{id}")@HystrixCommand(fallbackMethod = "paymentInfo_TimeOutHandler")public String paymentInfo_OK(@PathVariable("id") Integer id){String s = paymentHystrixService.paymentInfo_OK(id);return s;}@GetMapping("/consumer/payment/hystrix/timeout/{id}")@HystrixCommand //调用全局降级方法public String paymentInfo_timeOUT(@PathVariable("id") Integer id){String s = paymentHystrixService.paymentInfo_timeOUT(id);return s;}public String paymentInfo_TimeOutHandler(@PathVariable("id") Integer id){return "我是消费者80,对方支付系统繁忙,请稍后再试";}public String payment_Global_FallbackMethod(){return "global异常处理信息,请稍后再试";}
}
解耦服务降级
可以通过@FeignClient中的fallback进行服务降级,即将服务降级代码写到另外的实现类中,与controller进行解耦。
需要在application.yml文件中加入feign.hystrix.enabled=true
Feign业务接口:
@FeignClient(value = "cloud-provider-hystrix-payment",fallback = PaymentHystrixServiceImpl.class)
public interface PaymentHystrixService {@GetMapping("/payment/hystrix/ok/{id}")public String paymentInfo_OK(@PathVariable("id") Integer id);@GetMapping("/payment/hystrix/timeout/{id}")public String paymentInfo_timeOUT(@PathVariable("id") Integer id);
}
业务接口实现类:
@Service
public class PaymentHystrixServiceImpl implements PaymentHystrixService{@Overridepublic String paymentInfo_OK(Integer id) {return "服务降级OK impl";}@Overridepublic String paymentInfo_timeOUT(Integer id) {return "服务降级TIMEOUT——impl";}
}
熔断
熔断机制是应对雪崩效应的一种微服务链路保护机制。当扇出链路的某个微服务出错不可用或者响应时间太长时,会进行服务的降级。当服务调用的错误率达到阈值时,会触发熔断,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。
在Spring Cloud框架里,熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阈值,缺省是5秒内20次调用失败,就会启动熔断机制。熔断机制的注解是@HystrixCommand。
只需要在业务方法上加入@HystrixCommand注解,设置熔断相关属性即可。
@HystrixCommand(fallbackMethod = "paymentCircuitBreaker_fallback",commandProperties = {@HystrixProperty(name = "circuitBreaker.enabled",value = "true"),// 是否开启断路器@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),// 请求次数@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"), // 时间窗口期@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60"),// 失败率达到多少后跳闸})public String paymentCircuitBreaker(@PathVariable("id") Integer id){if(id<0){throw new RuntimeException("******id不能为负数");}String s = IdUtil.simpleUUID();return Thread.currentThread().getName()+" 调用成功 流水号:"+s;}public String paymentCircuitBreaker_fallback(@PathVariable("id") Integer id){return "id为负数不能调用OvO"+id;}
熔断类型
- 熔断打开:请求不再进行调用当前服务,内部设置时钟一般为MTTR(平均故障处理时间),当打开时长达到所设时钟则进入半熔断状态。
- 熔断关闭:熔断关闭不会对服务进行熔断。
- 熔断半开:部分请求根据规则调用当前服务,如果请求成功且符合规则则认为当前服务恢复正常,关闭熔断。
涉及到断路器的三个重要参数:
快照时间窗:断路器确定是否打开需要统计一些请求和错误数据,而统计的时间范围就是快照时间窗,默认为最近的10秒。
请求总数阀值:在快照时间窗内,必须满足请求总数阀值才有资格熔断。默认为20,意味着在10秒内,如果该hystrix命令的调用次数不足20次7,即使所有的请求都超时或其他原因失败,断路器都不会打开。
错误百分比阀值:当请求总数在快照时间窗内超过了阀值,比如发生了30次调用,如果在这30次调用中,有15次发生了超时异常,也就是超过50%的错误百分比,在默认设定50%阀值情况下,这时候就会将断路器打开。
熔断流程
满足上面3个条件后,熔断器会打开:
1 :再有请求调用的时候,将不会调用主逻辑,而是直接调用降级fallback。通过断路器,实现了自动地发现错误并将降级逻辑切换为主逻辑,减少响应延迟的效果。
2:原来的主逻辑要如何恢复呢?
对于这一问题,hystrix也为我们实现了自动恢复功能。
当断路器打开,对主逻辑进行熔断之后,hystrix会启动一个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,当休眠时间窗到期,断路器将进入半开状态,释放一次请求到原来的主逻辑上,如果此次请求正常返回,那么断路器将继续闭合,主逻辑恢复,如果这次请求依然有问题,断路器继续进入打开状态,休眠时间窗重新计时。