• 「SpringCloud」06 Hystrix断路器


    SpringCloud—Hystrix断路器

    笔记整理自【尚硅谷】周阳SpringCloud框架开发教程

    image-20220806192726395

    image-20220801123922304

    1. 概述

    Ⅰ. 分布式系统面临的问题

    复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免地失败。

    image-20220806130056162

    服务雪崩

    多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的 “扇出” 。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的 “雪崩效应” 。也就是服务的高可用受到了破坏。

    对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。

    所以,通常当你发现一个模块下的某个实例失败后,这时候这个模块依然还会接收流量,然后这个有问题的模块还调用了其他的模块,这样就会发生级联故障,或者叫雪崩。而面对这种糟糕的问题,我们就应该采取 服务降级、服务熔断 等方式来解决。

    Ⅱ. Hystrix是什么

    Hystrix是一个用于处理分布式系统的 延迟容错 的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。

    “断路器” 本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。

    Ⅲ. Hystrix能做什么

    主要有服务降级、服务熔断、接近实时的监控、限流、隔离等等,参考github

    Hystrix目前也已经停止更新,但是学习Hystrix及其里面的思想还是非常重要的;

    国内目前主流使用 SpringCloud Alibaba Sentinel 实现熔断与限流。

    2. Hystrix重要概念

    Ⅰ. 服务降级—FallBack

    假设对方的系统不可用了,需要一个兜底的解决方案或备选响应;向调用方返回一个符合预期的、可处理的备选响应。

    服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示:fallback

    哪些情况会触发降级

    • 程序运行异常
    • 超时
    • 服务熔断触发服务降级
    • 线程池 / 信号量打满也会导致服务降级

    Ⅱ. 服务熔断—Break

    服务熔断就相当于物理上的熔断保险丝

    类比保险丝达到最大服务访问后,直接拒绝访问,拉闸断点,然后调用服务降级的方法并返回友好提示。

    服务的降级 => 进而熔断 => 恢复调用链路

    Ⅲ. 服务限流—FlowLimit

    秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟 N N N 个,有序进行。

    3. Hystrix案例

    Ⅰ. 构建

    • 建Module

      cloud-provider-hystrix-payment8001

    • 改POM

      
      <dependency>
          <groupId>org.springframework.cloudgroupId>
          <artifactId>spring-cloud-starter-netflix-hystrixartifactId>
      dependency>
      
      • 1
      • 2
      • 3
      • 4
      • 5

      image-20220806200626047

    • 写YML

      image-20220806200700744

    • 主启动

      image-20220806203139820

    • 业务类

      Service

      image-20220806204426930

      Controller

      image-20220806204740467

    • 正常测试

      ➢ OK的方法

      http://localhost:8001/payment/hystrix/ok/31

      image-20220806210231017

      ➢ TimeOut的方法

      http://localhost:8001/payment/hystrix/timeout/31

      等待了 3 s 3s 3s 后也加载进来了,此时还未进行降级、熔断等操作:

      image-20220806210456403

    以上述为根基平台,从正确 => 错误 => 降级熔断 => 恢复

    Ⅱ. 高并发测试

    上述在非高并发情况下,还勉强可以满足。

    • 开启Jmeter,来20000个并发压死8001,20000个请求都去访问paymentInfo_TimeOut服务:

      image-20220806214046208

    • 此时再访问http://localhost:8001/payment/hystrix/ok/31

    • 结果

      ➢ 两个都在自己转圈圈(访问ok也会开始转圈圈了)

      image-20220806214454215

    • 为什么会被卡死?

      ➢ Tomcat的默认的工作线程数被打满了,没有多余的线程来分解压力和处理。

    Jmeter压测结论:上面还是服务提供者8001自己测试,假如此时外部的消费者80也来访问,那消费者只能干等,最终导致消费端80不满意,服务端8001直接被拖死。

    服务消费方80进行压力测试

    • 建Module

      cloud-consumer-feign-hystrix-order80

    • 改POM

      image-20220806215421466

    • 写YML

      image-20220806215521061

    • 主启动

      image-20220806215718211

    • 业务类

      Service

      image-20220806215918937

      Controller

      image-20220806215944968

    • 正常测试

      image-20220806220240772

    • 高并发测试

      2W个线程压8001

      消费端80微服务再去访问正常的OK微服务8001地址

      http://localhost/consumer/payment/hystrix/ok/32

      消费者80,o(╥﹏╥)o

      ➢ 要么转圈圈等待

      ➢ 要么消费端报超时错误

      image-20220806221047707

    • 故障现象和导致原因

      ➢ 8001同一层次的其它接口服务被困死,因为tomcat线程池里面的工作线程已经被挤占完毕,80此时调用8001,客户端访问响应缓慢,转圈圈。

    • 上诉结论

      ➢ 正因为有上述故障或不佳表现,才有我们的 降级 / 容错 / 限流 等技术诞生。

    • 如何解决?解决的要求

      ➢ 超时导致服务器变慢(转圈),超时不再等待。

      ➢ 出错(宕机或程序运行出错),出错要有兜底。

    • 解决

      ➢ 对方服务(8001)超时了,调用者(80)不能一直卡死等待,必须有服务降级。

      ➢ 对方服务(8001)down机了,调用者(80)不能一直卡死等待,必须有服务降级。

      ➢ 对方服务(8001)OK,调用者(80)自己出故障或有自我要求(自己的等待时间小于服务提供者),自己处理降级。

    Ⅲ. 服务降级

    @HystrixCommand

    8001先从自身找问题,设置自身调用超时时间的峰值,峰值内可以正常运行,超过了需要有兜底的方法处理,作服务降级fallback。

    1️⃣ 8001fallback
    • 业务类启用

      添加@HystrixCommand

      image-20220806223637409

    • 主启动类激活

      添加新注解@EnableCircuitBreaker

      image-20220806223929526

    • 测试

      降级成功

      此时用的是Hystrix的线程池 起到一定的隔离效果

      image-20220808224548492

    @HystrixCommand报异常后如何处理?

    一旦调用服务方法失败并抛出了错误信息后,会自动调用@HystrixCommand标注好的fallbackMethod调用类中的指定方法

    image-20220806224130199

    上图故意制造两个异常:

    • int age = 10 / 0; 计算异常。
    • 我们能接受3秒钟,它运行5秒钟,超时异常。

    当前服务不可用了,做服务降级,兜底的方案都是paymentInfo_TimeOutHandler()

    image-20220808225157387

    2️⃣ 80fallback

    80订单微服务,也可以更好的保护自己,自己也依样画葫芦进行客户端降级保护。

    一般服务降级是设置在客户端的。

    • YML

      image-20220808230025364

    • 主启动

      添加@EnableHystrix

      image-20220808230123550

    • 业务类

      OrderHystrixController

      image-20220808230323886

    • 测试

      在80端 超过 1.5 s 1.5s 1.5s 就会服务降级,但在8001端需要等待 3 s 3s 3s

      image-20220808232142709

    目前问题

    • 每个业务方法对应一个兜底的方法,代码膨胀
    • 统一和自定义的分开

    解决问题

    • 每个方法配置一个 => 膨胀

      Feign接口系列

      @DefaultProperties(defaultFallback = "")

      image-20220809113205189

      @DefaultProperties(defaultFallback = "")
       
      1:1 每个方法配置一个服务降级方法,技术上可以,实际上傻X
       
      1:N 除了个别重要核心业务有专属,其它普通的可以通过 @DefaultProperties(defaultFallback = "") 统一跳转到统一处理结果页面
       
      通用的和独享的各自分开,避免了代码膨胀,合理减少了代码量,O(∩_∩)O哈哈~ 
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7

      Controller

      image-20220809113742004

      image-20220809113716020

      测试

      image-20220809114222396

    • 和业务逻辑混一起 => 混乱

      服务降级,客户端去调用服务端,碰上服务端宕机关闭

      本次案例服务降级处理是在客户端80实现完成的,与服务端8001没有关系,只需要为Feign客户端定义的接口添加一个服务降级处理的实现类即可实现解耦。

      未来我们要面对的异常:运行、超时、宕机。

      再看我们的业务类PaymentController

      image-20220810114748262

      混合在一块 ,每个业务方法都要提供一个。

      ➢ 修改cloud-consumer-feign-hystrix-order80

      根据cloud-consumer-feign-hystrix-order80已经有的PaymentHystrixService接口,重新新建一个类(PaymentFallbackService)实现该接口,统一为接口里面的方法进行异常处理

      PaymentFallbackService类实现PaymentHystrixService接口

      image-20220810115625363

      PaymentHystrixService接口

      @FeignClient(value = "", fallback = xxx.class)

      image-20220810115742568

      ➢ 测试

      正常访问:http://localhost/consumer/payment/hystrix/ok/31

      image-20220810120001676

      故意关闭微服务8001,客户端自己调用提示:

      image-20220810120117828

      此时服务端provider已经down了,但是我们做了服务降级处理,让客户端在服务端不可用时也会获得提示信息而不会挂起耗死服务器。

    Ⅳ. 服务熔断

    断路器:一句话就是家里的保险丝

    熔断是什么

    熔断机制概述

    熔断机制是应对雪崩效应的一种微服务链路保护机制。当扇出链路的某个微服务出错不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。

    当检测到该节点微服务调用响应正常后,恢复调用链路。

    在Spring Cloud框架里,熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阈值,缺省是5秒内20次调用失败,就会启动熔断机制。熔断机制的注解是@HystrixCommand

    img

    实操

    • 修改cloud-provider-hystrix-payment8001

      PaymentService

      image-20220810124049364

      PaymentController

      image-20220810124522373

    • 测试

      ➢ 正确:http://localhost:8001/payment/circuit/31

      image-20220810124743240

      ➢ 错误:http://localhost:8001/payment/circuit/-31

      image-20220810124752836

      重点测试:多次错误,然后慢慢正确,发现刚开始不满足条件,就算是正确的访问地址也不能进行。

      image-20220810124943852

      过了一会才可以正常访问:

      image-20220810125002192

      体现了:服务的降级 => 进而熔断 => 恢复调用链路

    总结

    • 马丁·福勒 总结断路器流程图

      image-20220810125211365

    • 熔断类型

      1. 熔断打开: 请求不再进行调用当前服务,内部设置时钟一般为MTTR(平均故障处理时间),当打开时长达到所设时钟则进入半熔断状态
      2. 熔断关闭: 熔断关闭不会对服务进行熔断
      3. 熔断半开: 部分请求根据规则调用当前服务,如果请求成功且符合规则则认为当前服务恢复正常,关闭熔断
      
      • 1
      • 2
      • 3
    • 官网断路器流程图

      在这里插入图片描述

    • 官网步骤

      image-20220810130004331

    • 断路器在什么情况下开始起作用

      image-20220810125635250

      涉及到断路器的三个重要参数:快照时间窗、请求总数阀值、错误百分比阀值。

      1. 快照时间窗:断路器确定是否打开需要统计一些请求和错误数据,而统计的时间范围就是快照时间窗,默认为最近的10秒。
      
      2. 请求总数阀值:在快照时间窗内,必须满足请求总数阀值才有资格熔断。默认为20,意味着在10秒内,如果该hystrix命令的调用次数不足20次,即使所有的请求都超时或其他原因失败,断路器都不会打开。
      
      3. 错误百分比阀值:当请求总数在快照时间窗内超过了阀值,比如发生了30次调用,如果在这30次调用中,有15次发生了超时异常,也就是超过50%的错误百分比,在默认设定50%阀值情况下,这时候就会将断路器打开。
      
      • 1
      • 2
      • 3
      • 4
      • 5
    • 断路器开启或者关闭的条件

      1. 当满足一定的阀值的时候(默认10秒内超过20个请求次数)
      2. 当失败率达到一定的时候(默认10秒内超过50%的请求失败)
      3. 到达以上阀值,断路器将会开启
      4. 当开启的时候,所有请求都不会进行转发
      5. 一段时间之后(默认是5秒),这个时候断路器是半开状态,会让其中一个请求进行转发。
      如果成功,断路器会关闭,若失败,继续开启。重复4和5
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
    • 断路器打开之后

      1. 再有请求调用的时候,将不会调用主逻辑,而是直接调用降级fallback。
         通过断路器,实现了自动地发现错误并将降级逻辑切换为主逻辑,减少响应延迟的效果。
       
      2. 原来的主逻辑要如何恢复呢?
      对于这一问题,hystrix也为我们实现了自动恢复功能。
      当断路器打开,对主逻辑进行熔断之后,hystrix会启动一个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,
      当休眠时间窗到期,断路器将进入半开状态,释放一次请求到原来的主逻辑上,如果此次请求正常返回,那么断路器将继续闭合,
      主逻辑恢复,如果这次请求依然有问题,断路器继续进入打开状态,休眠时间窗重新计时。
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
    • All配置

      // ========================All
      @HystrixCommand(fallbackMethod = "str_fallbackMethod",
              groupKey = "strGroupCommand",
              commandKey = "strCommand",
              threadPoolKey = "strThreadPool",
      
              commandProperties = {
                      // 设置隔离策略,THREAD 表示线程池 SEMAPHORE:信号池隔离
                      @HystrixProperty(name = "execution.isolation.strategy", value = "THREAD"),
                      // 当隔离策略选择信号池隔离的时候,用来设置信号池的大小(最大并发数)
                      @HystrixProperty(name = "execution.isolation.semaphore.maxConcurrentRequests", value = "10"),
                      // 配置命令执行的超时时间
                      @HystrixProperty(name = "execution.isolation.thread.timeoutinMilliseconds", value = "10"),
                      // 是否启用超时时间
                      @HystrixProperty(name = "execution.timeout.enabled", value = "true"),
                      // 执行超时的时候是否中断
                      @HystrixProperty(name = "execution.isolation.thread.interruptOnTimeout", value = "true"),
                      // 执行被取消的时候是否中断
                      @HystrixProperty(name = "execution.isolation.thread.interruptOnCancel", value = "true"),
                      // 允许回调方法执行的最大并发数
                      @HystrixProperty(name = "fallback.isolation.semaphore.maxConcurrentRequests", value = "10"),
                      // 服务降级是否启用,是否执行回调函数
                      @HystrixProperty(name = "fallback.enabled", value = "true"),
                      // 是否启用断路器
                      @HystrixProperty(name = "circuitBreaker.enabled", value = "true"),
                      // 该属性用来设置在滚动时间窗中,断路器熔断的最小请求数。例如,默认该值为 20 的时候,
                      // 如果滚动时间窗(默认10秒)内仅收到了19个请求, 即使这19个请求都失败了,断路器也不会打开。
                      @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "20"),
                      // 该属性用来设置在滚动时间窗中,表示在滚动时间窗中,在请求数量超过
                      // circuitBreaker.requestVolumeThreshold 的情况下,如果错误请求数的百分比超过50,
                      // 就把断路器设置为 "打开" 状态,否则就设置为 "关闭" 状态。
                      @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage", value = "50"),
                      // 该属性用来设置当断路器打开之后的休眠时间窗。 休眠时间窗结束之后,
                      // 会将断路器置为 "半开" 状态,尝试熔断的请求命令,如果依然失败就将断路器继续设置为 "打开" 状态,
                      // 如果成功就设置为 "关闭" 状态。
                      @HystrixProperty(name = "circuitBreaker.sleepWindowinMilliseconds", value = "5000"),
                      // 断路器强制打开
                      @HystrixProperty(name = "circuitBreaker.forceOpen", value = "false"),
                      // 断路器强制关闭
                      @HystrixProperty(name = "circuitBreaker.forceClosed", value = "false"),
                      // 滚动时间窗设置,该时间用于断路器判断健康度时需要收集信息的持续时间
                      @HystrixProperty(name = "metrics.rollingStats.timeinMilliseconds", value = "10000"),
                      // 该属性用来设置滚动时间窗统计指标信息时划分"桶"的数量,断路器在收集指标信息的时候会根据
                      // 设置的时间窗长度拆分成多个 "桶" 来累计各度量值,每个"桶"记录了一段时间内的采集指标。
                      // 比如 10 秒内拆分成 10 个"桶"收集这样,所以 timeinMilliseconds 必须能被 numBuckets 整除。否则会抛异常
                      @HystrixProperty(name = "metrics.rollingStats.numBuckets", value = "10"),
                      // 该属性用来设置对命令执行的延迟是否使用百分位数来跟踪和计算。如果设置为 false, 那么所有的概要统计都将返回 -1。
                      @HystrixProperty(name = "metrics.rollingPercentile.enabled", value = "false"),
                      // 该属性用来设置百分位统计的滚动窗口的持续时间,单位为毫秒。
                      @HystrixProperty(name = "metrics.rollingPercentile.timeInMilliseconds", value = "60000"),
                      // 该属性用来设置百分位统计滚动窗口中使用 “ 桶 ”的数量。
                      @HystrixProperty(name = "metrics.rollingPercentile.numBuckets", value = "60000"),
                      // 该属性用来设置在执行过程中每个 “桶” 中保留的最大执行次数。如果在滚动时间窗内发生超过该设定值的执行次数,
                      // 就从最初的位置开始重写。例如,将该值设置为100, 滚动窗口为10秒,若在10秒内一个 “桶 ”中发生了500次执行,
                      // 那么该 “桶” 中只保留 最后的100次执行的统计。另外,增加该值的大小将会增加内存量的消耗,并增加排序百分位数所需的计算时间。
                      @HystrixProperty(name = "metrics.rollingPercentile.bucketSize", value = "100"),
                      // 该属性用来设置采集影响断路器状态的健康快照(请求的成功、 错误百分比)的间隔等待时间。
                      @HystrixProperty(name = "metrics.healthSnapshot.intervalinMilliseconds", value = "500"),
                      // 是否开启请求缓存
                      @HystrixProperty(name = "requestCache.enabled", value = "true"),
                      // HystrixCommand的执行和事件是否打印日志到 HystrixRequestLog 中
                      @HystrixProperty(name = "requestLog.enabled", value = "true"),
              },
              threadPoolProperties = {
                      // 该参数用来设置执行命令线程池的核心线程数,该值也就是命令执行的最大并发量
                      @HystrixProperty(name = "coreSize", value = "10"),
                      // 该参数用来设置线程池的最大队列大小。当设置为 -1 时,线程池将使用 SynchronousQueue 实现的队列,
                      // 否则将使用 LinkedBlockingQueue 实现的队列。
                      @HystrixProperty(name = "maxQueueSize", value = "-1"),
                      // 该参数用来为队列设置拒绝阈值。 通过该参数, 即使队列没有达到最大值也能拒绝请求。
                      // 该参数主要是对 LinkedBlockingQueue 队列的补充,因为 LinkedBlockingQueue
                      // 队列不能动态修改它的对象大小,而通过该属性就可以调整拒绝请求的队列大小了。
                      @HystrixProperty(name = "queueSizeRejectionThreshold", value = "5"),
              }
      )
      public String strConsumer() {
          return "hello 2020";
      }
      public String str_fallbackMethod() {
          return "*****fall back str_fallbackMethod";
      }
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
      • 21
      • 22
      • 23
      • 24
      • 25
      • 26
      • 27
      • 28
      • 29
      • 30
      • 31
      • 32
      • 33
      • 34
      • 35
      • 36
      • 37
      • 38
      • 39
      • 40
      • 41
      • 42
      • 43
      • 44
      • 45
      • 46
      • 47
      • 48
      • 49
      • 50
      • 51
      • 52
      • 53
      • 54
      • 55
      • 56
      • 57
      • 58
      • 59
      • 60
      • 61
      • 62
      • 63
      • 64
      • 65
      • 66
      • 67
      • 68
      • 69
      • 70
      • 71
      • 72
      • 73
      • 74
      • 75
      • 76
      • 77
      • 78
      • 79
      • 80
      • 81

    Ⅴ. 服务限流

    后面高级篇讲解 SpringCloud Alibaba 的 Sentinel 说明。

    4. Hystrix工作流程

    官网

    image-20220810130739296

    步骤说明
    1创建 HystrixCommand(用在依赖的服务返回单个操作结果的时候)或 HystrixObserableCommand(用在依赖的服务返回多个操作结果的时候) 对象。
    2命令执行。其中 HystrixComand 实现了下面前两种执行方式;而 HystrixObservableCommand 实现了后两种执行方式:execute():同步执行,从依赖的服务返回一个单一的结果对象, 或是在发生错误的时候抛出异常。queue():异步执行, 直接返回 一个Future对象, 其中包含了服务执行结束时要返回的单一结果对象。observe():返回 Observable 对象,它代表了操作的多个结果,它是一个 Hot Obserable(不论 “事件源” 是否有 “订阅者”,都会在创建后对事件进行发布,所以对于 Hot Observable 的每一个 “订阅者” 都有可能是从 “事件源” 的中途开始的,并可能只是看到了整个操作的局部过程)。toObservable(): 同样会返回 Observable 对象,也代表了操作的多个结果,但它返回的是一个Cold Observable(没有 “订阅者” 的时候并不会发布事件,而是进行等待,直到有 “订阅者” 之后才发布事件,所以对于 Cold Observable 的订阅者,它可以保证从一开始看到整个操作的全部过程)。
    3若当前命令的请求缓存功能是被启用的, 并且该命令缓存命中, 那么缓存的结果会立即以 Observable 对象的形式 返回。
    4检查断路器是否为打开状态。如果断路器是打开的,那么Hystrix不会执行命令,而是转接到 fallback 处理逻辑(第 8 步);如果断路器是关闭的,检查是否有可用资源来执行命令(第 5 步)。
    5线程池/请求队列/信号量是否占满。如果命令依赖服务的专有线程池和请求队列,或者信号量(不使用线程池的时候)已经被占满, 那么 Hystrix 也不会执行命令, 而是转接到 fallback 处理逻辑(第8步)。
    6Hystrix 会根据我们编写的方法来决定采取什么样的方式去请求依赖服务。HystrixCommand.run() :返回一个单一的结果,或者抛出异常。HystrixObservableCommand.construct(): 返回一个Observable 对象来发射多个结果,或通过 onError 发送错误通知。
    7Hystrix会将 “成功”、“失败”、“拒绝”、“超时” 等信息报告给断路器, 而断路器会维护一组计数器来统计这些数据。断路器会使用这些统计数据来决定是否要将断路器打开,来对某个依赖服务的请求进行 “熔断/短路”。
    8当命令执行失败的时候, Hystrix 会进入 fallback 尝试回退处理, 我们通常也称该操作为 “服务降级”。而能够引起服务降级处理的情况有下面几种:第4步: 当前命令处于"熔断/短路"状态,断路器是打开的时候。第5步: 当前命令的线程池、 请求队列或 者信号量被占满的时候。第6步:HystrixObservableCommand.construct() 或 HystrixCommand.run() 抛出异常的时候。
    9当Hystrix命令执行成功之后, 它会将处理结果直接返回或是以Observable 的形式返回。

    tips:如果我们没有为命令实现降级逻辑或者在降级处理逻辑中抛出了异常, Hystrix 依然会返回一个 Observable 对象, 但是它不会发射任何结果数据, 而是通过 onError 方法通知命令立即中断请求,并通过onError()方法将引起命令失败的异常发送给调用者。

    5. 服务监控HystrixDashboard

    除了隔离依赖服务的调用以外,Hystrix还提供了准实时的调用监控(Hystrix Dashboard),Hystrix会持续地记录所有通过Hystrix发起的请求的执行信息,并以统计报表和图形的形式展示给用户,包括每秒执行多少请求多少成功,多少失败等。Netflix通过hystrix-metrics-event-stream项目实现了对以上指标的监控。Spring Cloud也提供了Hystrix Dashboard的整合,对监控内容转化成可视化界面。

    Ⅰ. 构建仪表盘9001

    • 建Module

      cloud-consumer-hystrix-dashboard9001

    • 改POM

      <dependency>
      	<groupId>org.springframework.cloudgroupId>
          
      	<artifactId>spring-cloud-starter-netflix-hystrix-dashboardartifactId>
      dependency>
      
      • 1
      • 2
      • 3
      • 4
      • 5

      image-20220827163231039

    • 写YML

      server:
        port: 9001
      
      • 1
      • 2
    • 主启动

      HystrixDashboardMain9001 + 新注解@EnableHystrixDashboard

      image-20220827163715731

    • 测试

      启动cloud-consumer-hystrix-dashboard9001该微服务后续将监控微服务8001

      http://localhost:9001/hystrix

      image-20220827163947329

    Ⅱ. 监控实战

    断路器演示(服务监控hystrixDashboard)

    • 修改cloud-provider-hystrix-payment8001

      image-20220827164719703

    • 监控测试

      ➢ 启动Eureka7001

      ➢ 9001监控8001 填写监控地址:http://localhost:8001/hystrix.stream

      image-20220827165153151

      ➢ 启动PaymentHystrixMain8001

      ➢ 测试地址

      http://localhost:8001/payment/circuit/31

      http://localhost:8001/payment/circuit/-31

      先访问正确地址,再访问错误地址,再正确地址,会发现图示断路器都是慢慢放开的。

      1

    • 怎么看仪表盘

      ➢ 七色

      image-20220827172032669

      ➢ 1圈

      实心圆:共有两种含义。它通过颜色的变化代表了实例的健康程度,它的健康度从 绿色 < 黄色 < 橙色 < 红色 递减。

      该实心圆除了颜色的变化之外,它的大小也会根据实例的请求流量发生变化,流量越大该实心圆就越大。所以通过该实心圆的展示,就可以在大量的实例中快速的发现故障实例和高压力实例

      ➢ 1线

      曲线:用来记录2分钟内流量的相对变化,可以通过它来观察到流量的上升和下降趋势。

    • 仪表盘整图说明

      image-20220827171449272

      image-20220827171502752

    依照目前来看使用Hystrix服务监控还需要我们自己创建一个Module来进行监控,还是有点麻烦,但在后续的 SpringCloud Alibaba Sentinel 它会直接提供一个网站,登录网站直接就可以服务进行监控,非常的方便。

  • 相关阅读:
    java 业务幂等解决方案
    八大排序算法(C语言版)之插入排序
    血压心电的测量小工具,轻松了解身体状况,dido Y1S手环上手
    P3870 [TJOI2009] 开关(线段树)
    CHINTERGEO2023中国测绘地理信息技术装备展览会,大势智慧在3010展台期待您的莅临!
    MySQL中符号@的作用
    Windows远程桌面连线显示请稍后
    FPGA 按键控制串口发送
    尚品汇后台管理项目SPU模块和SKU模块的实现
    自定义QChartView实现鼠标放在图表时,显示鼠标位置坐标值(x,y)
  • 原文地址:https://blog.csdn.net/weixin_53407527/article/details/126560330