1.gatewayåzuulçåºå«ä¸èç³»
2.解Bug之路-Nginx 502 Bad Gateway
3.使用Gateway作为SpringCloud网关
4.SpringCloud之网关服务(gateway)
gatewayåzuulçåºå«ä¸èç³»
gatewayåzuulçåºå«ä¸èç³»ä½ç°å¨æ§è½ãæºä»£ç ç»´æ¤ç»ç»ä¸ã1ãæ§è½
spring cloud Gatewayæä¸ä¸ªå ¨æ°çéå µå¡çå½æ°å¼Reactive Webæ¡æ¶ï¼å¯ä»¥ç¨æ¥æ建å¼æ¥çãéå µå¡çãäºä»¶é©±å¨çæå¡ï¼å¨ä¼¸ç¼©æ§æ¹é¢è¡¨ç°é常好ï¼ä½¿ç¨éé»å¡APIï¼Websocketså¾å°æ¯æï¼å¹¶ä¸ç±äºå®ä¸Springç´§å¯éæãZuulæ¯ä¸ä¸ªåºäºé»å¡ioçAPI Gatewayï¼Zuulå·²ç»åå¸äºZuul2.xï¼åºäºNettyï¼ä¹æ¯éé»å¡çï¼æ¯æé¿è¿æ¥ï¼ä½Spring Cloudææ¶è¿æ²¡ææ´å计åã
2ãæºä»£ç ç»´æ¤ç»ç»
spring cloud Gatewayæ¯springæä¸spring cloudçä¸ä¸ªå项ç®ãè¿æä¸ç§è¯´æ³æ¯å 为zuul2è¿ç»è·³ç¥¨åzuul1çæ§è½è¡¨ç°ä¸æ¯å¾çæ³ï¼æ以å¬çäºspringåµåGateway项ç®ãzuulåæ¯netf1ixå ¬å¸ç项ç®ï¼åªæ¯springå°zuuléæå¨spring cloudä¸ä½¿ç¨èå·²ãå ³é®ç®åspringä¸æç®éæzuul2.xã
Spring Cloud Gatewayä¸å 个éè¦çæ¦å¿µï¼
1ãè·¯ç±ï¼è·¯ç±æ¯ç½å ³æåºç¡çé¨åï¼è·¯ç±ä¿¡æ¯æä¸ä¸ªIDãä¸ä¸ªç®çURLãä¸ç»æè¨åä¸ç»Filterç»æãå¦ææè¨è·¯ç±ä¸ºçï¼å说æ请æ±çURLåé ç½®å¹é ã
2ãæè¨ï¼å¹é çè§åãJava8ä¸çæè¨å½æ°ãSpring Cloud Gatewayä¸çæè¨å½æ°è¾å ¥ç±»åæ¯Spring5.0æ¡æ¶ä¸çServerWebExchangeãSpring Cloud Gatewayä¸çæè¨å½æ°å 许å¼åè å»å®ä¹å¹é æ¥èªäºhttprequestä¸çä»»ä½ä¿¡æ¯ï¼æ¯å¦è¯·æ±å¤´ååæ°çã
3ãè¿æ»¤å¨ï¼ä¸ä¸ªæ åçSpring webFilterãSpring cloud gatewayä¸çfilterå为两ç§ç±»åçFilterï¼åå«æ¯Gateway FilteråGlobal Filterãè¿æ»¤å¨Filterå°ä¼å¯¹è¯·æ±åååºè¿è¡ä¿®æ¹å¤çã
解Bug之路-Nginx Bad Gateway
读过Linux内核源码的好处,尤其在处理问题时,能迅速识别现象、原因及解决方案。以解决Linux TCP协议栈源码中的问题为例,有流畅的安卓源码 制作rom感觉。
现象描述:对自研的dubbo协议隧道网关进行压测时,两端网关为gateway1和gateway2,压测过程中gateway1出现大量报错,而gateway2无问题。
网关情况分析:gateway2的负载情况良好,无瓶颈迹象。Nginx所在机器CPU利用率接近%,Nginx的4个Worker分别占了一个核,CPU被吃满。去掉Nginx后,Gateway1和Gateway2直连,压测TPS飙升。
Nginx日志分析:发现大量报错,确为Nginx问题。通过阅读TCP源码,发现是端口号耗尽导致的。
原因分析:Nginx upstream和后端Backend默认为短连接,天空西游新版源码大量请求流量产生大量TIME_WAIT连接,占据端口号,而TIME_WAIT连接需1分钟左右才能被Kernel回收。
解决方案:调整端口号范围、将tcp_max_tw_bucket调小、开启tcp_tw_reuse等。Nginx upstream改成长连接也是一种有效方案。
总结:解决线上问题,内核参数调优和阅读内核源码有重要意义,能帮助我们避开一些坑。
使用Gateway作为SpringCloud网关
本着能用原生就用原生的原则,我们这里使用SpringGateway来作为云服务的网关
配置
从官网的介绍来看,spring网关拥有的功能有,路由(配置,过滤,重写等),熔断以及流量控制
首先引入包
动态路由
路由的配置比较简单,有两种方法:使用配置文件和代码注入,我们这里简单展示下两种方法
或者使用
路由配置中id、uri、order、predicates.path/host没什么好说的香烟溯源码图片,根据需求配置即可,filters相关参数,这里最好还是参考源码相关部分或者Spring Cloud Gateway比较全面,比如常用的前缀切割
这里我们以常用的两种filter,流量控制和熔断降级举例
流量控制
通常我们需要限流来保证服务的可用性,保护一些不太稳定的服务不会因为高并发的请求而挂掉,这里我们一般在网关层做流量控制,减少实际进入的请求达到平波峰的目的
计数器算法
如果某个服务会在请求中数量达到时候挂掉,请求平均时间为2s,我们给一段时间一个请求量的限制,比如2秒次,每次请求进入就减少计数,每2s开始时重新计数,这样就能保证服务请求中数量在以内。但是对于抢购类接口,可能前ms请求数量就用完了,后面所有请求都被拒绝,即请求突刺现象,这样的用户体验是非常差的所以我们需要尽可能在所有的时间内保证接口的可用性(计数器算法就像DRAM中的集中式刷新一样不太能被接受),而且短时间内大量请求运行在相同代码段是非常危险的,在设计不好的情况很可能会出现数据库死锁等等问题
漏桶算法
我们需要让请求尽可能地能进行来,就需要平波峰填波谷,格式工厂源码转换就上例而言,2s内最大请求为,也就是每个请求占用的时间比例为ms,我们设计一个容量为的桶(队列)每ms向接口发一个请求,可以让服务中请求数量不超过的情况下,每ms都能接受一个新的请求,这样就缓解了请求突刺现象。但是这里还有一个问题,对于抢购类接口,个容量可能ms就用完了,在第ms可能还会有个请求抢1个位置,个请求会被取消,这样也是相对来说不能被接受的
令牌桶算法
令牌桶算法就是目前spring cloud gateway采用的算法,这里采用的用户时间换用户失败的策略,假设我们认为用户的平均忍耐时间为8秒,接口超过8秒一些用户就要骂街了,减去实际执行的2秒,也就是说我们的可以利用6秒的时间容纳更多的请求。依上文而言每ms去调用这个端口,那么也就是说桶的设计可以更大,在桶里放上令牌,每个请求需要在桶里面拿到令牌才能调用,龙井溯源码钱塘这里的桶容量就是6s/ms为个。但是我们的执行速度是不变的,也就是结果是,在请求多的情况下用户的执行时间在8秒左右,而在请求少的情况下执行速度在2s左右,这样就缓解了短时间内大量请求导致大量失败的问题了。这里比较重要的参数有两个,第一个是桶请求容量 defaultBurstCapacity,第二个是每秒执行的请求速度(也就是桶的填充速率)defaultReplenishRate
在这个例子中defaultBurstCapacity=而defaultReplenishRate=,这两个参数我们会在下方配置
这里我们需要引用redis包,再说明一下,本站使用的是jdk的版本,其他版本的配置和引用可能会稍有变化,需要调整
覆写KeyResolver的实现类
流量控制,这里同样有代码实现和配置文件实现,由于目前idea对于复杂配置文件的支持不太好,如果使用配置文件方式会疯狂报红,但是如果全部使用代码的话会不方便实现动态路由,因为gateway是先加载配置再处理代码的。所以这里我们路由使用配置,filter之类复杂的使用代码实现,下面是简单示例
这样全服务层面的接口流量控制就完成了,具体的哪些服务使用流量控制,具体控制参数的配置,自行稍作修改即可
测试流量控制的话,可以将令牌回复量和令牌总容量调至比较低的水平,然后再浏览器直接curl接口,比如令牌回复量和容量为1,则单秒内curl即可触发浏览器提示,线上大令牌容量测试能需要多线程curl了,这里参考官方文档给的lua脚本
ip限流
如果我们需要对某个ip进行限流,比如防止脚本抢货,我们这里需要KeyResolver的实现不再使用exchange.getRequest().getURI().getPath() ,而是使用 exchange.getRequest().getRemoteAddress() 。但是这里还有一个问题,我们请求是经过层层转发的,nginx,docker等,所以我们可能并不能拿到原始的请求地址,所以这里我们需要在最外层,比如nginx中将原始地址存到header或者cookie当中,这里给出简单示例
当然还有其他类似X-Forwarded-For的字段不再本文主要探讨范围就不多拓展了,在nginx中配置记录初始远程地址到header后,我们这里需要在程序中取出来,如果你这里使用的标准的X-Real-IP的字段去存储,那么只需要
即可获取真实地址,如果你这里自定义了一个header的key那么需要在exchange.getRequest().getHeaders()里面自己找出来了
最后我们这里给出对同一个接口同时配置两种限流的示例
我在ip限流这里修改了返回的code由改为了,方便测试,这里我们将ip的限流参数设置为(2,2),将path的限流参数设置为(1,)然后不断请求接口就发现一开始返回错误,后续path令牌桶用完后返回错误,即设置成功
补充
如果这里你不希望返回,并且要求返回一个用户可读的带有json信息结果,那么比较好的业务处理方式是前端完成。如果是对外接口的话,那么我们这里就只能重写RateLimiter的实现了,不再使用RedisRateLimiter的类,而是自己去继承RateLimiter接口去实现,
参考 SpringCloudGateway限流后,默认返回的改造:改跳转或增加响应body,这篇文章已经很详细,这里就不赘述了
熔断降级
熔断降级,即某个接口调用失败时使用其他接口代替,来保证整体服务对外的可用性
首先需要引入熔断包
circuitbreaker-reactor-resilience4j 熔断的相关配置分为两个部分,熔断逻辑本身的配置以及在集成到gateway中时候,网关的配置,熔断的重要的配置有,触发熔断的接口,代替接口,熔断超时时间(当然还有其他的,比如自定义熔断HttpStatus等等,详细参数参考 Spring Cloud Circuit Breaker以及resilience4j官网)
这里熔断触发接口和代替接口配置位于gateway中,这里我们使用代码实现,位置参考前述
这里setName的目的是和熔断包中的配置产生对应关系,下方为熔断包的配置,这里定义默认超时时间(也就是没有匹配到name的超时时间)为s,your_breaker_id的超时时间为3s
最后
到这里网关的基本功能就差不多了,自定义的一些业务功能配置,比如header,cookie,以及调用方ip的处理逻辑等等其实都是在网关层处理的,可以参考 Spring Cloud Gateway WebFilter Factories以及Writing Custom Spring Cloud Gateway Filters,但是这种配置基本都没什么坑,这里就不谈了
网关由于不经常作为业务逻辑被重构,所以网络上的资料相对比较少,我这里使用的又是最新的版本还是蛮多和前版本不一样的地方,尤其是webflux的一些东西,很多问题需要看源码才能解决,非常的消耗意志力。这里建议小伙伴们如果是业务使用的这种资料相对较少的架构,最好还是不要使用最新版本的比较好,毕竟万一遇到坑,踩个一两天是很正常的事情,而这种在业务场景可能就没那么容易接受了
SpringCloud之网关服务(gateway)
SpringCloud中的网关服务在架构设计中扮演着核心角色,它不仅起到了服务隔离和保护的作用,还提升了内部服务之间的通信效率。此外,网关还具备限流和权限验证的功能,有助于服务专注于核心业务。例如,确保只有经过身份验证的用户才能进行下订单操作,并对系统访问进行流量控制。
要搭建一个网关项目,首先需要集成Eureka Discovery和Zuul路由组件。在入口类上添加@EnableZuulProxy注解,然后在配置文件中设置,当访问统一通过/apigateway/product/和/apigateway/order/的形式,隐藏了实际服务的API路径,实现了对外的访问控制。
对于权限验证,可以通过实现ZuulFilter进行拦截,这里采用简单方式,通过字符串校验,但通常会结合Redis和ACL进行更复杂的安全管理。权限验证后,网关可以进行流量限流,利用Guava生成每秒的令牌作为访问凭证,确保系统的稳定运行。
为了验证这些功能,可以使用如JMeter的压力测试工具,对/apigateway/order/api/v1/order/saveforribbon接口进行模拟负载,以检验网关的性能和限流效果。对于SpringCloud的相关视频和源码,有兴趣的读者可以在评论区留言交流。