使用前提:
项目重构了,旧项目还在线上运行,新项目准备替换线上的旧项目
最终目标:
要实现实时切换新旧项目,保证如果新项目上线后有问题,可以立刻快速的将流量切回旧项目
方案:
关于abtest的基本原理本文不再多说,本文重点是实践,先看图
如上图所示,用户访问的永远都是dns,单独集群部署,由dns上的配置决定后面的访问的集群
旧项目nginx和旧项目tomcat在一组linux上部署
新项目nginx和新项目tomcat在一另组linux上部署
只有旧项目的时候,就是dns直接打到旧项目nginx
升级新项目后,需要将新项目无感知的上线,并换下旧项目
第一步是嵌入新项目nginx,dns将流量打到新项目nginx,再转到旧项目nginx,
稳定后再下掉dns打到旧项目nginx的流量,最终结果就是图中第一步所示
第二步是使用lua模块引入外部redis,在nginx中配置,将新项目nginx的流量可配置的转到新项目tomcat
第三步是备用步骤,如果切到新项目后,发现线上有问题,就可以通过操作redis来控制新项目nginx的负载分配,可以达到几秒内迅速切回旧项目
有人会问,为什么不直接在dns这一层来做负载分配,其实也是可以的,只不过对于大的公司来说,这一层普通开发一般没有操作权限,即使可以通过一些配置完成,其中也经过了很多转换,导致切换一次所耗费的时间达到一分钟以上,而本次想实现的目标是快速切流量,所以用了本地的nginx
具体实现
新项目的nginx–config核心逻辑:
#首先在机器上要安装lua模块,来支持lua语言
lua_package_path "/export/servers/lualib/?.lua;;";
lua_package_cpath "/export/servers/lualib/?.so;;";
resolver 172.16.16.16 10.16.16.16;#这里加载了init.lua和worker.lua
init_by_lua_file /export/Packages/新项目名/latest/WEB-INF/classes/conf/abtesting/init.lua;
init_worker_by_lua_file /export/Packages/新项目名/latest/WEB-INF/classes/conf/abtesting/worker.lua;#设置新项目
upstream tomcat_mytomcat01 {server 127.0.0.1:1601 weight=10 max_fails=2 fail_timeout=30s ;
}
#设置旧项目01
upstream tomcat_oldtomcat01 {server XX.XXX.XXX.XX1:80 weight=10 max_fails=2 fail_timeout=30s ;server XX.XXX.XXX.XX2:80 weight=10 max_fails=2 fail_timeout=30s ;
}
#设置旧项目02(原来是两个项目,重构后合成一个项目,所以要有旧项目02)
upstream tomcat_oldtomcat02 {server XX.XXX.XXX.XX3:80 weight=10 max_fails=2 fail_timeout=30s ;server XX.XXX.XXX.XX4:80 weight=10 max_fails=2 fail_timeout=30s ;
}#nginx日志格式
log_format newmain '$remote_addr - "$http_x_forwarded_for" - $remote_user [$time_local]''"$request" $status $bytes_sent ''"$http_referer" "$http_user_agent" ''"$gzip_ratio" - "$http_x_proto" - "$host" ';
server {listen 80;server_name *.*.com ;access_log /export/servers/nginx/logs/otcfront.jd.com/otcfront.jd.com_access.log newmain;error_log /export/servers/nginx/logs/otcfront.jd.com/otcfront.jd.com_error.log warn;root /export/Packages/项目名/latest/;#默认流量打在新项目set $default_backend 'tomcat_mytomcat01';location / {proxy_next_upstream http_500 http_502 http_503 http_504 error timeout invalid_header;proxy_set_header Host $host;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;expires 0;#首先将默认值给backend,proxy_pass最终会以backend的值为准set $backend $default_backend;#匹配host,判断是否修改backend的值,以(www.zhangs01.com为例,是旧项目01对应的域名)if ($host ~* ^www\.zhangs01\.com$){#先默认将流量打到旧项目上set $backend "tomcat_oldtomcat01 ";#如果读出来在diversion01.lua中有对$backend的值做修改,则使用新的值rewrite_by_lua_file '/export/Packages/新项目名/latest/WEB-INF/classes/conf/abtesting/diversion01.lua';}#匹配host,判断是否修改backend的值,以(www.zhangs02.com为例,是旧项目02对应的域名)if ($host ~* ^www\.zhangs02\.com$){#先默认将流量打到旧项目上set $backend "tomcat_oldtomcat02 ";#如果读出来在diversion02.lua中有对$backend的值做修改,则使用新的值rewrite_by_lua_file '/export/Packages/新项目名/latest/WEB-INF/classes/conf/abtesting/diversion02.lua';}#最终打到backend对应的地方proxy_pass http://$backend;}location /logs/ {autoindex off;deny all;}
}
上面一段nginx中涉及到四个lua文件
init.lua—> 初始化参数
worker.lua—> 真正的分流逻辑
diversion01.lua—> 旧项目01的backend设置diversion02.lua−−−>旧项目02的backend设置 diversion02.lua---> 旧项目02的backend设置diversion02.lua−−−>旧项目02的backend设置
init.lua核心代码:
--定义全局变量
global_configs = {--在diversion01.lua中会用到这个值["divEnable01"] = false,--在diversion02.lua中会用到这个值["divEnable02"] = false,--连接redis的必要参数["redis"] = {ap_host='XXX.XX.XXX',ap_port=XXXX,ap_key='/redis/XXXXXXXXXXXX(redis地址)'}
}
worker.lua核心代码:
--初始化延迟时间,10秒
local start_delay = 10
--定义ngx.timer.at指令,这个指令中可以设置回调函数,回调函数中再执行这个指令,就可以循环起来
local new_timer = ngx.timer.at
local log = ngx.log
local ERR = ngx.ERR
local refresh
local get_redis
local close_redis--初始化两个redis的key,对应的value值是true就代表切到新项目,false就代表切到旧项目
local switch_key_01 = "abtest:switch:global01"
local switch_key_02 = "abtest:switch:global02"--定义获取redis方法
get_redis = function()local redis = require "resty.redis"local red = redis:new()local ok, err = red:connect(global_configs['redis']['ap_host'],global_configs['redis']['ap_port'])if ok and global_configs['redis']['ap_key'] thenok, err = red:auth(global_configs['redis']['ap_key'])endreturn red, ok, err
end--定义关闭redis连接方法
close_redis = function(red)if not red thenreturnendlocal ok, err = red:close()if not ok thenngx.log(ngx.ERR,"fail to close redis connection : ", err)end
end--核心逻辑
local function do_refresh()--获取redislocal red, ok, err = get_redis()--判活if not ok thenlog(ERR, "redis is not ready!")returnend-- refresh global switch01--获取key为"switch_key_01"的value值,用变量enable01保存local enable01, err = red:get(switch_key_01)if err thenlog(ERR, err)elseif ngx.null ~= enable01 then--如果enable01 不为null,并且enable01的值是"true",就将全局变量global_configs["divEnable01"]的值设置成true,否则就是falseglobal_configs["divEnable01"] = ("true" == enable01) and true or falseendend-- refresh global switch02,同理01local enable02, err = red:get(switch_key_02)if err thenlog(ERR, err)elseif ngx.null ~= enableTrade thenglobal_configs["divEnable02"] = ("true" == enable02) and true or falseendendreturn close_redis(red)
end--刷新方法,这里当成一个回调函数来用,被后面的new_timer调用
refresh = function(premature)if not premature thenlog(ERR, "rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrefresh")--调用核心逻辑(从redis中取key,判断value的值,从而确定流量分给谁)do_refresh()--再次调用这个new_time,构成持续循环local ok, e = new_timer(start_delay, refresh)if not ok thenlog(ERR, "failed to create timer: ", e)returnendend
end--第一次调用这里,10秒后调用上面的回调函数
local ok, e = new_timer(start_delay, refresh)
if not ok thenlog(ERR, "failed to create timer: ", e)return
end
diversion01.lua核心代码
--如果init.lua中的全局变量global_configs["divEnable01"]是false,就直接返回
if not global_configs["divEnable01"] thenreturn
end--如果init.lua中的全局变量global_configs["divEnable01"]是true,就将backend 的值设置成tomcat_mytomcat01
--tomcat_mytomcat01 是最一开始在nginx的配置文件中调用的
ngx.var.backend = "tomcat_mytomcat01"
diversion02.lua核心代码
--如果init.lua中的全局变量global_configs["divEnable02"]是false,就直接返回
if not global_configs["divEnable02"] thenreturn
end--如果init.lua中的全局变量global_configs["divEnable02"]是true,就将backend 的值设置成tomcat_mytomcat01
--tomcat_mytomcat01 是最一开始在nginx的配置文件中调用的
ngx.var.backend = "tomcat_mytomcat01"
最后捋一遍:
首先在nginx中加载init.lua,初始化几个全局变量
再加载worker.lua,使用lua回调函数实现循环,实时读取redis中的key的值
根据redis中的值的变化来改变nginx最终负载指向的位置,从而实现实时的控制流量方向