|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
% d2 f. p) M" e! A7 B( r z
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ # Q3 ^! M2 w2 A1 h+ M) C: u
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。5 s# o `( ~ s" `1 B7 B
6 d8 g( D3 [- W( G4 |- c$ q% G
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)% Z' o0 B0 w8 e7 u8 v
& |: E4 R" t1 W! f+ L
( d) x3 _( D5 h/ d: d% ]2 T) e
- worker_processes 1;
t" B& B2 U3 J7 q3 w - events{
复制代码 # q9 F3 V( q' p T- r
" K' O4 q2 y. P0 g* J& X8 g) O
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方" Y7 ^5 W. r$ V9 [8 S* ? t
1 w L8 n2 q0 o4 H, ?5 s! Z/ D) d比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。+ I' L3 w% J2 f; z, n1 c4 V% i
1 F, G& `. V1 O; r$ C" u
4 ]& p/ l; X3 Z( u$ }接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
- v; x' |& h9 r3 ?/ U) h6 N4 O+ u5 B% z8 h. ]
; D+ H/ u( k. ]+ P3 p: x
$ h8 U- ?6 F* Z, M0 m! j5 m1 T; L$ ?& _; p( @7 l
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
2 E0 A2 p+ M4 K7 _2 [
* p+ w. }) f2 W' b$ d7 l
: k- t0 d2 ~4 K( c1 r. Y9 ^这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
* I9 J& M4 Y* {5 m 2. 加权轮询,使用weight参数设置,配置如下
( m3 d% ~" P% x( a- W; F
2 D# Z6 j _6 {0 |. m3. ip_hash策略7 V: { C; t! M
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:- G% ?7 O/ z% l! B1 I
其他地方保持不变,在upstreaem中如下设置:' e2 K4 @$ Q- W2 I& Y
( j; a, |$ Y( g& ~" \0 `5 O: ]+ b7 v% I
* D' s4 x# C3 Q+ _* \5 [% `4 T* p/ y: k+ H; I0 c o
4. fair策略4 V5 `7 f; e) Q, y3 Y2 E. T: V+ ^
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)& @! h9 k0 m9 C4 q! O. S
5. url_hash策略
1 Z C# `3 B- w4 t" [' l
# m9 E9 n' P" s2 b5 O& M, Z(类似于ip,只不过绑定的值是url,这个也是第三方策略)
$ k' X$ j1 M0 l1 X. ` O2 V, efair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可/ D0 E; q. f( R& t
, l* o4 U; _. {. N2 t6 y5 f' |) _7 ` x/ b& L2 J) u0 d/ ]
. l/ s; ^7 K9 t
url_hash策略的用处?
2 O) F2 @0 W/ k6 p1 h: z# j" [* r0 H: F9 N6 x
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
* {; ]0 z) h6 D9 u5 A# l! i1 t3 y% l9 ?7 _. G- s
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
/ t$ B, [4 k" r0 ?7 d/ p Q+ e" _5 C! ^! K# u: ?2 L
$ m9 E; g' B# q* ~
+ U5 H8 T3 W' p$ T9 a: P其他的配置% }7 h5 d/ i& \6 I$ g
备份与停机状态:
7 J w! P4 ^" D8 y/ L4 P" M( sserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
0 Q$ c6 V: @. p# o- S, f: h; b( }$ D" U' C. G+ f; t% t+ K- G
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
6 u8 i# l: H0 c- Z! s9 k7 h* I, R1 l- V4 @4 S" `2 e
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。. M9 O( f3 @5 ?! p
4 }1 a {- r' h0 J- A5 `0 Q8 T' L
* ^; ^2 E% j. w7 a
6 L$ l- S, Z7 N& y$ p+ jmax_fails: 达到指定次数后认为服务器挂掉
7 U5 O6 h3 P" L0 @: A
4 G* f7 J* d5 X7 Q2 S fail_timeout:挂掉多久后再次测试是否已经挂掉
4 r; h; M( D9 n/ `/ j
* w, R4 D0 m1 E3 A9 `9 N配置命令
' `' ~/ r3 K5 I8 A& l8 M8 _- q. C% \% F8 p$ V1 W
server 192.168.1.66 max_fails=2 fail_timeout=60s;
5 g; v2 @: x! c
7 L$ @1 T6 @" o0 R 后记
7 ]8 ]2 f5 g m: r2 O: Z* r |我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
F% o% F$ v% d; k. `& v2 N% x- g$ G2 _2 d V% N c
; E8 u {+ X6 G8 E, v
. C% e% ~; c7 t
9 V9 u4 I4 y; G, d. `6 p8 \( o
+ L* }1 I( V! t0 ^6 M9 a; a
|