|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, + o- p1 t M5 w4 U8 F; ~, ^* q
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
3 f% w8 H* w, y1 m从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。+ D2 ^/ K8 ], a# @
* f% n- c, M# ?/ u那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)" M& g' r2 ?& j, Q# d8 V2 Q5 i) ?
+ Q" p. z3 x- E; a
4 O9 k" d* L& M
- worker_processes 1;4 A5 D& g' R F! ^
- events{
复制代码 1 _% ~3 z! a1 ^( J* ?" o$ E
8 b' s) q4 h6 @: |) ]4 Q重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方5 N! q7 s5 f8 ], I# k9 }
" {7 ?/ L! L7 C3 G
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
% E( F" `! X# S! n
. U! Q: m8 s8 ^3 Y* s) d$ y; N
9 [, A, D# P2 Y8 ]+ a9 ?接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?) k" Y% @$ a/ w$ [' {6 d/ X8 ]
2 R+ O3 u. M: l, M4 o9 `2 s3 c U8 d! U7 A) \
5 ]2 _; \( s- j; L" ]3 ^2 n
% ~- I+ I. e, b4 V7 o h负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
+ _( Y# T, n1 r1 y
6 ?& \5 P0 H5 s+ {
, Q6 T& y8 h. P4 R$ } C$ ^这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
3 {. O! y# }4 y# K" l 2. 加权轮询,使用weight参数设置,配置如下
7 Q; a5 e% R0 L. @0 V0 B
9 a1 Y! z4 h. W2 n3 B6 M
3. ip_hash策略
! {4 w+ M- B- z4 X9 x' h: L7 [7 e+ G(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:3 r+ ?9 I7 P" x2 e( k0 O% h
其他地方保持不变,在upstreaem中如下设置:
( K) i* W) A/ Z. P$ L
) i/ W! }# ]+ d. ~
4 }; g# @3 O) P/ D+ i, G9 @
# {# u- Q$ a. ^3 Q9 `
! S( _6 K( S c2 R4. fair策略8 |# p: |1 e) S4 o
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
# t Y' `+ G9 s4 A, I& v. B+ v7 Q5. url_hash策略* G$ L6 M) `5 A& R" m) j
8 ~6 Q# q- `" p: r" b(类似于ip,只不过绑定的值是url,这个也是第三方策略)5 z) w9 a$ U2 i! t: y
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可# D* J! I) U# z! P& @
7 g( z3 ~9 `6 @% V3 Z
5 }5 s. s& [! Y/ K/ @2 Y+ d O7 z/ j7 f, A7 C' g& H
url_hash策略的用处?
; ?0 }" E9 g- O: o3 X8 m0 X' |7 J. O: n6 A
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。& d$ v! e( D5 ~* X4 z# G
2 x: c, A- X+ ~( L" Y7 ~原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
( a7 x5 w; W* m- s' f+ z# ^) ]/ J8 s/ t' \7 P9 w. w0 C
- d9 K9 {# Q6 s6 q* `. Z. X# W4 H
, C e' x. M. B2 ]/ K% b4 s其他的配置5 m r/ ]5 @) d& @7 f
备份与停机状态:0 ]" f4 x, C* c3 G% `; J
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
3 w9 j5 w3 ]5 `! e( C1 B1 a
+ W# S8 v& t/ i3 g, B" w0 u" Bserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,) a" u' g- e% r! F8 @! `2 F
- Y' p4 e$ L6 w" I6 c8 ~. {down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
, U6 ~/ s; k* d E
( a/ ~4 u, [# b) `
7 z+ c- i( Y3 b; D( u! L( H: A7 m
" }% x! d o2 d2 |$ vmax_fails: 达到指定次数后认为服务器挂掉
$ _6 z0 r+ q+ M: r- S I [" i' \# B$ h7 O6 ?0 T0 _" _
fail_timeout:挂掉多久后再次测试是否已经挂掉+ U. l6 A8 ~8 `$ y, j2 U
4 p6 Y$ F9 C# c配置命令
* e. f* A5 ]7 }& n2 {7 D, U% O# B$ H" x
server 192.168.1.66 max_fails=2 fail_timeout=60s;- _3 A& L+ p, K) S" p
# _ R' w0 {, D% {: ] 后记
. S, U5 v# @7 k! \我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
( G% t' r& X* X; Y5 l" u
2 ^! Z+ E1 g+ L: l$ t
- ]+ ]' _$ `1 n& M/ C
0 v9 ?. [5 ^- @: K S0 v5 b4 o5 e; @% D8 ^
" P, r6 B) D% T- U+ f% z% ] |