|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
/ \# s. a+ v- h, m& @0 N, |" o
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
4 x& u7 x7 J( _8 p+ ?. [4 j* N从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
8 [" \; T( i. ]
: m$ B8 J$ K& O那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
" m, g/ U8 l X) A' u; n9 W; M$ G1 F* r0 b' J. Y) i- _
9 {" D/ M% p; @5 w
- worker_processes 1;# _1 T7 u6 l0 z3 @9 r8 g
- events{
复制代码 , B! Z4 S0 o% n% R
# @0 F- J; [- L& Y- y! l重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
7 B9 R) f, I! b$ l( s* w- g6 |0 ~, b& _( \9 F# [0 k
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
- H% X8 L- h. }* f" @( m9 l; R8 `1 f9 P
7 D( O. @4 E% T8 E6 B. F0 k# F D接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用? V4 {8 \, K) H: U
& p9 J$ P0 A' l: o& |! V
6 ?8 `% }2 Q; K7 J6 x
% n, d' `; d( |0 N0 o z6 [7 v+ O% h
+ T$ Z$ V* V& V( t0 c5 z
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
, C/ D2 w' |5 Z0 P3 b3 n- l4 {
& E9 F$ b+ i, g; ~2 t( S- U5 j& P1 @7 b! k/ \5 F
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。2 l( s) J" o7 P" Z
2. 加权轮询,使用weight参数设置,配置如下
. Q, G5 o' F$ J7 C# J
' Z9 d' O7 B1 R* k0 y* g$ N
3. ip_hash策略
8 p( z2 W6 P3 H(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
$ X t# e# K/ I, k# P! ~ 其他地方保持不变,在upstreaem中如下设置:
4 ~% D% o9 Y! w
. ?$ ^0 J7 O+ D0 P C3 ^
- [( P @7 P) y
: ^$ C& D2 m# N
' D7 q! R& s% L4. fair策略8 \8 {% p7 I& p. R5 d
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)5 |# j1 q6 B" C
5. url_hash策略
, P* U! L( P$ w+ k0 ?; S4 J5 n l
(类似于ip,只不过绑定的值是url,这个也是第三方策略)4 @" J5 m3 \( p) z+ B; u
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可/ y: a( c! d* W
/ i) {: R* N3 H) I; J2 @( I: |3 `4 Q
3 d, Q" o7 H3 J5 p. s6 Z8 hurl_hash策略的用处?3 k/ e" @+ w# w( k, o% |% a
7 Z" G1 U2 a5 t: R; murl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。* ?; G# K. l1 n1 B. d" Z: S
6 ?+ G5 C ^! @
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
2 j4 v O7 n6 S3 A" k. v8 y
) } L) H- {% [) O5 l/ C% g# O5 G+ g6 }" P3 `+ f6 T0 C
; Z* L- u O8 Y3 Q7 g" H其他的配置
: U( A6 H. U; [4 v: K. A& l& T备份与停机状态:
7 r( O) d8 _8 G; a3 ]& tserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
5 ~! ^. ~" N( u, r, x
1 }" d6 Q; m- l( a' @! Bserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
; d8 z) s9 u7 b, e3 c
$ E( m9 v, K& z+ ^* Ddown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
( C) G& q2 f) d% S( t$ ?
& M J5 {9 @( V3 P! r2 r
/ B6 V. A! |6 s7 M% s
/ P m7 F+ R3 O3 d7 o' T$ U( umax_fails: 达到指定次数后认为服务器挂掉1 {% l- C. }5 y/ k# u3 a8 j
% W/ e3 Z5 D: ~( n# ~
fail_timeout:挂掉多久后再次测试是否已经挂掉
# s/ j9 R. b' |6 v' I- w; O
) ^. p, }0 R9 j6 i配置命令
a6 L% v, {8 J8 a: P& L: j, J
3 R2 c/ r* d B: ?) Lserver 192.168.1.66 max_fails=2 fail_timeout=60s;
6 q, `2 D2 N7 ^. @2 P
* P$ b& C0 ~* n7 U 后记( I y" c) f3 F% q7 V) j
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。: k6 p* @ o) i; c' s. _- y* O( a0 P1 k
! K& x% F0 i; a8 Y+ |# g9 }" g- s$ g7 }
[5 P, U2 {# W( ~/ K
) q6 _% s! f* G% L' L. I$ z' d4 f1 y/ c# b/ r) k4 W: o
|