Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
6 Z/ ~/ S+ l" w. v
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ ! W! n$ o: ~8 D" b% x+ x4 W
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。% ?2 d5 g# l ?" L6 j. s
7 c6 W8 @2 ~" i9 P4 Z- C: \那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)! w2 [* ?) ]* r8 I {2 W, K; ?4 b; q6 ~
1 o1 c; @' Z2 y# O2 r; p2 a* [
# {$ N8 U+ U* q0 v1 _1 I
- worker_processes 1;3 U/ h: `! l1 X! p& n, _ J
- events{
复制代码 9 p, A4 u- O- ? M f/ x
) V4 S& ^- v2 Z! ~重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方4 D8 e! @ B" A* `8 M8 U% ^( a2 }. B
! M2 ]- }$ n. w; G e- ~
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。( w2 }3 l8 c! I i0 m5 V; j4 r; r
6 b7 z0 A+ Y3 C8 q1 ~* g! B& |
7 ^0 u d: k6 @1 f
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?+ j9 i; d" y9 e* {
6 g" r; L: c+ ~% w! o, {" A
' Q4 \& v |2 G4 Z0 {3 _
0 A" ~# `: u2 p" m4 D
3 A2 M# z2 o$ c- A- Y负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
, h" o T/ }& O# n$ x9 _3 e
$ S( d6 S& P4 J, W3 f4 l
' n1 d0 R' D3 C5 a9 |+ y这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
& v* x- u' O E b# C# U, y, C4 S 2. 加权轮询,使用weight参数设置,配置如下
" g S' D4 m! m) h7 c
. N2 a+ j: N1 D2 R3. ip_hash策略
5 Q( Y2 x+ x! s* ^5 R2 ^) k(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
2 [; l1 w8 u; C 其他地方保持不变,在upstreaem中如下设置:6 M& _+ `5 S' H F8 i/ d2 O
) w5 V5 |$ K7 W/ [
% ~% D* i1 `/ @' G7 ^
7 ^5 z4 R2 o- T; @" Q5 S0 b6 f
6 J3 `* ?: F' R* t+ e- @4. fair策略
' {7 t' c8 o C2 F% A( q(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)3 I5 ^2 G0 m3 ~7 p9 V# ^, i' O
5. url_hash策略6 A# {3 ^) P: t! n% g5 M# d& ~
! G) R& z. N& K9 t! S
(类似于ip,只不过绑定的值是url,这个也是第三方策略)3 @1 b. h( }: a0 H3 C
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
; i0 n0 m- S# w
- E& L1 P' H0 y% M7 Z6 g
0 {9 o* X" D- B3 N7 ^! e3 B. R# _ z% R* v4 [* G' \# @
url_hash策略的用处?
! ^0 B2 Y$ N. K5 L( p: c
/ U! n# s# A1 x/ I2 u8 f1 Furl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
. j7 O" S: g, q _; f
4 v& ]4 L: o! r- s/ _' k原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;. s" M$ u7 q9 S( w. z! Q5 L( ^
& P6 y# q) ~( }" C
0 D' B/ g: y! r' x7 C: {4 {) A; h! Q* `& Q! y2 ]
其他的配置
+ m5 T5 ^8 H t8 Q备份与停机状态:8 I& s+ f7 j8 r8 _9 R/ E$ I- u8 e
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
/ u! |: J, ?( o y. g( |* v0 \* U) n B& A
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
- ]/ Y( h! z d, k" p1 f: Q8 Z6 |
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。( i' Q! F( u* c# V
" w3 A. u- [% E) V
/ ]# P& l5 k0 k c6 u( A y
! L/ n+ Y7 g3 ?& r" ]* q% L) ]max_fails: 达到指定次数后认为服务器挂掉
: \6 l4 W/ P7 |2 G5 z
1 p+ ~; x% a$ x, Q fail_timeout:挂掉多久后再次测试是否已经挂掉
% q" t* [5 F) [/ W8 ^" h8 e4 G6 W1 H E! E! l- C* ?' U
配置命令
# U% N$ j! ?6 d' N& X8 E3 B. W# m, r5 w' [# f3 F! T
server 192.168.1.66 max_fails=2 fail_timeout=60s;
+ P$ ~/ P5 T! i: l: v
: S& t# s; d+ w* o' f+ L9 @: j 后记. A2 F' J3 A6 G5 j0 V, r! U! R
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
0 g5 a" r8 y% ]; _" K' g2 S+ }6 w
$ Y9 G/ |; y# X" X3 c
1 T$ x2 A4 ?8 {/ I3 w# w
* [. k* q' X7 J1 a7 B3 ^/ r- c/ r8 D9 G8 Z: s. \8 [( @' i
|