Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, 2 r$ T! h. Q3 P$ z
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ + w" k# g# _; b* C% n5 E9 z# ~6 `
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
; {$ E0 K! A5 v, e9 t4 I a! r6 N5 y& q5 a
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
: G: [- w; W; W
3 H0 K' q% v% T
) g* R7 n) ^* R6 ]: U2 Q* `- worker_processes 1;
& y4 \. |) T1 \) G. U! z - events{
复制代码 ; u6 s3 o( W8 l6 b2 ~' y
* X# t: J C7 C2 v重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
" k0 U& l/ \# c' C+ @: X5 U7 ?3 S- E7 Q& L+ K' j) p: [2 ]9 g
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。* Q- W A8 T: c
+ {) }7 I9 y% P3 e3 P2 M
/ H9 e% i) _: n0 d7 w接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
% `% q8 {, h) z
- `! O8 y: ?+ I: H3 ^* o5 T& n+ }4 G' J$ n5 p6 v
& O, N- s! p: `& l8 X5 G" c5 o8 n, Z
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
; u" D4 B. Z' r' E3 S0 |
% _$ v8 i- t+ F7 T; f% i
" i- Z: \* {' e3 n这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
( t* R: e9 Z, m6 k3 t7 J4 Q% ^1 C8 w3 { 2. 加权轮询,使用weight参数设置,配置如下& C4 o' L# e) s3 F+ k/ h
- B/ W9 k; W* K) p+ Z: m3. ip_hash策略
. A- y( r8 a- A(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
: L6 x* S3 _) c/ n" ?/ ^! r: D 其他地方保持不变,在upstreaem中如下设置:
& ^+ n S: z+ q" r, m$ D: m/ Y- a3 t4 ]) \
1 N( b4 l; ` M" A
$ a! l( _) W$ D/ {
1 | n: D* e4 a4 W w9 @3 @- R4. fair策略1 i4 Q9 \* P% q: k1 N W
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
2 p. K6 B! \' B# W5. url_hash策略 n1 O4 P7 h% I4 w0 l5 n
) x& N% i) P; V( ^(类似于ip,只不过绑定的值是url,这个也是第三方策略)
: @1 ]: O6 p; }fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
7 w4 Q, k, M5 o$ J8 S `/ _2 d* u. d+ p2 ?
. A& l3 e5 n& e$ t* X
/ ~$ @& t) b/ E3 }2 Surl_hash策略的用处?
8 D* f; Z* x0 E F" g1 A$ s. V9 }0 K2 e2 N
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。' j: \& e6 g$ i3 I9 g- j6 J
/ s" D2 w+ g- j3 p! g) t
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
- S8 M, Y% y1 M o H0 H6 Z/ ]' Z; }& U& M
& O! i0 u' j) j/ \
. W" y4 K+ Z4 _( u$ r) D其他的配置8 S# G5 F! Q5 `
备份与停机状态:$ u+ b! `$ O- v: b4 T
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
- g8 U8 z, R1 j' j0 D* Y
8 B) Y, ?$ L/ h" s8 | o' Qserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,4 F9 G* {! }# D2 @8 w* [2 ]/ Q- j2 W1 }
9 h1 a! X6 S9 s! B6 e/ n) ydown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
' D2 y% Z& f! `! t1 d! T& R, z6 l3 B, P! a
2 L2 r8 j8 s6 E5 Q4 }' [6 Z1 @7 T. s3 E
max_fails: 达到指定次数后认为服务器挂掉& u. a3 S/ {: c9 v
2 h) D6 g6 t. f fail_timeout:挂掉多久后再次测试是否已经挂掉 y; ]+ H- e5 o8 q
# @4 M% c1 x: U. r/ J$ }2 i
配置命令4 j9 e; q1 ]0 `6 D9 L
2 J3 M |+ _8 [, a. dserver 192.168.1.66 max_fails=2 fail_timeout=60s;
9 ?2 W* j0 n/ h0 o9 c$ _
% I/ o0 z. |) a' h3 F 后记
3 d3 j, i* C! D; x- d0 X我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
) a; R7 Z" b/ Y I$ y& P" H3 k
4 Q5 T+ o) x1 u4 ` r% x# O' C" B- [" Z
2 v ?* |* h& G2 R$ l ?% w. X5 y' I
" }4 V: d9 E( p( w, N, C6 z. e0 q- l) j3 z2 a6 F8 E& p- S `
|