|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, 8 a5 s" `" s$ m! l
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
6 T' _# W$ y" ~9 |% b; F从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。 Q$ R5 d, s# l! ~0 C
' O- `# K( |$ Z* l那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
. G0 }) \- ^; f3 R0 a& e! y0 ~0 l F1 x8 P& X) c
' o' K$ q- ~6 n$ @4 f! t
- worker_processes 1;" G3 S- B k8 ^1 g* h' @
- events{
复制代码
. O( p/ G6 F2 S7 E. e& o& r( _, Y$ R7 `: p
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
3 J: `( I1 d; z+ ~: U/ C0 z( O' F$ C; A( I
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
% m2 L8 P* R( i$ _& U) z' @' v- @# s. g; `5 Y4 C
# c/ R$ G7 e& H4 t9 I- K3 \+ w. l接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用? ^ x- G! P' q. y+ {
. u8 X- d! d9 ]3 U8 y1 `6 U% M/ I c; q, S" o
2 _4 x! d9 H9 q! i
. z/ Y& d4 U0 G ~6 o( g负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 9 J; P4 T) p/ L' T6 P
( [, b1 X: \5 g( o5 Q) G
0 Z& x# N, ^* o
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
9 p8 Q* I2 g+ n 2. 加权轮询,使用weight参数设置,配置如下
3 w& Z2 J, y! z" T: C& G
+ l, B: N' [! Q$ a3 n5 L3. ip_hash策略( f2 U0 r' k6 f' @4 j9 i( I3 T5 T
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:, f( c, W5 Y w# m* E; S9 E
其他地方保持不变,在upstreaem中如下设置:7 ~/ z; x( t! H# g1 p
+ w8 m; o7 Z. E3 d, u/ }+ ]
1 C! v9 f6 b D; ? K! R
% @( Y6 `5 d) D* f d
) }/ [5 ?& ]) S0 c$ k4 I& ^4. fair策略
& B$ b& m- c- ]% A$ w$ s! L(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
0 x# e% C' T# z, }5. url_hash策略% }" q9 ?5 y5 U6 R$ c
" s) M; l) a6 r6 M5 m9 \(类似于ip,只不过绑定的值是url,这个也是第三方策略)7 \; i, V) b5 T7 @' p
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
- c4 p) Q0 M) o' v6 N& {- z# t) S4 S- ?: Z* }
, s* m3 p% V8 Y* W @ W; I5 I
! i1 G! p. g5 ^url_hash策略的用处?
5 j& c' k) \# [; ~7 }/ a# s. G- a
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。3 n) N* q8 j+ h: U1 m3 f7 Q- M
- \5 H: A- h4 w1 o
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;, V; v+ M. ]7 c) f+ [6 ^. V
+ J3 A% s7 h5 X i3 G0 E3 o/ C* Q, D3 B
: V; u/ j$ a h; ?其他的配置) k: t, w6 N" k+ [* [2 o& N: y# [
备份与停机状态:/ a+ a( @# G! J9 }8 q j
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;: B) [$ a T" }( a" g5 ], a9 A
- ~4 u5 L8 {+ K9 Lserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,- o5 k. O+ A9 v/ M; T' y' j3 w
5 F- G# F% e9 t) F0 k! C h" q. Qdown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。& v& `0 N+ m3 W. }* f: x
" p" |; ^8 e0 |% R/ B1 F: I
( v7 ]; F- K; q2 m4 M/ ?! {; Q8 n2 O% X7 g; V7 s5 w! a
max_fails: 达到指定次数后认为服务器挂掉1 _3 L1 h1 Q0 Y
9 L4 U, X7 [0 |7 n$ P" P j( W) C fail_timeout:挂掉多久后再次测试是否已经挂掉: ]+ T- G! l8 }% r; _7 I" B- m9 A
. a& T7 b" E9 p6 i, K4 \* U# e
配置命令: d' T$ o1 P& {" v, U& ?" d
, P1 f) \ q+ B* R
server 192.168.1.66 max_fails=2 fail_timeout=60s;
# }+ r7 f$ o, N$ `% z( a: V; ]. i; Z1 r
后记
- w } D; a8 l5 R9 M我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。- K2 Z1 Z6 U& }
, k# w2 }. d+ A9 i, x/ C8 x4 k
* Q# ?8 q* v# I- n8 @; R j+ q* Z3 m, p' n
, p1 l4 x7 Y* e+ @3 q
" Y; b# b) t, V h
|