|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, ; M c! M5 t# E! U* a+ s2 v
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ " C2 \1 Z! Q* ^' E+ ~" Z
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
% s$ w7 _2 y" y* g( h
- v+ ~# u) Z6 i& C! G3 p那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)1 u! W2 J0 P5 ~. g" i1 N- {
5 d& n# Z0 C, X6 ^- t5 E$ n4 s
4 f/ @4 N; j9 L X# W& P- worker_processes 1;; P/ i* F: V" P- u+ c
- events{
复制代码
) Q9 |% @6 Q1 N! Q% `- B4 {8 w$ M. p" [
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方( I6 A' _1 @# p: a, E3 v% Q1 L
" _# z& ] Z( G( {" l比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。7 f2 B7 k: r8 z- q! B" A
* T' T" U: a( s+ k, e% u1 \" n- X+ X4 S& ~5 j
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?% V) `0 X" M+ ~* h$ ]$ a
3 F9 l! L, q. ~! q, q1 {5 P
- [" M" x8 j |* C
3 b( n. r! L: t, H
# ]* ]5 E" t3 Y) d
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
; m9 `1 g& n8 D. l# Z4 x9 }
& Q, j2 v( H3 W$ d Q0 l( \( Z( W$ }( G7 `' ^0 ^% J& k
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。5 R4 W" @8 C# n- B
2. 加权轮询,使用weight参数设置,配置如下
2 h+ z& K5 n; E: }' \6 X3 ]
' d; ^! d. Q4 m3. ip_hash策略4 p3 t, }# j1 @
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
( q/ y0 u5 Y8 p1 i 其他地方保持不变,在upstreaem中如下设置:( y- \ Q+ a. T% ^# O
+ d( K) Y% ~: R3 C0 O5 b& n
D, F/ y- t6 i2 N f# `8 ^
! }. m+ s7 a* w6 c6 w$ y
4 B# K4 B" l4 D1 U4. fair策略7 x. ]4 I. O1 ~: w: l
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
9 _* ~# \2 p% \% y# {' C* @3 \5. url_hash策略$ B. d: p. `' {# H. x6 s, n7 _3 P
5 a1 Y9 f/ B$ P(类似于ip,只不过绑定的值是url,这个也是第三方策略)
! |5 @( R& ?- J; i W% Kfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
# X8 \- [* q) c4 R; k5 L N/ [. t
) b2 M- [) C& g9 j8 {) ]9 o
8 f" L( V" v, R; W4 \2 e& u
/ _( e4 @* {1 R- C* Nurl_hash策略的用处?# [% C0 k1 l0 t9 q" R$ k
4 _6 z5 ]6 g9 j- h3 J6 d
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
; F9 l5 E8 I. o4 a- Q, O7 e) a6 b2 g# N7 ]9 @: R! T+ V; B
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;. s0 ~ _6 ~, y" B
/ C9 ~5 q( t# k, |
, E3 ^* K0 {! _+ ^
6 F" t" B# f# o
其他的配置3 i3 Y3 D3 ]" T% v
备份与停机状态:
) K- T. ?' B* O; Fserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;9 T- Z& K5 k0 k5 x3 F! z: V
) ]( k" m n1 q1 p0 i( U& p
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
4 Y: _+ W8 c* a2 Q- r9 h/ J
# _8 J V9 L6 p" x0 I/ Idown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
# ^0 v) J, f2 V
# M5 P; M: C; y: N8 ^1 y4 [8 A t! d& d+ y
- C9 ]$ m9 v ~( y, h+ Rmax_fails: 达到指定次数后认为服务器挂掉0 Z3 p* Q+ d; E6 w
! Z9 K3 h/ |- s# q fail_timeout:挂掉多久后再次测试是否已经挂掉' F* D3 B1 ~( a; x( o9 p' z& k: e
$ p+ i' c4 \" J6 Q" p
配置命令. O. i- U& J7 P( t' o
2 b# m* q' ]4 D* [- D u
server 192.168.1.66 max_fails=2 fail_timeout=60s;- @. u: E9 Q# x8 ?# t1 M
* K/ O5 V" ]; k3 k7 x! G; f 后记
' t% C" w+ d4 {2 b. M# N! k! w& @: r% b我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。- E/ M6 n9 R7 M# F2 Q
' h X8 n4 t. }) u& s
" t) y( o8 \. ^9 K2 {" Z: x
0 t! s9 t! W( n7 P+ i6 h/ R
5 L- g, e" r% H' N
% q4 h s5 Y& ?5 J4 z$ y7 b) B( \$ c |