|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
/ E0 G# I8 }# Z, S; S
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 2 H% |1 E# ~3 O4 _3 e( d
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
9 q! ^! S4 V( g/ e( z) Z* a( T0 V2 e- v/ B
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
: Q' g5 g3 F1 x. B3 C& Z6 p! X' O
# s/ f, j2 ^, a# d$ Y+ J8 o# F, h9 f1 L5 t8 q4 D$ b; X+ i3 G' {
- worker_processes 1;
! a$ W% [4 U& K" z - events{
复制代码 ! ^+ S q6 ^" q. e6 m2 B& ~8 {8 `* b# N
2 g9 ]" n) k$ k' }: `$ z重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方7 O6 h! J: C/ v
# U4 m6 ?5 [* @* ^: ]+ Q
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。3 q* Q6 c! g- w0 i
& U. ~) E6 z) @# j* L
- a$ N" \# h: `8 @接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?+ m; k Z A3 P( f8 J& k- u2 m" L8 D
! k3 Y: Z7 K9 g* E2 f( |$ h
, M$ u4 u# o3 S- c6 E7 ^
/ n& V* d% g: M$ t9 l, S$ v- O! `* b
# H. `; ~6 i" a1 K负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: . _- Y* ~8 m4 W* f. H0 `
4 G& y1 g, v% C6 \7 Y" O+ ~) L5 h( d
, a' K2 X/ \2 K3 ~这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
- H1 [% a4 Z- |6 z 2. 加权轮询,使用weight参数设置,配置如下$ r3 E, a. K: |6 c0 T7 g5 {
7 f. q4 [! e; z |* U& r0 y3. ip_hash策略" F. C7 \4 ]9 b0 j, k8 O
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
& W0 ?: x& i/ Z e& Y 其他地方保持不变,在upstreaem中如下设置:: s: j0 _8 e" P% w, C; X5 D1 u
2 n6 U) y0 U7 d% [ w: k! g
2 k2 B. ?( G6 M: x+ Q/ \
3 `' i) C# E- r3 Y0 C" g% v# k' V4 b! i
4. fair策略( p3 d7 w( u" z1 ^5 t0 W, b6 [
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
; n5 |/ S1 T0 T& o3 R! P5 k5. url_hash策略
* a: q0 C, e7 i$ y' Q. O0 a) i& `1 A: A) M6 g; m
(类似于ip,只不过绑定的值是url,这个也是第三方策略)
/ U& ]; Q; m0 x5 ]" c9 Qfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
* a* A, a( R& S4 l x, x# m3 Y+ H
7 X1 a3 D* {0 @& L, T8 |$ b! v! u- |7 u& k0 b
url_hash策略的用处?
- d2 k( ]+ B& D4 W4 |4 J8 x. ~( ?% J+ t) G6 P8 s0 v
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。, e, }# r( z7 r2 h
) @+ P K4 u) N5 n) }2 J2 f( s6 H) P& @原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;; R) s; D! m1 P- d
- t* ^1 i' C4 U4 u( ~1 }* X8 G. J5 w5 q6 s5 c) j
, _4 m$ u/ Y- @+ D# w; n其他的配置
+ W3 m% d4 t$ J4 e6 w- B* h6 g备份与停机状态:
$ y+ F7 z# j* Y( k2 R7 Zserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
, b( a& W, O3 W) _4 X. U* _0 z2 |1 K8 H3 B* X5 W4 u6 C
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
! \. M; g+ y, S1 f D2 r, ?( N( x' }! ?, v
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
! f5 {. r& S7 }2 g! E' \1 q
$ H* H, \4 s/ i# \7 X: v
' n' E1 l. |, @. R. b8 T9 o& K: ?9 y, p( [. }9 e
max_fails: 达到指定次数后认为服务器挂掉
0 ~) E' u1 i, _! Q* b( m. K
$ u) D5 K) i0 ]( @; G fail_timeout:挂掉多久后再次测试是否已经挂掉
! M1 f# }, B; S- c+ c' H/ Q" d$ b9 J' L
配置命令
# |8 u( \7 N$ d7 K+ L
& N9 ^& y( m8 l, s, R2 T% tserver 192.168.1.66 max_fails=2 fail_timeout=60s;
1 B! |! i) F2 g$ W. T, \: m/ D2 o G1 z& m" z+ }
后记
; w. i% }# T/ G. T我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。0 e& X# A2 H" [% _5 D0 Q
9 C. _9 q9 O+ e: ]" X$ U e; m7 \. N2 L7 _
4 N% c5 h" d# z! a) a% i- |
" [4 f6 e2 k% c" `8 k2 M
' \& U% a# c" t: s w; W, ` |