|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, 6 [/ a8 r/ h; g' E8 y/ [
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 5 i1 v: O! ]" z4 t
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。, f6 X) \, A6 d" y
/ a) z* V2 X6 c( |$ [
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效) n0 A6 [ v7 I2 u
% o1 C+ E/ `8 A. v) b) d" _3 t
0 w' W& W) w$ I |1 @6 P/ q
- worker_processes 1;8 n, ]' }% B( p M
- events{
复制代码 " h4 U4 E6 i G: j+ W
2 k) i* L, b8 a: R* ^
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
! K6 e! n! [; H( }0 Z/ L# ~# V- n2 H& n
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。) T7 O O& l. m5 f: H; C$ j8 x
3 f! ^6 l, e' z w' ^$ D9 l% j
1 b* W4 a- j* V* r3 ~
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?' u) h; X9 u. M9 L7 F4 v' G
% R/ F8 G7 l( i0 h& G
, m: Y6 R. I& B$ a1 j
) N5 i( s7 ]. l' q% p
+ S) \3 c' W r) o6 B: l+ w负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: / z1 g$ L: F6 j
# i" S8 x5 F& [1 J" O; {; T2 i# `3 M
( p! w2 |; [ J2 K7 X
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
2 I# \$ A5 y! m5 U. Y& V* Z/ A 2. 加权轮询,使用weight参数设置,配置如下
( `5 w) E$ E9 z* R! V- c# D
& h* b( z8 U3 s+ X9 X/ S6 a3. ip_hash策略
6 \2 a* V0 X* V(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
9 c( F+ a. V" A 其他地方保持不变,在upstreaem中如下设置:5 d2 M6 D( J7 ]" }9 ^$ M
7 Y! m9 ]* C- r5 l# f+ A
5 z; d f4 I' O* f; O l! s( Y
: L, g) ~1 ^* V1 S
8 M2 _, x% f5 N1 \+ s2 y6 H/ z4. fair策略
5 N6 `5 ]1 R0 T# N6 g2 j, \3 E(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
! p% I$ S% P; P9 N5. url_hash策略7 K% W$ L& F/ G, c
: m7 j1 x# K' z0 ]7 L5 l7 v(类似于ip,只不过绑定的值是url,这个也是第三方策略)
+ M! r. I) i9 z/ `2 l2 tfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可% J! w {5 {% D# z% z9 o
& ^) J* J2 I, Z- ]( l) w
1 D# J; K& `$ B( e; N% t: H# j
8 o! z; S- |* r) U! n. yurl_hash策略的用处?0 ~0 J4 \7 }: M6 k+ }
- k1 y) |( F8 O& G# \* c/ E6 Hurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。5 G- s) o3 ^; B( v6 i
' h& U- ~% z: A' u" ]7 f
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;; g; [+ Z* {% t- r4 Y. V+ r
, G$ }+ n* w) m2 b1 y! n* A8 V4 s6 ^" Y p
o5 G: C/ L7 K9 @! Q" i o j其他的配置# w8 d' Y5 ?3 V5 G
备份与停机状态:
% p& e! R$ K, v8 W3 J- @# zserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;) p) P( k. _5 W/ {1 Z+ i+ W+ d
7 d* M' k" @4 O" Kserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
8 B& U: G: {1 [" w* M
) w7 z3 @) ~+ b! m( a- _down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。5 t6 v: g( \9 }" J# w+ o7 E+ g" Z2 p
8 H& |8 w" H9 J) p1 e& H8 r3 J
1 z0 D& ]8 w, i/ A/ A+ O# |# d0 Y; E. B
max_fails: 达到指定次数后认为服务器挂掉$ I) T9 f) U7 U- W# A- I7 a
6 L" Q! P& |! V7 `; s! H4 Y
fail_timeout:挂掉多久后再次测试是否已经挂掉( o h3 _" o' l& t) ?5 t" r1 x% w
, {* l7 x% l4 h# ]7 |; T5 d0 r& ?配置命令
: }5 m1 m8 P0 F" i% a$ x: N( M2 l5 ~8 Q: D" T0 f) }
server 192.168.1.66 max_fails=2 fail_timeout=60s;
4 U$ ]: R* S$ v- {: E h% ~
4 \! C6 H! H) z8 k* d/ f9 b 后记
1 X% B. b5 V/ j9 t* w, L+ y我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
' m! b" X: E/ R# ?" Q2 G2 x+ Q! k; R1 k
6 E3 T! Z* G8 O% W' o2 w* e+ u" H
" T' W# u/ K1 n' v. p- d0 f( D3 ?2 Z N
|