|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
' s- j7 u& q, L9 F+ y
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ % R# q" d) Z# f& m2 c/ v/ W' j8 W
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。3 V }3 [: s& C9 V4 o+ G
; W% R" N; D% a* H1 i
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效), Z- U( p7 r* [, A) x
9 d6 m1 T! h/ q* ^3 F5 j
* g2 {. k3 _( d8 ~- worker_processes 1;. M! ^2 M0 c5 ^1 Q
- events{
复制代码
3 @6 N, ?' @2 G6 o- Z$ [/ t. t+ i1 n. O! t0 {
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方9 i; n# G3 u$ a) J
8 h# p/ O8 J4 W8 o' Y0 B, L
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。8 i% f) K) @5 Y/ N7 T6 L/ P/ i
( `: ]6 T' o# t% Y
6 r. c! F9 E7 Z
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?7 `2 d' A* e: P- @+ Q' _
3 Q. e, `" [6 m6 j3 j
/ \# v8 I/ y3 \" g7 q$ F$ n c4 n
0 `6 h, s4 b( t3 K7 q( u* c7 m8 M/ F4 n/ \* G/ F
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: . Q& ^4 T1 E6 A
_4 X7 f: F7 a/ c- c
: A6 W/ ?6 _/ h( G! I这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。$ R/ y# M5 d* j% [$ ^/ ~' z
2. 加权轮询,使用weight参数设置,配置如下
" A0 `* M, N: `' t
8 d7 h: j* b7 U3 j& W( S
3. ip_hash策略) T7 J* [; p# t* N6 t1 p8 y
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
5 i6 v" v8 I0 T" t4 d) w! ? 其他地方保持不变,在upstreaem中如下设置:: P8 v" Q; e+ d) x# ^2 w
, ^" m8 B, S" \( x5 p
, }" x; d5 W+ f- `
q' i! B) D% d) M* C8 n* Z( n
g0 l8 ?) I" o" O, o7 W, {1 J9 p
4. fair策略/ b" C; I, s1 I: p9 i
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)0 F0 D! X! Y6 H2 x$ `2 X
5. url_hash策略
( l. |- n( R6 n! T" c& W6 W: y3 j: V
(类似于ip,只不过绑定的值是url,这个也是第三方策略)7 }) h/ d& ~* m# W
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
G/ L( {! e9 z* x& W7 ~! f' R% |, T; ~+ P
% H4 [4 r1 n* C: ?- U8 @
; m# C! M K' F- {4 x9 ]
url_hash策略的用处?
- `8 o6 ~* i" E' B G8 R
- w# d# J- z) [! k9 W4 `url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
$ o* O6 u8 f9 {
! D9 i2 O- K+ o B( F8 }% N原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;+ R) K' X+ d/ Z
; n8 |* N, H+ b! V5 T
# s5 _: v4 B/ p4 w4 w) x: R5 ^$ K4 L+ D* j8 S
其他的配置 ? x7 G% m4 K, ]: ~5 @/ ~) L
备份与停机状态:
! e: z, {+ a) ] h; ^server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;+ J$ \ ?0 a) R( A# {9 A6 ^
* j% a" ]" H5 `: ~
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,4 H. A% K9 j- F' Y+ U$ }
! j2 W! q+ \4 M9 t% w, Ndown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。" p( U: f' i0 [# B
5 t; S) t$ B- _' u
; D& ^1 A& e; i: `* \) z
0 U7 A0 x; t; amax_fails: 达到指定次数后认为服务器挂掉
, H; j2 W# m7 W9 G- n
& J/ ^" L% x5 g1 q6 t" K& W fail_timeout:挂掉多久后再次测试是否已经挂掉
6 i. z% A/ R5 R+ t0 H) f! T U8 a C0 H
配置命令* a d* l' @6 c: B8 ^! F- q
$ ]; H( Q! a( _; ~: Z5 C Kserver 192.168.1.66 max_fails=2 fail_timeout=60s;+ V! P- l7 B9 l! q7 S* y4 a
& V5 g, T& w* S7 ?
后记; \) n; n+ H# c9 L5 N. u
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
/ W6 p! }* w% N- F( l# Y8 u4 X6 W! U" @& [* p' Q* Y2 U0 R
/ z* T+ f! ?; Q7 f- g2 w8 u/ |. V9 y4 F O) N# h' V
3 p# h/ t* J( Y: m9 b. e: S
; l8 ?' U. t9 f4 j- Z: k |