|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
% Z3 q/ r/ A( Y( D) r
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ * U9 K- j0 G; D% a4 ]. G* c
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。& W7 }8 r! g1 G: ~$ H
8 K- ~2 K+ C/ v3 a; V: S8 W% A1 Y4 r5 o那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效) A& P2 z" r% D0 M7 ~& X# ]7 S: p# c
/ z, }0 P1 s- b( t+ D
; i/ O9 o! e1 x, X5 w9 p- worker_processes 1;
6 M6 e" B& E" X( u) X; {* r - events{
复制代码 ; ?* n* U/ X: q0 E/ _
2 v O0 S7 D9 u" M ]. _
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
0 {& T$ C" s7 k- ]+ B6 `! E8 d J& L7 L: P3 w6 Z! _4 s6 C
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。! p- O) J1 u6 V6 I
$ E0 v# x6 Q+ g8 H
( M0 ]+ Z+ S' c" V- I8 |) S
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?% _4 @( B* u4 ]' j. G7 I# f
2 t, a& d; x2 J! U# j, W. K
$ i1 g" J- K3 e m0 }- G
* n2 z3 R+ t5 R$ W+ k3 R3 H* w# }" O6 e9 P0 F; T; A! F e, w
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
& a" r3 O9 O' p q! I
; `0 x: r4 [- k+ r, \" W, m
" l# f% j0 R2 t# }( ?$ d这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。; ?( H l8 v2 u1 L
2. 加权轮询,使用weight参数设置,配置如下! O- O6 D: h& W+ w6 i
( T5 o. Z+ o0 a' C8 v
3. ip_hash策略
) ?6 m0 J7 v) B) i j; Y( P(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:0 f q0 q& z$ V6 m2 ?3 ]4 @
其他地方保持不变,在upstreaem中如下设置:
' A& R9 M% F: j h
, u. q/ j+ k9 H+ t! n
- w/ E& p, a9 y' F: h' |
9 |. [' ^: x; u a( X& @3 r
+ I6 e: }" r4 M+ `. y! I
4. fair策略2 ~' c# u1 Q' y- [8 Y
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)) F: }$ P1 i. ^( g$ `1 T+ X V
5. url_hash策略- @7 K/ x& w5 l. }/ `' A
3 k2 j3 i; R9 d! P3 I4 _, ]4 A
(类似于ip,只不过绑定的值是url,这个也是第三方策略): b& h( g2 O9 y! V% B1 t5 ?
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可9 X2 Q m" o, g: T
) u/ v2 P4 f2 q8 |7 L
& p \* J, c( @/ M" i
* q: \9 p- d4 J& I. x* Furl_hash策略的用处?
) t' Z% N# u9 p7 q) E8 B G5 ?7 O8 o
3 c2 v% F- Q$ t. C1 ^, J0 u/ durl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。' l5 i8 w) e2 ~# Z# S' x
! y2 Z, [6 w/ f) R) O6 b" K3 @原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;3 Y9 G$ d) q, M; i3 [
* J1 i% ?* }9 ~0 N* C* H8 m6 ^9 |
7 {" w3 M/ n$ T5 { E4 n1 M) i: A# v
其他的配置
$ D* d( h: y9 G8 a$ c备份与停机状态: M; d+ p1 X+ F' t8 a! E3 E0 X
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;7 @2 Q. V# B) d* b+ P
) ? Z" z: P: t2 y( T
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,* Q/ P3 s- N: ~6 y0 r1 i
' G8 X1 B9 h% P# Z( Z* [down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
# G1 d# T% j) U( h5 B0 p
+ g. R: [6 Y2 D2 h: C4 l% ]- ~8 m# t' f. X# K0 p) |
1 {; p: x9 A6 @5 R4 A1 xmax_fails: 达到指定次数后认为服务器挂掉
# l0 w9 ]: z0 T- K$ T# R9 T8 j: x4 A2 `. n/ ^
fail_timeout:挂掉多久后再次测试是否已经挂掉
8 I- {+ W0 D5 e4 A; ?) m
) S3 B5 P, J$ W: p配置命令
+ h: V% H& I5 C0 t9 _! k2 Q$ r1 r0 h& D+ `
server 192.168.1.66 max_fails=2 fail_timeout=60s;
& U |6 Q2 g- A0 K1 i( d3 V |0 ]( K4 M+ i" }: `4 C5 n
后记
3 S! v$ n& `2 N; R我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。+ X6 t% |0 x( @6 Z9 C
0 }7 t, @+ U7 z( X" b( o
: ?' R# B, k( i* R8 a. H6 B( L
# c1 |, E5 B* T
; L# y8 A1 |+ M" m5 x: W8 W [' u7 f) R; Q; W5 g% Y
|