|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, 0 {- t: H5 T# y) r3 W7 m
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
* U) C. z0 }7 X0 R' R从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。7 Z c( j% d% a( z- q5 `% Q2 d
& O3 C0 n: F7 ?1 ?) ]* U; w! W那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
( P. Z1 W4 w+ T) Q3 v
& M! Z! Z: J( B8 t$ n8 h1 n& h" R3 p0 [3 C+ u' p! w
- worker_processes 1;: L* u y: m) _2 S. [% e
- events{
复制代码 ! I& Z6 |1 N3 E5 w8 e+ T
% d; L4 m1 P2 [重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
+ b) u- U& j; }. f W y. o
% L: W @3 V1 S8 W5 h; p比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。. J, X! @7 ~* l' W5 Y0 C. X# P
, ^1 j5 a2 T% X6 Y% r( u& d; L0 {! U: M" p W
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?* K$ `6 P* m( k% `1 C8 X7 f
% H+ a0 V6 b" k/ F/ v# S; x* o3 o; v: {* `9 H( F9 `# v$ |( L
' C# F5 k! e. w6 [( O2 g- C6 z1 n) S/ @% o, w0 W
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: % d; F: N5 [5 P( [8 M% h! \: ~. S% w; x
h' t4 A3 `0 M0 R5 h$ c
- F/ r, e$ l. [* \ p- D这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
6 e$ e0 c& q0 d2 C, d0 ` 2. 加权轮询,使用weight参数设置,配置如下
, Q+ I! C9 c2 F+ O
" x8 v& l3 e4 m1 a- W3. ip_hash策略# D. A$ [3 h u* @
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
& {$ o& i: t3 P2 p, H 其他地方保持不变,在upstreaem中如下设置:8 c; D% o. L2 m6 b( Q" @* R
( c! f) t P( X( y I2 O: D0 ]8 C
7 Y! o T& @: ?. N3 m
" {4 G2 F9 Z3 J, L2 s) {6 P& u: {7 l
4. fair策略1 t7 J, ?& F0 d9 C* S% O' Q# N+ {
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
+ h7 T1 P2 G" J8 }3 N. ?% H5. url_hash策略
2 U! B- J; M0 l8 l0 T& B0 [
0 X% m1 d9 k+ E: c6 } |(类似于ip,只不过绑定的值是url,这个也是第三方策略)
% O: }: H) k+ {" wfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可9 Q3 u% d* M4 v( x+ ?/ a
) h: a8 t7 a, R4 @
6 f9 N4 o6 q% i$ j) [( p% a8 v
9 U. X, \) d; R5 M- r9 V
url_hash策略的用处?- c) w3 w" O3 M8 @. C& a1 t
" F3 X9 S& s/ c6 g7 A0 D! r2 p3 U6 q+ }
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
7 H5 J) s; N/ f
% @3 K5 g" t4 u) W原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;, {/ y8 Q: b7 {8 E' j5 H
+ V* S( C# w) S4 S& e6 x
( l2 {! j8 @1 I, I* N' s" K8 C
( @. Z2 l5 T" B7 r其他的配置) S" [8 i- c" L
备份与停机状态:3 a% e+ V$ T$ \% f' S
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
( m7 z8 b9 y8 u4 A* u
6 w! r, u* W0 qserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,: ]7 @( b: g& t4 l* q$ @
+ S# G; Y; \7 L" r& G, vdown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
0 I: R, S- W* c/ x7 X
! Q1 t$ v4 t2 T' y
v+ G( T6 d- F( x
' S3 c* J, N( U" k8 ]2 {0 |max_fails: 达到指定次数后认为服务器挂掉
* E3 s& A" p' Z( w, z$ J3 x# l
fail_timeout:挂掉多久后再次测试是否已经挂掉: }& Z7 ~! J9 u# `8 T
$ F( p1 F, S2 P% P配置命令
6 X: K3 g) t3 s' W
. S3 @3 e) i4 ^- I% [! Y) c2 @4 U7 ]server 192.168.1.66 max_fails=2 fail_timeout=60s;
+ h6 d5 U0 g8 ~( ~
9 y( Q: ]1 Q; `# V8 m; k$ B 后记6 }: T" ~( E% F k
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。+ c9 w3 v0 D8 R5 k& I
* A8 v: p" f1 q
G/ {2 w2 T7 ^; ]8 L4 ^
9 A5 H% K7 ]6 d, H& e# i' M6 Y, l" l- y: c% [/ X
: m- Y& Z# ?- \& `9 t
|