|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
- T R2 }, s; T3 [
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
( ]# R- x- m1 f, z从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。. v3 W) j z a6 w: ~
' _" t* e& r# b' k. O9 k1 H) H那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)% m7 I( L, l: K" \. f; p6 O$ _
2 H3 k3 v" Z# i& n
% R: E4 k& J+ R! p8 p% h2 Q8 K0 e- worker_processes 1;
' `% a6 y( u6 v. b$ |7 K7 f% M - events{
复制代码
& ^# F: m1 W Z) E
/ r! S5 K4 D: G) ?重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方: h$ D, T) q& T# n0 a" _
7 ?. ~2 P1 N* d+ Y6 t9 F: h( a- E
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
! O$ p! V, ?' c9 H/ o' E
, ]5 z8 o% q, A5 J# n4 u# l5 i3 |4 X. |: y- `$ A+ g1 U
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?2 g" d4 y" z; w( F
6 h# d( u! [/ w ]9 `" V
8 n% ?2 j) I' J& E Z3 Z# E" C
- G; w D/ C+ u+ U( A+ q6 Q( a, s# d
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 4 z$ H) O+ h5 f: b) W7 a) n
; L- j: M/ l7 ]$ i) m4 J! O6 V+ `
2 a" v2 j# v4 e, D, l9 [$ x这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。- Z! k$ } U* h- Y
2. 加权轮询,使用weight参数设置,配置如下8 T6 F! b) N% P: L
H9 ^- z _/ ~! i3. ip_hash策略
- U8 {# Z1 ~& M6 y(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
0 @4 v# r$ \4 o- `1 S 其他地方保持不变,在upstreaem中如下设置:- m7 m% p+ b- R$ R g2 S, H
3 F: G. m S8 d
! H M3 ^8 ^* x; I" I4 B
( p, |, G9 L T, P' y. i
/ F* j# ?8 ?0 z4. fair策略
9 D" J+ q( f5 I: x {; G; ^(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
( d. C: w7 @3 G+ ]& j" Z) Q, W5. url_hash策略+ X# b+ ` @6 e! m' x
1 \+ k% W# A6 \# f3 A& s) c- y(类似于ip,只不过绑定的值是url,这个也是第三方策略)
( \% T: b0 t, U! l# I! h3 x! Rfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
# E* Y2 J& N- L$ P0 A) N: B Z# Q% u4 ?& A0 L. I$ r, j* \
}6 Q& l7 u3 P$ R+ k
Y! ~, a( s7 ]# X$ |0 S
url_hash策略的用处?3 F# W5 q: H6 ~, v. }
' V. A* K V8 Z$ ^' \, Jurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。 z8 h1 T9 u" @
/ I) z- Z% J0 X" v! C8 w原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
" V$ O0 p/ x! z# o7 z9 C `* ^7 {" r
/ z6 t9 L+ L8 ?7 H' A. f& X! M" c0 x% W- }- n* q: G% ~9 c
6 X k+ t) p3 C- U7 c
其他的配置
# w4 N# M8 k8 z: I8 T: |备份与停机状态:$ [1 G7 P4 C! G' H% T2 F; z
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
@8 P- ^5 k6 u, m& d: E/ e( ?: _% i
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,, r1 x% b M a; J, p7 ^
6 z0 ^8 m7 {# ~( o ~$ Edown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。8 u1 x8 x6 X3 Z9 M j5 T
0 S: l( ^0 \6 L( _5 h& f
0 E( p7 i0 [0 S9 w4 `; D7 @
+ O- G( ? p! X# w0 Gmax_fails: 达到指定次数后认为服务器挂掉
/ C8 H" b" t! C1 W
" e K, ^4 B* f/ s fail_timeout:挂掉多久后再次测试是否已经挂掉
, m( g0 n5 W& h" K1 ~( L, i+ T2 K- i& c' P1 t" d8 x
配置命令: B2 i- h, r1 H6 |- N
5 G6 z, B6 C" \1 hserver 192.168.1.66 max_fails=2 fail_timeout=60s;
/ U' _. E7 v1 {* Q& C ` N" x- A& j" d- q2 f2 g+ T" w( n- }% u
后记
: n+ |- d0 U. `9 s我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
( }$ @6 c" f E P3 [, p) `% A$ f
: ?& S9 T% y% l9 }3 @, o: D' F1 e. v7 A. g) u; ^
! w5 M+ a7 {8 _( J
2 o" F5 |8 Y0 [+ F7 @; V% n8 N7 D
|