Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, 0 ?( K& K$ {( m/ x2 Y
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
- }) D1 P6 Z3 U# K- `9 C从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
! J5 D& u, K7 ^& E. z
7 [; j( E4 D& ?' x' A4 c那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)- Y" n5 R/ L! R' Y) e# n
2 E+ J' Q, q/ p+ Z" K( ^
+ w n2 M- d, I; Z- worker_processes 1;) I6 g# X# L3 L2 U, W/ ~6 I
- events{
复制代码 8 v! U5 g0 a, I
- G, ]2 N1 t0 R' r, H; S' D重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方/ x- Q8 L- `( _3 S
- V2 S n0 O4 z0 M0 _8 }1 T
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
/ o' Y) y' o, Y: k2 p6 M$ P$ I5 r( N
" }, c3 o l* v1 w. W5 a接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
; m" a( b. ^) r4 b4 H! s; F' j, o5 i" |; n% ^1 R) @
. Z/ v/ ^4 P; |8 w$ }" Q, e
# j! l c* Y, G3 q r7 x R
* i, Y6 C( U3 r" @( V! u负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 1 F0 |# |6 Y6 H8 S4 Q
0 g6 \: _7 P P& W1 I2 T% M6 ?3 s: J, k# G
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。 n% K5 j+ S8 A0 {" o
2. 加权轮询,使用weight参数设置,配置如下
, ^4 A! \) }7 c! a. U7 W& T
- f. ]: q Y4 v& E) R& z# O3. ip_hash策略
( c1 V: G' p7 Y" }* s(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:9 ?# a f3 j9 ]
其他地方保持不变,在upstreaem中如下设置:
1 O. z& W" w* ^/ _! i. {
* m7 X4 L; A; Z* k8 h9 E/ I2 }, Y
* f" i) F# B( f S$ J! ]& ^+ d; {
: h; ~: J6 F7 N5 k' O( [: O+ s
- @. | i0 `: H% O# J1 z" M. i, J6 Y
4. fair策略
8 ^/ @+ R# o3 Y/ M' M; q- c(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)( g$ `) X; ?' i: f; I
5. url_hash策略
/ [0 ?8 Y4 b3 g* M k3 Z* L) b: I+ y7 z# y% Z/ n# K: Q u9 ]
(类似于ip,只不过绑定的值是url,这个也是第三方策略)( O8 U5 E6 | W% l6 A: T* y
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可! v9 v$ a# d ~, [
% w5 [ W$ Y; `% S! d
' e. h7 x" G2 S# Z7 Y# {+ t0 ]6 G4 U5 h0 k" b
url_hash策略的用处?8 P7 ^& y( R' T9 h' E9 Z5 I+ k/ T
3 x$ v7 S3 M' f& T! l q
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。' ^! l1 e [- b5 c% T
u) }+ j- l5 L! x" S* V6 m- Q- s
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;1 e6 N5 ~1 q) M6 ]
: w1 ~2 c4 s, Z) f) c2 w
- m2 Q, y7 H8 u1 L; s2 F
& g3 z/ S) O8 V6 Y9 i1 {' E
其他的配置
& j# p+ U7 j! k. `9 ^备份与停机状态:( l) z3 h& u2 Q
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;6 A+ D2 f: K, n. B& }: y
! ]& ?: p/ b' e
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,& z0 ~4 `/ m# ~$ g
: C: ^( _( P- v. T. _1 }# _& ^: o3 Ndown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。3 L, A5 R: Q# M) o
" R7 ^8 q* j* l, Q# f
4 m3 W" e9 r4 V# x. E2 Z6 A- s% j
max_fails: 达到指定次数后认为服务器挂掉
/ X) l$ y( }- `4 t( U: d: Q. N" t0 _* y7 _" b
fail_timeout:挂掉多久后再次测试是否已经挂掉
6 K" k6 r, F/ X% A" V
( l" g! `' t" l& h5 |配置命令
v0 a, v! o7 w
7 B L! `$ i2 f; c7 d/ L. Rserver 192.168.1.66 max_fails=2 fail_timeout=60s;
3 h& n& P" w" `/ {# a$ B1 g( V8 k. b, c
后记! {4 c7 Z5 J" o0 t3 \' ?8 x6 x
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。$ G1 ~% b% @" s0 U3 Q; }4 s
9 r' x/ ^; e, G B$ ~9 J/ }# i/ O1 w9 K) I5 k
8 D. j4 _ d: {" f( k: q" o! I4 f2 P
/ ~8 r) d+ ]: r- T* T7 V0 T |