|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
9 t4 b) L4 c$ p7 G( s
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ . _: q; y1 M# ~4 N% W
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
$ J' t$ h( ]% q. ^
3 L; n+ w7 ?2 v: S: u那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)4 t% l" Z. p. @; W8 e# l3 l8 r: U
# E6 `! q( t/ `* J" a/ R) {7 [1 ^2 N; N; J- Y8 J( N& K# {
- worker_processes 1;
' d1 s9 c; M5 \1 C$ O - events{
复制代码 $ v( X* G% d- G/ W7 Q8 Q
M8 }) O# O0 r, h0 Y7 P( i重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方; c! k* q4 p' `1 f7 `
3 K5 E3 ]+ a0 K* \比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
- l0 Z+ E: I9 n0 t
9 E4 @# B2 l! Z1 [+ X
& y4 Z9 g$ {& M m接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
- N; d# I7 F% v: g/ c" {4 L: P* Y9 v' c& G
6 M" N; e3 z1 w' A3 ^8 ^9 i) B! S
* }9 Y& e! G3 T8 J& S, c9 O0 H+ A
* v9 {' b$ K5 c! F, P4 V9 _& D4 y( ?$ R
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: S8 |( T2 G- q; e- N4 q
0 Q$ a4 ]' l1 f+ N
( p- R3 y) M* y6 G, o8 f5 Q. I0 b) `这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
9 D8 F6 l6 s( c; e. O, o) y 2. 加权轮询,使用weight参数设置,配置如下( n! @* Y, E* }" j9 S3 q, P
, B. Q6 N& H6 C2 [. j/ k; m5 _3. ip_hash策略
, v+ A& |8 o: n% c# D' i+ y- x(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:( Y* ~0 F g; Q; O
其他地方保持不变,在upstreaem中如下设置:5 v& H! {5 @0 O! W( c
8 f& Q2 C, \! R5 O1 F9 W& X9 p8 n
7 I- S- G7 m3 M7 T, l
6 b& _% I& k$ p" j
$ r1 N% o) s5 H# c4. fair策略
& R4 I i$ k8 c: x(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略); \! ^: Z' H' [- y+ F5 t
5. url_hash策略
' }. c9 V* V/ j& N) @& _3 T" U* ?
(类似于ip,只不过绑定的值是url,这个也是第三方策略), z* e& p2 V& u; c6 ^/ ~
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可" r' k1 S; _( m
2 w7 K$ q* x0 {; A/ W- ^( U
3 F: q j& ^ f# n% \" `! C4 o3 W% x
4 M5 ]0 v2 O& X. V1 curl_hash策略的用处? L: C9 d6 K# @0 I9 F0 e
0 ?; }, ]" x2 d9 Murl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。$ p' G* x5 H, P- G! \2 o: L% G
0 @) \' T$ }7 L1 X' Y5 p* I4 j$ E原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;+ g: P3 ]" q! {
7 @6 Z9 l4 ]2 Y
7 k+ ?/ ~4 F4 e( F% K) t/ v* f5 h9 s: [
其他的配置" e h- i$ t3 G
备份与停机状态:
; h& E% i9 ]' B |4 i% y9 s8 ?server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
, P6 i# K: d! C7 R, E$ G0 D
0 R6 F0 x# Z% _server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
2 q1 i2 ]+ [4 i5 K! l
, S1 ^0 n5 l" y- |) q$ p' ^down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。. L0 a0 M; I, q4 P# Y1 ^
9 A( `" h/ D. d6 g1 i
# N7 c7 {' E( S5 U# u& y& O, g8 [( \4 @2 P
max_fails: 达到指定次数后认为服务器挂掉
2 ]3 n2 |6 L' I- C+ d+ t: P B& o) t& N2 w" A" K P
fail_timeout:挂掉多久后再次测试是否已经挂掉
4 i+ i' I7 {6 G% A# ~- o* E1 n4 g
2 l5 H6 \( d- F! z配置命令7 B+ |9 e: F, W3 H' `, o
1 W8 s X9 k4 l, Hserver 192.168.1.66 max_fails=2 fail_timeout=60s;
0 ]' o$ \- u6 [$ N! j3 |9 S+ q4 A6 N1 G5 d* u
后记# Y3 Q3 R4 d" Z+ m- M) I) Y2 Z
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
- N" o+ N! h ~1 o7 M* ?
' S d: [- `$ a( o& W% x) S; n
& C# \2 c, U" Y# [' o+ }. L9 Z+ q6 a+ {: l$ y$ A
/ W; |$ o# G1 { r, r. f9 h- h. F
0 T% F% s3 A& f1 n |