|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
) b4 Q" I% e4 W& y
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
) i$ ^, Z) z* R7 ~+ x# Z! i从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。! X3 I+ R$ ^, ~3 d1 ?/ s
: z# |) ]6 B' G5 u7 X& j" e, _( X
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)- Y7 b) A) }- O) s- t4 Y3 ?3 y
5 i* u0 a4 Z/ _. ]: D
! V& q. n. N6 O; l; ]1 U& l+ v- worker_processes 1;0 Y n* B' l" [
- events{
复制代码
, E1 ~. \" H& Y/ U, {# U/ J# S7 \4 l( u4 `0 Q* a8 U
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方5 K* ^1 \* Q) F4 ~- j- y( N
% {& \1 G/ ?8 h6 _( Y- `# F
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
" f5 Y$ \( Y' Q, r1 \) S: I/ L% S! w
5 u" n$ }! i& ]. O接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
! G# Y0 m# \8 R9 n1 k+ D7 u9 e$ c7 w! t4 O- P6 [
' n, k4 i0 i9 f& n `
) Q% M/ f% P ]5 d: k
* l! r5 U2 R- u$ w2 M, R负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: * t% \' L6 i! S" n" \6 T
5 F9 [- J& g! e& Y( L& L0 q
& [: L Q% b$ M% e, x8 S( ~
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。& f' P4 c# { J! s+ ?
2. 加权轮询,使用weight参数设置,配置如下. \# L0 ^' i8 S( e7 T
6 f h! e7 y' R) g3. ip_hash策略5 d# r2 w+ v; b+ I C
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
8 x; |4 u( G6 Q. ^( Z 其他地方保持不变,在upstreaem中如下设置:
/ l) G/ \! Y, U K3 X" p: ?9 ?4 b/ t& w, ?* p. H8 w
5 z: N$ q4 _' [& s
7 R5 E: E9 s0 O/ \6 N; t7 y, M7 @+ v/ u$ B, ]: B X+ w
4. fair策略' z+ m# x- |% X4 g- A- [
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略). {, |. ?* k* [- j0 Q K+ e. x$ _
5. url_hash策略
/ }: _ j" ~( m: s! A* U
9 `/ i. b2 W/ x- d* u2 Q(类似于ip,只不过绑定的值是url,这个也是第三方策略)2 o) i; t9 w* u: r8 | F- [
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可, l" c c) n4 A& u1 m e9 u
* R" } j6 T# `+ T
. h1 U: c' e3 L4 p7 L
2 B4 L5 [7 Y+ u7 p5 H A0 Turl_hash策略的用处?2 b/ }4 Z0 y* z5 w+ {9 [
" A! u0 ?: M# a3 f4 N# w9 U
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
2 ^+ t8 \, m; I. I4 i* g) b
0 A) L1 U+ \2 C# g% T, x原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
; g3 C' X8 t- j. e
1 k- O" t3 U2 [& R+ q2 l; p" N2 e p# h3 h
0 t' m4 Z, q" R. r$ o, A' g
其他的配置$ Z/ o, L: g# J; M0 r6 W
备份与停机状态:8 w6 _, Z# M4 O' s- G8 S
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
, d5 W* G* [( @5 s& ~( M
" s' k \3 z$ M' ^server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
% F" l, W% S' A6 C8 u, x* }. C5 O
/ ]5 W- N& o; M4 v! `4 H3 L1 xdown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
3 O. I6 n0 E. U
3 {- L7 T3 F7 J8 ~# ?
# ? m* F4 b0 {' [+ B8 H0 w% c y5 P9 r( z
max_fails: 达到指定次数后认为服务器挂掉' p$ r& k, g+ V( C9 i
- y* u# k- n, F' W* ? fail_timeout:挂掉多久后再次测试是否已经挂掉: C1 V. e, [- w: C9 G, p& E) D
3 C1 d, g. Z, Q3 u' n
配置命令# A) I/ I$ i- _9 X* t' v
* L, y* v7 {& _- \2 X; v3 ]
server 192.168.1.66 max_fails=2 fail_timeout=60s;) C0 O; z! S( D5 `+ b
P" w9 `2 Q3 Q" k" _7 q
后记
' @: d# G! F9 E8 m, d我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。% \1 A5 y/ j6 v$ S, C, O8 [
. E5 [3 `; p0 k. t4 s1 B3 w! r3 q% u! Z3 C, |+ e5 N
1 p' K# }: [' q$ h4 j- c# x
2 n4 v6 i4 X7 {$ O+ U
( N% k" d: W, [" {6 F7 C |