Communication 版 (精华区)

发信人: freshwind (浮云流水|生命何物), 信区: Communication
标  题: 利用Web交换技术优化因特网结构 
发信站: 哈工大紫丁香 (2001年06月24日21:56:48 星期天), 站内信件

贵州省数据通信局 刘穗武

1 引言 

随着越来越多的用户加入到Internet这个全球网络中来,人们在网上的活
动也正在变化,从信息收集发展到购物、娱乐以及进行各种商业交易。面对不断增
加的负载和新的应用需求,网上业务的提供者需通过架构新的体系结构以适应其业
务的增长,Web交换机应运而生,为数据中心设备包括互联网服务器、防火墙、
高速缓存服务器、网关等提供管理、路由和负荷分担。

除了提供可由传统第二、三层交换机提供的连接和打包路由服务外,Web交换机
还可提供传统局域网交换机和路由器所不能提供的服务器负载均衡、存取控制、Q
oS保证及带宽管理等功能,可在应用层为运营商提高性能,增强安全性、可用性
和扩充能力。Web交换机又称第四层交换机,目前Web交换技术已由纯粹的传
输层(第四层)发展到具有基于内容(第七层)交换的智能,这种技术在新一代I
nternet中将会具有更广泛的应用。

2 Internet发展的新要求

2.1 Web服务器集群 

以单台服务器处理Web服务的结构已渐成历史,现在通常是以多台服务器联合支
持一个网站,并以一个单一的虚拟IP地址(VIP)代表整个服务器集群,由集
群中的多台服务器来分摊处理访问流量。这种结构使得某台服务器发生故障时,不
影响Web服务的继续工作,同时通过增加更多的服务器可以平滑地提升Web服
务的性能,具有较高的扩展性,这样在服务器之间起引导传输作用的负载均衡器就
成为必需。负载均衡器截取进入VIP的客户端请求,并将请求分配给相对性能最
佳的服务器。 

Web服务器的虚拟化也带来了内容管理方面的挑战。如果同一个网站的服务器都
能为任意请求提供服务,那么这些服务器就必须存取整个网站的内容,这在Int
ernet发展的今天几乎是行不通的。而且,服务器功能的专业化(如专门内容
存储和专门从事计算)也使内容的分离势在必行,如动态内容最好存放于经过优化
后适于运行Scripts和Java applets的高性能服务器,而图片
、样板文件、视频剪辑文件等静态内容可以存放于具有较大存储容量的低档服务器
,以降低成本。 

2.2 Web用户的虚拟化 

在有代理服务器、防火墙、VIP的服务器集群中,IP地址的简单的一一对应关
系不复存在,这就使IP用户不能再以其IP地址作为网络上的唯一识别标识。事
实上,由一个用户向同一个地址发出的连续性请求可能代表不同的源IP地址。这
会令持续性(persistense)难以实现。持续性是指把来自每个独立用
户的多个请求传递给同一台服务器进行处理,这对于网上购物等应用至关重要。在
线应用如购物卡或搜索引擎等应用常常需要持续的处理,这意味着一个客户在一个
会话期间要不断地与同一个真实服务器对话,而且可能是由多个TCP连接完成。
如购物卡,如果一个客户和服务器连接不是持续的,可能导致购物破裂,甚至授权
给其他用户。持续性连接有助于提高服务器效率,实现网上购物、多页表格的状态
性事物处理。 

2.3 多媒体应用 

现代因特网上多媒体业务发展非常迅速,RTSP(实时流协议)和VoIP(I
P话音)协议在客户端和服务器之间利用不同的通道传送控制信息和数据流,用于
数据传送通道的端口号是动态产生的,并通过预先建立的控制通道在客户端和服务
器之间通信。为正确将这些应用程序送到适合的服务器,流量管理设备必须解析控
制通道传输的内容,以为数据通道析取出动态端口,使相关的控制和数据通道可作
为单一的逻辑会话进行处理。 

2.4 带宽管理 

Internet是各种用户的共享资源,对于网络运营商来说,不同层次地保证
不同用户的需求是十分重要的。对于电子商务应用而言,能否确保其Intern
et带宽至关重要,如果一个商业网站和影视站点共享Web托管资源,它就要避
免共享的路由器链路被大量视频下载所阻塞,或者是需实时传送的业务(如IP 
Phone)通道被大量静态数据传送所挤占。这种需求引发了服务质量(QoS
)技术。作为多台服务器连接Internet的接入口,需要在内容源头上实施
QoS控制,严格的QoS控制需要能够测量、记录、控制各Web站点的带宽使
用、目前登录用户、服务内容等能力,即具有带宽管理能力。 

3 Web交换对网络性能的改善 

为解决Internet发展所带来的新问题,基于第四层交换技术的Web交换
机应运而生。Web交换机完成连接建立,按应用或内容标识解析流量,运用服务
器选择算法,监视服务器的健康状态和性能,测量和控制服务器的带宽使用,完成
流量过滤和网络拓扑更新等。 

3.1 提高服务器利用率 

在会话过程中,服务器会将最近使用过的资料存储于内存中,在本机内存中存取资
料要比在后台数据库或硬盘存取资料快得多,具有内容智能交换功能的Web交换
机可发送具有相同网络跟踪器的成功请求到同一台服务器,利用服务器高速缓存提
高服务器的效率和性能。在使用高速缓存服务器的地方,Web交换机对进入的客
户端请求具备智能过滤能力,可避免将不相关的请求传递给高速缓存服务器。如动
态内容请求、具备内嵌网络跟踪器的请求等可直接转发到所请求的服务器,以减少
缓存服务器上不必要的负载。 

3.2 灵活分配服务内容 

Web交换机通过检验网络请求的URL,可确定受请求内容的类型,并将该请求
转发到存放该请求URL的服务器,这样,网站内容可在不改变应用程序的前提下
被分离,使得每台服务器只需拥有部分的而不是全部的网站内容,这使得经营者可
以使用专用于特定内容类别或处理功能的服务器。 

3.3 支持持续性连接 

"购物车"、付款交易、搜寻显示及多页表格等应用程序需要持续性的连接。目前将
多个连接匹配到同一个用户的可靠方式是匹配内嵌于非加密的HTTP连接的"网
络跟踪器"(Cookie),或内嵌于安全HTTP-S会话的"SSL会话识别
器"(SSL ID),具有这一解析内容能力的Web交换机能将来自统一用户的
连续性请求准确地与同一台服务器联系起来,实现会话的完整性。 

3.4 优先级别服务及带宽管理 

Web交换机可通过识别"网络跟踪器"为不同的用户类别提供不同优先级的服务,
同样,也可通过对URL的识别,为在传送不同的内容类别时分配适当的带宽。如
果对内容不敏感,传输分类及服务质量只可根据IP地址或应用端口等在初级层次
进行。 

3.5 虚拟主机的支持 

虚拟主机通过同一个IP地址代表多个域名,当Web交换机收到客户端对共用I
P地址的请求时,可从HTTP包头的"主机包头"部分析出请求的域名,然后将其
与IP地址配合,以取得唯一的主机识别资料,并将请求转发到适当的服务器。 


4 Web交换机体系结构 

目前有三种不同的Web交换机设计方案:集中式CPU模式、分布式处理系统和
二级混合模式。 

4.1 集中式模式 

集中式模式是将控制和交换部分置于一个中央处理器(CPU)上,这是典型的2
 / 3层交换机采用的结构,可以用软件方法将处理程序加载到系统中。第2 /
 3层交换机的交换部分可能在端口级具有分布特性,但在数据包对应的会话连接
,包括网络地址转换、TCP连接绞合等,必须由中央处理器处理后才能由交换部
分传送。 

这种模式特别适合访问流量从单一端口(如广域网连接)进入的拓扑结构,交换机
所有的处理能力和内存被集中起来处理该端口流量。但当会话流量负载很重,或流
量从多个端口进入时,所有的会话处理,甚至简单的包交换都得经过中央处理器时
,中央处理器很易成为瓶颈。这种结构缺乏扩展性,只适合预计流量较少和只需简
单流量管理的环境。 

4.2 分布式模式 

另一种交换机结构是采用基于端口的分布式处理模型。在这种结构中,每个端口都
有与之相连的控制和交换部分,其控制和交换部分之间的"距离"几乎为零,所有功
能都能在端口本地完成,业务处理速度很快,这种设计适合会话流量从多个端口进
入的拓扑环境。但在超过端口处理能力时,一个端口不能利用其他端口的资源,这
使得每个端口的成本较高,因为理论上每个端口必须有足够的内存处理进入端口的
所有流量;同时,一个端口不能利用其他端口上的信息进行流量决策,会导致某些
内容处理的混乱,如访问流量最初进入Web交换机的某个端口,而后由于拓扑结
构的变化导致随后的流量进入其他端口,相邻处理器不能共享会话状态信息,已建
立的会话连接将一直持续下去。 

4.3 二级混合模式 

鉴于上述两种结构的缺陷,自然提出了一种折衷方案,就是二级混合模式,这种体
系结构将所有控制部分集中在一个中央处理器,同时让每个端口有自己的传递部分
,这样Web交换机能适应网络的拓扑变化,共享控制部分的信息,不需要或很少
需要中央处理器的介入,就能执行基于端口的交换。 

这种架构的实现方案实际上是将属于第四层的会话交换部分(包括简单网络和TC
P端口地址转换)分发到各端口处理,而将属于第七层的TCP连接集中由中央处
理器完成。 

这种结构的效率和CPU部分可处理的各端口提交的控制处理任务数及CPU处理
能力有关。在大会话流量和复杂控制的情况下,控制处理器和连接中央控制部分的
总线可能会成为潜在的瓶颈。据此,有些厂商提出了所谓虚拟矩阵体系结构(VM
A),通过将大量网络处理器直接集成在高吞吐能力的交换矩阵上,使得由软件控
制的处理和各端口由硬件组成的交换引擎可以直接协同完成Web 交换。 

5 利用Web交换技术提升网络性能 

具有第四层交换功能的Web交换机在因特网上可以有很多具体应用,如Web 
Server的负载分担、认证服务器(RADIUS Server)的负载、
防火墙负载分担、全透明缓存、域名服务器(DNS Server)的负载分担
、函件服务器(Mail Server)的负载分担等,具体应用因实际网络结
构而异,在此仅以一个简单的Web Server负载分担为例说明其应用。 

目前Internet上广泛使用的Web Server(如Apache HT
TP Server Microsoft Internet Informat
ion Server Netscape Enterprise Server
等),采用的是多进程技术,占用资源较多,一般一台Web Server只能
承受几百个并发用户。解决其扩展性问题,传统的方法是增加多台Web Ser
ver,采用DNS Round Robin方式在Web Server群之间
实现负载分担。采用Round Robin方式存在着缺陷: 

1. 可靠性不足 

当某台Web Server不能提供服务时,DNS Server不能发现,仍
然按Round Robin方式把用户的HTTP请求平均分配到服务器群,导
致某些用户不能得到Web服务,影响系统服务质量。 

2. 负载分担不能实现 

在性能不同的Web Server之间平均分配请求,显然会造成性能低的设备
成为瓶颈,而性能高的设备得不到充分使用;即使是在性能相同的设备之间平均分
配请求,也会造成负荷不均,因为Web Server对每个不同请求返回的数
据量不同。 

利用一台第四层Web交换机可解决上述问题,结构示意图如下。 




Web Switch监测服务器的可用性,包括物理连接、Web Server
主机等性能状况,当发现某台服务器不能提供服务时,自动将Web请求分配到另
两台服务器上。同时依靠设置每台Web Server能承受的最大会话数、设
置溢出Web Server、备份Web Server等手段进一步保证系统的
可靠性。现有第四层交换机主要用Least Connection、Roun
d Robin、MinMiss和Hash等负载分担算法,以解决负载分担。
 

对某些跨国大型ISP,其Web Server可能不在一个局域网内,也可利
用Web Switch的Global Balance技术进行广域网范围的平
衡。

2001年05月11日  

--
 金风玉露一相逢
 便胜却人间无数

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: ce.hit.edu.cn]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:4.241毫秒