宅急送基础设施平台规划建议书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
宅急送基础设施平台规划建议书
1. 公司简介
宅急送公司恪守“安全、准确、亲切、视服务为生命”的经营训诫。
自1994年成立以来,公司以跨越式成长的发展进度,在全国建立了庞大的“快运网络”,以优质的服务赢得了国内上千家著名企业以及广大民众的信赖。
以“不言实行,忠效为先”的企业精神,矢志成为民族快运行业的一面旗帜,挑起中国快运追赶世界水平的重任。
2008年,公司总资产5.25亿元,年营业额12亿元。
2008年,公司在全国拥有580家全资分支机构、500余个操作点及1000多家加盟特许经营合作网络,业务可覆盖全国2800多个城市和地区。
2008年,员工15000名,车辆1900台,年货物进出港量7000万件,年递增率超过45%。
公司在华北、华东、华南设有三大物流配送基地,4个运转中心,同时拥有38个航空口岸,191条航线,近1500个航班,518条物流班车线,纵横交错的空陆网络为全国快件业务及时保驾护航。
2. 建设背景
宅急送公司于1994年成立,随着客户需求的增加,业务的不断扩展目前已成为中国速递行业中的佼佼者之一。
随着中国速递业的蓬勃发展,各大速递公司之间的竞争日趋激烈,服务的质量和效率直接影响着各速递企业的声誉和经济效益。
宅急送公司希望通过借助计算机、网络数据中心、现代通信、多媒体等丰富的信息技术手段的建设达到以下目的:受理客户的接单请求、查单服务、客户信息管理从而提高企业经营效率并降低成本;整合企业内部资源,提升业务处理能力,使呼叫中心不仅成为与客户有效联络的统一的服务窗口,还要与业务系统能够进行高效的集成,更要成为企业的生产系统,对利润的产生有直接的支持。
综上所述,由于行业特点,宅急送公司系统对安全及稳定性的要求很高。
所以我们根据以往经验,按7X24小时提供服务的严格要求来规划该系统,这就要求系统从网络、服务器、软件集群、电源保护等提供全方位的保障,降低甚至避免故障的发生。
同时,还要在软硬件的热部署、热替换方面作充分的考虑。
下面从这几个方面分别阐述。
3. 基础设施平台建设规划
3.1网络
核心网络使用3台CISCO千兆交换机,全网络连接,提供高可靠的核心连接。
汇聚层交换机、主要服务器使用trunking技术。
在网络的分层结构和宽带的合理分配方面,TRUNK被解释为“端口汇聚”,是带宽扩展和链路备份的一个重要途径。
TRUNK把多个物理端口捆绑在一起当作一个逻辑端口使用,可以把多组端口的宽带叠加起来使用。
TRUNK技术可以实现TRUNK内部多条链路互为备份的功能,即当一条链路出现故障时,不影响其他链路的工作,同时多链路之间还能实现流量均衡。
简而言之,它是将多条连接捆绑合并,做为一条逻辑上的主链路提供连接,链路间透明的提供负载均衡和故障切换的技术。
核心业务网络通过两条租用线路接入Internet,在线路上互为备份。
3.2服务器
服务器方面,主要包括应用服务器、数据库服务器、接入服务器等。
在业务系统核心应用服务器和数据库服务器上实现双机保护,从而提高系统的高可以性,保证业务顺畅、不间断的运行。
3.3电源保护
由于用户对系统的可用性的高要求,所以系统需要全面的电源保护方案,而不是简单地做一个"后备电源"。
这个保护方案应该在保障"不间断供电"的原则下,尽可能地提供基于电力供应的全方位的保护,如消除电网杂讯、抑制电网波动、防雷击等,并最大限度地与信息系统的其他部件实现技术或物理模块上的整合,形成一个智能的、层层递进式的立体保护网。
电源保护分为对关键业务服务器的电源保护、对工作站和PC的电源保护、对网络互连设备的电源保护和对数据传输线路的电源保护四部分。
该策略主要有以下几个内涵:1.对于单纯的硬件而言,电源保护不是最重要的,真正重要的是对网络可用性的保护。
2.网络系统更加复杂,数据要求更加严格,对关键设备的保护更加重要。
3.在设计电源保护方案时应该综合考虑对关键服务器、工作站和PC、网络互连设备、数据传输线路等方面的保护,优化对整个网络的电源保护。
4.在设计电源保护方案时,应关注电源保护系统的管理。
能将有关信息通过网络传递给操作系统或网络管理员,便于进行远程管理,节省时间和资金。
3.4集群
应用集群是提高应用服务器性能的一种有效的解决方案,它是一种以资源的冗余为代价来获取高质量的服务的方法,这里高质量的服务中的质量主要体现在服务的吞吐量、服务的速度、服务的容错能力等。
集群的基本原理是在服务器端部署同一个应用的多个冗余实例,由调度模块对这些实例进行统一的调度,当客户端提出应用请求的时候,调度模块从多个冗余实例中选择一个最佳的实例为客户提供服务,而这个过程对于客户端来讲是透明的。
由于服务器端多个冗余实例都能为客户提供服务,因而提高了整个服务器的吞吐量和服务的速度,当服务器端某个实例出现错误的时候,调度模块会将出错实例中的任务重新分配给其它的实例来继续完成,因而集群能够具有容错的能力。
一个简单的集群体系结构如下图所示,图中红线表示请求与响应,绿线表示服务器实例端内部通信。
3.4.1集群的特点
集群的体系结构使得集群具有可以动态扩充的特点,也就是说,服务器多冗余的应用实例可以动态增加和减少,当客户请求量增大,现有配置的实例的数量不能满足需求的时候可以增加新的应用实例,而当客户的请求量明显减少,现有配置的实例数量造成了明显的浪费
的时候,可以适当减少实例。
由于多个实例同时服务,因而服务的可用性得到了大大的提高,服务器不会因为某个服务实例的失败而导致整个服务的失败。
集群系统另一个非常重要的特征就是负载均衡,当某个服务实例的负载很大而存在其他负载很小的实例的时候,调度模块会根据一定的调度策略将重负载实例中的部分负载重新分配给其他实例,这样,就实现了负载均衡的功能,从而提高了整个服务器的服务性能。
综上应用程序服务器群集有以下好处:
✓可扩展性
可以增强应用程序的能力;
✓高可用性
如果群集中的一个应用程序服务器实例失败,应用程序处理将可以在群集中其他应用程序服务器实例上继续进行;
3.4.2基于硬件的集群
通过共享外部存储子系统,使用多台服务器来提高系统的可靠性和可伸缩性。
3.4.3基于应用服务器的集群
✓数据库方面:
可以使用RAC来提高系统得可靠性。
例如ORACLE10g的RAC(Real Application Cluster)在硬件群集的基础上,实现了数据库管理系统的群集,可以方便灵活的实现高可靠性部署,自动的故障迁移,确保数据库系统的不间断运行。
✓应用服务方面:
可以使用WebSphere或者weblogic搭建应用集群。
业务应用集群目前通过两种方式实现:EJB对象集群,集群Cache。
两种方式可以独立使用也可以在一定程度上混合使用。
J2EE规范支持对EJB对象的负载平衡及故障恢复。
对于程序的编写者服务是透明的。
负载均衡服务处理对于对象的Lookup操作,定位EJB对象及EJB对象的业务方法。
由故障恢复服务确定Home skeleton的调用在集群中如何路由,确定remote stub业务方法的调用是否在另外一个服务实例上重新执行。
使用集群Cache的集群方案, 发布到集群的服务器通过集群Cache的组播来同步应用数据。
通过前端的负载均衡器,DNS轮询等方式来提供负载均衡。
也可通过负载均衡器来提供故障恢复功能。
3.4.4硬件负载均衡器简介
硬件负载均衡器包括Intel、Alteon Web、Arrow Point(已被思科并购)、Coyote Point、F5 Networks、FoundryNetworks、HydraWeb RADWare等。
负载均衡器的形式多种多样,Alteon、ArrowPoint,将负载均衡器集成到交换设备中,置于服务器与Internet链接之间; Coyote Point、F5 Networks 以及HydraWeb则运用两块网络适配器将这一功能集成到PC中,其中一块连接到Web服务器所在的网段上,另一块通过路由器或其他设备连接到Internet上。
一旦负载均衡设备检测到所管理的每台服务器承载的负荷量,它会按照一定的算法来分配通信。
Arrow Point公司的CS-100、F5的Big/ip、以及Coyote Point公司的均衡器都支持循环均衡功能。
其处理方法是,均衡器同时向所有可用服务器以命令序列方式发送相同数量的请求。
Alteon的AceSwitch 180、Coyote Point的均衡器、F5 Networks的Big/ip以及RADWare的Web服务定向器支持这样一种均衡方法:它能以最小的TCP链接将请求发送到服务器。
Arrow Point的CS-100还支持静态负荷均衡选项,这就是说,为服务器分配请求是建立在事先已指定负荷量的基础之上的。
3.5存储
3.5.1业务分析
宅急送公司建立核心业务数据中心的策略,适应了运输行业数据集中存贮的趋势,对于
一个从事物流运输业务的公司来说,数据的安全、高效存储是系统建设的重中之重。
宅急送公司的数据存储具备以下特点:
✓数据集中存储
所有的业务数据都存储在一个中心,数据的分布存储不能满足系统的要求。
✓数据种类多
数据种类不仅包括核心业务所需要的基础数据,应该还包括办公自动化数据,电子邮件数据等。
✓数据安全性要求高
数据的安全是公司正常运营的前提,保障客户服务也要求数据安全性。
✓数据机密性较强
客户的资料和账户数据等敏感信息需要为客户保密。
✓数据增长量大
通常的大型物流运输公司数据每天以大约10M-20M的速度增长。
✓数据备份及管理的工作量比较大
3.5.2容灾级别分析
数据容灾可以被划分为几个基本的等级,用户能够识别自己的需求属于哪个等级的话也就可以基本了解需要使用哪些软硬件设施了。
1.低级容灾
低级容灾是在本地进行备份和存储的冷备份,实际上这也是我们通常所使用的数据备份方法。
这个等级的数据容灾通过普通的磁带机就可以完成,当需要存储较多的数据时,可以利用多磁带机和磁带轮换方案进行解决。
2.中级容灾
中级容灾是在本地进行备份的同时,也在异地存储的冷备份,这个等级已经具有了基本的容灾性。
相对于本地备份和存储的冷备份这个等级的数据容灾,需要备份设备具有更高的备份容量及备份速度,而且最好有专用的备份软件进行备份管理。
对于大多数的企业而言,这种等级的数据灾备就可以满足基本要求。
3. 高级容灾
高级容灾基本需要使用热备份技术。
一种典型的方案就是在异地建立一个数据的热备
份,通过网络进行数据备份和恢复操作。
这种等级的数据容灾通常需要使用较大型的磁带阵列、磁盘阵列以及光盘柜等等,而且必须使用足够专业的备份软件来完成所有的运作。
在这种等级的数据容灾中通过光纤线路进行备份等先进的备份技术已经成为比较常见的选择。
最高的数据容灾等级同样使用热备份作为容灾处理手段。
但是与单纯的热备份相比,应用地的数据与备份地的数据不再是主从关系。
所有数据存储地点的数据都作为一个数据备份体系的节点而存在,所有的节点之间互为镜像。
在发生灾难事件的时候每个节点都可以随时提供可用的数据。
这个等级的数据容灾已经具备了应用容灾的框架。
3.5.3容灾建议
鉴于系统的复杂程度,单纯依靠数据库自身的备份功能,不足以保证系统的灾难恢复能力。
系统的数据量对普通的硬盘、以太网等在容量和性能上也是一个考验。
好的存储解决方案应该具有以下特征:
✧根据预先设定的策略自动备份、智能的增量备份、异地备份(可应对地震、洪水、
火灾等不可抗因素)等。
✧备份数据足够全面(包括应用备份),可使应用系统完整恢复,而不止是数据恢复。
✧备份时间足够短,即性能足够好,对正在运行的系统性能影响尽可能小。
✧能在用户的存储需求增长时轻松的进行升级和扩展。
因此,我们建议可采用软硬结合的方式:
软件支持各种数据备份策略和各种存储设备,可采购第三方产品。
硬件方面,为保证容量、缩短备份时间,可使用高速光纤网络(存储区域网,SAN),高速磁盘阵列(RAID),大容量磁带机(TAPE)等。
安全性和冗灾支持方面,光纤接口提供了10公里的连接长度,这使得实现物理上分离的、不在机房的存储变得非常容易。
结合宅急送公司的具体情况,我们设计了如下存储拓扑图:
存储服务器
所有的服务器共享一个磁盘阵列,服务器通过光纤交换机(SAN)与磁盘阵列和磁带库相连,光纤磁带库可以远离机房放置,以防止各种地震、火灾、水灾等自然灾害。
两台光纤交换机互为备份,提供更高的性能和可靠性。
目前磁带库硬件设备的特点如下:
✓高速:
磁带数据持续传输速率高达到30MB/秒,由此,备份及恢复时间大为缩短,极大地提高了生产效率。
✓可靠:
磁带系统数据可靠性高。
✓大容量:
磁带容量为100GB,数据可压缩存贮。
为避免各种灾害导致的数据丢失,用户可以在10公里以内的地方部署磁带库,也可以将数据备份到磁带后,将磁带放到更远离机房和更安全的地方,确保数据安全。
3.6容灾备份
3.6.1备份
备份是最普遍的用于保证数据可用性的方法。
在进行备份时宅急送公司需要考虑到以下几个因素:
✓设备的协同工作能力
✓存储的容量
✓介质的寿命
✓所选用的备份软件
目前主要可以采用的手段有:磁盘、磁带驱动器、大容量移动存储介质、CD 盘、网络备份(包括使用网络存储设备和网络磁盘)、复制和同步以及INTERNET 在线备份。
可通过采用镜像备份方式将计算机中所安装的系统、应用软件和相关设置存储成一个镜像文件,以便以后能完整恢复数据、系统和相关的设置。
对于镜像备份的恢复会将计算机完全恢复成镜像前的情况,因此镜像备份对于恢复大量的标准化配置的计算机方面有一定的优势。
另外日志备份也必须建设,该技术通过将对数据的各种操作的日志记录通过网络通讯线路远程的备份到异地的存储设备上,一旦发生故障,可以通过存储在远程的日志信息对数据进行恢复处理。
例如ORACLE10g的Data Guard技术。
对于数据库服务器的备份相比终端要更为频繁。
通常情况下可以采用以下几种手段:
✧完全备份:对于服务器上所有的数据和文件进行备份;
✧增量备份:只备份自从上次备份以来创建的或是经过修改的文件;
✧差异备份:只备份自从上次完全备份以来创建的或是经过修改的文件;
当然在具体使用时可以考虑多种备份手段结合起来使用,每种手段使用的频率各不相同。
同时,在使用备份技术时还应当考虑以下安全相关问题:
✧备份介质的选择:
明确应当尽量采用存储时间长的存储介质,或者采用两种以上的存储介质对重要数据进行保存,以防止由于存储介质失效而导致的数据丢失。
✧备份介质存放地点的选择:
对于备份介质的存放地点应当尽量保存在一个安全的环境中。
以防止由于一些环境因素造成存储介质的提前实效或损坏。
同时,对于一些存储了非常重要信息的介质可以考虑
采用异地保存的方式,就是将该数据的另一个副本存储在不同的地域。
以防止由于意外事故造成的备份数据丢失。
3.6.2容灾
在通常情况下,建立容灾系统的目的是为了保障以下内容:
✧实时数据保护-数据复制、近乎0的数据丢失、数据一致性
✧应用系统恢复-恢复时间(包括数据库恢复)、应用版本的一致性(PTF)等
✧网络系统恢复-数据访问点变化、建立新网络路径、动态路由(收敛时间/稳定
性)
✧容灾切换决策-及时发现灾难(容灾系统管理)、容灾切换的损失和补救办法
✧容灾切换过程-变更管理
宅急送公司系统相关的灾难备份方案设计要考虑以下五大因素:
✓灾难类型
需要考虑哪些灾难?怎样的灾难?会使业务中断多久?
✓恢复速度
灾难发生后需要多久来启动及运行系统?能否承受数天或数分钟的等待?
✓恢复程度
部分数据可以不恢复,或者可以有选择的恢复。
✓可用的技术
必须结合考虑所选技术在本地区的适用性、实现条件以及在实施时是否受某些现有条件的制约?
✓方案总体成本
实现灾难备份需要多少投资?不实现灾难备份会造成什么损失?
综合以上所述,如下图所示:
用友公司在着手设计开发冗灾系统前,会从这五个方面综合考虑,设计符合宅急送公司的容灾系统。
宅急送公司也肯根据具体情况,建立异地的备份中心,备份机在热待命状态下运行,数据同步采用实时或者定时的方式进行。
备用系统存在的目的在于保障系统部分重要应用的不中断,所以备用系统的建设可以比正式系统配置低。
在正式系统出现问题的时候,由介入系统负责把请求转向备用系统。
正式系统恢复后,由备用系统向正式系统交换数据后,起用正式系统。
备份系统的设立目的在于防止数据的丢失和临时接管正式系统,所以在业务分发的时候,建议备份中心只处理查询业务,避免后期带来风险。
4. 设备选型
4.1硬件选型
待定
4.2软件选型
待定。