学校数据中心存储系统的设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学校数据中心存储系统的设计
班级:07级计算机与技术2班 姓名:xx 学号:200706404102xx
摘要:存储系统作为数据的载体,是高校信息化设施的重要系统。针对高校业务特点以及存储系统的技术发展,提出高校数据中心的存储系统的规划设计和建设思路。
关键词:数据中心;集中存储;D2D;应用系统;灾难备份
1 概述
伴随着信息化建设的深入,高校信息化的应用系统构架和数据存放模式也逐渐发生着变化,正在向着海量存储,集中管理的数据中心模式转变。数据中心IDC是数据运算/交换/存储的中心,通过IDC实现对用户的数据、应用程序、物理构架的全面整合和集中管理。在信息社会的今天,存储系统作为数据的载体,其重要性也越来越大,甚至成为决定高校信息化系统建设成败的关键因素,所以,数据中心建设要周密考虑存储系统的规划方案和建设思路。
高校数据中心包含邮件服务、门户网站、FTP、VOD、办公系统、一卡通系统等多种应用,还需要为教育系统内其他部门提供服务器托管业务,满足存储空间的扩展需求。除海量数据以外,数据中心还拥有20~30台服务器,属于典型的多服务器集中,海量数据存储的环境。高校信息化数据中心往往运用多套应用系统,为了提高存储设备的应用效率降低整体拥有成本,需要建设集中的存储系统,搭建性能优异、经济高效、方便管理、扩展性强的存储平台,需要建立数据备份机制,保障办公系统、基础数据信息、电子资源、邮件系统的数据安全。此外应用系统的保护和快速恢复、灾难备份也是关注的重点。如图1-1,一个中等规模数据中心的数据需求如表。
图1-1数据中心日常业务表
2 数据中心存储系统需求分析
(1)具备极高的安全性存储系统采用的是应用与数据分离的方式和结构,因此,系统必须考虑如何保障应用服务器与存储系统之间的连接和访问的安全性。
(2)具有先进的体系结构,易于扩充采用先进、成熟的技术,使存储系统整体上具有较快的响应速度和更高的数据带宽,可以长时间承受大量用户极高频率和速度的访问,同时,还必须保障系统具有良好的架构,产品具备良好的扩充性。
(3)具有运行稳定,关键应用无单点故障的特点图书馆所有应用数据及全校的应用数据集中后,数据的安全性和稳定性非常重要,因此,存储系统应考虑冗余配置,减少单点故障,使其能够支持对图书馆所有应用眼务器的不问断访问。
(4)具有较高的性价比采用优良的系统设计及多种存储架构,并充分考虑到存储系统的性能、价格、使用寿命以及系统投产后的后续成本等因素,以满足未来数年图书馆网络及校园网对存储容量及性能的要求。
(5)具备良好的兼容性存储系统应能够同网络及主流的操作系统、主流的服务器平台、数据库系统、应用软件较好
地结合,并保证应用系统在升级后能够进行平稳的数据迁移及系统过渡。
(6)具有高可用性保障存储系统应能实现可靠的系统备份和重要历史数据的有效归档及恢复,为应用系统提供高可用性保障。通过使用可靠、便捷、功能强大的管理软件,实现数据自动化存储,减少对人工
干预的依赖。
3 存储系统的原理和技术
3.1 常用的海量信息存储系统模式
随着信息数据成几何级数增长,海量信息的出现对数据的存储、访问、共享、备份等提出了更高、更多的要求。信息数据的存储方式从最初的直接存储,到光盘、光盘塔、光盘库存储,再到后来的磁盘阵列存储,其随数据量的增长而不断发展的速度非常之快,然而,单一的盘阵如今已不能很好地满足海量数据存储的需求了。图书馆因所收藏的信息资源量大,数字资源多而对此感受尤深。
因此,各种基于海量数据存储的新型存储构架模式应运而生,如近两年在IT界颇受关注和重视的SAN、NAS及DAS存储模式就是能较好地满足海量信息存储需求的先进存储模式,自然也是我们优先选择的对象。
3.1.1 DAS存储
DAS存储(direct attached storage,直接附加存储,或称“直连存储”)是将存储设备通过SCSI接口或光纤通道直接连接在各种服务器或客户端扩展接口下的存储方式。这种存储方式通常也能存储一定数量的信息数据,但其数据的共享具有很大的局限性,服务器无法扩展为更大的集群,在数据访问速度和存储系统的扩展上,较难形成大规模集群存储的能力,比较适合于存储数量少、扩展较慢的核心数据口。
3.1.2 NAS存储
NAS存储(network attachment storage,网络附加存储)是一个有很大存储容量的设备,通过集线器(hub)或交换机(switch)直接连在网络上,并直接通过网络存取数据,实现海量数据的网络共享。NAS由核心处理器、文件服务管理工具、一个或多个硬盘驱动器组成,可以应用在任何网络环境中。NAS具有磁盘阵列存储的高容量、高效能以及能保证数据完整性的RAID功能等主要特征,还具有磁盘空间扩展简单、管理方便的特点,它使磁盘空间的扩展如同在网络上添加了打印机一样简单方便。它通过标准的网络拓扑结构连接存储设备,无需服务器直接上网,不依赖通用的操作系统,而是采用一个面向用户设计的、专门用于数据存储的简化微内核操作系统(如嵌入式Linux系统,和优化的文件系统,内置了与网络连接所需的协议,使其更适于文件存储;对硬件也进行了优化,因此使整个系统的管理和设置较为简单。NAS是真正即插即用的产品,物理位置灵活,可放置在工作组内,也可
放在其他地点与网络连接,提供方便快捷的存储服务,因而,具有更高的性能价格比。但它也有一定的局限性,比如:由于NAS是基于网络的存储系统,当网
络中的存储介质增多时,存储/访问数据时可能会“争先恐后”,如果再受到网络带宽的限制,就会影响其速度,从而降低存储系统的性能;而当它占用大量网络流量时,也会影响校园网络的性能,等等。此外,作为文件级的存储方式,NAS采用NFS、CIFS等网络文件协议,而不是块协议或数据库协议,从而不能支持数据库服务。
总之,NAS比较适用于存储容量需求大而对传输速度要求不高的数据,而不太适合关键数据或事务的应用。
3.1.3 SAN存储
SAN存储(storage area network,存储区域网)是独立于服务器网络系统之外的高速存储网络,这种网络采用高速的光纤通道作为传输媒体,专用于存储,不占用服务器运算处理的网络带宽,通常由RAID阵列、带库、光盘库和光纤交换机组成。SAN和服务器之间的的通信访问通过FC+SCSI应用协议进行,数据则以数据块的形式被访问,将存储子系统网络化,实现真正的高速共享存储。SAN消除了服务器的许多I/0处理瓶颈,适合海量数据传输、实时数据处理。此外,SAN全面突破了传统存储技术的局限性,将网络管理的概念引入到存储管理中,将存储技术带入了一片全新的天地。SAN技术面向大容量数据多服务器的高速处理,包括高速访问、安全存储、数据共享、数据备份、数据迁移、容灾恢复等各个层面,与其他的存储模式相比,它具有明显优势:·基于千兆位的高速高效存储带宽,更适合海量数据高速处理的要求。
·完善的存储网络管理机制,能对所有存储设备,如磁盘阵列、磁带库等进行灵活管理及在线监测。
·将存储设备与主机的点对点的简单附属关系升华为全局多主机动态共享模式。
·可实现LANfree,数据的传输、复制、迁移、备份等均可在SAN网内高速进行,不需占用WAN/LAN的网络资源。
·无限的动态平滑扩容能力。
·兼容以前的各种SCSI存储设备。
· 灵活的网络体系结构,包括点对点、FC—AL仲裁环、Fabric交