存储基础知识培训

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据写入
A,B,C,D,E,F
D0
C B A
D0
F E D
RAID
RAID(Redundant Array of Independent Disks):独立冗余磁盘阵 列,简称磁盘阵列。RAID是按照一定的形式和方案组织起来的存储设备。 它比单个存储设备在速度、稳定性和存储能力上都有很大提高,并且具 备一定的数据安全保护能力。
磁盘阵列

什么是磁盘阵列:磁盘阵列是一种采用RAID技术、冗余技术和在线 维护技术制造的一种高性能、高可用的磁盘存储设备。

磁盘阵列核心技术:

体系结构设计 缓存技术 RAID技术 主机通道连接技术
常见阵列体系结构

光纤通道主机 端口

CPU

高速缓存
• •
光纤通道 后端环路 •. . .

TCQ

Tagged Command Queuing ,标记命令队列

NCQ

Native Command Queuing ,本机命令队列,是SATA Ⅱ规范支持的一种新的功能,支持 NCQ的硬盘可以对指令进行排队(多达32条指令),重新编排指令执行次序,也可以立即
执行指令,可提高硬盘的性能,减少CPU占用率
阵列中磁盘数量越多, 数据备份的成本就越低
需要专用磁盘做校验盘 使用,如果校验盘故障 会导致数据无备份 任一磁盘写数据将会导 致校验信息的重新计算, 校验盘的写性能可能会 成为瓶颈
适合用于视频生成、视 频编辑等高吞吐量的应 用环境
RAID级别 —— RAID 4

RAID 4是带有共享校验硬盘的独立数据盘( Independent data disks with shared parity disk),与RAID 3类似,不同在于对数据访问是每 次一个盘,而RAID 3是每次一个条带,RAID4的读写性能较差,目前 较少使用
RAID6 P+Q的工作原理
RAID6 P+Q需要计算出两个校验数据P和Q,当有两个数据丢失时,根据 P和Q恢复出丢失的数据。校验数据P和Q是由以下公式计算得来的:
-P=D0⊕ D1 ⊕ D2 …… -Q=(α⊗D0)⊕(β⊗D1)⊕(γ⊗D2)……
驱动器1
驱动器2
驱动器3
驱动器4
驱动器5
P1 D3 D6 D9 Q5
RAID
RAID的数据组织方式
•分块:将一个分区分成多个大小相等的、地址相邻的块,这些块称为分 块。它是组成条带的元素。
•条带:同一磁盘阵列中的多个磁盘驱动器上的相同‚位臵‛(或者说是 相同编号)的分块。
驱动器1 D6 D3 D0
磁盘上的数 据分块
驱动器2 D7 D4 D1
磁盘上的数 据分块
驱动器3 D8 D5 D2
镜像结构的阵列
逻辑磁盘
D0,D1,D2经过镜像器
D2 D1 驱动器1 D2 D1 D0 驱动器2
D2
D1 D0
D0
RAID 1的特性
优点
缺点
应用范围
RAID 1对存储的数据 进行百分之百的备份, 提供最高的数据安全保 障 设计、使用和配臵简单
磁盘空间利用率低,存 储成本高 磁盘写性能提升不大
可应用于金融、保险、 证券、财务等对数据的

• •

Write-through

回写

CPU

CPU
CPU

CPU
直写
后端总线
后端总线

磁盘
控制器的缓存保护技术

三种常见控制器Cache保护设计

FC或IP(GE)

FC或IP(GE)

FC或IP(GE)

缓存(Cache)
• •

CPU

CPU
缓存(Cache)
Cache电池 CPU



...

光纤通道主机 端口

CPU

高速缓存

通常的中档控制器设计 单个或集群的双控制器 前端主机端口,后端光纤环路 镜像的高速缓存
矩阵式高端阵列体系结构

高端企业级磁盘阵列

CHIP

Cross


ACP

光纤通道

...
Bar


CHIP
ACP

光纤通道

...

光纤通道


4Gb/s
RAID 0的特性
优点
缺点
应用范围
I/O负载平均分配到所 有的驱动器。由于驱动 器可以同时读写,性能 在所有RAID级别中最 高。 磁盘利用率最高
设计、使用和配臵简单
数据无冗余,一旦阵列 中有一个驱动器故障, 其中的数据将丢失
视频生成和编辑、图像 编辑等对传输带宽需求 较大的应用领域。
RAID 1的工作原理

CHIP
高速

ACP

光纤通道

...

CHIP

ACP

光纤通道

...

CPU

高速缓存与共享内存
控制器缓存工作模式


主机写入

反馈

主机写入

• • • •
反馈

数据流
• •
写OK
数据流
写OK
前端总线 系统缓存 •读缓存 •写缓存

前端总线 系统缓存 •读缓存 写缓存


Write-back
可用性和安全性要求较
高的应用领域
RAID 3的工作原理
带奇偶校验码的并行阵列
D0,D1,D2,D3,D4,D5,D6,D7,D8
校验码生成
驱动器1
驱动器2
驱动器3
校验驱动器
D6
D3 D0
D7
D4 D1
D8
D5 D2
P3
P2 P1
RAID 3的特性
优点
缺点
应用范围
通过较为简单的异或运 算技术获得数据备份
存储基础知识培训 ——北京众志和达信息技术 2011年3月
Huawei Symantec Technologies Co., Ltd.
日程
1 2 3 4 硬盘技术简介 磁盘阵列简介 网络存储架构 存储软件功能介绍 备份基础知识 远程容灾基础知识
5
6
硬盘主要物理结构

盘片

Байду номын сангаас
磁头

马达(motor)
常见存储接口技术




IDE/ATA
SCSI
SATA
SAS
FC
FC接口概述
硬盘类型

ATA/IDE

SCSI

FC

SATA

SAS
接口视图

SC

LC
各类硬盘对比
ATA 转速(RPM) 缓存(MB) 串行/并行 容量(GB) 年失效率 AFR TCQ 7,200 8/16 并行 SATA 7,200 8/16/32 串行 2000 0.73% 支持 支持* Sata2.0 375MB/s SATA3.0 750MB/s SCSI 15,000 8/16 并行 SAS 15,000 8/16 串行 2000 0.55% 支持 支持 6Gb SAS 750MB/s FC 15,000 8/16 串行 450/600 0.55% 支持 支持 8Gb/s 1000MB/s

A0

A1

A2

A3 •B0 •B1

B2

B3

C0 •……

异或运算


A0 A1
• •

B0

C0 C1
• •

D0
P0



B1



D1

• •
P1
P2 P3
A2
B2
C2
A3

B3

C3
D2 •D3

数据盘
校验盘
RAID 5的工作原理
分布式奇偶校验码的独立磁盘结构
D0,D1,D2,D3,D4,D5
缓存(Cache)

CPU

CPU
后端总线
• •

CPU

后端总线

磁盘 后端总线


阵列外臵UPS

阵列内臵UPS

外臵UPS保护
cache电池保护

内臵UPS保护
磁盘阵列
磁盘阵列
JBOD
RAID
JBOD
JBOD (Just a Bunch of Disks) :是在逻辑上把几个物理磁盘一个接 一个的串联在一起,其目的纯粹是为了增加磁盘的容量,并不提供数据 安全保障。
250 —— 支持 不支持 不同接口速率 不同
300 —— 支持 支持 Ultra 640 SCSI 640MB/s
NCQ
接口速率

交易型数据使用FC、SAS,归档等使用SATA*
日程
1 2 3 4 硬盘技术简介 磁盘阵列简介 网络存储架构 存储软件功能介绍 备份基础知识 远程容灾基础知识
5
6


Duty Cycle

指硬盘的工作负荷, 定义为特定时间段内硬盘用于寻道、读/写操作的时间占总时间的 百分比。100%即表示硬盘每天24小时不停在进行读写操作

SCT

即S.M.A.R.T Command Transport,该技术在硬盘内部划出一部分扇区做为日志记录,分 析SMART命令包含的状态信息,判断硬盘的工作状况从而调节负载(比如数据流量)来保 证硬盘可靠性
Q1 P2
D0 Q2
D1 D4
D2 D5
条带0 条带1 条带2
D7
D10
P3
D11
Q3
P4
D8
Q4
条带3
条带4
D12
D13
D14
P5
RAID6 DP的工作原理
DP-Double Parity,就是在RAID4所使用的一个行XOR校验磁盘的基础 上又增加了一个磁盘用于存放斜向的XOR校验信息 横向校验盘中P1—P4为各个数据盘中横向数据的校验信息 例:P0=D0 XOR D1 XOR D2 XOR D3 斜向校验盘中DP1—DP4为各个数据盘及横向校验盘的斜向数据 的校验信息 例:DP0=D0 XOR D5 XOR D10XOR D15
常用指标

转速


平均访问时间

平均访问时间(Average Access Time)是指磁头从起始位臵到达目标磁道位臵,并且从目标 磁道上找到要读写的数据扇区所需的时间。平均访问时间体现了硬盘的读写速度,它包括平 均寻道时间+平均等待时间。平均寻道时间(Average Seek Time)是指硬盘的磁头移动到盘面 指定磁道所需的时间,一般8ms以内。平均等待时间是指磁头已处于要访问的磁道,等待所 要访问的扇区旋转至磁头下方的时间。平均等待时间为盘片旋转一周所需的时间的一半,一 般应在4ms以下。 传输速率(Data Transfer Rate) 硬盘的数据传输率是指硬盘读写数据的速度,单位为兆字 节每秒(MB/s)。硬盘数据传输率又包括了内部数据传输率和外部数据传输率。 内部传输率(Internal Transfer Rate) 也称为持续传输率(Sustained Transfer Rate),它 反映了硬盘缓冲区未用时的性能。内部传输率主要依赖于硬盘的旋转速度。 外部传输率(External Transfer Rate)也称为突发数据传输率(Burst Data Transfer Rate)或接口传输率,它标称的是系统总线与硬盘缓冲区之间的数据传输率,外部数据传输 率与硬盘接口类型和硬盘缓存的大小有关。 硬盘缓存的目的是为了解决系统前后级读写速度不匹配的问题,以提高硬盘的读写速度。

底座(Base)

PCB及RV传感器

硬盘接口
硬盘的基本参数

容量

硬盘的容量MB或GB为单位。容量指标还包括硬盘的单碟容量单,是指包括正反两面在内的单 个盘片的总容量 。单碟容量越大,单位成本越低,平均访问时间也越短。 转速(Rotational speed)是指盘片每分钟转动的圈数RPM(Round Per Minute) 。

传输速率
— —


缓存

硬盘的主要技术

S.M.A.R.T

Self-Monitoring ,Analysis and Reporting Technology ,自监测、分析及报告技术, 监测磁头、磁盘、马达、电路等部件,然后根据得到的关于各部件运行情况与历史记录 的数据进行分析、比较,根据需要会自动向用户发出警告

独立存取模式:对每个磁盘驱动器的存取都是独立且没有顺序和时间 间隔的限制,可同时接收多个I/O Requests,每笔传输的数据量都比较小。 -适用范围:数据存取频繁,每笔存取数据量较小的应用

RAID 0的工作原理
无差错控制的条带化阵列
逻辑磁盘 D0
D5
D0,D1,D2,D3,D4,D5
D4
D3 D2 D1 D0 D6 驱动器1 D4 D2 驱动器2 D5 D3
磁盘上的数 据分块 条带2(strip) 条带1(strip) 条带0(strip)
RAID数据存取方式
并行存取模式:是把所有磁盘驱动器的主轴马达作精密的控制,使每 个磁盘的位臵都彼此同步,然后对每一个磁盘驱动器作一个很短的I/O数 据传送,使从主机来的每一个 I/O 指令,都平均分布到每一个磁盘驱动器, 并 行 存 取 将阵列中每一个磁盘驱动器的性能发挥到最大。 -适用范围:大型的、数据连续的以长时间顺序访问数据为特征的应用
驱动器1 P2 D2
驱动器2 D4 P1
驱动器3 D5 D3
D0
D1
P0
RAID 5的特性
优点
缺点
应用范围
高可用性
异或校验影响存储性能 硬盘重建的过程较为复 杂 控制器设计复杂
适合用在文件服务器、 Email服务器、WEB服 务器等输入/输出密集、 读/写比率较高的应用 环境
磁盘利用率较高
随机读写性能高 校验 信息分布存储于各个磁 盘,避免单个校验盘的 写操作瓶颈
条带2
条带1 条带0
D0
各磁盘上的 数据块

D1
各磁盘上的 数据块
RAID 2是RAID 0的改良版,以汉明码(Hamming Code)的方式将数据进行编码后
分割为独立的位元,并将数据分别写入硬盘中。因为在数据中加入了错误修正码(ECC, Error Correction Code),所以数据整体的容量会比原始数据大一些。
相关文档
最新文档