蓝光光盘库存储系统分类存储研究_姜晓青
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《工业控制计算机》2016年第29卷第8期面对海量数据大爆发带来的能耗,数据中心绿色节能建设已刻不容缓。由于数据中心中巨大的能耗中只有6%~12%被用于响应用户查询和计算,绝大部分电力能源都消耗在了磁盘存储上[3]。为了降低数据存储能耗,企业开始研发蓝光光盘库存储,利用蓝光光盘来存储冷数据。
1光盘库多层分类存储设计
存储数据分为热数据、温数据和冷数据,本文提出的光盘库
分类存储架构如图1所示,存储系统由固态硬盘、磁盘和蓝光光盘组成,上层通信层为文件管理系统,下层为存储模块。
图1
光盘库分类存储架构
系统为SSD 、HDD 和光盘库分别设计了存储管理模块,当文件被上传到系统时,先被热度状态转换模块更新热度状态、访问时间以及修改时间等信息,之后系统根据文件热度状态将文件存储到相应介质中。当一个文件被请求访问时,分类系统根据文件目录调出相应文件,如果文件存储在SSD 或HDD 中则直接响应,否则存储系统先将文件复制到HDD 中,然后更新文件热度状态。分层存储系统由文件存储管理、文件信息统计模块、
文件热度状态转换和文件迁移回迁组成。
2光盘库多层分类存储功能实现2.1光盘库文件信息统计
信息统计模块用来统计文件管理相关信息变量,主要参数包括:时间参数t old 、t new ,标志参数changeFlag 、ssdFlag 、hddFlag 、
bdFlag ,文件热度状态status 、文件访问热度状态visitStatus 和路径参数path_disk 、path_bd 。
t old 、t new 分别表示上次物理访问时间和当前物理访问时间,visitStatus 根据二者之间时间间隔来确定。visitStatus 可取值0、1,分别表示冷访问和热访问;ssdFlag 、hddFlag 、bdFlag 用来标记存储文件存储的位置,分别对应SSD 、HDD 和光盘库。三个标志位取值如表1所示:
表1
参数path_disk 用来表示文件在SSD 固态硬盘或HDD 磁盘中的存储路径,参数path_bd 用来表示文件在光盘中的存储路径。其中ssdFlag 、hddFlag 取值不可同时为真,当ssdFlag 或hddFlag 有且仅有一个为真时,path_disk 值有效,否则无效。当bdFlag 值为真时,path_bd 值有效,否则,path_bd 值无效。
2.2光盘库文件热度状态更新
热度状态转化基于文件物理访问时间,每个文件的物理访问时间都会被系统记录,分别为t old 、t new 。文件热度分为hot 、
warm 、cold 三种状态,分别存储在SSD 、HDD 、蓝光光盘,文件
蓝光光盘库存储系统分类存储研究*
姜晓青(广东工业大学计算机学院,广东广州510006)姜红(钟祥市柴湖一中,湖北荆门431900)
许俊彬(广州飞机维修工程有限公司,广东广州510470)
Study on Classification of Blu-ray Optical Ddisc Library Storage System
摘要:随着蓝光存储技术的发展,大容量蓝光光盘库存储系统开始应用到数据存储领域中。光盘库存储已经成为时下研究的热点。根据文件访问频率设计了基于文件热度的光盘库分类存储系统,实现数据分类存储,将不同热度的文件分别存储到固态硬盘、磁盘和蓝光光盘库中。利用蓝光光盘存储冷数据,降低冷数据存储能耗,实现数据节能存储。
关键词:光盘库,冷数据,蓝光存储,节能存储,能耗
Abstract :This paper designs a classification storage system for optical disc library which is based on file access fre-quency and the files with different heat will be stored in SSD,HDD and Blu-ray disc library,which achieves data classifica-tion storage and saving-energy storage,while reducing the energy consumption of cold data storage.
Keywords :optical disc library,cold data,Blu-ray disc storage,saving-energy storage,energy consumption
*广东省重大科技专项(2015B010108005)
图2热度状态转换图
97
蓝光光盘库存储系统分类存储研究
热度转换如图2所示。
文件热度状态转换存在2种方式:文件定时扫描方式和文件热度访问方式。
文件定时扫描方式基本方法是设置一个时间阈值t s,系统根据当前文件扫描时间和上次文件物理访问时间之间时间间隔与t s的关系来确定文件热度状态转换。
文件热度访问方式基本方法是设置一个时间阈值t t(t t≤t s),根据文件连续两次物理访问之间的时间间隔决定文件访问热度,再结合文件当前热度状态确定文件热度状态转换。
由于3种状态的文件分别存储在不同媒介中,不同媒介在数据传输速度和响应时间上存在差异,特别是在光盘存储中,响应时间差异更大。因此,分类存储系统中热度状态转换可分为以下2种分类:
1)hot与warm之间热度状态转换。hot热度状态文件存储在SSD中,warm状态文件存储于HDD中,二者之间状态转换存在上述2种方式,分别用来针对长时间不妨问的文件和短时间内文件访问频率较高的文件。
hot→warm文件定时扫描时,如果当前文件扫描时间与上次文件物理访问时间之间的间隔大于t s,则表明文件访问频率不高,文件热度状态由hot状态更新为warm状态。反之,不进行状态更新。
hot←warm为了避免访问文件在SSD和HDD之间频繁迁入和回迁,该方向上的状态转换采用文件热度访问方式,系统将文件访问方式分为hot访问和cold访问。文件连续两次物理访问之间的时间间隔小于阈值t t,则当前访问状态为hot访问,该文件短时间内访问频率较高,热度状态应由warm变为hot;反之,则为cold访问,不进行状态更新;
2)warm与cold热度状态转换。cold热度状态的文件存储在光盘库中,文件刻录之后是无法删除的。因此,warm与cold 之间的热度状态转换过程如下:
warm→cold文件定时扫描时当前文件扫描时间与上次文件物理访问时间间隔大于t s,表明文件几乎不访问,文件热度状态由warm状态更新为cold状态。反之,不进行状态更新。
warm←cold当访问的文件存储在光盘库时,被访问的文件应立即从光盘库中复制到HDD阵列中,并且标记ssd_hddFlag为1,记录ssd_hddPath路径值,同时将文件的热度状态由cold状态更新为warm状态。文件热度状态更新算法如算法1所示:
算法1文件热度状态转换算法
stateUpdate(fileinfo&file)
{
//文件扫描方式下文件热度状态转换
if scanFlag=true then
interval←current_time-file.newAccessTime
if interval>ts then
if file.hotState=hot then
file.hotState←warm
end if
if file.hotState=warm then
file.hotState←cold
end if
end if
else
//文件访问方式下文件热度状态转换
file.oldAccessTime←file.newAccessTime
file.newAccessTime←current_time
interval←file.newAccessTime-file.oldAccessTime
if file.hotState=cold then
file.hotState←warm
else if interval<tt
if file.hotState=warm then
file.hotState←hot
end if
end if
end if
}
在算法1中,参数scanFlag是文件扫描的标志,默认值为false,当系统定时扫描启动时,该值被设置true,扫描完成后,恢复默认值。
2.3光盘库文件迁移回迁模块
文件迁入/回迁模块是基于文件信息统计模块和文件热度状态更新模块的。由于不同类型的文件要存储在不同的介质中,所以当系统中文件的热度状态被更新后,就会调用文件迁移/回迁功能。文件迁移和回迁是文件状态更新上两个不同方向上的文件转移,其中文件迁移是将文件热度状态较高但访问频率却很低的文件进行转移;而文件回迁则是由于用户的访问行为导致文件热度状态较低的文件访问频率却很高而发生的转移行为。
文件迁移模块分别扫描热数据视图和温数据视图,并得到文件列表,然后根据文件热度状态、文件存储路径以及文件标志位来转存文件;在温数据向冷数据转存过程中要注意判断bd-Flag是否有效。
文件回迁分为光盘库向HDD回迁和HDD向SSD回迁。前者ssd_hddFlag和bdFlag都有效,后者仅ssd_hddFlag有效。在文件回迁过程中,如果文件在光盘库中,只需要将其复制到磁盘中即可,同时要设置ssd_hddFlag和ssd_hddPath;而当文件在磁盘中时,则需要将其剪切到固态硬盘中。文件迁移/回迁实现算法如算法2所示:
算法2文件迁移/回迁算法
moveFile(fileinfo&file)
邀
if file.hotState=hot then
if file.ssd_hddPath=hdd then
copy file to SSD and remove file from HDD
end if
else if file.hotState=warm then
if file.ssd_hddFlag=1then
if file.ssd_hddPath=SSD then
copy file to HDD and remove file from SSD
end if
end if
else
if file.ssd_hddPath=HDD then
if file.bdFlag=1then
remove file from HDD
else
record file to BD file and remove file from HDD
end if
end if
end if
妖
2.4光盘库文件存储管理
文件管理模块根据存储介质差异性可分为硬盘存储管理和光盘库存储管理。
硬盘管理包括SSD文件管理HDD文件管理,用来存储和管理温热数据。其中SSD用来存储热点数据和文件目录,HDD 存储温数据。文件目录即存储系统所有文件的状态、存储位置、修改时间、访问时间、标志位等相关信息组成的记录集。文件目
(下转第100页)
98