闪存数据库_现状_技术与展望_王江涛
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 5 5 0
计 算 机 学 报
2 0 1 3年
理速度提高近 6 而磁盘的读写速度只提升了 0 0 倍, 不足 1 低速的磁盘已经成为制约系统性能提升 0倍, 的瓶颈 . 随着多核 、 这 G P U 等高性能处理器的出现 , 磁盘自身机械寻道特性使 一现象必然会更加 突 出 . 数据处理急切需要新型高效 其性能难有大幅提 升 , 的存储设备来提高存储系统的性能 . 诞生于 2 0 世纪 ) 为解决这 8 0 年代末的 闪 存 存 储 器 ( F l a s h M e m o r y 一问题提供了有效途径 . 闪存是一种全电设备 , 通过 具 有 非 易 失、 极高的读写速 电子电路来 读 取 数 据 , 抗震 、 低功耗 、 体积小等特性 , 目前已经广泛应用 度、
)
)
) S c h o o l o I n o r m a t i o n, R e n m i n U n i v e r s i t o C h i n a, B e i i n 0 0 8 7 2 f f y f j g 1
) S c h o o l o C o m u t e r S c i e n c e a n d T e c h n o l o u a i i n N o r m a l U n i v e r s i t u a i a n, J i a n s u 2 2 3 3 0 0 f p g y,H y y,H g
, r o w i n o u l a r i t A b s t r a c t i t h t h e o f f l a s h m e m o r f l a s h h a s b e e n w i d e l u s e d i n v a r i o u s W g g p p y y y , , , , t e s o f a l i c a t i o n s s u c h a s m o b i l e d e v i c e s P C m a c h i n e s a n d s e r v e r s . F l a s h a s a n e w t e o f y p p p y p , s t o r a e m e d i a u n l i k e d i s k, h a s i t s i n h e r e n t r o e r t i e s w h i c h i n c l u d e n o n v o l a t i l i t h i h a c c e s s - g p p y g , , , , , o w e r r o e r t i e s s h o c k r e s i s t a n c e l o w e r a n d h i h s t o r a e d e n s i t e t c . T h e s e h o w e v e r s e e d p p p g g y p w i l l b r i n n e w c h a l l e n e s f o r d a t a m a n a e m e n t .A l t h o u h d i s k b a s e d d a t a b a s e m a n a e m e n t s s - - g g g g g y , t e m h a s t h e o w e r f u l a b i l i t f o r m a n a i n d a t a i t s c u r r e n t t e c h n i u e s c a n n o t m a k e f u l l u s e o f p y g g q / , h i h I O e r f o r m a n c e o f f l a s h m e m o r i f w e t r a n s f e r i t t o f l a s h w i t h o u t m o d i f i c a t i o n. T h e r e f o r e p g y , i t i s a h o t t o i c t o d e s i n a n d i m l e m e n t f l a s h b a s e d d a t a b a s e s s t e m s . I n t h i s s u r v e t h e n e w - p g p y y , r o e r t i e s a n d t r a n s l a t i o n l a e r o f f l a s h i s i n t r o d u c e d f i r s t l . S e c o n d l s e v e r a l d a t a b a s e c r i t i c a l p p y y y , , o n b u f f e r i n d e x,q o t i m i z a t i o n a n d t r a n s a c t i o n a r e s u r v e e d a n d t e c h n i u e s u e r r o c e s s i n p y y p g q ,w c l a s s i f i e d . T h i r d l e d i s c u s s s o m e r e s e a r c h i s s u e s o n f l a s h b a s e d h b r i d s t o r a e s s t e m s .A t - y y g y , , l a s tb a s e d o n t h e a n a l z e d r o b l e m ss u e s t i o n s f o r f u t u r e r e s e a r c h w o r k s a r e u t f o r w a r d . y p g g p ; ; ; K e w o r d s l a s h m e m o r b u f f e r i n d e x; h b r i d s t o r a e u e r f y y g q y y 发展 , 数据产生的规模和速度呈现爆炸式增长 , 海量
: , F l a s h B a s e d D a t a b a s e S t u d i e s T e c h n i u e s a n d F o r e c a s t s - q
1 WANG J i a n a o -T g
1) ( 2) (
) , 2)
1 1 A I W e n u NG X i a o F e n L -Y ME - g
] 1 2 - 于嵌入式系统 、 航空航天 、 消费电子等领域 [ 闪存 .
每个块 K 9WAG 0 8 U 1 A① 闪存芯片包 含 8 1 9 2 个 块, 由6 每一个页由数据区和备用区组成, 4 个页组成 , 2K B 的数据区用于存储用 户 数 据 , 6 4 B 的备用区用 、 来存储校验 逻辑 页 地 址 等 信 息 . 闪 存 具 备 读、 写和 擦除 3 种操作 , 页是闪存的基本读写单位 , 重写数据 前必须进行擦除 , 擦除操作以块为单位 , 执行时间和 能耗远高 于 读 写 操 作 . 在 页 被 擦 除 前, S L C 型闪存 最小写单元 可以对同一个数据 页 进 行 多 次 写 操 作 , 为5 闪存 芯 片 的 读 写 方 式 与 磁 盘 截 然 不 1 2 个字节 . / 同, 二者的 I O 操作性能对比见表 1.
第3 6卷 第8期 2 0 1 3年8月
Βιβλιοθήκη Baidu
计 算 机 学 报 CH I N E S E J OUR NA L O F C OMP UT E R S
V o l . 3 6 N o . 8 A u . 2 0 1 3 g
闪存数据库 : 现状 、 技术与展望
王江涛
, 1) 2)
1 引 言
随着 社 交 网 络、 物联网等新技术和应用的快速
数据处理给计算机 系 统 性 能 带 来 巨 大 挑 战 . 作为数 据主要存储介质的磁盘已经越来越不能满足实际应 用对存 储 带 宽 的 需 求 . 在 过 去 的 几 十 年, C P U 的处
; ) 、 收稿日期 : 最终修改稿收到日期 : 本课题得到国家自然科学基金 ( 国家“ 八六三” 2 0 1 2 1 2 2 4 2 0 1 3 0 4 1 7. 6 1 0 7 0 0 5 5, 9 1 0 2 4 0 3 2, 9 1 1 2 4 0 0 1 - - - - ) 、 ) 高技术研究发展计划项目基金 ( 中国人民大学科学研究基金 ( 资助 . 王江涛 , 男, 2 0 1 2 AA 0 1 0 7 0 1, 2 0 1 3 AA 0 1 3 2 0 4 1 1 XN L 0 1 0 1 9 7 8年生, : 博士研究生 , 中国计算机学会 ( 会员 , 主要研究方向为闪存数据库系统 、 混合存储系统 . 赖文豫, 男, C C F) E-m a i l i a n t a o w@r u c . e d u. c n. j g 硕士研究生 , 主要研究方向为闪存数据库查询优化 . 孟小峰 , 男, 博士 , 教授 , 博士生导师 , 主要研究领域为网络数据 1 9 8 9 年生 , 1 9 6 4 年生 , 管理 、 云数据管理 、 移动数据管理 、 社会计算 、 闪存数据库系统 、 隐私保护 .
[] / 表 1 闪存与磁盘 I O 性能对比 4
的读写速度超过磁 盘 百 倍 以 上 , 随着制作工艺的发 展, 闪存的容量不断增大 , 应用领域开始逐步扩展到 高吞吐 、 数据访问密集的企业级应用环境 . 图灵奖获 “ 就像磁盘取代磁带一 得者 G r a y 先 生 就 曾 预 测:
赖文豫 孟小峰
1)
1)
1) ( 中国人民大学信息学院
) 0 0 8 7 2 北京 1 ) 2 3 3 0 0 江苏 淮安 2
2) ( 淮阴师范学院计算机科学与技术学院
摘 要 随着闪存存储技术的发展 , 闪存已经广泛 应 用 于 各 种 移 动 设 备 、 作为一种完全不同于 P C 机 和 服 务 器 中. 磁盘的新型存储介质 , 闪存具有非易失 、 高速读写 、 抗 震、 低 功 耗、 高 存 储 密 度 等 物 理 特 性, 这使得基于闪存的数据 数据库系统是数据管理的重 要 技 术 , 将现有的数据库系统直接移植到闪存上并不能充分 管理问题成为新的挑战 . 发挥其硬件特性 , 设计实现基于闪存的数据库系统是当前的一个研究热点 . 文中 介 绍 了 闪 存 的 特 性 和 闪 存 转 换 层 ; 总结了缓冲区 、 索引 、 查询和事务等数据库关键技术 ; 讨论了基于闪存的混合存 储 数 据 管 理 . 最后, 基于该领域亟待 解决的诸多问题 , 指出了未来的研究方向 . 关键词 闪存 ; 缓冲区 ; 索引 ; 查询 ; 混合存储 / 中图法分类号 T P 3 1 1 D O I号 1 0. 3 7 2 4 S P. J . 1 0 1 6. 2 0 1 3. 0 1 5 4 9