hbase列式存储原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
hbase列式存储原理
HBase是一个开源的非关系型数据库,它的存储基础是一种列式存储结构,下面我们来具体的介绍HBase列式存储的原理。
1、传统行存储
传统的关系型数据库,以行为存储单位,一条记录是由一行定义的,每一行后面跟一个结束符,行后面的结束符可以是回车符,也可以是其他的特殊字符。
2、列存储
在列存储中,以列为存储单位,一条记录都是由一列定义的,列的值可以是字符串,也可以是任意类型的值,列也有一个结束符,其他逻辑上与传统行存储类似,只是存储层次上的结构变得更加灵活更加紧凑。
3、HBase行列存储
HBase可以说是行列存储的一种组合,就是将行与列结构结合起来形成一个复杂的结构,为HBase提供表格的数据表示,每一行可以由多个列组成,每一列都由一个列簇和多个列族组成。列簇分为主列簇和多个副列簇,主列簇只能有一个,它的列族可以由多个。这种行列存储模式可以把一个完整的记录拆分成多个小的单元,从而能更好的优化存储空间。
4、HBase列存储的优势
HBase列存储的优势有:
(1)高性能:HBase列存储把一条记录拆分成多个小的单元,
这样查询操作的速度会很快,因为数据库只需要读取所需要的列就可以,而不需要读取整行数据。
(2)节约存储空间:HBase列存储只存储被访问到的列数据,从而节约存储空间。
(3)易扩展:HBase很好的支持水平扩展,可以很容易地添加新的机器来支持更多的存储。
(4)分布式:HBase支持分布式,可以很好的支持大数据存储。
总结
以上就是HBase列式存储的原理和优势,HBase是一个开源的非关系型数据库,它的存储基础是一种列式存储结构,特别适合存储大数据,它的列存储把一条记录拆分成多个小的单元,查询操作的速度会很快,而且节约存储空间,还支持水平扩展,所以HBase 列存储是一种非常有优势的存储方式。