大鱼集群存储系统-海量小文件存储解决方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大鱼集群存储系统
海量小文件存储解决方案
北京聚存科技有限公司
BEIJING AGGSTOR TECHNOLOGY CO., LTD.
大数据时代数据量爆炸式增长,数据对象数量也指数级升高,海量小文件已成为一类非常典型的海量数据应用,如拥有数以亿计商品图片的电商平台,每日上传大量用户文字、照片的Web2.0网站等。但现有传统文件系统多面向机械磁盘设计,难以高效应对海量小文件应用场景,存在诸多问题。
海量小文件环境下,元数据操作比例大幅上升,大量并发的随机磁盘访问,
极大降低了机械磁盘运行效率,导致文件检索速度极差,甚至会出现大目
录无法打开的情况。
文件检索困难
海量小文件环境下,由于文件较小,数据读写也同样表现为随机模式,数据访问延迟较大,而用户业务多采用同步方式处理海量文件 ,系统整体的IOPS 表现极低,业务操作耗时居高不下。
读写性能低下
管理海量文件困难众多,备份数据、删除文件、文件整理等日常运维操作,都会相当耗时,甚至会持续数天。同时,这些
操作也消耗大量系统资源,影响前端业务的正常运转。
运维困难
某些高端存储设备采用大容量缓存和大量SSD 磁盘来提升海量小文件性能,但是成本较高。另外,业务中经常出现的小文件及大文件混合应用的场景,也进一步降低了产品性价比。
成本问题
作为专业存储软件、系统及服务提供商,聚存科技多年来致力于研究并解决用户应用领域的数据存储问题,研发了面向大数据优化管理的大鱼集群存储系统,并通过对上述海量小文件存储问题的深入研究,基于大鱼存储系统,推出了针对海量小文件各类典型业务全面优化的存储解决方案,帮助用户构建高性能、高可扩展、高可靠、易管理的数据生产和处理平台。
北京聚存科技有限公司(简称聚存科技)成立于2010年,是一家专业的存储软件、系统及服务提供商。公司凝聚众多存储领域资深专业人才,致力于海量数据的优化管理,专注于自主技术创新及客户应用需求,借助差异化服务全力为客户创造最大价值。公司位于海淀区中关村软件园,是北京市软件企业和中关村高新技术企业。
性能卓越接口丰富稳定可靠轻松管理
文件数据与元数据分离存储和管理,各自专门优化。元数据服务器基于内存实现,采用
share-nothing 的集群机制,突破元数据性能瓶颈,支持百亿级别文件总数目和千万级单目录文件数目。
元数据性能优化设计
系统聚合性能随节点数目线性扩展,完美应对高性能计算中常见的大规模并发数据I/O ;单流读写性能优化,多磁盘优化调度、前后端SSD 缓存,元数据内存存储等多种优化方法,进一步提升系统性能表现。
前后端SSD 性能加速
主流通用x86服务器及以太网络
构建,经济可靠;灵活的存储策略可充分利用少量SSD
即可达到可观性能;弹性扩展,按需购置。
成本可控
高可用集群架构,数据智能冗余分布,系统无单点故障,数据实时校验,故障自动切换,数据自动恢复,确保数据安全可靠及业务连续。
安全可靠
数据服务器支持SSD和大容量磁
盘混插设计(用户自定比例),
并通过独有的策略存储机制,充
分利用SSD来提升小文件和热点
数据性能,同时使用大容量磁盘
来存储大文件及冷数据。
策略存储
特有的客户端磁盘缓存功能,可利用
多块SSD在客户端构建大容量高速缓
存,智能透明的缓存大量热点小文件,
减少多次后端网络及磁盘开销,提供
最优的性能体验。
客户端SSD缓存
Copyright © 2016 北京聚存科技有限公司 版权所有,保留一切权利。
提供离线文件元数据数据库支持,可通过SQL
接口来简化和加速海量小文件的查询,并为业务统计提供有力支
持。同时,提供了一批高效工具(如快速批量删除),减轻海量文件的运维难度。运维支持
API 接口(C++/Java/Python )提供了强大的新型接口支持(如快速目录列举),用户基于API 编程,可克服传统接口的诸多局限,文件访问更加高速高效。
编程接口