TCE-BS-003-041 腾讯专有云 产品架构设计 对象存储(CSP)V3.4.2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对象存储(CSP)产品架构设计
本文档著作权归腾讯云单独所有,未经腾讯云事先书面许可,任何主体不得以任何形式复制、修改、抄袭、传播全部或部分本文档内容。
及其它腾讯云服务相关的商标均为腾讯云计算(北京)有限责任公司及其关联公司所有。
本文档涉及的第三方主体的商标,依法由权利人所有。
本文档旨在向客户介绍腾讯云全部或部分产品、服务的当时的整体概况,部分产品、服务的内容可能有所调整。
您所购买的腾讯云产品、服务的种类、服务标准等应由您和腾讯云之间的商业合同约定,除非双方另有约定,否则,腾讯云对本文档内容不做任何明示或模式的承诺或保证。
编号修改日期修改人更新内容
01 2018-12-20 ajaxhe 第一次发布。
前言 (2)
目录 (4)
1.产品介绍 (5)
1.1.整体概述 (5)
1.2.产品优势 (5)
1.3.整体架构介绍 (6)
1.4.平台管理模块介绍 (7)
1.5.应用场景 (8)
2.功能介绍 (9)
2.1.关键业务流程 (9)
2.1.1.写请求 (9)
2.1.2.读请求 (9)
2.2.数据冗余策略 (9)
2.3.关键技术 (10)
1.产品介绍
1.1.整体概述
腾讯云对象存储旨在帮助客户降低企业存储数据成本,通过高效、灵活、自动化的方式,管理呈指数级增长的业务数据。
腾讯云私有云存储提供了大规模、可扩展的持久化分布式存储平台,管理分布式群集上的数据,并为对象级别提供存储接口,让您可以集中精力运行主要业务。
腾讯云对象存储服务是在腾讯多年的海量数据存储的经验之上,结合开源存储项目生态与自研组件服务,对外提供的可靠、安全、易用的海量存储平台。
您可以按需部署以实现企业的海量文件存储的需求,例如:文档、图片、视频等非结构化文件的存储。
使用HTTP RESTful API 协议作为基础接口,可以支持原生云计算应用、批量计算分析、归档备份以及内容分发等应用场景。
1.2.产品优势
数据稳定,持久可用。
基于腾讯公有云分布式存储架构,无单点故障;支持跨主机、跨机架、跨机房多种故
障域隔离策略;支持多副本方式冗余,数据分片存储分布在不同主机磁盘中。
弹性部署,按需扩容。
支持从TB 级到PB 级线性扩展,无需复杂的资源需求规划,即可满足业务增长需求,
提高资源利用率。
支持磁盘纬度、主机纬度在线扩容,批量部署,全图形化界面,快速
上线。
通用硬件,开放兼容
支持通用 x86 服务器,避免硬件厂商锁定;兼容S3访问接口协议,降低迁移成本;提
供RESTful API、多语言SDK,快速与上层应用集成。
简洁易用,灵活部署
提供简洁易用的可视化运维界面,掌握系统实时运行状态;支持客户机房部署、腾讯
云机房专区部署,满足不同场景需求;自动监控报警,故障时能快速定位、排查、解
决问题。
1.3.整体架构介绍
主要的模块如下:
⚫Data Access:负责对外提供API 接口,解析HTTP请求。
该模块无状态,可以根据用户流量的需求,实现分布式部署。
⚫Index Storage:负责存储对象元数据,该模块可以与Data Storage Device模块混合部署。
⚫Data Storage:模块负责管理磁盘存储,保障数据可靠性、安全性。
⚫
⚫
1.4.
1.5.应用场景
⚫安防监控
在安防监控领域,面对上千路监控视频流同时上传的业务场景,存储系统需要提供大容量IO 吞吐能力;受监管部门要求,存储系统还需要提供PB 级别存储能力以及监控视频检索能力。
⚫广电媒资
面对有大量UGC 内容生成、访问的业务场景,相比传统的磁盘阵列存储模式,对象存储分布式架构提供大容量IO 吞吐能力,能有效地解决了多点并发上传、下载的问题,轻松应对业务突发场景。
⚫备份归档
在法规要求下,很多行业(例如金融、医疗、传媒、教育、企业等)需要长期保存大量的合同、报表、邮件、工作文档等数据。
包括数据库在内的任何系统为了记录用户操作行为,需要保留大量用户行为日志。
将这些日志数据备份归档到对象存储中,将显著减少业务TCO成本。
⚫政企金融
受国家政策、行业监管要求,政企、金融客户需要将存储系统部署在自建机房中,分布式对象存储非常契合这类对安全要求较高的存储场景;数据文件分片散落在不同机架不同主机不同磁盘中,即便某台主机遗失,也无法恢复出原文件。
2.功能介绍
2.1.关键业务流程
2.1.1.写请求
数据写入可以分为如下步骤:
1.请求接入:使用特定语言的开发套件,与对象存储服务的接入节点建立连接,并向其发送数据。
2.数据分片:接入节点根据收到的数据,采取最优的分片策略,将一个较大的对象分为多个小文件。
3.数据路由:在接入节点完成分片后,根据这些信息,计算分片对应存储的机器节点,并将数据发送到对
应的存储节点。
4.数据存储:存储节点在收到数据后,将数据按照策略安全的保存为多副本或者纠删码。
2.1.2.读请求
1.数据读取操作与写入类似,只是数据流的流向不同。
2.请求接入:客户端与对象存储服务的节点建立连接,客户端向访问的节点请求数据。
3.数据路由:接入节点根据路由规则寻址到存储节点,读取相应的数据片。
4.数据修复:如果某些数据片损坏,存储节点将根据数据的存储策略进行相应的修复操作。
5.数据聚合:接入节点将数据片聚合为完整的数据,发送给客户端。
2.2.数据冗余策略
对象存储支持多种副本策略,来保证数据的持久性。
对于3副本策略,对于每一个对象,存储系统都会将其按照用户要求的故障域隔离级别,在多台机器上保存该对象。
在机器宕机或者其它不可恢复故障时,对象存储自动地将对象迁移到其它节点上,确保数据的完
整性。
3副本的冗余策略可以提供较高性能的读写能力,容忍磁盘损坏或者机器宕机等多种故障,保证数据可靠性。
2.3.关键技术
⚫无单点架构设计,PB级存储能力。
⚫对象存储系统的每个模块都是水平拓展的,没有故障单点,可以提供PB级别的存储能力。
在任意组件发生故障的时候,系统会自动修复数据。
对象存储系统基于分布式哈希算法来路由存储请求,客户端可以访问存储结点,简化存储路径,让对象存储系统具有优异的性能和海量的存储能力。
⚫海量文件存储与检索能力。
⚫对象存储针对于对象存储的读写场景,提供了key-based存储模型以及存储桶、对象的存储单位概念,简化了大量文件系统的不必要属性与语义,同时不同于传统文件系统的inode设计,对象存储独立数据与元数据的存储,让整个系统拥有海量文件的存储能力,不受inode的个数限制。
对象存储提供了简单实用的一致性模型"read-after-write",只要确认一个文件写成功,后续的所有读取操作都可以访问该文件,同时因为元数据的独立存储,检索路径短,与传统文件系统的多次系统调用相比,性能提升明显,让海量小文件存储没有瓶颈。