大数据存储方式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
另外云数据库可以满足企业动态 变化的数据存储需求。
云数据库与其他数据库的关系
从数据模型的角度来说,云数据库并 非一种全新的数据库技术,而只是以 服务的方式提供数据库功能;
云数据库并没有专属于自己的数据模 型,云数据库所采用的数据模型可以 是关系数据库所使用的关系模型(微 软的SQL Azure云数据库、阿里云RDS 都采用了关系模型);也可以是NoSQL 数据库所使用的非关系模型(Amazon Dynamo云数据库采用的是“键/值”方 式存储),同一个公司也可能提供采 用不同数据模型的多种云数据库服务, 许多公司在开发语音数据库时,后端 数据库都是直接使用现有的各种关系 数据库或能收购数据库产品
展示完毕,感谢观看
No SQL数据库
关系型数据库已经无法满足Web 2.0 的需求。主要表现为:无法满足海量 数据的管理需求、无法满足数据高并 发的需求、高可扩展性和高可用性的 功能太低。
NoSQL数据库的优势:可以支持超大 规模数据存储,灵活的数据模型可以 很好地支持Web 2.0应用,具有强大 的横向扩展能力等,典型的NoSQL数 据库包含以下几种:键值数据库、列 族数据库、文档数据库和图形数据库。
大数据存储方式
由于轻型数据库无法 满足对结构化、半结 构化和非结构化海量 数据的存储管理以及 复杂的数据挖掘和分 析操作
通常使用分布式文件 系统、No SQL 数据库、 云数据库等进行数据 存储
01 分布式系统 02 No SQL数据库 03 云数据库
CONTENTS
目 录
分布式系统
分布式系统包含多个自主的处理单元,通过计 算机网络互连来协作完成分配的任务,其“分 而治之”的策略能够更好的处理大规模数据分 析问题。主要包含以下两类:
1)分布式文件系统:存储管理需要多种技术的 协同工作,其中文件系统为其提供最底层存储 能力的支持。分布式文件系统 HDFS 是一个高 度容错性系统,被设计成适用于批量处理,能 够提供高吞吐量的数据访问。
2)分布式键值系统:分布式键值系统用于存储 关系简单的半结构化数据。典型的分布式键值 系统有Amazon Dynamo,以及获得广泛应用和关 注的对象存储技术(Object Storage)也可以 视为键值系统,其存起的基础
云计算通过整合、管理、调配分布 在网络各处的计算资源,通过互联 网以统一界面同时向大量的用户提 供服务
云数据库的概念
云数据库的特性
与其他数据库的关系
云数据库是基于云计算 技术发展的一种共享基 础架构的方法,是部署 和虚拟化在云计算环境 中的数据库
云数据库的特性
a) 动态可扩展 b) 高可用性 c) 较低的使用代价 d) 易用性 e) 高性能 f) 免维护 g) 安全
云数据库是个性化数据存储需求的理想选择
企业类型不同,对于存储的需求也 千差万别,而云数据库可以很好的 满足不同企业的个性化存储需求:
首先云数据库可以满足大企业的 海量数据存储需求;
其次云数据库可以满足中小企业 的低成本数据存储需求;
云数据库与其他数据库的关系
从数据模型的角度来说,云数据库并 非一种全新的数据库技术,而只是以 服务的方式提供数据库功能;
云数据库并没有专属于自己的数据模 型,云数据库所采用的数据模型可以 是关系数据库所使用的关系模型(微 软的SQL Azure云数据库、阿里云RDS 都采用了关系模型);也可以是NoSQL 数据库所使用的非关系模型(Amazon Dynamo云数据库采用的是“键/值”方 式存储),同一个公司也可能提供采 用不同数据模型的多种云数据库服务, 许多公司在开发语音数据库时,后端 数据库都是直接使用现有的各种关系 数据库或能收购数据库产品
展示完毕,感谢观看
No SQL数据库
关系型数据库已经无法满足Web 2.0 的需求。主要表现为:无法满足海量 数据的管理需求、无法满足数据高并 发的需求、高可扩展性和高可用性的 功能太低。
NoSQL数据库的优势:可以支持超大 规模数据存储,灵活的数据模型可以 很好地支持Web 2.0应用,具有强大 的横向扩展能力等,典型的NoSQL数 据库包含以下几种:键值数据库、列 族数据库、文档数据库和图形数据库。
大数据存储方式
由于轻型数据库无法 满足对结构化、半结 构化和非结构化海量 数据的存储管理以及 复杂的数据挖掘和分 析操作
通常使用分布式文件 系统、No SQL 数据库、 云数据库等进行数据 存储
01 分布式系统 02 No SQL数据库 03 云数据库
CONTENTS
目 录
分布式系统
分布式系统包含多个自主的处理单元,通过计 算机网络互连来协作完成分配的任务,其“分 而治之”的策略能够更好的处理大规模数据分 析问题。主要包含以下两类:
1)分布式文件系统:存储管理需要多种技术的 协同工作,其中文件系统为其提供最底层存储 能力的支持。分布式文件系统 HDFS 是一个高 度容错性系统,被设计成适用于批量处理,能 够提供高吞吐量的数据访问。
2)分布式键值系统:分布式键值系统用于存储 关系简单的半结构化数据。典型的分布式键值 系统有Amazon Dynamo,以及获得广泛应用和关 注的对象存储技术(Object Storage)也可以 视为键值系统,其存起的基础
云计算通过整合、管理、调配分布 在网络各处的计算资源,通过互联 网以统一界面同时向大量的用户提 供服务
云数据库的概念
云数据库的特性
与其他数据库的关系
云数据库是基于云计算 技术发展的一种共享基 础架构的方法,是部署 和虚拟化在云计算环境 中的数据库
云数据库的特性
a) 动态可扩展 b) 高可用性 c) 较低的使用代价 d) 易用性 e) 高性能 f) 免维护 g) 安全
云数据库是个性化数据存储需求的理想选择
企业类型不同,对于存储的需求也 千差万别,而云数据库可以很好的 满足不同企业的个性化存储需求:
首先云数据库可以满足大企业的 海量数据存储需求;
其次云数据库可以满足中小企业 的低成本数据存储需求;