非结构化数据知识精品PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随着网络技术的发展,特别是Internet和Intranet
技术的飞快发展,使得非结构化数据的数量日趋增 大。这时,主要用于管理结构化数据的关系数据库 的局限性暴露地越来越明显。因而,数据库技术相 应地进入了“后关系数据库时代”,发展进入基于 网络应用的非结构化数据库时代。
层次数据库
网状数据库
关系数据库
云存储的好处:
企业能大幅减少存储基础架构成本,在减少人工管理非 结构化数据所需时间的同时增加了存储的灵活性;
定价都是根据实际使用了多少存储容量而决定的。支付 多少钱就享用多少容量。因此不再需要存储架构师,也 不再需要安装和管理存储设备;
保障不出现有害的物理访问,还保护任何自然和人为操 作所产生的灾难;
描、识别、录入等许多人工处理工序,费时费力而 且成本高昂。如果能够自动化地直接转换,则可以 直接输入到企业内容管理系统中,并有效提取价值 信息和索引,企业的工作效率将会大为提高,而成 本也会相应降低。
学习并没有结束,希望继续努力
Thanks for listening, this course is expected to bring you value and help
为方便学习与使用课件内容,课件可以在下载后自由编辑, 请根据实际情况调整
ቤተ መጻሕፍቲ ባይዱ
2013年2月19日
结构化数据:行数据,存储在数据库里,可以用二 维表结构来逻辑表达实现的数据。
非结构化数据:不方便用数据库二维逻辑表来表现 的数据,包括所有格式的办公文档、文本、图片、 XML、HTML、各类报表、图像和音频/视频信息等。
非结构化数据库:其字段长度可变,并且每个字段 的记录又可以由可重复或不可重复的子字段构成的 数据库,用它不仅可以处理结构化数据(如数字、 符号等信息)而且更适合处理非结构化数据(全文 文本、图象、声音、影视、超媒体等信息)。
非结构化 数据库
据一项调查报告中指出:企业中80%的数据都是非 结构化数据,这些数据每年都按指数增长60%。
如今,这种迅猛增长的从不使用的数据在企业里消 耗着复杂而昂贵的一级存储的存储容量。如何更好 的保留那些在全球范围内具有潜在价值的不同类型 的文件,而不是因为处理它们却干扰日常的工作?
当然你可以采购更多的就地存储设备,但这总会有 局限性的。云存储是越来越多的IT公司正在使用的 存储技术。
随着备份和灾难恢复的处理和要求变得日益复杂、昂贵 以及耗费时间,云存储能够大大减少这种复杂性和成本。
1、计算机的存储结构决定了其处理结构化数据具
有很大优势,例如关系数据库已发展得非常成熟, 将大量的非结构化数据进行转换就能利用计算机处 理结构化数据的优势及数据库成熟技术;
2、若非结构化数据无法自动转换,就需要通过扫