计算机数据管理的发展
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)数据的共享性高,冗余度低,易扩充
数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。
所谓数据的不一致性是指同一数据不同拷贝的值不一样。采用人工管理或文件系统管理时,由于数据被重复存储,当不同的应用使用和修改不同的拷贝时就很容易造成数据的不一致。在数据库中数据共享,减少了由于数据冗余造成的不一致现象。
计算机数据管理的发展
教学内容
教学步骤、方法
§1.2计算机数据管理的发展
数据库技术是应数据管理任务的需要而产生的。数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。
人们借助计算机进行数据处理是近三十年的事。研制计算机的初衷是利用它进行复杂的科学计算。随着计算机技术的发展,其应用远远地超出了这个范围。在应用需求的推动下,在计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统和分布式数据库系统四个阶段。计算机数据管理的发展的四个阶段及各自的特点。
物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
教学内容
教学步骤、方法
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。
数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由DBMS负责,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
四个发展阶段,硬件、软件的变化及其与程序的关系
组织讨论:
数据独立的意义
演示:图1-2
教学内容
教学步骤、方法
(3)系统中没有对数据进行管理的软件
数据管理任务,包括存储结构、存储方法、输入输出方法等完全由计算机自负其责。这就给应用程序设计人员增加了很大的负担。
第二阶段:文件系统阶段(50年代后期至60年代中后期)
演示:图1-3
教学内容
教学步骤、方法
与人工管理和文件系统相比,数据库系统的特点主要有以下几个方面。
(1)数据结构化
数据结构化是数据库与文件系统的根本区别。在文件系统中,相互独立的文件的记录内部是有结构的。传统文件的最简单形式是等长同格式的记录集合。
例有3个文件,图书(总编号、分类号、书名、作者、出版单位、单价);读者(借书证号、姓名、性别、单位、职称、地址);借阅(借书证号、总编号、借阅日期、备注),要想查找某人所借图书的书名、出版社及借阅者的职称,则必须编写一段很不简单的程序来实现。数据库系统不仅表示属性之间的联系,而且表示实体之间的联系。只要定义好数据模型,上述询问可以非常容易地连机查到。
文件系统阶段20世纪50年代后期到60年代中期,这时硬件方面已有了磁盘、磁鼓等直接存取存储设备;软件方面,操作系统中已经有了专门的数据管理软件,一般称为文件系统;处理方式上不仅有了批处理,而且能够联机实时处理。由于文件系统具有数据的增、删、改等操作,使得数据管理变得轻松,且数据可以反复使用。但这个阶段仍存在一些问题,如数据冗余度大、数据共享性差等。
其主要优点是:
(1)局部自主
网络上每个结点的数据库系统都具有独立处理本地事物的能力(大两的),而且各局部结点之间也能够互相访问、有效地配合处理更复杂的事物。因此,分布式数据库系统特别适合各个部门的地理位置分散的组织机构。例如,银行业务、飞机订票、企业管理等。
(2)可靠性和可用性
分布式系统比集中式系统有更高的可靠性,在个别结点或个别通信链路发生故障的情况下可以继续工作。一个局部系统发生故障不至于导致整个系统停顿或破坏,只要有一个结点上的数据备份可用的。可见,支持一定程度的数据冗余是充分发挥分布式数据库系统优点的先决条件之一。
文件系统存在的问题
(1)数据冗余和数据不一致(Data Redundancy and Inconsistency)
(2)数据访问困难(Difficulty in Accessing Data)
(3)数据孤立(Data Isolation)
(4)完整性问题(Integrity Problems)
(ቤተ መጻሕፍቲ ባይዱ)原子性问题(Atomicity Problems)
(4)数据由DBMS统一管理和控制
数据库的共享是并发的(Concurrency)共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。
图1-4数据库系统数据与程序的关系
第四阶段:分布式数据库系统阶段(70年代后期之后)
分布式数据库系统是数据库技术和计算机网络技术相结合的产物,在80年代中期已有商品化产品问世。分布式数据库是一个逻辑上统一、地域上分布的数据集合,是计算机网络环境中各个节点局部数据库的逻辑集合,同时受分布式数据库管理系统的控制和管理。
由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大,易于扩充,可以适应各种用户的要求。可以取整体数据的各种子集用于不同的应用系统,当应用需求改变或增加时,只要重新选取不同的子集或加上一部分数据便可以满足新的需求。
(3)数据独立性高
数据独立性是数据库领域中一个常用术语,包括数据的物理独立性和数据的逻辑独立性。
特点:
(1)数据与程序不具有独立性
一组数据对应一组程序。这就使得程序依赖于数据,如果数据的类型、格式或者数据量、存取方法、输入输出方式等改变了,程序必须做相应的修改。
(2)数据不能长期保存
由于数据是面向应用程序的,在一个程序中定义的数据,无法被其他程序利用,因此程序与程序之间存在大量的重复数据。
强调
第一阶段:人工管理阶段(50年代中期以前)
人工管理阶段20世纪50年代以前,数据的组织和管理完全靠程序员手工完成。其硬件是:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备;软件是:没有操作系统,没有管理数据的软件;数据处理方式是批处理。数据与应用程序之间的关系如图1-2所示。
图1-2人工管理数据与程序的关系
(6)并发性问题(Concurrent-access Anomalies)
(7)安全性问题(Security Problems)
图1-3文件系统数据与程序的关系
第三阶段:数据库系统阶段(60年代后期至70年代后期)
数据库系统阶段为了解决多用户、多应用共享数据的要求,使数据为尽可能多的应用服务,出现了统一管理数据的专门软件系统即数据库管理系统。
图1-5分布式数据库系统
演示:图1-5
演示:图1-4
教学内容
教学步骤、方法
(3)效率和灵活性
分布式系统分散了工作负荷,缓解了单机容量的压力。数据可以存储在临近的常用结点,如果本结点的数据子集包含了要查询的全部内容,显然比集中式数据库在全集上查找节省时间。
系统易于实现扩展。例如,一个单位要增加新的机构,分布式数据库系统能够在对现有系统影响较小的情况下实现扩充。因此,扩大系统规模比集中式系统更加方便、经济、灵活。
数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。
所谓数据的不一致性是指同一数据不同拷贝的值不一样。采用人工管理或文件系统管理时,由于数据被重复存储,当不同的应用使用和修改不同的拷贝时就很容易造成数据的不一致。在数据库中数据共享,减少了由于数据冗余造成的不一致现象。
计算机数据管理的发展
教学内容
教学步骤、方法
§1.2计算机数据管理的发展
数据库技术是应数据管理任务的需要而产生的。数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。
人们借助计算机进行数据处理是近三十年的事。研制计算机的初衷是利用它进行复杂的科学计算。随着计算机技术的发展,其应用远远地超出了这个范围。在应用需求的推动下,在计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统和分布式数据库系统四个阶段。计算机数据管理的发展的四个阶段及各自的特点。
物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
教学内容
教学步骤、方法
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。
数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由DBMS负责,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
四个发展阶段,硬件、软件的变化及其与程序的关系
组织讨论:
数据独立的意义
演示:图1-2
教学内容
教学步骤、方法
(3)系统中没有对数据进行管理的软件
数据管理任务,包括存储结构、存储方法、输入输出方法等完全由计算机自负其责。这就给应用程序设计人员增加了很大的负担。
第二阶段:文件系统阶段(50年代后期至60年代中后期)
演示:图1-3
教学内容
教学步骤、方法
与人工管理和文件系统相比,数据库系统的特点主要有以下几个方面。
(1)数据结构化
数据结构化是数据库与文件系统的根本区别。在文件系统中,相互独立的文件的记录内部是有结构的。传统文件的最简单形式是等长同格式的记录集合。
例有3个文件,图书(总编号、分类号、书名、作者、出版单位、单价);读者(借书证号、姓名、性别、单位、职称、地址);借阅(借书证号、总编号、借阅日期、备注),要想查找某人所借图书的书名、出版社及借阅者的职称,则必须编写一段很不简单的程序来实现。数据库系统不仅表示属性之间的联系,而且表示实体之间的联系。只要定义好数据模型,上述询问可以非常容易地连机查到。
文件系统阶段20世纪50年代后期到60年代中期,这时硬件方面已有了磁盘、磁鼓等直接存取存储设备;软件方面,操作系统中已经有了专门的数据管理软件,一般称为文件系统;处理方式上不仅有了批处理,而且能够联机实时处理。由于文件系统具有数据的增、删、改等操作,使得数据管理变得轻松,且数据可以反复使用。但这个阶段仍存在一些问题,如数据冗余度大、数据共享性差等。
其主要优点是:
(1)局部自主
网络上每个结点的数据库系统都具有独立处理本地事物的能力(大两的),而且各局部结点之间也能够互相访问、有效地配合处理更复杂的事物。因此,分布式数据库系统特别适合各个部门的地理位置分散的组织机构。例如,银行业务、飞机订票、企业管理等。
(2)可靠性和可用性
分布式系统比集中式系统有更高的可靠性,在个别结点或个别通信链路发生故障的情况下可以继续工作。一个局部系统发生故障不至于导致整个系统停顿或破坏,只要有一个结点上的数据备份可用的。可见,支持一定程度的数据冗余是充分发挥分布式数据库系统优点的先决条件之一。
文件系统存在的问题
(1)数据冗余和数据不一致(Data Redundancy and Inconsistency)
(2)数据访问困难(Difficulty in Accessing Data)
(3)数据孤立(Data Isolation)
(4)完整性问题(Integrity Problems)
(ቤተ መጻሕፍቲ ባይዱ)原子性问题(Atomicity Problems)
(4)数据由DBMS统一管理和控制
数据库的共享是并发的(Concurrency)共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。
图1-4数据库系统数据与程序的关系
第四阶段:分布式数据库系统阶段(70年代后期之后)
分布式数据库系统是数据库技术和计算机网络技术相结合的产物,在80年代中期已有商品化产品问世。分布式数据库是一个逻辑上统一、地域上分布的数据集合,是计算机网络环境中各个节点局部数据库的逻辑集合,同时受分布式数据库管理系统的控制和管理。
由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大,易于扩充,可以适应各种用户的要求。可以取整体数据的各种子集用于不同的应用系统,当应用需求改变或增加时,只要重新选取不同的子集或加上一部分数据便可以满足新的需求。
(3)数据独立性高
数据独立性是数据库领域中一个常用术语,包括数据的物理独立性和数据的逻辑独立性。
特点:
(1)数据与程序不具有独立性
一组数据对应一组程序。这就使得程序依赖于数据,如果数据的类型、格式或者数据量、存取方法、输入输出方式等改变了,程序必须做相应的修改。
(2)数据不能长期保存
由于数据是面向应用程序的,在一个程序中定义的数据,无法被其他程序利用,因此程序与程序之间存在大量的重复数据。
强调
第一阶段:人工管理阶段(50年代中期以前)
人工管理阶段20世纪50年代以前,数据的组织和管理完全靠程序员手工完成。其硬件是:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备;软件是:没有操作系统,没有管理数据的软件;数据处理方式是批处理。数据与应用程序之间的关系如图1-2所示。
图1-2人工管理数据与程序的关系
(6)并发性问题(Concurrent-access Anomalies)
(7)安全性问题(Security Problems)
图1-3文件系统数据与程序的关系
第三阶段:数据库系统阶段(60年代后期至70年代后期)
数据库系统阶段为了解决多用户、多应用共享数据的要求,使数据为尽可能多的应用服务,出现了统一管理数据的专门软件系统即数据库管理系统。
图1-5分布式数据库系统
演示:图1-5
演示:图1-4
教学内容
教学步骤、方法
(3)效率和灵活性
分布式系统分散了工作负荷,缓解了单机容量的压力。数据可以存储在临近的常用结点,如果本结点的数据子集包含了要查询的全部内容,显然比集中式数据库在全集上查找节省时间。
系统易于实现扩展。例如,一个单位要增加新的机构,分布式数据库系统能够在对现有系统影响较小的情况下实现扩充。因此,扩大系统规模比集中式系统更加方便、经济、灵活。