有效时间不确定性研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有效时间不确定性研究
主要内容
时态数据库简介 有效时间变量Now的研究与分析 传统有效时间不确定时态数据模型 Now复杂语义不确定时态数据模型
一、时态数据库简介
区别于传统的关系型数据库(RDBMS),时态数据库 (Temporal Database)主要用于记录和管理记录那些随着 时间变化而变化的值的历史,而这些历史值对应用领域而 言又是重要的,这类应用有:金融、保险、预订系统、决 策支持系统等。时态数据库有着深厚的理论基础和丰富的 应用技术知识。
2.传统处理方法
对有效时间不确定性问题很多学者进行了讨论和研究, 处理方法主要有以下三种: ①最大值法将数据库允许的最大时间作为有效时间不确 定性时态数据库的VTe值进行存储。最大值法假设不确 定性的元组或事件将永远有效。 ②变动常量法将常量作为有效时间不确定定时态数据库 的VTe值进行存储,但是VTe值随着时间不断推进,每更 新一个粒子时间就要对其赋以新的时间值CT。 ③绑定CT法不将不确定时间终点与具体的时间相联系, 只有当需要对数据进行访问和操作时才对时态变量Now 进行具体绑定运算,将其赋值。
四、Now复杂语义不确定时态数据模型
前面提到一些不确定时态数据模型用概率动态刻画时态变量的不确定 性,用概率的多少来反应时态信息的可靠程序。但是这些模型还存在 许多不足:查询结果中的可信度不科学;只考虑了区间查询,不能处 理点查询;需要对存储的元组添加额外属性,降低了可行性;需要对 SQL进行扩展,影响了可移植性。 在多项前人研究成果的启发下,针对有效时间不确定性处理问题,本 文提出了新的解决模型一一Now复杂语义不确定时态数据模型TDMSCIN, 在该模型中,定义了两个Now变量时间参数——有效时间跨度和预期 有效度。 有效时间跨度VTspan:是指事物保持其原有性质不变的可能的时间区 间长度,如电子元器件的寿命、产品的保质期等。 预期有效度EVD:是指事物在有效时间跨度后未破坏其原有性质的概率, 如电子产品在保质期后的合格率等。 当指定查询时间QT,要求查询数据库中符合条件的元组时,显然满足 条件的元组的有效时间区间必定包含查询时间QT。当有效时间确定时, 直接就可以进行判断;当有效时间不确定时,情形就比较复杂。在此, 对不确定的有效时间的查询进行分析。
1.时间点查询算法
时间点也可以看作是时间区间的特例,即当查询时间QT为一个时间 点,也就是当QTs=QTe。我们用可信度Reliability来描述元组有效 的可能性。有效的可信度随时间递增而趋于0,其具体算法如下: ①当VTS≤CT时,这是常见情况,要综合考虑Now现在、过去和将来 的语义,查询结果的可信度在时间轴上分布可分为三段来分析:确 定性时间区间[min(Time),VTS]、确定性时间区间[VTs,CT-△)和不 确定性时间段[CT一△,max(Time))。确定性时态区间的可信度可 以用确定的值来描述,而不确定性区间的可信度可以通过概率来反 应,其概率值可根据指数分布计算。 ②当VTs>CT时,这是元组预先更新时的特殊情形,在查询结果的 可信度分布图上,时间轴将以VTs为分割点,分为两个区间,确定 性时间区间(min(Time),VTs)和不确定性时间区间 [VTs,max(Time))。
2.时间区间查询算法
当查询时间QT是一个时间区间,即QT=[QTs,QTe)并且QTs≠QTe 时,就存在两个时间区间,有效时间区间和查询时区间。根据几何 概率的定义,元组的可信度可以表述为其分布概率函数与查询区间 相交形成的阴影部分面积同查询区间矩形部分面积的比值。
3.表示数据模式 根据Snodgrass的表示数据模型,其数据模式可以表示 为 R ( A1 ,L An ,VTs,VTe) 在Now复杂语义不确定时态关系数据模型中,主要研究 的是有效时间问题,不考虑事务时间。有效时间跨度 VTspan和预期有效度EVD可以定义每个元组的附加属 性。在实际应用中,因为数据集的相关性,VTspan和 EVD通常为元组集合所共享,为了尽可能不破坏元组的 原有结构,我们为相关的元组集合定义一个VTspan和 一个EVD,并且被该元组集合所共享。其数据模式可表 示为:
二、有效时间变量Now的研究与分析
在时态数据库中事务时间变量UC语义单一,按照自身规定取当前值。 而有效时间变量Now却相对复杂,下面将分析有效时间变量Now。 (1)Now语义分析 ①当前时间语义 时态变量Now是为了解决更新VTe而引入的,数据时间标签的终 止点Now表示该数据所反映的客观事实直到“当前”都是有效的。 ②过去时间语义 在实际应用中,现实中事物的变化与在数据库中记录它们的相应 数据变化往往不是同步的,二者之间存在一定的延迟,即事务时间的 起点TTs一般滞后于有效时间的起点VTs,这个滞后时间通常是固定 的,其值为TTs-VTS。 ③将来时间语义 在时态数据库中,时态变量Now的引入主要是为了反映事务的动 态延续性,只要能确定一个客观事情会在“将来”时间或者成立,就 可以为该事实的数据对象加上表示“将来”的标签。
1.4 时态数据模型
为了适应实际应用的需要,TSQL2根据用途的不同提出了 三种表述能力相同的时态数据模型: (1)面向查询的双时态概念数据模型 (2)面向存储的表示数据模型 (3)面向显示的演示数据模型
பைடு நூலகம்
1.5 时态查询语言
作为用户与时态数据库系统交互的主要方式,时态查询语 言在很大程度上决定了时态数据库系统的功能及其实现细 节。目前,ATSQL2是时态数据库领域中普遍认可的时态 查询语言。 ATSQL2(Applied TSQL2)由Michael bohled、Christian Jensen和Richard Snodgrass三人为了满足时态查询的需 要在SQL3基础上扩展而成。ATSQL2是它定义了时态数 据查询语句、时态数据修改语句、时态数据定义语句、时 态约束和断言的语法和语义。1996年,ATSQL2获得 ANSI通过。
3.不确定时态关系数据模型
由于传统的处理方法不能合理有效地处理带有时态变量Now的 有效时间不确定的时态数据信息,很多学者进行了更深入的研究和 分析,提出了一些不确定时态关系数据模型ITRDM,对处理不确定 时态关系数据进行了讨论。 不同的随机事件发生的可能性是不同的,概率是人们用来表示 随机事件发生的可能性大小的一个量。一些时态关系数据模型中用 概率来反应有效时间的不确定性。
(2)Now带来的问题 时态变量Now确实给我们带来了很多方便,它可以避免大量的数据 冗余。但是它的使用也带来了一些问题: ①确定与不确定的问题——当前时间、查询时间和元组的有效时间 在进行时态查询时都应当是确定的,但查询的数据涉及时态变量 Now时,由于有效时间的不确定将导致查询结果的不确定。 ②悲观或乐观问题——在一些数据模型中,每次查询时将时态变量 Now与查询的当前时间绑定.这将导致对所模型化的现实过分悲观的 问题;另外一些数据模型将时态变量Now与数据库系统中可表示的 最大时间值绑定,即认为含有时态变量Now的记录将在系统允许的 最大时间内一直有效。 ③更新滞后和预先更新问题——对于数据创建和更新来说,通常数 据入库时刻相对于其反应的事物实际生效或改变的时刻会有一个 “滞后”情形,即VTs≠TTs,其间存在一个延迟时间,具体的延迟 量为TTs一VTs;但有时提前将预定的记录更新,即数据库中的数据 创建和更新时间相对先于其反应的事物实际生效或改变的时刻。
三、传统有效时间不确定时态数据模型
1.有效时间不确定性
有效时间不确定性产生的原因主要有:时间粒度匹配不当、时间测定 技术、计划不确定性、未知或不精确的事件时间和计时器度量误差等。 有效时态变量Now的绑定取值需要有相对的参考时间,我们称这种时 间为Now变量时间参数,它是决定时态变量绑定值的重要参数。下面 给出三种Now变量时间参数的定义: 定义1 当前时间CT 对数据进行访问和操作时,数据库系统的当前 运行时间。 定义2 查询时间QT 在进行时态查询时,要明确查询操作对何时的 数据,也就是在时间轴上的哪一段时间区间来查看数据库的状态,这 种时间称为查询时间。 定义3 滞后时间△ 前面提到过事务时间起点TTs 常滞后于有效时 间起点VTs,引入变量△来表示这个滞后时间,当VTs<TTs时,滞后 时间△=VTs﹣TTs﹥0。
1.3 时态变量
时态标签是时态数据库中的基本特征,它是构成时态数据库的必需元 素。时态数据库是反映现实世界时变特性的数据库,对数据库对象时 变属性的记录是通过时态标签来刻画的。在时态数据库时间属性的记 录中,若时态属性是固定的,则可以用固定时态标签描述。为了表达 变动时态标签,需要引入时态变量,即有效时间变量Now和事务时间 的变量UC。 (1)有效时间变量Now 现实世界中有大量的信息,其有效时间的结束点不能预先确定,那么 其结束点就不能简单的用某个时刻来表示。因此,当有效时间没有明 确截止点时,使用某种“变量”表示其终点较为方便。通常考虑问题 都是“截至”到当前时间(Current Time) (Current Time),人们自然选择英语中的 “Now”作为这样的变量。后面介绍它带来的一些特殊问题和不足。 (2)事务时间变量UC 事务时间是指记录逻辑上被存放在数据库中的时间,它反映了记录被 查、删、改的时间。事务时间与有效时间正交的一个概念,表示了数 据库的变化过程。 UC在应用于事务时间中它有比Now更精确的解释语义,因为按照事 务时间本身规定性,一般认为其中变量UC语义单一,在应用中取更 新时的当前时间值即可。
1.1 时间的概念
宇宙大爆炸的假说中,理论物理学家们认为时间开始 于大爆炸的那一瞬间。时间的概念就像一个被压缩的橡皮 筋,随着宇宙的爆炸还在不断地扩展。时间有一个标准的 几何暗喻——轴线。 时间有连续的表示方式和离散的表示方式,但在计算 机的应用方面采用离散的表示方式。
1.2 时态数据库 时态数据库就是显式处理时态数据的重要数据库技术。 由于其处理对象和处理要求的特定性,时态数据库在诸多 方面有别于传统关系型数据库。 时态数据库中有三种类型的基本时间概念:有效时间、 事务时间和用户自定义时间。 (1)有效时间是指一个事件或对象在现实世界中发生并 保持的那段时间,即该事件或对象在现实世界中为真的时 间 (2)事务时间是指对一个数据库对象进行操作的时间, 是一个事实存储在数据库中的时间,它记录着对数据库修 改或更新的各种操作历史,对应于对象状态在数据库中的 变迁历史。 (3)用户自定义时间是指用户根据自己的应用需求或理 解定义的时间。
R( A1,L An ,VTs,VTe,Re liability())
在反馈查询处理结果的数据模式中,由于增加了有效时 间不确定信息的可信度P,其数据模式可表示为 其中,Reliability是元组可信度,取值范围是[0,1], Reliability()是可信度计算函数。
谢谢!
主要内容
时态数据库简介 有效时间变量Now的研究与分析 传统有效时间不确定时态数据模型 Now复杂语义不确定时态数据模型
一、时态数据库简介
区别于传统的关系型数据库(RDBMS),时态数据库 (Temporal Database)主要用于记录和管理记录那些随着 时间变化而变化的值的历史,而这些历史值对应用领域而 言又是重要的,这类应用有:金融、保险、预订系统、决 策支持系统等。时态数据库有着深厚的理论基础和丰富的 应用技术知识。
2.传统处理方法
对有效时间不确定性问题很多学者进行了讨论和研究, 处理方法主要有以下三种: ①最大值法将数据库允许的最大时间作为有效时间不确 定性时态数据库的VTe值进行存储。最大值法假设不确 定性的元组或事件将永远有效。 ②变动常量法将常量作为有效时间不确定定时态数据库 的VTe值进行存储,但是VTe值随着时间不断推进,每更 新一个粒子时间就要对其赋以新的时间值CT。 ③绑定CT法不将不确定时间终点与具体的时间相联系, 只有当需要对数据进行访问和操作时才对时态变量Now 进行具体绑定运算,将其赋值。
四、Now复杂语义不确定时态数据模型
前面提到一些不确定时态数据模型用概率动态刻画时态变量的不确定 性,用概率的多少来反应时态信息的可靠程序。但是这些模型还存在 许多不足:查询结果中的可信度不科学;只考虑了区间查询,不能处 理点查询;需要对存储的元组添加额外属性,降低了可行性;需要对 SQL进行扩展,影响了可移植性。 在多项前人研究成果的启发下,针对有效时间不确定性处理问题,本 文提出了新的解决模型一一Now复杂语义不确定时态数据模型TDMSCIN, 在该模型中,定义了两个Now变量时间参数——有效时间跨度和预期 有效度。 有效时间跨度VTspan:是指事物保持其原有性质不变的可能的时间区 间长度,如电子元器件的寿命、产品的保质期等。 预期有效度EVD:是指事物在有效时间跨度后未破坏其原有性质的概率, 如电子产品在保质期后的合格率等。 当指定查询时间QT,要求查询数据库中符合条件的元组时,显然满足 条件的元组的有效时间区间必定包含查询时间QT。当有效时间确定时, 直接就可以进行判断;当有效时间不确定时,情形就比较复杂。在此, 对不确定的有效时间的查询进行分析。
1.时间点查询算法
时间点也可以看作是时间区间的特例,即当查询时间QT为一个时间 点,也就是当QTs=QTe。我们用可信度Reliability来描述元组有效 的可能性。有效的可信度随时间递增而趋于0,其具体算法如下: ①当VTS≤CT时,这是常见情况,要综合考虑Now现在、过去和将来 的语义,查询结果的可信度在时间轴上分布可分为三段来分析:确 定性时间区间[min(Time),VTS]、确定性时间区间[VTs,CT-△)和不 确定性时间段[CT一△,max(Time))。确定性时态区间的可信度可 以用确定的值来描述,而不确定性区间的可信度可以通过概率来反 应,其概率值可根据指数分布计算。 ②当VTs>CT时,这是元组预先更新时的特殊情形,在查询结果的 可信度分布图上,时间轴将以VTs为分割点,分为两个区间,确定 性时间区间(min(Time),VTs)和不确定性时间区间 [VTs,max(Time))。
2.时间区间查询算法
当查询时间QT是一个时间区间,即QT=[QTs,QTe)并且QTs≠QTe 时,就存在两个时间区间,有效时间区间和查询时区间。根据几何 概率的定义,元组的可信度可以表述为其分布概率函数与查询区间 相交形成的阴影部分面积同查询区间矩形部分面积的比值。
3.表示数据模式 根据Snodgrass的表示数据模型,其数据模式可以表示 为 R ( A1 ,L An ,VTs,VTe) 在Now复杂语义不确定时态关系数据模型中,主要研究 的是有效时间问题,不考虑事务时间。有效时间跨度 VTspan和预期有效度EVD可以定义每个元组的附加属 性。在实际应用中,因为数据集的相关性,VTspan和 EVD通常为元组集合所共享,为了尽可能不破坏元组的 原有结构,我们为相关的元组集合定义一个VTspan和 一个EVD,并且被该元组集合所共享。其数据模式可表 示为:
二、有效时间变量Now的研究与分析
在时态数据库中事务时间变量UC语义单一,按照自身规定取当前值。 而有效时间变量Now却相对复杂,下面将分析有效时间变量Now。 (1)Now语义分析 ①当前时间语义 时态变量Now是为了解决更新VTe而引入的,数据时间标签的终 止点Now表示该数据所反映的客观事实直到“当前”都是有效的。 ②过去时间语义 在实际应用中,现实中事物的变化与在数据库中记录它们的相应 数据变化往往不是同步的,二者之间存在一定的延迟,即事务时间的 起点TTs一般滞后于有效时间的起点VTs,这个滞后时间通常是固定 的,其值为TTs-VTS。 ③将来时间语义 在时态数据库中,时态变量Now的引入主要是为了反映事务的动 态延续性,只要能确定一个客观事情会在“将来”时间或者成立,就 可以为该事实的数据对象加上表示“将来”的标签。
1.4 时态数据模型
为了适应实际应用的需要,TSQL2根据用途的不同提出了 三种表述能力相同的时态数据模型: (1)面向查询的双时态概念数据模型 (2)面向存储的表示数据模型 (3)面向显示的演示数据模型
பைடு நூலகம்
1.5 时态查询语言
作为用户与时态数据库系统交互的主要方式,时态查询语 言在很大程度上决定了时态数据库系统的功能及其实现细 节。目前,ATSQL2是时态数据库领域中普遍认可的时态 查询语言。 ATSQL2(Applied TSQL2)由Michael bohled、Christian Jensen和Richard Snodgrass三人为了满足时态查询的需 要在SQL3基础上扩展而成。ATSQL2是它定义了时态数 据查询语句、时态数据修改语句、时态数据定义语句、时 态约束和断言的语法和语义。1996年,ATSQL2获得 ANSI通过。
3.不确定时态关系数据模型
由于传统的处理方法不能合理有效地处理带有时态变量Now的 有效时间不确定的时态数据信息,很多学者进行了更深入的研究和 分析,提出了一些不确定时态关系数据模型ITRDM,对处理不确定 时态关系数据进行了讨论。 不同的随机事件发生的可能性是不同的,概率是人们用来表示 随机事件发生的可能性大小的一个量。一些时态关系数据模型中用 概率来反应有效时间的不确定性。
(2)Now带来的问题 时态变量Now确实给我们带来了很多方便,它可以避免大量的数据 冗余。但是它的使用也带来了一些问题: ①确定与不确定的问题——当前时间、查询时间和元组的有效时间 在进行时态查询时都应当是确定的,但查询的数据涉及时态变量 Now时,由于有效时间的不确定将导致查询结果的不确定。 ②悲观或乐观问题——在一些数据模型中,每次查询时将时态变量 Now与查询的当前时间绑定.这将导致对所模型化的现实过分悲观的 问题;另外一些数据模型将时态变量Now与数据库系统中可表示的 最大时间值绑定,即认为含有时态变量Now的记录将在系统允许的 最大时间内一直有效。 ③更新滞后和预先更新问题——对于数据创建和更新来说,通常数 据入库时刻相对于其反应的事物实际生效或改变的时刻会有一个 “滞后”情形,即VTs≠TTs,其间存在一个延迟时间,具体的延迟 量为TTs一VTs;但有时提前将预定的记录更新,即数据库中的数据 创建和更新时间相对先于其反应的事物实际生效或改变的时刻。
三、传统有效时间不确定时态数据模型
1.有效时间不确定性
有效时间不确定性产生的原因主要有:时间粒度匹配不当、时间测定 技术、计划不确定性、未知或不精确的事件时间和计时器度量误差等。 有效时态变量Now的绑定取值需要有相对的参考时间,我们称这种时 间为Now变量时间参数,它是决定时态变量绑定值的重要参数。下面 给出三种Now变量时间参数的定义: 定义1 当前时间CT 对数据进行访问和操作时,数据库系统的当前 运行时间。 定义2 查询时间QT 在进行时态查询时,要明确查询操作对何时的 数据,也就是在时间轴上的哪一段时间区间来查看数据库的状态,这 种时间称为查询时间。 定义3 滞后时间△ 前面提到过事务时间起点TTs 常滞后于有效时 间起点VTs,引入变量△来表示这个滞后时间,当VTs<TTs时,滞后 时间△=VTs﹣TTs﹥0。
1.3 时态变量
时态标签是时态数据库中的基本特征,它是构成时态数据库的必需元 素。时态数据库是反映现实世界时变特性的数据库,对数据库对象时 变属性的记录是通过时态标签来刻画的。在时态数据库时间属性的记 录中,若时态属性是固定的,则可以用固定时态标签描述。为了表达 变动时态标签,需要引入时态变量,即有效时间变量Now和事务时间 的变量UC。 (1)有效时间变量Now 现实世界中有大量的信息,其有效时间的结束点不能预先确定,那么 其结束点就不能简单的用某个时刻来表示。因此,当有效时间没有明 确截止点时,使用某种“变量”表示其终点较为方便。通常考虑问题 都是“截至”到当前时间(Current Time) (Current Time),人们自然选择英语中的 “Now”作为这样的变量。后面介绍它带来的一些特殊问题和不足。 (2)事务时间变量UC 事务时间是指记录逻辑上被存放在数据库中的时间,它反映了记录被 查、删、改的时间。事务时间与有效时间正交的一个概念,表示了数 据库的变化过程。 UC在应用于事务时间中它有比Now更精确的解释语义,因为按照事 务时间本身规定性,一般认为其中变量UC语义单一,在应用中取更 新时的当前时间值即可。
1.1 时间的概念
宇宙大爆炸的假说中,理论物理学家们认为时间开始 于大爆炸的那一瞬间。时间的概念就像一个被压缩的橡皮 筋,随着宇宙的爆炸还在不断地扩展。时间有一个标准的 几何暗喻——轴线。 时间有连续的表示方式和离散的表示方式,但在计算 机的应用方面采用离散的表示方式。
1.2 时态数据库 时态数据库就是显式处理时态数据的重要数据库技术。 由于其处理对象和处理要求的特定性,时态数据库在诸多 方面有别于传统关系型数据库。 时态数据库中有三种类型的基本时间概念:有效时间、 事务时间和用户自定义时间。 (1)有效时间是指一个事件或对象在现实世界中发生并 保持的那段时间,即该事件或对象在现实世界中为真的时 间 (2)事务时间是指对一个数据库对象进行操作的时间, 是一个事实存储在数据库中的时间,它记录着对数据库修 改或更新的各种操作历史,对应于对象状态在数据库中的 变迁历史。 (3)用户自定义时间是指用户根据自己的应用需求或理 解定义的时间。
R( A1,L An ,VTs,VTe,Re liability())
在反馈查询处理结果的数据模式中,由于增加了有效时 间不确定信息的可信度P,其数据模式可表示为 其中,Reliability是元组可信度,取值范围是[0,1], Reliability()是可信度计算函数。
谢谢!