数据流窗口查询语义的局限性及改进方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据流上的滑动窗 口持续查询只是将查询局限在输入数据流元组的一个窗口中, 它包含最近 的输入元 组. 对于有 n个输入数据流的滑动窗口,如 S 至 S ,定义一个大小为 w 的窗口. l i 随着 窗口的滑动,需要 通过更新查询结果以反映在窗 口中新进入和过期的元组 ,元组是 以先进先过期 的方式进入和过期的. 主要
持续的滑动窗 口查询模型被广泛地用在数据流管理系统中,如 S R A z e ga h Q 等. T E M【、T l rp C 】 滑动 J e
窗口技术是数据流系统中实现近似查询 的一项重要技术 . 口技术的实质是 :不在所有数据上进行查询 窗 而把活动的窗口作用在数据流上 ,仅对窗口中可视的数据进行查询.由于数据流在容量上可能是无限的, 为了计算数据流查询的精确结果 ,所需的存储器容量也会无限制地增长.由于存储器 的容量是有限的,对 数据流查询就不可 能总是产生精确 的结果,用高质量的近似结果来替代准确 结果往往是可 以接受 的. 此 外 ,分块操作要求在检索数据的过程中,必须对所有 的输入数据完成扫描后才能计算输出的结果【 排序 5 J . 是分块操作的一个例子,还有聚集运算符,如 S M、C U T U O N 、MI N、MA X和 A G. V 数据流管理系统中 的查询计划不能使用分块查询操作符 ,因为扫描所有输入信息是无法完成的. 通过定义 窗口数据模型、使
示 为 S【 n eU b u d d. Ra g n o n e ]
分组滑动窗 口.这种 窗口按照相同的属性值在逻辑上把数据流分割为不 同的子数据流( 类似于分组操
J) d ,然 后在 每一 个 子数据 流 上独 立 地计 算 一个 大 小为 N 的基 于 元组 的滑 动 窗 口 ,输 出关 系就 是这 些 窗 口 : -
摘 要: 在数据流处理系统普遍使用滑动窗口查询模型来解决数据流的持续查询问题. 对一些特殊的查询类
型, 在使用滑动窗 口查询 时无 法完全 达到查询要 求, 通过 引入条件 窗口对滑 动窗 口 型进行 更一般 化的扩展和改 模 进,可以解决滑动窗 口语 义在处理这 一类型查询 中的局 限性.
文章编号:0 87 2 (0 80 .0 80 10 .8 620 )30 2 .4
Байду номын сангаас
数 据流 窗 口查询语 义 的局 限性及 改进 方法
陈磊 松 , 国平 z 林
(. 1 漳州师范学院 传媒技术 中心, 福建 漳州 330 ;. 6 00 2 漳州师 范学 院 数 学系, 福建 漳卅 600 f 30 ) 3
S R n e o 有两个特别的情况: = 和 T ∞ 当 T 0时, [ag (. 】 T0 =. = 关系 R t由数据流中带有时间戳 t ( ) 的元组组成, 这一情况在 C L中可表示为 S【 o ] 当 T 0 Q N w. =。 关系 R t 时, ( 由数据流中所有时间戳 小于 t ) 的元组组成, 表
2 9
有 以下三 种类 型 的滑 动 窗 口: 基 于元 组 的滑 动 窗 口.它 通过 滑 动 一个 有 序数据 流 中最 后 N个 元 组 的 窗 口作 为输 出关 系.这个 参数 在 引用 数据 流 S之后 指 定 ,其 子 句 表 示 为 :S【 ws . Ro N】 基 于 时间 的滑 动 窗 口.基 于 时 间 的滑动 窗 口使 用一 个 时 间间 隔 t 为 参数 , . O作 它通 过 滑动 大 小 为 ∞ 的时 间间隔来 接 收有 序数 据流 中最近 的部 分 作为 输 出关系 .这一 参 数在 引 用数 据 流 S之 后 指定 , 子句 表示 为 : 其
用增量计算方法和规定流数据约束条件都可 以帮助系统进行非分块操作.
2 T E M 系统 与滑 动窗 口 S R A
S R A (tnodsra d t n gr是 Sa fr T E M Sa fr tem aama ae) tnod大学 设计 开 发 的数 据流 管 理 系统 (S ) D MS ,它 用 扩展的 S QL语言 处 理数 据流 查 询 ,称 为 C ( 0 t u u eyL n u g) ,对 标 准 S QL C ni o sQu r a g ae J n QL的修 改主 要 有 两个 方面 :在 F OM 子 句 中允 许 引用数 据 流和 关系 ;扩 充 查询 语 言 的滑 动 窗 口表 示. R
关键词:数据 流 ;持续查询 ;窗 口语 义
中图分类号: T 31 P 1 文献标识码 : A
1 引言
传统数据库技术在 2 O世纪得到 了非常成功的发展,已形成成熟的技术和产业.随着高速 网络技术的 发展 ,需要实时处理的大容量数据流 的应用系统越来越多,在网络监测、通信数据管理、金融股票信息、
20 0 8年第 3期 ( 总第 6 1期)
漳州师范学 院学报 ( 自然科学版)
J u n l fZh n z o r l ie st ( t S i) o r a a g h u No ma v riy Na. c. o Un
No 3 2 0 . . 0 8年
Ge e a . 1 n rl No 6
收 稿 日期 : 0 80 -2 2 0 -51
基金项 目:漳 州师 范学院科学研究 资助项 目(K 7 0 ) S 0 02 作 者简介:陈磊松(9 3) 17 . ,男,福 建省福安市人,副教授,硕士.
第2 期
陈磊 松 , 国平 : 林 数据流窗 口查询语义 的局限性及 改进方法
传感器网络等领域 中,数据流处理已成为很常见的应用. 这些系统会 自然产 生数据流而不是数据集,面对 的都是在线的、持续的高速数据流,系统处理的对象形态完全不 同于传统的静态数据处理,在数据流模型 中,不支持对部分或全部数据的随机访问,而是 以持续数据流的形式到达.与传统存储关系模型不同,数 据流具有实时J 、无序性、无穷性、瞬时性、时序性等特 . 陛
相关文档
最新文档