基于文本文件的可拓数据挖掘方法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
{ u∈ U, u Ml K( )≤ 0 为 的负域 ; }
A = { u E U, “ =0 uI K( ) }为 A的零界 。 显然 , 界是正域和 负域的交集 。若 ∈ , 零 。
贝 ∈ A+ 且 “ E 一 0u , 。
事 物 在 经 过 可 拓 变 换 后 , 以 从 不 行 变 为 可 可
称 J = { M E U, ( MI K ) =一1 }为 A 的
个难题 。
与 之 对 应 , 称 则 A = { , )J ∈ U, ( Y “
Y = K(/ /)∈ ( ∞ ,+ ∞ )} , 一
为论域 上 的一个 可拓 集合 , 中 Y=K( ) A 其 u为
的关 联 函 数 。K( ) /关 于 A 的 关 联 度 。 称 n 是 / , A = { H ∈ U, ( )≥ 0} A的 正 域 ; Ml KM 为
掘 , 图发现 地震前兆信 息 。 试
1 可 拓 数据 挖 掘技 术 概 述
1 1 可 拓 集 .
设 u为论 域 , 对 u 中的任 一 元 素 u ∈ U, 若 都有一个 实数
K( u)∈ ( ,+ ) 一
据库 和文本方式 , 而后者更 为普 遍 以地 震卫星数 据为 例 , 得到 的是二进制文件 , 以很容 易地转换 可 成文本 文件 , 而且 是海 量数据 , 如何从海量 数据 中 找 出地 震发生前 的异常信息是 当前急需研 究 的一
箜 鲞笙 塑
21 0 1年 6月
防 灾
科
技 学 院 学
报
Vo . 3. . 1 1 No 2
J o n ttt fDia t rP e e t n . fI si e o s se r v ni u o
J . 01l un 2
基 于 文 本 文 件 的 可 拓 数 据 挖 掘 方 法 研 究
数据挖 掘是研 究从 数 据 中挖 掘有 用 的知 识 , 即从 已有 的数 据 找 出数据 之 间所 呈 现的规 律 , 推
导 出有 用 的 知 识 。数 据 挖 掘 技 术 可 以应 用 到 多 个 领 域 , 文 本 数 据 挖 掘 、 e 如 w b数 据 挖 掘 , 且 并 都 已取 得 显 著 的成 效 。 数 据 的 存 储 方 式 主 要 有 数
行 , 这种变化并 不 是说 将 不可 行 的事 物都变 为 但
可 行 , 此上 面的定义必定 存在一个 临界 , 因 因此 如 下 定义 :
异常 , 而达到预报地震 的 目的。 从 “ ・2 大 地震 给 灾 区人 民带 来 了巨大 的灾 51” 害, 目前 已有许 多学 者对 此 次地震 进 行 了深入 的
收 稿 日期 :0 1—0 21 3—2 2
基 金 项 目 : 国地 震 局教 师 科 研 基金 ( 0 9 1 5 , 灾科 技 学 院 2 0 中 20 00 ) 防 0 9年 大学 生 创 新 项 目
作者简介: 李忠 (9 6 ) , 士 , 授 , 16 一 男 博 教 主要 从 事 信息 处 理 、 工 智 能等 方 向 的研 究 . 人
・
l ” 川地 震 空 间电 离 层 电场 文 本数 据 文 件 的 处 理 。 利 用 自行 开 发 的数 据 挖 掘 软件 进 行 数 据 分 类 , 震 前 2汶 在
】 0天 数据 中 , 到 了 2个 关 联度 异 常文 件 , 计 算 了挖 掘 知 识 的支 持度 与 可信 度 。 得 并
研 究 , 文 采 用 的数 据 是 震 前 1 本 2天 D M T R 卫 E EE
称 A = { I K( ) >0 为 A的纯正 “E U, M }
域, 即经典域 ;
称 A = { u∈ U 一1<K( )<0} u I , M 为 的
可 拓域 ;
星采集 的电离层 电场 数据 , 其施 行 可拓 数据 挖 对
李 忠 , 方 辉 ,李 鑫 , 涂 袁 静 ,邢 丽 wk.baidu.com ,申 涛
( 灾科技 学 院 , 防 河北 三 河 050 ) 62 1
摘 要 : 文介 绍 了可拓 学理 论 与 可拓 数 据挖 掘 技 术 的 基本 概 念 与 基 本 方 法 , 将 可 拓 数 据 挖 掘 技 术 用 于 “ 本 并 5
A
一
本 文 主 要 研 究 将 可 拓 学 理 论 和 方 法 应 用 于 数 据 挖 掘 中 。可 拓 学 是 利 用 可 拓 变 换 , 从 变 化 的 即
=
角 度使假命题 变 为真命 题 , 把不 可 知 问题变 为 可
知 问 题 , 不 可 行 的 问 题 转 换 为 可 行 问 题 。 可 把 拓 数 据 挖 掘 是 在 数 据 挖 掘 获 得 的 静 态 知 识 基 础 上 , 过 可 拓 变 换 , 取 变 化 的 知 识 , 含 可 拓 变 通 获 即 换 的 规 则 知 识 。 算 法 研 究 的 数 据 基 础 就 是 地 震 卫 星数 据 , 用 可 拓 工 程 的 方 法 研 究 地 震 发 生 的 前 利 兆异常 , 即地 震 卫 星 数 据 在 地 震 发 生 时 所 出 现 的
关键 词 :文本 文件 ;可拓 数据 挖 掘 ;物元 ;关 联 函 数 ;地 震 电磁 卫 星 中 图分 类 号 : P 1 .3 T 3 1 1 文献 标 识 码 : A 文 章 编 号 :6 3—8 4 2 1 ) 2—0 2 17 0 7( 0 1 0 0 4—0 4
O 引 言
第 2期
李 忠等 : 于文本 文件的可拓数据 挖掘方 法研 究 基
。 5・ 2
称 : { ∈ , )<一1 为 的非域 ; l ( }
称此 函数为 关 于 。 的初 等 关联 函数 。此 函 ,
称 = { u∈u, u uI ( )=o 为 A的零 界 ; t