非对称性相关技术应用于商业数据分析的研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 购物 篮数 据及 其 相关 分析 、
商 品 的顾 客 同时 购买 了B中商品 的可 能性 有 多大1 。若 条 规 则 的 支 持 度 和 置信 度 分 别 大 于 给 定 的最 小 阈 商 品 间 的相 关性 分 析 由关 联 分 析延 伸 而 来 .下 面 值 . 这样 的规 则 是 “ 趣 的” 称 有 。相 关 分 析从 使 用 支持
一
置信 度 架构 的关 联 分析 扩充 而来 . 常 . 并 非独 通 当A 使 用 关 联 规 则 挖 掘 中 的 一 些 记 号 和 定 义 来 描 述 购 度一 立 于B出现 时 . 称A和B 相关 的。 是 物 篮数 据及 其 相关 分析 。
的 商业数 据 的相 关分 析是 商 业辅 助决 策 系统 的一项 重要 内容 。文章 首先研 究 了购物篮数 据 项 间的相 关性 , 分 析 了其 非 对 称性 的特 点 , 引入 了衡 量 非 对称 相 关性 的方 法 ; 对统 计 独 立性 进 行 了研 究 , 出基 于信 息 并 提 熵 的新 方 法 用于检验 非对 称相 关 的统计 独 立性 。最后 , 通过 一 个 实例 验证 了上 述方 法的有 效性 。
在实 际购 物篮 数 据上进 行 了实例 验证 为叙 述方 便 . 不引 起混 淆 的情况 下 , 文将 直接 使 用 在 下 本 文 第 1 主要 介 绍 相 关 性 分 析 的 有 关 背 景 知 识 A 节 表示 事件 X=A, 表示 事件Y B B = 。这 样 , 规则Af的支 B 和相 关研 究工 作 : 节探 讨 非对 称 相关 性 的度 量方 法 持 度 可 以表 示 为 概率 PAuB , 信度 为 条 件概 率 PB 第2 ( 1置 (I
这些 商业数 据 也称 为购 物 篮数 据(ak t a ) 。在研 也称 为k 项 集 b se t … da 一 制新 大陆税 控 收款 机增 值 服 务 系统 ( 业 营销 辅 助决 商 定 义4 关联 规 则 : 于包 含n 项 的事 务数 据集 T 对 个 . B 的关联 规 则 , 中A、 其 BcI 是非 空项 策 系统 ) 程 中 , 们提 出使 用数 据挖 掘模 型 作 为 系统 形 如Af 的规则 为T 过 我 的基础 技术 架 构 .购物 篮 数据 分 析 是其 中的一 项关 键 集 . AnB 且 = 技术。 关 联 规 则 描 述 的 是 各 种 商 品 之 间 的关 联 关 系 . 这 关 联 r scai ) 析 是数 据挖 掘 技 术 在 购 物 篮数 种关 系 以( a o it n分 s o 一些 商 品A)( f另一 些商 品B) 的形 式 表示 , 其 据 分析 中 的一项 典 型应 用 .其 目的是 挖掘 购 物 篮数据 含义 是顾 客 在 购买 商 品A的 同时也 倾 向于购 买 商 品B 项 间 的 有 趣 联 系 。在 关 联 分 析 领 域 , 已提 出著 名 的 关 联规 则 的 “ 有趣 程度 ”用 下 列 的支持 度 和置 信度 衡 A rr pi i o 算法 用 于关联 规 则挖 掘 . r 等人 将 关 联规 则推 量 。 Bi n 广 到 相关 (Orlt n分 析 , 献 [,] 出 了相 关 分析 Cre i ) ao 文 45 给 定义 5 支 持度 : 虑任 意项 集I若T中s 考 , %的事务 包 在 商业 领域 的一 些应用 。 而 . 然 在构 造商业 数 据 挖掘模 含I称 I . 的支 持度 为s %。 型 时 .我 们发 现 商 品间 的相 关 性存 在 明显 的 非对 称现 定义 6 置信 度 : 于形 如 A B 对 的关 联规 则 , 若T中 象 .这种 特性 使 得上 述 经典 技术 和方法 的有效 性 大大 包 含项 集A的事 务 中有 c %的事务 也包 含项 集 B. 关 联 则
【 关键 词 】 数 据挖 掘 ; 物篮 分析 ; 关性 ; : 购 相 对称 性
在 商业 领 域 .条码 技 术 和 税控 收款机 技 术 的 发展 商 品 , x, , 用 12 x …表 示 。
使得 商 场 、 市 能 容 易 地 收集 、 储 大量 的销 售 记 录 , 超 存
定 义3 项集 : 集I {。: x} 个 项 的集合 。I 项 x, , 为k = x …,
以及基 于 信息 熵 的统计 检 验 方法 : 3 通过 实 例对 研 A)分别 反 映 了规则 的有 用 性( 第 节 , 同时购 买项 集A和B 的所 究成 果进 行验 证 : 最后 在 第4 节结 束 语 中对 本 文研究 成 有 商 品 的 可 能 性 有 多大 ) 确定 性 f 买 了项 集 A中 的 和 购 果进 行 总结并 简要 介绍 研 究成 果 的应 用成 效 。
降低 。 为此 , 文研究 了一种 描述 商 品 间这种 非对 称相 规  ̄ A B 置信度 为c 本 J (的 %。 关 的方法 . 对其 统计 独 立性 进 行 了分 析 , 并 在指 出传 统 从 统计 学 的角 度看 .项 集A、 在事 务数 据T 的出 B 中 方法 缺点 的基 础 上 。 出 了一种 基 于信 息熵 新 方法 . 提 并 现 可 以看 作 两个 随 机变 量 X、 Y的2 事件 X A和Y B 个 = =。
21 0 0年第 1 2期
福 建 电
脑
7 5
非对 称 性 相 关 技 术应 用 于 商 业 数Biblioteka Baidu据 分 析 的研 究
吴 学 超
( 建 新 大 陆 电 脑 股 份 有 限公 司 福 建 福 州 3 0 1 福 5 0 5)
【 摘
要 】 通 过条 码 识 读设 备和 税 控收 款机 可 以容 易地 收 集到 大 量 的商 业数 据 ( 物篮 数 据)对 这样 : 购 ,
商 品 的顾 客 同时 购买 了B中商品 的可 能性 有 多大1 。若 条 规 则 的 支 持 度 和 置信 度 分 别 大 于 给 定 的最 小 阈 商 品 间 的相 关性 分 析 由关 联 分 析延 伸 而 来 .下 面 值 . 这样 的规 则 是 “ 趣 的” 称 有 。相 关 分 析从 使 用 支持
一
置信 度 架构 的关 联 分析 扩充 而来 . 常 . 并 非独 通 当A 使 用 关 联 规 则 挖 掘 中 的 一 些 记 号 和 定 义 来 描 述 购 度一 立 于B出现 时 . 称A和B 相关 的。 是 物 篮数 据及 其 相关 分析 。
的 商业数 据 的相 关分 析是 商 业辅 助决 策 系统 的一项 重要 内容 。文章 首先研 究 了购物篮数 据 项 间的相 关性 , 分 析 了其 非 对 称性 的特 点 , 引入 了衡 量 非 对称 相 关性 的方 法 ; 对统 计 独 立性 进 行 了研 究 , 出基 于信 息 并 提 熵 的新 方 法 用于检验 非对 称相 关 的统计 独 立性 。最后 , 通过 一 个 实例 验证 了上 述方 法的有 效性 。
在实 际购 物篮 数 据上进 行 了实例 验证 为叙 述方 便 . 不引 起混 淆 的情况 下 , 文将 直接 使 用 在 下 本 文 第 1 主要 介 绍 相 关 性 分 析 的 有 关 背 景 知 识 A 节 表示 事件 X=A, 表示 事件Y B B = 。这 样 , 规则Af的支 B 和相 关研 究工 作 : 节探 讨 非对 称 相关 性 的度 量方 法 持 度 可 以表 示 为 概率 PAuB , 信度 为 条 件概 率 PB 第2 ( 1置 (I
这些 商业数 据 也称 为购 物 篮数 据(ak t a ) 。在研 也称 为k 项 集 b se t … da 一 制新 大陆税 控 收款 机增 值 服 务 系统 ( 业 营销 辅 助决 商 定 义4 关联 规 则 : 于包 含n 项 的事 务数 据集 T 对 个 . B 的关联 规 则 , 中A、 其 BcI 是非 空项 策 系统 ) 程 中 , 们提 出使 用数 据挖 掘模 型 作 为 系统 形 如Af 的规则 为T 过 我 的基础 技术 架 构 .购物 篮 数据 分 析 是其 中的一 项关 键 集 . AnB 且 = 技术。 关 联 规 则 描 述 的 是 各 种 商 品 之 间 的关 联 关 系 . 这 关 联 r scai ) 析 是数 据挖 掘 技 术 在 购 物 篮数 种关 系 以( a o it n分 s o 一些 商 品A)( f另一 些商 品B) 的形 式 表示 , 其 据 分析 中 的一项 典 型应 用 .其 目的是 挖掘 购 物 篮数据 含义 是顾 客 在 购买 商 品A的 同时也 倾 向于购 买 商 品B 项 间 的 有 趣 联 系 。在 关 联 分 析 领 域 , 已提 出著 名 的 关 联规 则 的 “ 有趣 程度 ”用 下 列 的支持 度 和置 信度 衡 A rr pi i o 算法 用 于关联 规 则挖 掘 . r 等人 将 关 联规 则推 量 。 Bi n 广 到 相关 (Orlt n分 析 , 献 [,] 出 了相 关 分析 Cre i ) ao 文 45 给 定义 5 支 持度 : 虑任 意项 集I若T中s 考 , %的事务 包 在 商业 领域 的一 些应用 。 而 . 然 在构 造商业 数 据 挖掘模 含I称 I . 的支 持度 为s %。 型 时 .我 们发 现 商 品间 的相 关 性存 在 明显 的 非对 称现 定义 6 置信 度 : 于形 如 A B 对 的关 联规 则 , 若T中 象 .这种 特性 使 得上 述 经典 技术 和方法 的有效 性 大大 包 含项 集A的事 务 中有 c %的事务 也包 含项 集 B. 关 联 则
【 关键 词 】 数 据挖 掘 ; 物篮 分析 ; 关性 ; : 购 相 对称 性
在 商业 领 域 .条码 技 术 和 税控 收款机 技 术 的 发展 商 品 , x, , 用 12 x …表 示 。
使得 商 场 、 市 能 容 易 地 收集 、 储 大量 的销 售 记 录 , 超 存
定 义3 项集 : 集I {。: x} 个 项 的集合 。I 项 x, , 为k = x …,
以及基 于 信息 熵 的统计 检 验 方法 : 3 通过 实 例对 研 A)分别 反 映 了规则 的有 用 性( 第 节 , 同时购 买项 集A和B 的所 究成 果进 行验 证 : 最后 在 第4 节结 束 语 中对 本 文研究 成 有 商 品 的 可 能 性 有 多大 ) 确定 性 f 买 了项 集 A中 的 和 购 果进 行 总结并 简要 介绍 研 究成 果 的应 用成 效 。
降低 。 为此 , 文研究 了一种 描述 商 品 间这种 非对 称相 规  ̄ A B 置信度 为c 本 J (的 %。 关 的方法 . 对其 统计 独 立性 进 行 了分 析 , 并 在指 出传 统 从 统计 学 的角 度看 .项 集A、 在事 务数 据T 的出 B 中 方法 缺点 的基 础 上 。 出 了一种 基 于信 息熵 新 方法 . 提 并 现 可 以看 作 两个 随 机变 量 X、 Y的2 事件 X A和Y B 个 = =。
21 0 0年第 1 2期
福 建 电
脑
7 5
非对 称 性 相 关 技 术应 用 于 商 业 数Biblioteka Baidu据 分 析 的研 究
吴 学 超
( 建 新 大 陆 电 脑 股 份 有 限公 司 福 建 福 州 3 0 1 福 5 0 5)
【 摘
要 】 通 过条 码 识 读设 备和 税 控收 款机 可 以容 易地 收 集到 大 量 的商 业数 据 ( 物篮 数 据)对 这样 : 购 ,