Web使用挖掘在电子商务个性化服务中的应用

合集下载

Web使用挖掘及其在电子商务中的应用研究

Web使用挖掘及其在电子商务中的应用研究

3 W e 日志 数 据预 处 理 b
We b日志数据预处理 . 是在模式挖掘之前 , We 对 b
1志数 据 进 行 清 理 、 理 并 转 换 存 储 的 过 程 。 3 整
W b 务器 e服
We 志数据预处理 的任务包括 : 据净化 、 b1 3 数 客户 识别、 会话识别 、 路径补充 、 事务识别等 5个方面 , 如图
格 式记 录 客户 对 We b服 务器 的所 有 访 问行 为 。
的频 繁访 问 模 式 .可 以为 解 决 上 述 问题 提 供 有 效 的辅 助 决 策 支 持
1 We b使 用 挖 掘 流 程
We 用 挖 掘 流 程【 图 1 示 b使 l I 如 所
图 2 We b服 务 模 型
志预处理是 We b使用挖掘质量保证的关键 。
显示 的 I P地址不相 同. 默认访问 的是不 同的客户。 () 2 如果 客户 的 I P地址 相 同 . 比较代 理信息 代理
服 务 器 字 段 的 内容 是 否 相 同 . 如果 不 同 。 明客 户 使 用 表
的操作 系统和浏览器不 同.可 以假定为两 个不 同的客
\ 、
李 海 威
! 三
We b使用挖掘及其在 电子商务 中的应 用研 究
, 李 小 福 , 樊 安 之
( . 东 省 财 政 信 息 中 心 , 州 50 3 ; . 山 大学 数 学 与计 算 科 学 学 院 , 州 5 0 7 ) 1广 广 10 0 2 中 广 1 2 5
摘 要 : 掘 商 务 网站 客 户 的 频 繁 访 问模 式 。 以 为提 高商 务 网站 的 个性 化服 务 水 平 和 服 务 质 量 提 挖 可 供 辅 助 决 策 支 持 。 究使 用 w e 研 b服 务 器 日志数 据 挖 掘 客 户频 繁 访 问模 式 的方 法 , 并依 据 客 户访 问 网站 序 列 的 有序 性 和 连 续 性 . A r r 算 法提 出四 点 改进 。 用 改 进后 的 A r r 于 对 pi i o 应 pi i o

电子商务中Web挖掘技术的应用

电子商务中Web挖掘技术的应用

本 ,形 成 一 个文 本 数 据集 。 由于 文 本数 据 源 基 本 上 无结 构 可 言 ,一 般采 用 自然语 言 描述, 现有 的计 算机很 难 处理 其语 义 , 以 所 要 进 行有 效 的 文 本挖 掘 就 必须 先 做 文本 分 析 ,抽 取 或 归纳 文 本 中具 有典 型 意 义 的元 数 据 并 加 以有 效 的表 示 。特征 修 剪 包括 横 向切 片 和纵 向投 影 两种 方 式 。 横 向切 片 是 剔除 噪声 文档 或抽 样数 据 ,改 进挖 掘 质量 , 提高 精 度 和效 率 。纵 向投 影 是按 照挖 掘 目 标 选取 有用 的特 征 , 通过 这种 特征 修剪 , 获 取一 个 代 表文 档 集 合 的 、有 效 的 、精 简 后 的特 征 子 集 ,为 文本 挖 掘做 好 准 备 。 W b 的内容 挖掘还 包括挖掘 后台交 易 e 数据 库 ,这主 要是 注册 用户 的活动 信息 ,它 在电子商务活动中起着非常重要的作用。 后 台 交 易数 据 库 中包 括 客 户登 记 信 息 ,它 是指 客户通过 W b页 在屏幕 上输 入的 、要 e 提 交 服务 器 的 相关 信 息 ,很 多 电 子 商务 的 提 供 者 都 能 够 收 集 到 有 关 用 户 的 各 种 信 息 ,包括姓 名 、地 址 、信用状 况 、统计数 据 以 及 线上 的各 种 细节 ,如 交货 日期 、数 量 等 。 ‘ 三 W b挖 掘的过 程和方 法 e ( )W 挖 掘 的过 程 一 eb 电子商 务中的 W eb挖 掘过程 一般 由 3 个主要 的 阶段组 成 :数 据准 备 、挖掘 操 作 、 结果表达和解释。 1、数据 准备 。这个 阶段又 可进一 步分 成 3个子 步骤 : 据集成 、数 据选择 、数据 数 预 处 理 。数 据 集 成将 多 文 件或 多数 据库 运 行环 境 中 的数 据 进 行 合并 处 理 ,解 决 语 义 模 糊 数 据 准备 ,这 个 阶 段 又可 进 一 步分 成 为处 理 数据 中的遗 漏 等 。 数据 选 择 的 目的 是 辨 别 出需 要 分 析 的数 据 集 合 ,缩 小 处理 范 围 ,提 高 数 据挖 掘 的 质 量 。预 处 理 是 为 了 克服 目前 数 据 挖 掘 工具 的 局 限 性 。 2、数 据挖掘 。这 个阶段 进行 实际的挖 掘操 作 ,包 括 的要 点有 :决定 如 何 产生 假 设; 选择 合适 的 工具 ; 发掘 知识 的操 作 ; 证 实 发 现 的知 识 。 3、结 果表述 和解 释。根 据最终 用 户的 决 策 目的 对提 取 的 信 息 进行 分 析 ,把 最 有 价 值 的 信 息 区分 开 来 ,并 且 通过 决 策 支 持 工具 提 交 给 决 策者 。因 此 ,这 一步 骤 的 任 务 不仅 是 把 结 果表 达 出 来 ,还 要对 信 息 进 行过 滤处 理 , 如果 不能 令决 策者满 意 , 要 需 重 复 上述 过 程 。 ( ) 电 子 商 务 中 数 据 挖 掘 的 方 法 二 针 对 电子 商 务 中不 同 的 挖 掘 目标可 以 采 用 不 同的 数 据挖 掘 方 法 ,数 据挖 掘 的 方 法有 很多 , 主要 包括 下面 3大 类 : 统计分 析 或数 据分 析 知识 发现 ;基于预 测模 型的 挖 掘方法等。 l 、统计分 析 。统计分 析主要 用于检 查 数 据 中 的数 学 规律 ,然 后 利 用 统 计模 型 和 数 学 模型 来 解释 这 些规 律 。统 计 分析 方 法 有 助于查 找大 量数据 间的 关 系 ,例 如 , 别 识 时 间 序列 数 据 中 的模 式 、异 常数 据 等 ;帮 助 选 择适 用 干 数 据 的恰 当的 统计 模 型 ,包 括 多维表 、剖分 、排序 , 同时应生 成恰 当的 图表提供给分析人员。

基于Web使用挖掘的电子商务个性化服务研究

基于Web使用挖掘的电子商务个性化服务研究
于个性 化推 荐所面 临 的关键 问题 是需要 对 大量 非 注 册用 户 的行 为模 型进行 深 层理 解 ,传 统 的协 同 过 滤方 法很 难处理 非注 册用 户 的情况 , b使 用 We
种静 态 的概念 , 它包 含在 站点 的定义 中 : 户通 用
过 注册 申请 一 块定 制 的 区域 , 面包 含用 户需 求 里

we b使 用 挖 掘 L 是 从 用 户 的 网络 行 为 中抽 1
取用 户感 兴趣 的模式 。通 过对 用户 浏览 网站 的使 用数 据 收集 、 分析 和处理 , 建立 起用 户行 为 和兴趣 模型, 这些 模 型可 以帮助 理解 用户行 为 , 改进 站点 结 构 以及为用 户提供 良好 的个 性化 信息 服 务 。由
摘 要 : 于 国 内外 最 新 研 究 成 果 对 电子 商 务 中个 性 化 服 务 的 We 用 挖 掘 进 行 了深 入 研 究 。 绍 了个 性 化 基 b使 介
服 务 系 统 的 内涵 , 出 了 W e 使用 挖 掘 的 基 本 过 程 和 关 键 技 术 , 提 b 围绕 模 式 识 别 , 究 了其 中 的 一 些 关 键 的 数 研 据 挖 掘 技 术 与 算 法 。 后 针 对 电子 商 务 的个 性 化 服 务 提 出 了 基 于 We 最 b使 用挖 掘 的体 系结 构 , 对 其 工 作 流 程 并
然 而另 外 一 种更 加 有效 、 自动 化 程 度更 高 的
方 法是 系统根 据 当前 用 户的浏 览模 式 来动态 调整
念 、 务方 式 、 服 服务 机制 的变 化 以及 相 关 的技 术 、
政 策与外 部 环境 的支撑 。 随着 近几 年 的发展 , 性 个
站 点 结构 与 内容 , 据 用户 的行 为 特征 为 其提 供 根

Web挖掘在电子商务中的应用的综述

Web挖掘在电子商务中的应用的综述
200 7 N0 . 3匕 SC IF NC「 & T任 CHNOLOOY } ORMA NF ON
学 术 论 坛
Web 挖掘在电子商务中的应用的综述
李晓勇
(江苏联合职业技术学院南京工程分院
江苏南京
21113 ) 5
摘 要: Web 挖掘技术已经得到了广泛的发展,并渗透到各个行业。本文介绍了 We b 挖掘的概念、任务和分类,并重点介绍了 Web 挖掘在电子商务中的应用。 关键词: Web 挖掘 电子商务 综述 文章编号: 1627 一3791(2007)12(b)一 0229一 1 0 中图分类号: T P 393 文献标识码 : A
1.3 We 挖掘的分类 b We 挖掘分为We 内容挖掘、We 结构 b b b
挖掘、W e b 使用挖掘。
(l We 内容挖掘。We 内容挖掘是指在 ) b b 组织的We 上, b 从文件内容及其描述中获取有 用信息的过程。Web 内容挖掘和基于多媒体 信息(包括TEXT、HTML 等格式)的挖掘和基 于多 媒体信息(包括IMAGE、 AUD1 、 0 VIDEO 等煤体类型)的挖掘, 是数据挖掘技术在网络信 息处理中的应用。基于文本的Web 挖掘软件 有AGENT 方法 和数据 库方面, 基于多 体的 媒 Web 挖掘有关联规贝方法和特征提取方法曰 J I 。 (2 Web 结构挖掘。Web 结构挖掘是从 ) WWW的组织结构和链接关系中获取有用的知 识的 过程。 大量的We 链接信息提供了 b 丰富的 关于Web 内容相关性和结构方面的信息, 为
I Web挖掘介绍
1. I Web挖掘的 概念, ] 数据挖掘是指从大量的、不完全的、模 糊的、随机的数据中提出隐含在其中的、潜 在的知识的过程。We b 数据挖掘贝是数据挖 1 掘技术的重要应用, 它是指在大量训练样本的 基础上, 得到数据对象间的内在特性, 并以此为 依据在网络资源中进行有 目的的信息提取。 1 2 Web挖掘的 任务!2 ] Web 挖掘是对Web 存取模式、Web 结构 和规则, 以及动态的We 内容的查找。We 挖 b b 掘包括信息检索、信息提取、概括和分析等

WEB挖掘在个性化服务系统中的应用研究

WEB挖掘在个性化服务系统中的应用研究
( )用户 识别 二
过 程可 以分成 3 个阶 段 : 预 处理 ,需 要对 收集 的数 据进 行必 要 的预处 理 , ①
例 如清 除 “ ”数 据 : 模 式发 现 ,应 用不 间 的W b 掘 算法 发 现用 户 访 问 脏 ② e挖
模 式 : 模式 分 析 ,从模 式 发现 的模 式 集合 中选 择 有 意义 的模 式 。W b 掘 ③ e挖
1 存 储 网页 主题 信 息 。在 网 站 的每 个页 面 中 , 已经把 主 题信 息 写入 . 规定字 段 , 以便 为 页面相 似提 供依 据 。 2 聚 类 分 析 。采 用 通 用 的WB 挖 掘聚 类 算法 , 根据 用 户 的频 繁 项 . E 集 ,对 用 户进行 分类 , 以丰 富页面 推荐 的深 度 。 3 加 工前 期 的会 话 文件 ,合 并生 成用 户 访 问跟 踪 文件 和 用户 访 问频 . 度 文件 。
果 归纳 。
用 户访 问 网站 时 ,按照 系统 可 以识 别程 度的 不 同,分 为三 种类 型 :注
册 用户 ; I P惟 一用 户 ;I 类 用户 。 P ( )析 取 配置 三
根 据用 户 I 在 配 置文 件 中 查找 用 户 的页 面访 问序列 ,序列 中 包括 用 D
户 最近 访 问 的网 页或 定制 的 网页 ( 指注 册 用户 )。依 次读 取 序列 ,参 考 单
3 e 日志 挖掘 。W b 、w b e 日志 挖 掘是通 过 分析 w b 务器 的 日志 文件 , 已 e服
个 人定 制 信息 ,最 终 生成 用 户主 题序 列 ,连 同页 面 访 问序列 一 起作 为 F 步
处 理的 输入 。
( )筛选 兴趣 四 筛 选的 依据 分 为两种 ,一种 由模 式库 的 关联 规则 导 出,另 外一 种 由聚 类 分析 的 分类 结果 生成 。关 联规 则分 析用 户 的访 问序 列 ,参 照模 式 库 中有 用 的 知 识 ,提 出或 推 荐 特 定 于访 问者 的 页 面 。模 式 库 中是 基 于规 则 的 知 识 ,依 据 用户 访 问的 旧档 信 息 ,我们 可 以预 测 出用户 的兴趣 爱 好、 搜索 习 惯 、 未 来 行 为 等 。 比 如 规 则 L I ve ( s r IY a e TE iw : F iw ue , BP g ) HN v e ( s r Pa e ,如 果用 户 的访 问序 列 中包 括介 绍 IM 的 页面 ,那 么 我 u e ,HP g ) B 们可 以把 有关H 的 页面推 荐给 用户 。 P ( )个 性化 应用 五 信息 经过 加 工处 理后 ,可 以得 到用 户 的兴趣 知 识 ,也就 是 兴趣序 列 。 利用 这种 个 性化 知 识 ,不 同类 型 的用 户在 各种 应 用 中反 映的 结果 也就 不 尽 相 同,这 些应用 都 可 以称 为 个性 化应 用 。在I TRE 领域 ,主 要包 括智 能 NE NT

Web使用挖掘技术在电子商务中的应用

Web使用挖掘技术在电子商务中的应用
21 0 0年
《 田 师 范 专 科 学 校 学 报 》( 文 综 合 版 ) 和 汉
J 1 0 0第 2 u. 1 2 9卷 第 四 期
总第 6 6期
We 使用挖掘技术在电子商务中的应用 b
唐 晓琴
( 商洛学院中文系
屈正庚
陕西商洛 760) 200
【 摘 要 J Wb服务 志 从 e 器日 文件和客户 交易数 挖掘出有意 据中 义的用 的用户端在访 问/ a ,0l 时,是从/a 开始 ,经过/ms w, c S b02 ls ( cs ls d  ̄e
子商务活动。 该文分析了 Wb e 使用挖掘技术, 阐述 了挖掘数据的过程并提出了 Wb e 使用挖掘技术在电子商务中的作用 。
骤如图 1 所示 :
活动 。
35聚类技 术。聚类技术 是对符合某 一访 问规律特 征的用户进 . 行用 户特 征挖掘 。聚类 分析可 以从 Wb访 问信息数据 中聚集 出具有 e 相似特性的那些客户。在 We 事务日志中,聚类顾客信息或数据项 b 能够 便于开发和执 行未来的市 场战略 。这种 市场战略包括 : 自动给 个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一
户访 问模式和潜在的客户群,使为企业提供全方位信息服务和开展有针对性的电 & ̄s o , c & o l l &ok / ̄s o k,最后才 到的/  ̄s o2 这 条规则说明在 l c &ok 。 l
/as 0l 页面上有有用的信息,但因为客户对站点进行的是迂回 c s bo2 l / ( 绕行 访 问,所 以这个有用信 息并不 明显 。如果这个页面对 网站来说 [ 关键字]e使 挖 ; 子 务 关 ; 类: 列 w 用 掘 电商 ;联 聚 序 b 比较重要,那么可以通过此路径分析改进页面及网站结构的设计, 1引言 . 从而使客户更容易的访问,as ol 。 c s bo2 l/ 【 电子商务的出现改变了传统的商务模式,使顾客在购买商品的 32关联规则。关联规则主要关注事物内的关系。在 W b使用 . e 过程中有了更大的选择空间,而不是像以前首先考虑品牌和地理因 挖掘 中,关联规 则就 是寻找 出用户 在访 问一个服 务器期 间中页面 / 素。因此,只有更好的了解客户的爱好、价值取 向等,才能赢得更 文件 之间 的关系 ,找出在某 一次服务器会话 中最经常一起 出现 的相 多的客户。We b使用挖掘是将传统的数据挖掘同We 结合起来, b 从 关画面。 例如,0 的客户购买了笔记本电脑之后又购买屏幕清洁剂。 4% We 文档和 We 活动中抽取用户感兴趣的、 b b 潜在的有用模式和隐藏 利用挖掘 出来的这些 相关性 ,我们 可以更好 的组 织站点 ,实施有效 信息,从而可有效地了解客户行为, 提高站点效率、 优化网站设计, 的市场策 略。 在激烈的市场竞争中处于有利位置。 33序列模式。序列模式挖掘就是挖掘出交易集之间有时间序 . 2 Wb使用挖掘 .e 列关系的模式, We 在 b曰志中发现所有满足用户规定的最小支持度 2 1e .Wb使用挖掘的概念 。 b 用挖掘 , We 挖掘 的一个方 的大序列模式。序列模式的发现就是在时间戳有序的事务集中,找 We 使 是 b 面。 b We 挖掘是从 WwW ( o d i e )上抽 取知识 的过程 ,它 到 那 些 “ 些 项 跟 随 另 一 个 项 ”的 内部 事 务 模 式 。例 如 :在 w r d w b lw e 一 是从与 www 相 关的资源和行 为中抽 取感兴趣 的、 有用 的模 式和隐 M ̄ &ok 上进行过在线定购的顾客, 6% s ol 有 0 的人在过去 1 天内也 5 含信 息, 也是将数据挖掘 技术和理论应 用于 WWw 资源 中进行挖 掘 在/I s a l处下 过订单 发现序列模式 能够便于进行 电子商务的 c S, g a b 的一个 新兴 的研究领域 。 组织预测客户的访问模式,对客户开展有针对性的广告服务。通过 We 用记录挖掘在 新兴的电子商务领域有 重要意义 ,主 要任 系 列模式 的发现,能够在服 务器方选取有 针对性 的页 面,以满足访 b使 务是从 Wb的访问记录 中抽取 感兴趣的模式 。Wb使用挖掘数据 除 问者的特定要求 。 e e 了服 务器的 日志记录外还 包括代理服 务器 日志 、浏 览器端 日志 、注 3 4分类规则。分类规则主要是根据用户群的特征挖掘用户群 . 册信息、用户会话信息、交易信息、C oi ok e中的信息、用户查询、 的访问特征 。 We 在 b数据挖掘 中,分类规则 的发现就 是给出识别一 鼠标点击流等一切用户与站点之间可能的交互记录。 个特殊群体公共属性的描述,这个描述可以用来分类新的项,例如: 22 b .We 使用挖掘 的过 程 。 电子商务环境下 , 在 主要 的挖掘对 象 在/  ̄s o2 c &ok 进行过在线定购 的顾客中有 5%是 2一O l 5 O3 岁生活在南 是服务器 日志 。W b使用挖掘 是一个多步骤 的挖掘 过程 。其主要 步 方 的年轻人 。得 到这一分类 后,就可 以进 行适合这一类客户 的子商务中的应用 .e

WEB数据挖掘及其在电子商务中的应用

WEB数据挖掘及其在电子商务中的应用
维普资讯
20 0 8年 第 1 期

建 电脑 17 来自 WE . B数据挖 掘及 其在 电子 商务 中的应 用
r . 阳 理 工 学 院 河 南 南 阳 4 3 0 . 南 1 704 2 州 交通 大 学 甘 肃 兰 州 7 0 7 .兰 3 0 0)
赵 焕 平 仝 选 悦 0
【 摘
用。
要】 随着互联 网信息的增长 , B挖掘 已经成 为数据挖掘研 究的热点之 一, : WE 尤其适 用于电子 商务领域 。 中介绍 文
了 w b数 据 挖 掘 的 概 念 和 分 类 . 阐述 了 W b挖 掘 在 电子 商 务 中的 挖 掘 方 法 和 过程 , 析 了数 据挖 掘 在 电子 商 务 中的 具 体 应 e e 分
面. 开展 有 针对 性 的 电子 商 务 以更好 的 满 足访 问者 的 需求 。
2WE . B数 据 挖 掘 概 述 2 1 B 数据 挖掘 的定 义 . WE
2知 识 发 现 : 于 人 工 智 能 和 机 器 学 习 , 用 数 据 搜 寻 过 . 源 利 程 . 到 一 个 有 意义 的 数 据 模 式 . 中 可 以发 现 规 律 , 体 的 方 得 从 具 法 有 人 工 神 经 网络 、 策树 方 法 、 传算 法 、 则 推 理 等 。 决 遗 规
售策略。 22 据 挖 掘 的分 类 .数 We b数 据 有 三 种 类 型 : nl 记 的 We Ht 标 l b文 档 数 据 , b文 33电 子 商 务 中 WE We . B数 据 挖 掘 的过 程 档 内连 接 的结 构 数 据 和 用 户 访 问 数 据 。按 照 对 应 的数 据 类 型 . 电 子 商 务 中 的数 据 挖 掘 的过 程 一 般 由 以下 几 个 主 要 的阶 段 We b挖 掘 可 以分 为 三 类 : 组成 : 据准备、 掘操作、 果表达和解释。 数 挖 结 1 b内容 挖 掘 : 是 从 We . We 就 b文 档 或其 描 述 中筛 选 知 识 的 1数 据 准 备 : b数 据 挖 掘 的 数 据 来 自两 个 方 面 : 方 面 是 . We 一

Web使用挖掘在用户个性化服务系统中的应用

Web使用挖掘在用户个性化服务系统中的应用
类报 告还 能提 供一 些有 限的分 析 , 比如 检测 未授 权 入 口点 。 出最 常见 不变 的 U L等 。尽管 这 种分 析 找 R 缺乏 深度 。 但这 类 知识 有助 于改 进 系统性 能 、 高系 提 统 的 安全性 、 于站 点修 改 , 提供 决策 支持 。 便 并 ( )关联 规则 。关 联 规则 主要 关 注事 务 内的关 2 系 。在 We b使 用挖 掘 中 , 联 规 则挖 掘就 是 挖掘 出 关 用 户与访 问 页面 P文件 之 间 的关 系 ,找 出在 某 次服 务器 会话 中经 常 一起 出现 的相 关 页面 。挖 掘发 现 的 关联 规 则往往 是 指支持 度 超过 预设 阕值 的 一组访 问 网页 。 研 算 法是挖 掘关 联规 则 的常用技 术 , A 可从 事务 数 据库 中挖 掘 出最 大 频繁 访 问项集 ,该 项集 就 是关 联规 则挖 掘 出来 的用 户访 问模 式 。 由于一般 网 站 的用 户访 问序 列数 据库 数据 量都 很 大 , 目前 的关
供个性 化 服务特 别有 用 。 () 4 分类 技术 。 主要 是根 据用 户群 的特征 挖掘 用 户群 的访 问特 征 ( 些 共 同 的特 性 )其 结 果 可 用 于 某 , 分析访 问某 一 服务 器 的用 户特 征 ,从而 用于 页 面推 荐等 。 () 5 序列 模式 。 这是 挖掘 出交 易集之 间 时间 序列 关 系的模 式 . 是从 We 日志 中发现 所 有满 足 用户 规 b 定 的最 小支 持度 的大 序列 模式 。 223 模式 分析 .- 模 式分 析 的主 要任 务是 对模 式发 现 中收 集到 的 数据进 行分 析 , 以便得 到用 户感兴 趣 的模式 。 一般 采
用 的模 式 分析方 法有 两种 。一种是 类似 S L的形 式 Q 化 的知识 查 询机 制 : 另外 一 种 就是对 We b数 据进 行 预处 理 以后创建 数 据仓 库 。并转 化 为相对 应 的多 数 据模 型 ,利用 联 机分 析工 具 O A L P对数 据 模 型进 行 处理 以后 获得知 识 , 终 提供可 视化 的结果 输 出 。 最

Web数据挖掘在电子商务的应用

Web数据挖掘在电子商务的应用

Web数据挖掘在电子商务的应用1电子商务中的数据挖掘简介电子商务中的数据挖掘即Web挖掘,是利用数据挖掘技术从www的资源(即 Web 文档)和行为(即Web服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合技术,涉及到Internet技术学、人工智能等多个领域。

当电子商务在企业中得到应用时,企业信息系统将产生大量数据,并且迫切需要将这些数据转换成有用的信息,为企业创造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。

2Web数据挖掘的流程Web数据挖掘是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取商业决策的关键性数据,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。

在电子商务环境下,Web数据挖掘主要分为以下儿步:(1)数据收集。

首先数据收集主要针对web数据中的服务器数据、用户数据。

其中服务器数据是Web挖掘中的主要对象。

服务器中承载着用户访问时产生的对应的服务数据,其中包括了:日志文件、cookie文件、数据流。

将这些数据进行初步收集,再针对这些数据进行深度分析挖掘。

(2)数据选择和预处理。

通过数据收集将数据进行分类,根据所需的信息主题对收集的数据进行选择,通过选择相关的数据项缩小数据处理的范用,挑选其中的有效数据进行数据预处理。

数据预处理能够提高挖掘效率,为之后的数据分析提供有效的数据。

Web数据中大多数都是半结构或非结构化的,所以对web数据进行直接处理是不可行的。

数据预处理能够把半结构或非结构化的数据处理成标准的数据集方便后期处理。

(3)模式发现。

模式发现是运用各种方法,发现数据中隐藏的模式和规则。

通过模式发现技术对预处理之后的数据进行处理得到相应的事务数据库,利用模式发现对数据进行初步挖掘,将预处理下的事务数据转换成可被挖掘的存储方式,通过数据挖掘模式算法对其中有效的、新奇的、有用的及最终可以理解的信息和知识进行挖掘与总结。

Web数据挖掘在电子商务中的应用

Web数据挖掘在电子商务中的应用

Web数据挖掘在电子商务中的应用电子商务网站每天都会产生大量的数据,运用数据挖掘技术可以从这些数据中发现对市场分析及预测非常有益的信息。

本文讨论了Web数据挖掘技术在电子商务中的应用。

标签:数据挖掘Web数据挖掘电子商务网络技术和数据库技术飞速发展,电子商务显示出越来越强大的生命力,同时各种基于互联网的商业Web站点也面临越来越激烈的竞争。

如何了解到顾客尽可能多的爱好和价值取向,为顾客提供更优质的服务成为电子商务发展迫切要解决的问题。

而电子商务网站的顾客在Web上的行为都会产生大量数据信息,不仅包括本次交易信息而且还有利用搜索引擎,以及在站点内进行浏览的相关数据。

利用数据挖掘技术可以有效地帮助企业分析这些数据,优化Web站点拓扑结构,指导企业调整营销策略,给客户提供动态的个性化的高效率服务。

一、Web数据挖掘Web数据挖掘(Web Data Mining),是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。

它是一项综合技术,涉及到Internet技术、人工智能、计算机语言学、信息学、统计学等多个领域。

对应于不同的Web数据,Web挖掘也分成三类:Web内容挖掘、Web结构挖掘和Web使用模式挖掘。

Web使用模式挖掘(Web Usage Mining)是对用户访问Web时在服务器方留下的访问记录进行挖掘,它通过挖掘Web日志文件及客户交易数据来发现有意义的用户访问模式和相关的潜在用户群。

其主要特点是对用户信息数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。

尽管Web挖掘的形式和研究方向层出不穷,但随着电子商务的兴起和迅猛发展,Web挖掘的一个重要应用方向将是电子商务系统。

电子商务是数据挖掘技术最恰当的应用领域,因为电子商务可以很容易满足数据挖掘所必需的因素:丰富的数据源、自动收集的可靠数据,并且可将挖掘的结果转化成商业行为,商业投资可以及时评价。

电子Web使用挖掘的个性化电子商务的设计

电子Web使用挖掘的个性化电子商务的设计

1 个 性 化 信 息 服 务 的 概 念 .
个 性化信息服务 的研 究起 源于 1 9 9 5年卡 内基 . 梅隆大学 的 Rbr Amsog oet r t n 等人在美国人工智能协会上提 出个性化导航系统 。 r
ev o 用户 I.服务器名 ,U L e g P R .完成浏览所 目前 , 个性化信息服务是全世界信息服务的研究热点 , 传统的通用 问 ,具体包括 S r rl (

足 用户的需求。本文构建 了基于 W b 用数据挖 掘的个, 4 e使 t L电子商务的模型 ,对该模型 中的数据 资源,关键技 术及基本流程  ̄ -
进 行 了研 究和探 讨 。
[ 词 ]W b 用数 据挖 掘 电子 商 务 关键 e使

个性化
个 性化信息 服务
2 We 使用挖掘的数据来源 b () 1 服务器端 数据 We 服务器的访问日志文件 .记录 了访 问者的访 问和交互信 b 息。We b日志文件是由许 多记录组成 ,记录 了用户对该 网站 的访
;忭 个
据挖掘 的方法包括路径分 析、关联规则 、序列模式 、分类规则 、
统计分 析、依 赖关系建模 和聚类分析等 。
图 基 e挖 的 化电 商务 墅 统 型 架 于Wb 掘 个性 子 模 的系 模 框
《现化2年月 旬) 5 商 代 0 3(刊总 6 o 场 0 中 第9 9 期
[ 摘
… … …

一 夏 治坤 淮安信 息职 业技术 学院
要 ]用户是 开 展 c c电子 商 务不 可 忽视 的 因素 , 用户体 2
对 该 用户 的 数据 进 行 预 处理
一 一 … … …
包 括数 据 的 清理 、转 换 、集 成

Web挖掘技术在电子商务中的应用研究

Web挖掘技术在电子商务中的应用研究
电 三 商 务 j F
We b挖掘技术在电子商务[ 的应用硼 夯 1 】
一 周
[ 摘ቤተ መጻሕፍቲ ባይዱ

中国矿 业大 学管理 学 院
要 ]w 曲挖 掘 是 数据 挖 掘 应 用 于 互联 网的 具体 表现 形 式 , 是 从 海量 的 电子 商 务 交 易信 息 中提 取知 识 以 掌握 网络 客 也
户 消 费 习惯 的 重要 技 术手段 。 本 文 旨在 分析 W b 掘 常 用 的技 术 及 其 在 电子 商 务 中的挖 掘 流程 , 并 对其 在 电子 商 务 中 的应 e挖 用 领域 进 行 探 讨 ,以 协助 商 家 更好 的 运 用 网络 开展 电子 商 务活 动 。 [ 关键词 ]W b 掘 电子 商 务 e挖

数据挖 掘
引 言
类是以 ” 簇内最 大相似 、簇 间最大不同”为宗旨的.它没有任何
1 多年 来 . 据 挖掘 技 术 在我 国理 论 界和 应 用 实 践 上都 取 得 划 分 标 志 .最终 可 划 分 为 几簇 也 不 可知 。序列 模 式 与 关联 分 析 类 0 数
了长足发展。电子商务通过 I e e 被越来越多的人认识并使用 . 似 .它寻找的是事件之间时间上的相关性。能发现数据库 中形如 nr t tn 成为现代社会节省资源、提升交易效率的新型商业运作模式 。正 “ 一段 时间 内 .顾 客 购买 物 品 A.然 后购 买 物 品 B 在 .而 后购 买物 是由于电子商务的深入发展 ,积累了大量的客户信息和 交易信
三 We 挖 掘在 电子商务中的流程 b 与普通的数据挖掘不同的是 we 挖掘的对象是互联 网上的 b
的动 态 特 征 .使 得 w b 掘 过 程 更加 复 杂 。 总体 来 说 we 挖掘 e挖 b

Web使用挖掘在电子商务个性化服务中的应用

Web使用挖掘在电子商务个性化服务中的应用
议 是 无 状 态 的 .所 以不 能 区分 和跟 踪 一 个 的 、有用 的 以及 最 终 可 以理 解 的信 息 和 知
因此 .如 何利 用技 术 手 段 了解 电 子 商 务 系 访 问 者 在 网站 上 的 所 有 行 为 .仅 依 靠 分 析 识 。可 用 于 We b使 用 的 挖 掘 技 术有 路 径 分

关键 词
We b挖掘 技 术 电子 商务 T 33 P 9
个性 化 服 务 A
中 图分 类 号
文 献标 识码
随着 Itme 应 用 迅 速 发 展 . ne t 电子 商 务 在 服 务 器 上 产 生 的 一 种 典 型 数 据 .是 在 线 程 效 率 更 高 , 据 挖 掘 的结 果 更 合 理 、 于 数 用
We b使 用 挖 掘 面对 的是 在用 户 和 网络 交 互
实 际 系统 中 的 数 据 一 般 都 具 有 不 完 全 模 型转 化 为 知 识 、再 经 过 某 种 度 量得 到真
统 用 户 的 偏好 、 惯 、 物模 式 和 潜 在 的 消 习 购 日志 文 件 所 得 到 的 用 户 信 息 是 很 少 的 因 析 、 联 规 则 、 类 分 析 、 类 分 析 、 列 分 关 分 聚 序
费 意 识 .为不 同用 户提 供不 同 的 信 息 和 商 此 要 吸引 访 问 者 成 为 注 册 用 户 . 以便 得 到 析 等 等 。路 径 分 析 是用 于发 现 一 个 站 点 中
维普资讯
Wb e使用挖掘在电 务个性服务中 应用 子商 的
李 晓 艳
( 中科 技 大 学管理 学 院 湖 北 武汉 华 4 07 ) 3 0 4
摘 要 电 子 商 务 的 快 速 发 展 和 电子 商务 系 统 积 累大 量 的 数 据 为 We b使 用挖 掘 提 供 了一 个 广 阔 的 应 用 领 域 。 通过 We b使 用挖 掘技 术挖 掘 出 电子 商务 用 户 潜在 模 式 对 用 户提 供 个性 化 服 务 。

Web使用挖掘技术在电子商务中的应用

Web使用挖掘技术在电子商务中的应用
GU O Ja g pn in — i g
( s a ltc nc Fo h n Poy e h i ,Fo h n 5 8 3 , h n ) s a 2 1 7 C ia
Absr c : ih t e d v l pme to nt r t,ee ton c c ta tW t h e eo n f I e ne l c r i omme c S bo n.W ih t e r i ie o lc r ni r e i r t h ap d rs fe e t o c c omme c t e nd f bu i s nd c t me r e. he d ma s o sne s a us o r whih ba e he W e d t e re a a ni wi1 e c s d on t b a a r t iv 1 nd mi ng l b r ie c a e e s y At a s d e s ls l . pr s n ,t e t tc tuc ur i t W e p g ha be n e a e ce ry e e t h s a i s r t e n he b ae s e r plc d l a l pe s na ie r o lz d dy mi t uc ur ie na c s r t e st .Ac o di g t he W e e v rl ie c r n o t b s r e og fls,c s o rt a a to a a,i s i p r a tt n u t me r ns c i n d t ti m o t n hi g t g o t t e m e ni gf e c e s pa t r d p e ilc t m e s,t n t ovde e t r rs s wih a f l O di u h a n ulus r a c s te nsan ot nta us o r he o pr i n e p ie t ul

Web挖掘技术在电子商务的应用

Web挖掘技术在电子商务的应用

请求和浏览过程中的点击流, 这部分数据主要用于考察用户的行为表现 。 () 挖 掘 对 所 得到 的 信 息进 行 挖掘 , 现普 遍 的模 式 。 3数据 发 () 分 析:对 挖掘 出的 结果 , 4结果 即普 遍 模 式进 行 确认 或者 解 释 , 分 将
析所 得 到的知 识 和模 式用 于 网站 的设 计 和改造 中去 。 1 3W b . .e 数据 挖 掘 的 主 要技 术 W e 数 据挖 掘 中常 用 的技 术 有路 径 分 析 技术 、 联规 则 、 类 聚 类 技 b 关 分 术等 。 () 径 分析 技 术. 路径 分 析 技术 进 行 We 使 用 模 式 的数 据 挖 掘 时 , 1路 用 b
Al
We b挖掘 是 一 项综 合 技术 , 及 W e 、 涉 b 数据 挖 掘 、 算机 语 言 学 、 计 信 息学 等 多个 领 域 。 e W b挖掘 就 是 从 W e b文档 、 b 动 中抽 取 感 兴 趣 的 、 We 活 潜在 的有 用 模 式 和 隐藏 信 息 。 e 挖掘 是 指 从 大量 We 文档 结 构 和使 用 的 W b b 集合 C中发现 隐含 的模 式 p ,如果 将 C看作 输 入 ,P 作 输 出 ,那 么 W e 看 b 挖掘 的 过程 就 是从 输 入 到 输 出的 一 个 映射 { —p。 e 挖 掘从 数 据 挖 掘 :C W b 发展 而来 , 因此其 定 义与 我 们熟 知 的数 据挖 掘 定义 相 类似 , 都是 在对 大 量 的 数 据 进行 分 析 的基 础 上 , 出 归 纳性 的 推理 , 测 客 户 的行 为 , 助 企业 的 作 预 帮 决 策 者调 整 市 场策 略 、 减少 风 险 、 出正 确 的 决 策 的过 程 。 作 1 2 W b挖 掘 的基 本 步 骤 ..e 通常 可 以将 We 数据 挖 掘 分 为 四个 步 骤: b () 定业 务 对 象 虽然 We 数 据 挖 掘 的最 后 结 构 是不 可 预 测 的 , 对 1确 b 但

Web挖掘在电子商务中的应用研究

Web挖掘在电子商务中的应用研究

en t It e 的发 展 各企 业 均积 累 了大量 的数 据 。如何 从这 些 数据 中 n r
1 关 联分 析 ,用于 发 现 同一 事 件 中不 同数 据项 的相 关性 。 常
发 现潜 在 的 规 律 ,来 帮 助 制定 企 业 今 后 的发 展 战 略 , 是各 电子 商 用 的 A O i 法分 为 两步 .首 先找 出 满足最 小 支持度 阈 值的频 繁 p ir算 r 务平 台急 待解 决 的 问题 。We b挖掘 作 为数据 挖掘 的 一个 重要 分支 项 集 然后 由它 们 形 成满 足 最 小置 信 度 阈 值 的强 关 联规 则 。 可 以
2 优 化 We b站 点 结构 。通 过 分析 用 户的 浏览 路径 .用有 向 图 1 数据 收 集 W e b挖掘 的数 据 对象 包括 服 务器 日志数 据 、代 来 表 示 用户 的 整 个页 面 访 问过 程 . 图 中的 顶 点代 表 页面 ,图 中的
隐含 在 其 中 的 、人 们 事 先不 知 道 的 、 但又 是 潜 在 有 用 的知 识 的过 器 模 型 .然后 将 其 用于 对 其 它 数据 的分 类 。 常 用 的方 法 有贝 叶 斯
的资 源 和行 为 中抽 取感 兴 趣 的 、有 用的 模式 和 隐含 知识 。一般 地 ,
We b挖 掘可 分为 三类
它又 可 以分 为 W b 页面 内容挖 掘 和搜 索 结 果挖 掘 。 页面 内容 挖 费 群 体 的 特 殊 需 要 。 e
指 的是 以某 一 搜 索 引擎 为 基 础 . 已搜 索结 果 进 行挖 掘 。 对
2 We 结构 挖掘 ,是 从 WWW 的组织 结构 和链接 关 系中推 导知 b 识 。它 又可 以分 为外部结 构 挖掘 内部结 构挖 掘和 U L挖掘 。We R b 结 构 挖掘 的 目的是通 过聚 类 和 分析 网 页 的链 接 , 发 现 网页 的结 构 和有 用 的模 式 , 找 出权 威 页 面 录 发现 用户 访 问 W e b页 面 的模 式 。 它又 可分 为一 般访 问 模式 挖 掘 和个 性 化 服 务 模 式 挖 掘

Web挖掘在电子商务中的应用研究

Web挖掘在电子商务中的应用研究

务 的快捷 和方便时 ,他们 同时面临着一 个重要问题 :

方面 ,用户 面对 网站上 提供 的琳 琅满 目的众 多商
次购 买 ,就必须 浏览许 多不相 关的网页 ,在众多 的
品 ,他们 只对其 中的一部 分商品感兴趣 。用户要实现

商 品分类中找到 自己所 需要 的商 品 ;另一方面 ,商家 面 对众多的用户 ,不知道他们对商 品的兴趣和要求是 什 么。 因此 ,电子 商务的商 家无 法及时调整 网站 的页
掘在 电子商务 中的应 用。
关 键 词 : 电子 商 务 ;W e数 据 挖 掘 ;知 识模 式 b
与互联 网的迅速 发展和普及一样 ,电子 商务也 以 极其迅猛 的速度 向前 发展 。这种商业 电子化 的趋 势不
仅为顾客提供 了更加便 利的交易 方式和广泛 的选择 , 也给商家提供 了无数 的商机。而基于W b e 的数据挖掘 技术 的出现不仅 为商 家做 出正确 的商业决 策提供 了强 有力 的工具 ,也 为商 家更加深入地 了解客 户需求信息
三 、电子商务 中We 数据挖掘能够获取的知 b
识模式
运 用 W e 数据 挖 掘 技 术 对 站 点 上 的各 种 数 据 源 进 b 行 挖 掘 ,找 到 相 关 的一 些 知 识模 式 , 以指 导 站 点 人 员
接 ,授权失败 ,超时等。
C o i lg :C o i 是 一 种W e , 务 器 通 过 浏 o k s o k s eo e bE  ̄
技 术 尤 其 是 It re 的 发 展 所 催 生 的产 物 。 1 9 年 , ne n t 5 9
N t c p 和 If s e 公司在 网上售 出了第一 个旗 帜 es a e n o e k 广告 空间 ,所以人们一般将 电子商务开始 的年代定 为 1 9 年 ,电子商务理论的研 究也就从此开始。 5 9

关于Web数据挖掘在电子商务中应用分析

关于Web数据挖掘在电子商务中应用分析

10 6 1 1 1)
摘 要 :本文立 足 于 W e b数据 挖掘技 术 ,从 W e b数据 挖掘 的技 术介 绍、客 户关 系管理 中的应 用和 W e 挖 掘 的作用 三 b 个 角度 ,分 析 了电子 商务 中的 w b数据 挖掘 应 用。 e 关键词 :We 数 据挖掘 ;电子 商务 ;C M b R 中 图分 类号 :T 3 P1 1 文献标 识码 :A 文章 编号 :10— 59 ( 00 1— 19 0 07 99 21 ) 2 00 — 1
Th eApp id le Ana y i fW e t i i n busne s l sso b Da a M n ngi E- i s
Zh u Yig o n
(i nn d n t t nC l g , h n a g 1 1 1C i ) L o ig mi sr i o e eS e y n O , h a a A i ao l 1 6 n
机 系 统 .0 9 20

1 09 一
计算机 光盘 软件 与应 用
21 第 1 0 0年 2期 C m u e D Sf w r n p l c t o s o p trC o t a ea dA p a in i 工 程 技 术
关于 We b数据挖掘在电子商务中应用分析
周 莹
( 宁行 政 学 院 ,沈 阳 辽


度 。然 后 ,经常 会 因为 网路线路 连接 问题 ,会致 使造 访者 在提 出 了 U L 求指 令之 后 ,相关 网页会 在很 长的 一段 时间才 能打开 , R请 这就 导致 了用 Itr e 日志所 记录 的 时间去分 析所 有模式 规 则 nen t 时 ,会产 生一定 程度 上 的误差 。为 了解 决这一 问题 ,我们 最常 用 的方法 就 是利用 序列 模式 挖掘方 式预 测 出造访者 后 续所要 访 问的 页面集 ,根 据预 测 出的页 面集把 它提 前下 载到本 地 计算机 的缓存 空间 中,这 样就 能很 大程度 地 降低打 开页 面 的时间 ,这势 必将会 提高浏 览 时间 的有效性 和准 确性 。 ( )聚类 分类 技术 。把相 同特 征数据 项聚 成一 类 的技 术称 三 为聚类 技术 。 聚类 分析 的模式 主要 就是通 过对 数据划 分不 同 的组 , 尽可 能地加 大各 组之 间的差 别 , 同组之 间要尽 可能减 小这种 差别 , 因此我 们通 常把 聚类 分析称 为元 监督 分类 。聚类 归类 之后 ,当造 访者 的模式 完全 吻合 其型 号后 ,推荐 引擎 就会 自动将 造访者 还 没 有访 问的页 面进 行准确 的测 试 ,然 后再 将此 推荐给 造访 者 。 三、在 电子 商务 中的应 用介绍 近 几年 ,随着 电子商 务 的不断兴起 和 发展 , e 数据挖 掘将 来 Wb 发展方 向会 向着 电子 商务系 统发 展 。 e访 问信息 挖掘 则是与 电 而W b 子商 务关系 最为 密切 。 ( ) 现潜 在客 户 。 于Wb 一 发 对 e 数据挖 掘 的客户信 息 中,通 常 是利用 分类 技术 在 网络 上牵 引 出未来 的潜在 客户 群 。这种方 法就 是先要 对 己有造 访者进 行分 类 , 然后通 过在W b 的分 类寻 求 , e上 在 网络 中根据 现有 客户 的特征 描述 识别 出与其 相似 的 客户 ,之后 再 对 其进 行运 算和 分析进 行 正确 的归类 。最后 根据 所 罗列 的特 征 判 断是不 是属 于 自己所 要开发 的客 户群 。 当客 户 的类 型确定之 后 , 就 可 以动态地 对客 户展 示W b e 页面 , 页面 的 内容取 决 于客户 与服 务 之 间 的关 联和 销售 商提 供的产 品 。 ( )提供优 质个 性化 服务 。对 一般用 户来 说 , 已经 不存 在 二 销 售商 与传 统客户 之 间的 空间距 离 。在 网络 中,所有 的销售 商对 客 户来 说都 是一样 的 ,对销 售商 来讲对 他们 最大 的挑 战 ,就 是如 何才 能保 证客 户驻 留在 自己的销售 网点 上, 销售 商为 了 留住 客户 , 所 以首先 就要 了解 所有 客户 的浏 览行为 ,只 有知 道 了客 户 的需求 及兴 趣 ,才 能动态地 去 调整Wb e 页面 ,从 而满足 不 同客户 的需要 。 通 过对客 户访 问信 息 的挖掘 ,就 能知道 客户 的浏 览行 为 ,从 而 了 解 客户 的兴趣 及需求 。 ( ) 三 搜索 引擎 的应用 。 过对W b 通 e 网页 内容 的挖 掘 , 能 实 就 现对 网页 的分类 和 聚类 ,实现 网络 信息 的分 类检 索与浏 览 ;通过 对用 户使 提 问的历 史记 录 ,进 行有 效地 业务扩 展 ,从而 提高 了用 户 的检索 效果 ; 用 不断地运 用W b 利 e挖掘 技术 改进 关键词 的加 权算 法 ,以便 于更 有效 地提 高 网络 信息 的标 引准确 度 , 善检索 效果 。 改 参考 文献 : 『I 家炜. eq 掘研 究【. 算机研 究 与友 展 , 1,4 5 44 1 韩 W bg l计 I 2 0 : — 1 0 40 【 张德 干. 于 电子商 务 中的数据挖 掘技 术研 究 【. 2 】 基 I小型微 型计算 1

基于Web的数据挖掘在网站个性化服务系统中的应用

基于Web的数据挖掘在网站个性化服务系统中的应用

<年 龄 :5 4 >并 且 <收 入 :0 — 9 9元 > 2— 9 50 19 ==> <购 前 了解 渠 道 :报 纸 > 并 且 <置 信 度 :0 >并 且 < 6%
支 持度:0 > 2%
它表达 了这样一个信 息: 在该产 品的主体用户群 中( 年龄
在 :54 2 — 9并 且 收 入 在 :0.19 5 0 99元 之 间 并 具 有 占 到 调 查 用 户 的 2 % )在 购 买 前 主 要 (0 ) 通 过 报 纸 了解 该产 品 的 。 0 , 6% 是
本文 的研究 重点就 是使用 上面提 到 的关联规则 的分析
用 网站存 储 的历史记 录能够 分析 网站 的性能 ,改变 网站 的 布局 以适应用 户需求 , 分析用户 的浏览行为 。只按照用 户访
问某 一 个 页 面 的 频 率 的 大 小 去 判 断 这 个 页 面 受 用 户 关 注 的 程 度 的大 小 , 一 种 非 常 不 适 合 的 方 法 。而 利 用 网站 存 储 的 是 历 史 记 录 , 解 用 户 的 访 问 行 为 , 非 常 有 依 据 的 , 是 一 了 是 这 种非常适 合的方法 。 此 外 , 基 于 we 数 据 挖 掘 的分 析 方 法 中 , 于 用 户 在 b的 对
品的用户有如下 的关联规则 :
数据挖掘 , 以建设 能够提 供个 性化服 务 的网站 , 可 而且可 以
在 We b上进行 交易 。
2 基 于 We . b的 数 据 挖 掘 概 述 所 谓 基 于 We 数 据 挖 掘 ,是 指 利 用 数 据 挖 掘 技 术 从 b的
含有丰 富的信息 的 网络 中挖掘 出隐含 的 、 未知 的、 非一般 的 以及有 潜在 的有用信 息 的过 程 ,从 而为用 户提供 个性化 的 服务 , 同时满足 网站经营者获 得更 多利润 的要求 。 3 .基于 we b的数据挖掘在 网站个性化服务 系统 中的应
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

维普资讯
2 o 年 9月 O7
湖 北 经 济 学 院学 报 ( 文 社会 科 学 版 ) 人
J unlo b i iest f o o c( ma ie n o il ce c s o ra f Hu e v ri o n misHu nt sa dS ca in e Un y Ec i S
提 出 了基 于 w e b使 用挖 掘 的 个 性化 电子 商务 体 系结 构, 对 其 工 作流 程 进 行 了简要 的介 绍 。 并 关键 词 : e w b使 用挖 掘 ; 电子 商 务; 个性 化 服 务



引言
传 统 的数 据 挖 掘 同 We b结 合 起 来 ,进 行 We 挖 掘 ,即从 与 b w WW相 关 的 资 源 和 用 户 浏 览 行 为 中抽 取 感 兴趣 的 、潜 在 有
随着 it t 用迅 速发 展 , 类 电子 商 务 网 站 以其 成本 ne me 应 各 低 廉 、 捷 、 受 时 空 限 制 而逐 步 在 全 球 流 行 。 在 这 种新 型 的 快 不 商务 模 式 下 , 持老 客 户 的 同 时 获得 新 客 户 的 难 度 更 大 , 各 保 从
二 、 性 化 服 务 与 电 子商 务 个
We 结 构挖 掘 和 We 用 挖 掘 。其 中 We 用 挖 掘 在 个 性 b b使 b使
化 服 务 中扮 演 着 重要 角 色 。 b使 用 挖 掘 是从 We We b的 访 问记 录 中抽 取 用户 感 兴 趣 的模 式 。通 过 对 用 户 浏 览 网 站 的使 用数 据 收 集 、 析 和处 理 , 立 用 户 行 为 和 兴 趣 模 型 , 些 模 型 可 分 建 这 以帮 助 理解 用 户 行 为 ,改 进 站 点 结 构 以 及 为用 户 提 供 良好 的 个 性 化服 务 。 由于个 性 化 推 荐 所 面 临 的 关键 问题 是 需 要 对 大
性 化 服 务 可 以 比较 有效 地 解 决 用 户 “ 息 过载 ” “ 息 迷 失 ” 信 和 信
的 困境 . 可 以帮 助 企 业 建立 友好 的客 户 关 系 。 还 电 子 商务 的竞 争 比传 统 的业 务 更 加 激 烈 。用 户 只 需 要 几 个 点 击 操 作 就 可 能 流 失 到竞 争 者 那里 。 网站 的任 何 一 个 地 方
挖 掘建 立 的个 性 化系 统 是 实 现 良好个 性 化 服 务 的 一 个 有 效途
径。
都 有 可能 成 为 吸 引 客 户 或失 去 客 户 的 因 素 。 同时 站 点 企 业 通 常 以 We 形 式 展 现 商 品 信 息 以 供 访 问 者浏 览 , 天 都 会有 b的 每
S p2 0 e .0 7 Vo. . 1 No9 4
第 4卷 第 9期
We使用挖掘在 电子商务个性化服务中的应用 b
王 改 芬 , 道 强 胥
( 昌教 育 学 院 , 北 宜 昌 4 3 0 ) 宜 湖 4 10 摘 要 : 绍 了电子 商务 中 的个 性 化 服 务 内涵 , 析 了 W e 介 分 b使 用挖 掘 在 个 性 化 电子 商 务 中的 作 用 及 工 作 过程 。
个 方面 建 立 起 与 客 户 良好关 系 ,提 高 客户 的忠 诚 度 就 显 得 非
常 重要 。 建 立 与 客 户 的 良好 关 系可 以表 现 为 了解 用 户 偏 好 、 而 向 客户 提 供 个 性 化 服 务 、 荐 用户 感 兴 趣 商 品 , 强 网站 交 叉 推 增 销 售能 力 . 已经 成 为许 多 电 子 商务 企 业 追 求 的 目标 。 于 上述 基 原 因, 商务 站点 个 性 化 服 务 孕 育 而生 。
用 的模 式 和 隐 藏 的信 息 【 为 用 户 提 供个 性 化 推 荐 服 务 和协 助 l 1 , 管 理 者 优 化 站点 结 构 , 高 站 点 效 率 , 好 地 为 用 户 服 务 。根 提 更
据 挖 掘 对 象不 同 , 以将 We 可 b挖 掘 分 为 三类 : b内容 挖 掘 、 We
个 性 化 服 务 是 指 针对 不 同的 用 户 提供 不 同 的服 务 策 略 和
服务 内容 的 服 务 模 式 ,其 实 质 就 是 以 用户 需 求 为 中 心 的 We b 服 务 。个 性 化 服 务 通 过 收集 和分 析 用 户信 息 来 学 习用 户 的兴
趣 和行 为 , 而 实 现 主 动 推 荐服 务 。因 此 , 过 网络 提 供 的 个 进 通
成 千 上 万 次 的 在 线交 易 , 生成 大 量 的 1 文件 和登 记 表 。 这 3志 对
We 使 用 挖 掘 通 常需 要 经 过 数 据 收 集 、 据 预处 理 、 b 数 模式 发 现 、 式 分 析 及 其 应用 五 个 阶段 : 模 ( ) 据 收 集 : b用 户 访 问数 据 可 以从 三 个 方 面 收 集 : 1 数 We 服务 器 端 、 户 端 和 代理 服 务 器 端 . 中 主要 是 服 务 器端 的数 客 其
据。
些 数 据 进 行 分 析 和 挖 掘 。 充 分 了解 客 户 的 的 行 为模 型 进 行 深 层 理解 ,传 统 的协 同过 滤 方 法 很 难 处 理 非 注册 用 户 的情 况 , We 而 b使用 挖 掘 能 较 好 处 理
这类 问题 ; 时 , 助 于 We 同 借 b使用 挖 掘 可 以从 传 统 的 基 于 使 用 数 据 的 静 态 建 模 转 换 到 基 于 用 户 操 作行 为 的 动 态 建 模 , 在 系 统 里 帮 助改 善 用 户 的网 络 使 用 经 验 。 因此 , 于 We 基 b使 用
相关文档
最新文档