电子商务中的商务智能

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
和基于视频的动态图像挖掘。
7.4 电子商务数据挖掘
3.Web结构挖掘 从WWW的组织结构和链接关系中推导知识 Web结构挖掘有助于用户找到相关主题的权威
站点,并可以指向众多权威站点的相关主 题站点。 Hub页面提供了指向权威页面的链接集合。
7.4 电子商务数据挖掘
4. Web使用记录的挖掘 通过挖掘Web日志文件和相关数据,来发现用
1.网络营销 2.客户的聚类分析 3.客户的个性化服务 4.挖掘潜在的客户 5.挽留老客户
主要目标有:基于对需求和能满足的或不能满足的终端用户需求数据有更详尽的 了解,重新定义项目的规模;确定项目开发的优先次序,对项目的规模、预算和时 间安排基于这些优先次序做必要的调整;为了支持用户的决策信息需求,将网站上 的任何变更用文挡的形式记录下来;创建一个描述关键性机遇的领域、分析信息需 求以及数据来源的商务智能需求文挡,为项目今后阶段的工作制定详细工作计划。
7.2 电子商务数据仓库的逻辑模型
7.2.1 营销的数据仓库模型演变
时间
地理位置
销售事实
产品
促销
7.2 电子商务数据仓库的逻辑模型
7.2.1 营销的数据仓库模型演变
用户时间
物理地理
Web地理
财政时间 内容
用户活动/站点点击事实
站点地理 内部促销
活动
用户
外部促销
7.2.2 客户维——用户维
用户身份信息是用户的代理信息。可以分成两种属性,即用户 代理类型和用户代理名字。其中,用户代理类型主要用来 区分一次相应的网页点击是真实用户行为还是索引机器人 的行为。用户代理名字属性给出用户浏览器或者索引机器 人的名字以及版本号。
7.2.5 商品维——内容和活动维
3.站点地理维属性
站点地理维属性主要包括:表示候选站点地理 ID的惟一整数标识符;页面URL;惟一的 页面标识符,一个独立的页面标识符表示 与页面相关联的动态页面URL;父URL, 例如,mysite/index.html;总页面字节大小, 包括所有组件项,如页面转载的图像或脚 本;页面版本号;页面最后修改日期;页 面主要用途,例如,主页面、搜索、信息、 购物篮、产品说明和下载等。
2.Web服务器日志
通用日志格式(CLF,Common Log Format)和扩展 通 用 日 志 格 式 ( ECLF , Extended Common Log Format)
通用日志格式文件中主要包含七种元素:主机、 识别、审核、时间、请求、状态和字节数。
扩展通用日志格式文件除七种元素外,还增加了 引用站点和用户代理两个元素。
7.1.2 电子商务数据仓库项目规划
首先需要定义项目的商业目标。
要用智能型电子商务的商务词汇表示。即用“提高网站商品销售量”、“提高电 子商务销售利润”、“提高网络促销策略响应率”来表示商务智能的最终目标。
7.1.3 电子商务数据仓库需求分析
需求分析是电子商务数据仓库设计的基础 了解在电子商务网站中可以用哪些数据来满足最终用户的决策要求。
引用者地理维属性包含:标识符;引用URL;引用页面标识符 ID;查询字符串;引用域;已引用URL;已引用页面ID。
7.2.4 地理位置维——物理地理、Web地理 和站点地理维
3.站点地理维属性
站点地理维属性主要包括:表示候选站点地理 ID的惟一整数标识符;页面URL;惟一的 页面标识符,一个独立的页面标识符表示 与页面相关联的动态页面URL;父URL, 例如,mysite/index.html;总页面字节大小, 包括所有组件项,如页面转载的图像或脚 本;页面版本号;页面最后修改日期;页 面主要用途,例如,主页面、搜索、信息、 购物篮、产品说明和下载等。
7.1 电子商务的数据仓库开发
7.1.1 电子商务的数据环境分析
点击流数据、E-mail、IP地址、交易记录、安全检查、 电子金融数据
1.电子商务数据环境
Web服务器日志(Web Server Logs)、Cookie信息、广告服 务 器 数 据 库 ( Ad Server Database ) 、 注 册 数 据 库 (Registration Database) 、 商 业应用 数 据库 ( Commerce Application Database)。
用户ID 用户代理类型 用户代理名 用户类型 性别 注册用户名 电子邮件地址 消费人群 ……
主机地理ID 域名 国家 州、省、市
……
引用者ID 引用URL 引用页面ID 查询字符串 已引用URL
……
站点地理ID 页面URL 页面标识符 父URL 总页面字节 ……
内部促销ID 内部促销URL 内部促销类型 内部促销版本 内部促销码 内部促销品牌 内部促销目录
人力资源 数据库
订单管理
购买
呼叫中心 数据库
库存管 理
库存数 据库
可接受的账户 可支付的账户 通用分类账
混合报表与报告系 统
ERP数据库
自动买 卖
买卖数 据库
自动销售人员
购买力数据库
7.3 电子商务数据仓库的ETL设计
混合报表与报告系统
ERP数据库
自动销售人员
Web应用 服务器 和数据

备份Web 服务器
7.2.6 促销维——内部促销和外部促销维
2.外部促销维
属性:表示候选外部促销关键字的惟一整数标 识符;包含查询串URL完整文本的外部促 销URL;外部促销引擎/赞助商;外部促销 格式,例如,标语、擎天柱、弹出式广告 链 接 等 ; 外 部 促 销 版 本 ; 用 SKU 或 服 务 码 表示的外部促销产品或服务;外部促销品 牌;外部促销目录;
1.物理地理维
物理地理维表中的属性一般可以包含:用惟一整数标识符表示 的候选物理地理关键字;国家、州或省份、乡村或城市、 街道、门牌号、邮政编码或邮递区号,地理位置是家庭、 公寓、商务、政府部门等场所类型。
2.Web地理维属性 主机地理维表和引用者地理维表
主机地理维的主要属性包含:候选主机地理关键字;主机Ip地 址;主机名;域名;主机所在国家、所在州或省份、所在 城市等。
在服务器的日志文件中还包含文件名、服务时间、 IP地址、服务器端口、进程ID、格式化时间、 被请求的URL、服务器名称和Cookie等信息。
与电子商务直接有关的后台应用程序数据库中的 商品销售数据、商品发送数据、商品库存数据、 客户基本信息等商务活动数据源也是智能型电 子商务数据仓库的主要数据来源。
7.1.4 电子商务数据仓库逻辑模型设计
1.数据仓库的逻辑模型设计 2.智能型电子商务应用开发 3.逻辑模型文档设计
7.1.5 电子商务数据仓库物理模型设计
⑴电子商务数据仓库的结构和基础开发 ⑵电子商务数据仓库的物理模型设计 ⑶电子商务数据仓库的应用开发 ⑷电子商务数据仓库的系统集成
7.1.6 电子商务数据仓库实现与部署
7.2.7 电子商务数据仓库模型的事实表设计
由与维表相关联的外键以及网页点击加载时间、 点击接收时间、点击完成时间、点击传输 字节和点击HTTP事务状态码等5个度量浏 览者活动状况的事实组成
7.2.7
电子商务数据仓库模型的事实表设计
用户时间ID 时间类型 时间段 SQL时间戳 GMT
财政日期ID 数据类型 季节 日期时间戳 财政年 财政月 财政日 ……
户访问Web页面的模式。 一般的访问模式追踪和个性化的使用纪录追踪 Web使用记录的挖掘要经过数据预处理阶段、
模式识别阶段、模式分析阶段三个阶段。
7.4 电子商务数据挖掘
5.Web数据挖掘的意义 ⑴有助于网络资源的开发和利用 ⑵有利于提高网络服务水平 ⑶是构建科学的决策支持系统的需要
7.4.2 Web数据挖掘在电子商务中的应用
用户日期和用户时刻表是从用户的观点来分析用户行为的,用 户日期和用户时刻是基于一个特定用户日历。
用户时间维和财政时间维一样,同样被分成日期维表和时刻维 表。
用户日期维表包含属性同企业的日期维表类似。只是增加了日 期的用户季节
7.2.4 地理位置维——物理地理、Web地理 和站点地理维
考虑用户的物理地理位置、用户到达企业站点的途径和站点地 理位置,这样就至少需要三个地理位置维
内容ID 内容标识符 内容URL 内容类型 内容用途 相关页面 内容大小 ……
活动ID 活动标识符 活动类型 活动组
物理地理ID 国家 州或省份 乡村或镇区、城市 街道 门牌号 ……
网页点击加载时间 点击接收时间 点击完成时间 点击传输字节 HTTP事务状态码 用户ID 财政日期ID 物理地理ID 内容ID ……
用户维可以包括这样一些属性:用户标识符、用户代理类型、 用户代理名、用户类型、性别、注册用户名、电子邮件地 址、消费人群、人口统计信息、最后购买时间戳、信用概 要、电话号码和地址等。
用户维的属性是可选的。用户类型和性别可以在会话过程或者 用户注册信息中获取。消费人群和人口统计信息由许多描 述用户的字段组成,这些信息也可能来自第三方的市场调 查公司。如果站点支持在线购物,那么用户的最后一次购 物时间、信用概要、电话、地址等都可以从用户所提供的 信息和信用卡供应商处获得。
外部促销ID 外部促销URL 外部促销引擎/赞助商 外部促销格式 外部促销版本 外部促销产品/服务码 外部促销品牌 外部促销目录
图7.3 电子商务数据仓库事实表及维表
7.3 电子商务数据仓库的ETL设计
7.3.1 电子商务数据仓库的ETL环境
人力资源管理
税务系统
预算计 划
固定资产
报告系 统
呼叫中心
数据准备区域
工作存储区

数据抽
阶段区
坏数据存储

取转换
域加载
发送模式


仓库数 据库
商业 应用 数据 库
创建维
创建事实
归 档






ຫໍສະໝຸດ Baidu
数据仓库数据 数据仓库过程管理
7.3.3 建立ETL系统
1.数据分析 2.使Web站点适合电子商务产生的点击流 3.创建高层ETL设计和体系结构 4.设计特定的点击流组件
电子商务中的商务智能
本章学习目标: 电子商务数据环境的特殊性; Web数据的各种分析; 电子商务数据仓库的逻辑模型设计; 电子商务数据仓库的ETL系统设计方法; 数据挖掘在电子商务中的应用;
电子商务中的商务智能
• 7.1 电子商务的数据仓库开发 • 7.2 电子商务数据仓库的逻辑模型 • 7.3 电子商务数据仓库的ETL设计 • 7.4 电子商务数据挖掘
7.2.6 促销维——内部促销和外部促销维
分成内部促销维和外部促销维
1.内部促销维 属性有:表示内部促销ID的惟一整数标识符;
内 部 促 销 URL , 如 , mysite/InternetSpecial4.html 等 ; 点 击 URL ; 内部促销类型,如,内部广告、附属链接、 外部文章链接和销售等;内部促销版本; 用SKU或服务码表示的内部促销产品或服 务码;内部促销品牌;内部促销目录等。
7.4 电子商务数据挖掘
7.4.1 Web数据挖掘技术 1. Web的特点 • Web的庞大性。 • Web的动态性。 • Web的异构性。 • 非结构化的数据结构。 • 形形色色的用户群体
7.4 电子商务数据挖掘
2. Web内容挖掘 ⑴基于文本信息的挖掘 和通常的平面文本挖掘比较类似 ⑵基于多媒体信息的挖掘 基于音频的挖掘、基于图片的静态图像的挖掘
代理服务器
购买力数据库 防火墙
用户身份服务 在线广告服务 付费和金融服务 内容缓存服务 搜索引擎和服务
商业ISP 因特网
用户
用户/参与者ISP
商业伙 伴系统
7.3 电子商务数据仓库的ETL设计
7.3.2
E
T
L 的 体 系 结 构
点击流 数据
其他数 据源








取、



点点点点 击击击击 流流流流 分分分分 析析析析
7.3.3 建立ETL系统
过滤记录 (可选)
分析事实记录 IP地址解析
Web地理维 参照表 主机表 Web服务维
会话维
用户维 用户时间维 物理地理维
会话匹配
页面辨认
用户辨认
过滤记录 (可选)
内容维 页面维 活动维
维处理
7.3.3 建立ETL系统
5.设计和建立维表 6.设计和建立事实表ETL组件 7.建立数据加载机制和整合ETL程序 8.为数据管理建立支持
7.2.3 时间维——财政时间维和用户时间维
财政时间维分成:财政日期表和财政时刻表。
财政日期维表中可以包含:候选财政日期关键字、数据类型、 季节、日期时间戳、财政年、财政月、财政周、财政日数、 日名、周天数、月天数和日类型等。
财政时刻表中可以包含:候选财政时间维关键字、时间类型、 一天的时间段、SQL时间戳和GMT时分秒。
相关文档
最新文档