基于领域知识库的信息推荐系统智能文本篇章分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
后台分析程序处理过程分为两个功能模块: 从用户浏览记录中挖掘用户兴趣 搜索用户关键词产生推荐信息
三 用户兴趣模型
兴趣模型的定义:
用户兴趣模型是将用户感兴 趣的事物抽象出其概念,并且用 特定的表达形式表示出用户兴趣 的一种方案。
三 用户兴趣模型
3.1 用户兴趣模型的表示方法
向量空间模型是将用户兴趣模型表示成一个n维 特征向量,每一维向量表示如下:
四 智能文本篇章分析和信息推荐
4.2 自动搜索关键词,提取有效网页地址 关键技术:正则匹配
四 智能文本篇章分析和信息推荐
4.3 网页文本提取思路及算法
以体育领域为例,树形结构图:
四 智能文本篇章分析和信息推荐
4.1.2 个人知识库实例
个人知识库看作公共知识库树的一棵子树, 简单的用户知识库实例如图:
体育
NBA专题
网球
足球
国际足球
英超
梅西
个人知识库树形结构图:
四 智能文本篇章分析和信息推荐
4.5 计算子概念对某关键词贡献度
主概念 子概念 贡献度
该如何选择我 感兴趣的信息呢
?
一 概述
这个时候信息推荐系 统来了!
信息推荐系统
Information Recommedation System
一 概述
信息推荐系统
推荐系统是一种为解决 Internet上成千上万的信息过 载而设计的智能的代理系统 。它能从Internet上大量的信 息中向特定用户自动推荐符 合其个人兴趣偏好或需求的 信息,从而实现个性化的推 荐服务。
四 智能文本篇章分析和信息推荐
4.8 用户个人知识点兴趣度变化的勒夏特列原理
“知识点兴趣度的时间修正:快开始,慢减少 ”的思想,效果如图:
五 系统测试结果
5.1.1 百度搜索“体育”的结果
本次仅以关键词“体育”为例,来测试后台分 析程序的运行结果。
五 系统测试结果
5.1.2 搜索结果的网页源代码
5.2.3 动态生成用户个人兴体趣育 关键词之间的包含关系
足球
梅西
六 结论与展望
结论:
本项目基本实现了:
建立用户兴趣模型并进行动态更新; 智能文本篇章分析; 依据用户个人的兴趣知识库产生推荐信息 。
六 结论与展望
展望:
将来有如下几个方面值得个性化推荐 系统及用户兴趣模型相关研究者关注:
基于领域知识库的信息 推荐系统智能文本篇章
分析
2020年7月6日星期一
基于领域知识库的文本 信息推荐系统
--智能文本篇章分析
演 讲 者:谷 林 指导老师:林荣德
一
二 三 四
五 六
一 概述
网络高度发达的今天,网络信息的量 也正以几何级数的方式增长。有些时候, 您是否发现对信息的选择有些困难呢?
一 概述
wID2(主概念) wID1(子概念) P(关联值)
体育
足球
0.7
足球
国际足球
0.5
uID(用户编号 )
0921121010
0921121010
以体育领域为例,树形结构图:
体育
1
2
3
5
6
7
4
8
9
10 11
12
假想兴趣树
遍历访问的顺序为:
13 14 15
体育
NBA专题
网球
足球
国际足球
Байду номын сангаас
英超
NBA专题对体育的贡献度为:0.8*0.5=0.4 梅西
面向用户多兴趣的模型研究; 面向用户群体的建模研究; 用户长期和短期兴趣的集成研究; 用户建模过程可视化技术的研究和实 现。
The end Thank you!
从用户浏览记录中挖掘用户兴趣的数据处理流程图
搜索用户关键词产生推荐信息的数据处理流程图
四 智能文本篇章分析和信息推荐
4.2 自动搜索关键词,提取有效网页地址
本次仅列举第一条信息的网页源代码,如下图 :
五 系统测试结果
5.1.3 分析提取有意义网页地址的结果
测试网页地址
五 系统测试结果
5.1.6 文章最终评分结果以及产生的推荐信息
五 系统测试结果
5.2 用户兴趣的挖掘和个人知识库的动态生成
五 系统测试结果
5.2.1 读取用户浏览记录 点击信息表中的一条记录如下
二 系统框架
2.1 信息推荐系统的框架图
Web 推荐系统
读取用户个人信息以及推荐信息 反馈用户的浏览记录
数据库
读取所有用户的浏 览记录和每个用户 的所有关键词 存储推荐信息以 及动态更新的用 户兴趣
访问推荐的网页
Internet
返回搜索结果 搜索用户关键词
后台分析程序
二 系统框架
2.2 后台分析程序数据处理流程
一 概述
项目简介
基于领域知识库的文本信 息推荐就是根据知识点之间 的相关性和用户的兴趣来推 荐用户感兴趣的文章信息。
推荐信息分类: 个人热点推荐 公共热点推荐
一 概述
本项目需要解决的三个问题
I. 建立用户兴趣模型并进行动态更 新;
II. 抓取网页文本,并对文本篇章进 行智能分析;
III. 依据用户个人的兴趣知识库产生 推荐文本信息。
主概念
father
子概念
child
相似或包含关系值
p
三 用户兴趣模型
3.2 用户行为的数据收集
用户行为的数据收集是一个获取与用户特征、 偏好或活动相关的信息的过程。
一般有两种方式: 显性 隐性
四 智能文本篇章分析和信息推荐
4.1 领域知识库
四 智能文本篇章分析和信息推荐
4.1.1 公共知识库实例
梅西对国际足球的贡献度为:0.5*0.5*0.6=0.15
四 智能文本篇章分析和信息推荐
四 智能文本篇章分析和信息推荐
4.6 文章评分和信息推荐 按如下公式对文章进行评分:
四 智能文本篇章分析和信息推荐
4.7 推荐信息的动态更新
推荐的信息超过3天后,默认为此文章已经 失去时效性,故予以删除,从而达到减少数据 冗余。
三 用户兴趣模型
兴趣模型的定义:
用户兴趣模型是将用户感兴 趣的事物抽象出其概念,并且用 特定的表达形式表示出用户兴趣 的一种方案。
三 用户兴趣模型
3.1 用户兴趣模型的表示方法
向量空间模型是将用户兴趣模型表示成一个n维 特征向量,每一维向量表示如下:
四 智能文本篇章分析和信息推荐
4.2 自动搜索关键词,提取有效网页地址 关键技术:正则匹配
四 智能文本篇章分析和信息推荐
4.3 网页文本提取思路及算法
以体育领域为例,树形结构图:
四 智能文本篇章分析和信息推荐
4.1.2 个人知识库实例
个人知识库看作公共知识库树的一棵子树, 简单的用户知识库实例如图:
体育
NBA专题
网球
足球
国际足球
英超
梅西
个人知识库树形结构图:
四 智能文本篇章分析和信息推荐
4.5 计算子概念对某关键词贡献度
主概念 子概念 贡献度
该如何选择我 感兴趣的信息呢
?
一 概述
这个时候信息推荐系 统来了!
信息推荐系统
Information Recommedation System
一 概述
信息推荐系统
推荐系统是一种为解决 Internet上成千上万的信息过 载而设计的智能的代理系统 。它能从Internet上大量的信 息中向特定用户自动推荐符 合其个人兴趣偏好或需求的 信息,从而实现个性化的推 荐服务。
四 智能文本篇章分析和信息推荐
4.8 用户个人知识点兴趣度变化的勒夏特列原理
“知识点兴趣度的时间修正:快开始,慢减少 ”的思想,效果如图:
五 系统测试结果
5.1.1 百度搜索“体育”的结果
本次仅以关键词“体育”为例,来测试后台分 析程序的运行结果。
五 系统测试结果
5.1.2 搜索结果的网页源代码
5.2.3 动态生成用户个人兴体趣育 关键词之间的包含关系
足球
梅西
六 结论与展望
结论:
本项目基本实现了:
建立用户兴趣模型并进行动态更新; 智能文本篇章分析; 依据用户个人的兴趣知识库产生推荐信息 。
六 结论与展望
展望:
将来有如下几个方面值得个性化推荐 系统及用户兴趣模型相关研究者关注:
基于领域知识库的信息 推荐系统智能文本篇章
分析
2020年7月6日星期一
基于领域知识库的文本 信息推荐系统
--智能文本篇章分析
演 讲 者:谷 林 指导老师:林荣德
一
二 三 四
五 六
一 概述
网络高度发达的今天,网络信息的量 也正以几何级数的方式增长。有些时候, 您是否发现对信息的选择有些困难呢?
一 概述
wID2(主概念) wID1(子概念) P(关联值)
体育
足球
0.7
足球
国际足球
0.5
uID(用户编号 )
0921121010
0921121010
以体育领域为例,树形结构图:
体育
1
2
3
5
6
7
4
8
9
10 11
12
假想兴趣树
遍历访问的顺序为:
13 14 15
体育
NBA专题
网球
足球
国际足球
Байду номын сангаас
英超
NBA专题对体育的贡献度为:0.8*0.5=0.4 梅西
面向用户多兴趣的模型研究; 面向用户群体的建模研究; 用户长期和短期兴趣的集成研究; 用户建模过程可视化技术的研究和实 现。
The end Thank you!
从用户浏览记录中挖掘用户兴趣的数据处理流程图
搜索用户关键词产生推荐信息的数据处理流程图
四 智能文本篇章分析和信息推荐
4.2 自动搜索关键词,提取有效网页地址
本次仅列举第一条信息的网页源代码,如下图 :
五 系统测试结果
5.1.3 分析提取有意义网页地址的结果
测试网页地址
五 系统测试结果
5.1.6 文章最终评分结果以及产生的推荐信息
五 系统测试结果
5.2 用户兴趣的挖掘和个人知识库的动态生成
五 系统测试结果
5.2.1 读取用户浏览记录 点击信息表中的一条记录如下
二 系统框架
2.1 信息推荐系统的框架图
Web 推荐系统
读取用户个人信息以及推荐信息 反馈用户的浏览记录
数据库
读取所有用户的浏 览记录和每个用户 的所有关键词 存储推荐信息以 及动态更新的用 户兴趣
访问推荐的网页
Internet
返回搜索结果 搜索用户关键词
后台分析程序
二 系统框架
2.2 后台分析程序数据处理流程
一 概述
项目简介
基于领域知识库的文本信 息推荐就是根据知识点之间 的相关性和用户的兴趣来推 荐用户感兴趣的文章信息。
推荐信息分类: 个人热点推荐 公共热点推荐
一 概述
本项目需要解决的三个问题
I. 建立用户兴趣模型并进行动态更 新;
II. 抓取网页文本,并对文本篇章进 行智能分析;
III. 依据用户个人的兴趣知识库产生 推荐文本信息。
主概念
father
子概念
child
相似或包含关系值
p
三 用户兴趣模型
3.2 用户行为的数据收集
用户行为的数据收集是一个获取与用户特征、 偏好或活动相关的信息的过程。
一般有两种方式: 显性 隐性
四 智能文本篇章分析和信息推荐
4.1 领域知识库
四 智能文本篇章分析和信息推荐
4.1.1 公共知识库实例
梅西对国际足球的贡献度为:0.5*0.5*0.6=0.15
四 智能文本篇章分析和信息推荐
四 智能文本篇章分析和信息推荐
4.6 文章评分和信息推荐 按如下公式对文章进行评分:
四 智能文本篇章分析和信息推荐
4.7 推荐信息的动态更新
推荐的信息超过3天后,默认为此文章已经 失去时效性,故予以删除,从而达到减少数据 冗余。