网络信息过滤技术 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
缺点:需要用户的参与。稀疏性问题,在系统使用初期,由 于系统资源还未获取足够的信息,系统很难利用这些信息 来发现相似的用户。另一缺陷是系统可扩展性,即随着系 统用户和信息资源的增多,系统的性能会下降。
ppt课件
16
对比
可以注意到基于内容的信息过滤和基于合作的信息过滤 (协同过滤)的相同点都是要计算两个物品的相似度, 但不同点是前者是根据物品的内容相似度来做推荐,给 物品内容建模的方法很多,最著名的是向量空间模型, 要计算两个向量的相似度。而后者根据两个物品被越多 的人同时喜欢,这两个物品就越相似。
可能为用户提供新的感兴趣的信息,拓宽用
户的视野。
ppt课件
9
通过网络信息过滤,可以减少不必 要的信息传递,节约宝贵的信道资源。 利用网络信息过滤,可以对网络信息的 流量、流向和流速进行合理的配置,使 网络更加畅顺。而对于用户来说,信息 过滤由于剔除了大量的不相关信息的流 人,可以避免塞车现象。
ppt课件
基于合作的协同过滤,首先从数据库里获取他之前喜欢 的东西,然后从剩下的东西中找到和他历史兴趣近似的 东西推荐给他。核心是要计算两个东西的相似度。
ppt课件
15
基于合作的过滤优缺点
优点:协作过滤系统利用用户之间的相似性来推荐信息, 它能够为用户发现新的感兴趣的内容,其关键问题是用户 聚类。并且能为用户发现新的感兴趣的信息。
ppt课件
3
网络信息过滤技术采取适当的技术措施, 对互联网不良信息进行过滤,既可阻止不良 信息对人们的侵害,适应社会对意识形态方 面的要求,同时,通过规范用户的上网行为, 提高工作效率,合理利用网络资源,减少病 毒对网络的侵害,这就是信息过滤技术的根 本内涵。
ppt课件
4
网络信息过滤是根据一定的标准运 用一定的工具从动态的网络信息流中选 取用户需要的信息或剔除用户不需要的 信息的方法和过程。
组长:刘伟 1221330048 组员:史波 1221330053
张旭 1221330056 伍思同 1221330068
ppt课件
1
目录
基本信息与发展历史 ——刘伟 网络信息过滤技术方法 ——史波 网络信息过滤技术应用 ——伍思同 现状分析及发展趋势 ——张旭
ppt课件
2
互联网的飞速发展在给人们的工作、生活、 学习等诸多方面带来巨大便利的同时也带来 诸如“信息超载”以及“不良信息”和垃圾 信息的侵害等问题。信息过滤技术由此产生, 并广泛应用到了网络的各种信息处理过程中, 对网络信息实用化具有极大的推动作用。
由此可以看到两种方法的不同点在于计算两个物品的相 似度方法不同,一个根据外界环境计算,一个根据内容 计算。
ppt课件
17
例1
用户u1喜欢的电影是A,B,C 用户u2喜欢的电影是A, C, E, F 用户u3喜欢的电影是B,D 我们需要解决的问题是:决定对u1是不是应该推荐F这部电影 基于内容的做法:要分析F的特征和u1所喜欢的A、B、C的特
缺点:基于内容过滤难以区分资源内容的品质和 风格,而且不能为用户发现新的感兴趣的资源,只 能发现和用户已有兴趣相似的资源.随着信息的 剧增,效率和质量会降低;使用过程中难以发现新 的感兴趣的信息;一旦过滤方法选择错误,后果将 很严重。
ppt课件
14
基于合作的信息过滤
基于合作的过滤技术根据人的判断为用户过滤信息,它使 用多个用户信息预测单个用户的偏好根据相同或相近兴 趣的用户对应信息做出评价,向其用户进行推荐。由于不 依赖于内容,这种模式不仅适用于文本格式,也可以适用于 非文本介质的资源,如视频、音频等。
ppt课件
5
网络信息过滤有利于减轻用户的认知压 力。它在为用户提供所需要信息的同时,着 重剔除与用户不相关的信息,从而提高用户 获取信息的效率;它根据用户信息需求的变 化提供稳定的信息服务,能够节约用户获取 信息的时间,从而极大地减轻用户的认知负 担,起到减压阀的作用。
ppt课件
6
目前网络信息过滤的工作概括为2项:一 是建立用户需求模型。即用户模板,用于表 达用户对于信息的具体需求。建立用户需求 模型的主要依据是用户提交的关键词、主题 词或示例文本。
从网络信息过滤结构
基于内容的信息过滤 基于合作的信息过滤(协同过滤)
从网络信息过滤的依据
内容过滤 网址过滤
混合过滤
Байду номын сангаас
ppt课件
12
基于内容的信息过滤
基于内容的信息过滤通过用户模型(user profile) 来描述用户的信息需求,将新获取的信息与用户 模型进行相似度计算,主动将相似度高的信息提 供给用户。
内容过滤的基本思想是,给用户推荐和他们之前 喜欢的物品在内容上相似的其他物品。核心任务 就是计算物品的内容相似度。
ppt课件
13
基于内容的过滤优缺点
优点:基于内容过滤利用资源和用户兴趣的相似 性来过滤信息,它的关键问题是相似性计算,其优 点是简单、有效。这种过滤技术已经比较成熟, 使用也相对较广。
10
网络信息过滤技术的发展历史
“信息过滤”最早出现在1982年的3月美国 计算机协会上。
1992年,代表了世界文本检索领域最高水 平和文本检索领域最权威的国际会议之一 的文本检索会议召开,并将过滤作为其一 个重要的议题。
会议对信息过滤学科形成和发展提供了强 有力的支持。
ppt课件
11
网络信息过滤技术方法
ppt课件
8
网络信息过滤对个性化信息服务起到了
巨大的推动作用。在个性化信息服务中,最
重要的是收集和分析用户的信息需求。由于
信息过滤的反馈机制具有自我学习和自我适
应的能力,可以动态地了解用户兴趣的变化,
掌握用户的信息需求,从而为用户提供更有
针对性的信息。在协作过滤系统中,还可以
根据用户之间的相似性来推荐信息,从而有
ppt课件
7
二是匹配技术,即用户模板与文本的匹 配技术。简单地讲,任何信息过滤系统就是 根据用户的查询创建用户需求模型。将信息 源中的文本有效表示出来,然后根据一定的 匹配规则,将信息源中可以满足用户需求的 信息返回给用户,并根据一定的反馈机制, 不断地调整改进用户需求模型,以期获得更 好的过滤结果。
征,需要知道的信息是A(战争片),B(战争片),C(剧情 片),如果F(战争片),那么F很大程度上可以推荐给u1,这 是基于内容的做法,你需要对item进行特征建立和建模。 协同过滤的办法:那么你完全可以忽略item的建模,因为这种 办法的决策是依赖user和item之间的关系,也就是这里的用户 和电影之间的关系。我们不再需要知道ABCF哪些是战争片, 哪些是剧情片,我们只需要知道用户u1和u2按照item向量表示, 他们的相似度比较高,那么我们可以把u2所喜欢的F这部影片 推荐给u1。
ppt课件
16
对比
可以注意到基于内容的信息过滤和基于合作的信息过滤 (协同过滤)的相同点都是要计算两个物品的相似度, 但不同点是前者是根据物品的内容相似度来做推荐,给 物品内容建模的方法很多,最著名的是向量空间模型, 要计算两个向量的相似度。而后者根据两个物品被越多 的人同时喜欢,这两个物品就越相似。
可能为用户提供新的感兴趣的信息,拓宽用
户的视野。
ppt课件
9
通过网络信息过滤,可以减少不必 要的信息传递,节约宝贵的信道资源。 利用网络信息过滤,可以对网络信息的 流量、流向和流速进行合理的配置,使 网络更加畅顺。而对于用户来说,信息 过滤由于剔除了大量的不相关信息的流 人,可以避免塞车现象。
ppt课件
基于合作的协同过滤,首先从数据库里获取他之前喜欢 的东西,然后从剩下的东西中找到和他历史兴趣近似的 东西推荐给他。核心是要计算两个东西的相似度。
ppt课件
15
基于合作的过滤优缺点
优点:协作过滤系统利用用户之间的相似性来推荐信息, 它能够为用户发现新的感兴趣的内容,其关键问题是用户 聚类。并且能为用户发现新的感兴趣的信息。
ppt课件
3
网络信息过滤技术采取适当的技术措施, 对互联网不良信息进行过滤,既可阻止不良 信息对人们的侵害,适应社会对意识形态方 面的要求,同时,通过规范用户的上网行为, 提高工作效率,合理利用网络资源,减少病 毒对网络的侵害,这就是信息过滤技术的根 本内涵。
ppt课件
4
网络信息过滤是根据一定的标准运 用一定的工具从动态的网络信息流中选 取用户需要的信息或剔除用户不需要的 信息的方法和过程。
组长:刘伟 1221330048 组员:史波 1221330053
张旭 1221330056 伍思同 1221330068
ppt课件
1
目录
基本信息与发展历史 ——刘伟 网络信息过滤技术方法 ——史波 网络信息过滤技术应用 ——伍思同 现状分析及发展趋势 ——张旭
ppt课件
2
互联网的飞速发展在给人们的工作、生活、 学习等诸多方面带来巨大便利的同时也带来 诸如“信息超载”以及“不良信息”和垃圾 信息的侵害等问题。信息过滤技术由此产生, 并广泛应用到了网络的各种信息处理过程中, 对网络信息实用化具有极大的推动作用。
由此可以看到两种方法的不同点在于计算两个物品的相 似度方法不同,一个根据外界环境计算,一个根据内容 计算。
ppt课件
17
例1
用户u1喜欢的电影是A,B,C 用户u2喜欢的电影是A, C, E, F 用户u3喜欢的电影是B,D 我们需要解决的问题是:决定对u1是不是应该推荐F这部电影 基于内容的做法:要分析F的特征和u1所喜欢的A、B、C的特
缺点:基于内容过滤难以区分资源内容的品质和 风格,而且不能为用户发现新的感兴趣的资源,只 能发现和用户已有兴趣相似的资源.随着信息的 剧增,效率和质量会降低;使用过程中难以发现新 的感兴趣的信息;一旦过滤方法选择错误,后果将 很严重。
ppt课件
14
基于合作的信息过滤
基于合作的过滤技术根据人的判断为用户过滤信息,它使 用多个用户信息预测单个用户的偏好根据相同或相近兴 趣的用户对应信息做出评价,向其用户进行推荐。由于不 依赖于内容,这种模式不仅适用于文本格式,也可以适用于 非文本介质的资源,如视频、音频等。
ppt课件
5
网络信息过滤有利于减轻用户的认知压 力。它在为用户提供所需要信息的同时,着 重剔除与用户不相关的信息,从而提高用户 获取信息的效率;它根据用户信息需求的变 化提供稳定的信息服务,能够节约用户获取 信息的时间,从而极大地减轻用户的认知负 担,起到减压阀的作用。
ppt课件
6
目前网络信息过滤的工作概括为2项:一 是建立用户需求模型。即用户模板,用于表 达用户对于信息的具体需求。建立用户需求 模型的主要依据是用户提交的关键词、主题 词或示例文本。
从网络信息过滤结构
基于内容的信息过滤 基于合作的信息过滤(协同过滤)
从网络信息过滤的依据
内容过滤 网址过滤
混合过滤
Байду номын сангаас
ppt课件
12
基于内容的信息过滤
基于内容的信息过滤通过用户模型(user profile) 来描述用户的信息需求,将新获取的信息与用户 模型进行相似度计算,主动将相似度高的信息提 供给用户。
内容过滤的基本思想是,给用户推荐和他们之前 喜欢的物品在内容上相似的其他物品。核心任务 就是计算物品的内容相似度。
ppt课件
13
基于内容的过滤优缺点
优点:基于内容过滤利用资源和用户兴趣的相似 性来过滤信息,它的关键问题是相似性计算,其优 点是简单、有效。这种过滤技术已经比较成熟, 使用也相对较广。
10
网络信息过滤技术的发展历史
“信息过滤”最早出现在1982年的3月美国 计算机协会上。
1992年,代表了世界文本检索领域最高水 平和文本检索领域最权威的国际会议之一 的文本检索会议召开,并将过滤作为其一 个重要的议题。
会议对信息过滤学科形成和发展提供了强 有力的支持。
ppt课件
11
网络信息过滤技术方法
ppt课件
8
网络信息过滤对个性化信息服务起到了
巨大的推动作用。在个性化信息服务中,最
重要的是收集和分析用户的信息需求。由于
信息过滤的反馈机制具有自我学习和自我适
应的能力,可以动态地了解用户兴趣的变化,
掌握用户的信息需求,从而为用户提供更有
针对性的信息。在协作过滤系统中,还可以
根据用户之间的相似性来推荐信息,从而有
ppt课件
7
二是匹配技术,即用户模板与文本的匹 配技术。简单地讲,任何信息过滤系统就是 根据用户的查询创建用户需求模型。将信息 源中的文本有效表示出来,然后根据一定的 匹配规则,将信息源中可以满足用户需求的 信息返回给用户,并根据一定的反馈机制, 不断地调整改进用户需求模型,以期获得更 好的过滤结果。
征,需要知道的信息是A(战争片),B(战争片),C(剧情 片),如果F(战争片),那么F很大程度上可以推荐给u1,这 是基于内容的做法,你需要对item进行特征建立和建模。 协同过滤的办法:那么你完全可以忽略item的建模,因为这种 办法的决策是依赖user和item之间的关系,也就是这里的用户 和电影之间的关系。我们不再需要知道ABCF哪些是战争片, 哪些是剧情片,我们只需要知道用户u1和u2按照item向量表示, 他们的相似度比较高,那么我们可以把u2所喜欢的F这部影片 推荐给u1。