网络信息资源个性化服务及成功案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息呼叫中心主要利用电话、 传真等方式来服务客户, 处理简 单的呼叫流程。信息呼叫中心引 入客户关系管理, 建立客户数据 库, 对信息进行分析、处理、采 集和挖掘, 使呼叫中心可以得到 每个客户的详细信息, 由此为客 户提供一对一的个性化服务。
3 网络信息资源个性化服务实现过程
1.用户描述文件的 表达与更新 3.个性化推荐
案例五:QQ空间的RSS订阅
方式一:直接输入订阅网址
方式三:通过热文排行
方式二:通过推荐订阅
方式四:通过好友推荐
案例五:QQ空间的RSS订阅
案例六:
数字图书馆个性化信息服务
数字图书馆拥有海量的信息,而用户要在如此海 量的信息中挖掘出有用的或自己感兴趣的资料非 常困难。因此,用户获得信息的主要障碍已转变 为选择上的障碍。这种用户需求的转变催生了个 性化信息服务的提出。
2 网络信息资源个性化服务方式
2 网络信息资源个性化服务方式
分类定制是指信息用户可以按 照自己的目的和需求, 在某一特定 系统功能服务形式中, 自己设定信 息的资源类型、表现形式、选择特 定的系统服务功能等。通过分类定 制, 用户每次登录网站时, 只要键 入自己的用户名和密码, 服务器根 据用户信息数据库将查询结果主动 推送给信息用户, 并利用动态网页 生成用户定制的动态页面。
RSS订阅
2 网络信息资源个性化服务方式
智能代理技术很好的解决了用 户无法贴切、完全地表达出自己的 爱好、兴趣和需求的问题。它是一 种能够完成委托任务的智能计算机 系统, 能模仿人的行为执行一定的 任务, 不需要或很少需要用户的干 预和指导。智能化代理通过跟踪用 户在信息空间中的活动, 自动捕捉 用户的兴趣、爱好, 主动搜索可能 引起用户兴趣的信息并提供给用户。
网络信息资源的个性化服务 及成功案例
目录
网络信息资源个性化服务 网络信息资源个性化服务方式 网络信息资源个性化服务实现过程
案例介绍
数字图书馆个性化信息服务方式 数字图书馆个性化信息服务经典案例
1.1网络信息资源开展个性化服务的必要性
2006.12——2010.6中国网站规模变化
个性化服务
1.2 网络信息资源个性化服务定义
1
• 用户注册,并把定制信息提交给数据库
• 系统自动跟踪用户行为,分析其偏好并将信息存入用户信息数据库 • 系统处理用户信息,提供符合用户需求的信息 • 用户反馈,系统根据反馈信息修改用户信息数据库内容
2
3
Page 47
4
1.1.1 个性化内容定制服务范例
MyLibrary@NCStatc 系统 MyLibrary@Concll 系统
个性化信息:
是反映个性化特征的一切信息,同时还包括 个体特定的信息需求组合。
• 个性化信息服务 就是基于信息用户的信息使用行为、习惯、 偏好和特点, 向用户提供满足其各种个性化需求的 一种服务.
1.2 网络信息资源个性化服务的特点
用户提出现有的需求——提供用户所需 要的信息 研究用户个性、习惯、知识结构、信息 需求……——预测和搜集用户可能感兴 趣的信息——提供信息、激活用户的潜 在信息需求
3.3 个性化推荐
百度文库
规则可以由用户定制,也可以利用基于关联规则的 挖掘技术来发现,利用规则来推荐信息依赖于规则的质 量和数量,基于规则的技术其缺点是随着规则的数量增 多,系统将变得越来越难以管理.一个规则本质上是一个 If-Then语句。 为了利用规则来推荐资源,用户描述文件和资源描 述文件需用相同的关键词集合来进行描述.
3.2资源文件的表达
基于分类的方法是利用类别来表示资源,对 文档资源进行分类有利于将文档推荐给对该类文 档感兴趣的用户.文本分类方法有多种,比如:朴 素贝叶斯(Naïe-Bayes),k最近邻方法(KNN)和支 持向量机(SVM)等。 资源的类别可以预先定义,也可以利用聚类 技术自动产生。许多研究表明:聚类的精度非常 依赖于文档的数量,而且由自动聚类产生的类型 可能对用户来说是毫无意义的,因此可以先使用 手工选定的类型来分类文档,在没有对应的候选 类型或需要进一步划分某类型时,才使用聚类产 生的类型。
可以表示为用户浏览 模式或访问模式
3.1用户描述文件的表达与更新
用户注册 基本信息
系统隐式收 集用户信息
用户修改 用户描述 文件一
系统自适应修改 (显示跟踪、隐 式跟踪)
用户描述 文件……
3.1用户描述文件的表达与更新
系统可以要求用户反馈自己对推荐资源的喜好 程度。一般情况下,这种做法很难收到实效,因 为很少有用户向系统主动表达自己的喜好。 •行为跟踪.用户行为可以表现为查询、浏览页 面和文章、标记书签、反馈信息、点击鼠标、 拖动滚动条、前进、后退等等。文献的研究表 明,用户查询、访问页面、标记书签能有效揭示 用户的兴趣.
•80%的用户愿意向Web站点提供自己的姓名、性别、年 龄、教育背景和兴趣,但大多数用户不愿意提供私有、 敏感的信息,比如个人收入和信用卡号等 •28%的用户愿意Web站点向其他Web站点共享自己的信息
3.1用户描述文件的表达与更新
可以表示为加权矢量模型、类型 层次结构模型、加权语义网模型、 书签和目录结构等
2.资源描述文件 的表达 4.个性化服务 体系结构
3.1用户描述文件的表达与更新
收集用户描述文件前应考虑问题:
① ② ③ ④ ⑤ 有没有现成的标准? 收集什么数据?收集的数据用于什么目的? 如何收集数据?根据什么信息源来收集? 收集的数据如何组织? 用户信息能否自适应地更新?
www.cyberdialogue.com调查显示
2 网络信息资源个性化服务方式
系统帮助用户修改检索提问式, 如当用户输入一个检索词, 系统就 会将检索词与内部词表中相关词进 行比较, 并在界面上显示各种与该 词有逻辑关联性的词组, 以供用户 选择。通过帮助用户选择更接近自 己检索目标的检索词来提高信息查 询效率。
2 网络信息资源个性化服务方式
•日志挖掘,利用Web日志可以获得页面的点击次 数、页面停留时间和页面访问顺序等信息。通 过分析Web日志可以获得相关页面、相似用户群 体和用户访问模式等信息
① 首先清除日志中无关的信息, 3.1用户描述文件的表达与更新 将有效数据存放到数据库中
② 将用维变量 构建数据立方体 (URL、资源类 型、大小、时 间……) ④ 利用各种数 据挖掘方法来 预测、分类和 发现有意义的 关系
优点是不仅可以支 持基于内容的过滤 和协作过滤,还支 持用户描述文件在 不同Web应用之间 的共享 缺点是可能需要传 输用户描述文件.
案例一 个性化服务系统 ILOG
案例二 个性化服务系统 Personal WebWatcher
案例三 个性化服务系统 GroupLens
案例四
新华社多媒体数据库特点:
Page 50
信息 定题
最新资 料快报
推送 服务
智能化 推荐
1.2.1 最新资料快报 通过推送技术开展最新资料快报服务,也就是信息 服务机构在动态收集用户信息行为或用户定制基础 上,建立用户信息需求模型,及时将符合用户兴趣 的最新资料推送给用户。
中国科学院上海 文献情报中心图 书馆 带有分类选择功 能的新书信息推 送系统
第一,信息量大,需要对海量信息进行搜索、存储和智能管理。 文字信息,从1948年以来新华社播发的所有中文电讯稿3000余万 篇,每天新增各种精选稿件10000多篇。200多万张图片涉及国内 外政治、经济、文化、体育、教育及风土人情等,而且每日增 加1600多张。国内外多个领域,集新闻性与艺术性于一体的图表 近万张,每天递增最新的国内国际图表新闻10多张。音、视频信 息近万小时。 第二,信息形式多,需要提供统一、跨媒体检索。不但包括文 字、图片、图表和视频等多种形式的信息资源,而且涵盖了中 文、英文、法文、西文、俄文等10多种语言信息资源。 第三,服务人群多,需提供个性化服务。新华社多媒体数据库 搜索引擎不仅面向内部用户,还面向许多类型外部用户,例如 为媒体用户提供大量丰富、前沿、精彩的各类新闻,作为编写 稿件的权威参考等。
信息
个性化
服务
个性化
个性化 信息服 务
Page 45
国内外数字图书馆个性化信息服务现状
Page 46
1 数字图书馆个性化信息服务 1.1个性化内容定制服务
个性化内容定制服务主要指用户根据自己的需求和目的,向 某一特定的系统提交自己的检索界面、偏好资源、系统服务 等信息。它通过获取用户个性化信息,为用户提供更为准确 满意的信息服务,因而成为了数字图书馆个性化信息服务的 最主要方式。
3.3 个性化推荐
3.4 个性化服务体系结构
3.4 个性化服务体系结构
优点是可以避免用 户描述文件的传输, 除了支持基于内容 的过滤,还可以支 持协作过滤 缺点是用户描述文 件不能在不同的 Web应用之间共享 Syskill,Letizia, GroupLens
优点是用户描述文 件可以在不同的应 用之间共享 缺点是只能进行基 于内容的过滤
3.3 个性化推荐
基于内容过滤的技术是通过比较资源与用户 描述文件来推荐资源,它的关键问题是相似度计 算,对于矢量空间模型来说,通常采用的方法是余 弦度量。如果用户的描述文件没有正确描述用户 的兴趣和行为,那么该方法推荐的数据可能和用 户真正的兴趣根本不相关。 优点:是简单、有效 缺点:难以区分资源内容的品质和风格,而且不 能为用户发现新的感兴趣的资源,只能发现和用 户已有兴趣相似的资源。
人大个性化 信息服务 系统 MyLibrary@HUST 系统
ILAS系统下的 “我的图书馆” 子系统
Page 48
1.1.2 个性化内容定制服务范例(深圳图书馆)
深圳图书馆的ILAS系统
Page 49
1.2 个性化信息推送服务
推送技术通过自 动传送信息给用 户,来减少用于 网络上搜索的时 间。它根据用户 的兴趣来搜索、 过滤信息,并将 其定期推给用户, 帮助用户高效率 地发掘有价值的 信息。
目次信息推送系 统
Page 51
新书信息推送系 统
1.2.1 最新资料快报(UnCover数据库)
2 网络信息资源个性化服务方式
协调过滤服务主要是把用户 的偏好与其他用户的偏好进行比 较, 建立偏好群体的描述, 然后 假定这个特定用户与这个同偏好 群体的需求相同,对其需求内容 进行推荐。
垂直门户是和综合性及水 平门户相对应的概念, 它通 过汇聚网上某一特定专题信 息资源, 并对其进行挖掘和 加工, 以满足用户基于专业 的深入的信息需求。
1.2 网络信息资源个性化服务的特点
服务方式的针对性
服务内容的针对性
1.2 网络信息资源个性化服务的特点
最大程度地了解用户对信息的明确需 求与潜在需求、当前需求与长远需求 个性化信息服务适应动态变化的个性 需求
1.2 网络信息资源个性化服务的特点
用户满意是个性化信息服务 的出发点和归宿点,面向用户的 个性化信息服务提高了信息需求 的满足度,速度更快、容量更大。 查全率和查准率得到很大的提高, 个性化信息服务对网络信息资源 进行自动化处理,使用户的需求 能够得到高效、准确、及时的反 馈。
③ 进行在线分析 处理,通过对数据 立方体的切块和 切片,分析用户在 不同域的分布情 况,分析用户对资 源的使用情况等 等.
3.2资源文件的表达
基于内容的方法是从资源本身抽取信息来表示资源,使用 最广泛的方法是用加权关键词矢量.对文档来说,关键的问题是 特征选取,特征选取要达到两个目标:一是选取最好的词;二是 选取的词最少.要抽取特征词条,需要对文档进行词的切分,在 切分的同时,利用停用词列表(stop word)从文档特征集中除去 停用词,在完成词切分后,接着除去文档集中出现次数过少和过 多的词.经过这些处理后,特征数目一般还很大,还需对特征进 行进一步的选取,以降低特征的维数. 在完成文档特征的选取后,还得计算每个特征的权值,使用 最广泛的是TFIDF方法,对某一特征,TF(term frequency)表示 该特征在文档中出现的次数,IDF(inverse document frequency)表示log(所有文档数/包含该特征的文档数).矢量 模型的代价是比较大的,有时为了加快处理速度,可以只考虑TF 一项,
相关文档
最新文档