个性化搜索引擎中用户兴趣模型研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1卷 第8 1 期
软 件 导 刊
SO t r f wa e Gui e d
v011 . lN O 8
Aug 2 2 . 01
个 性 化 搜 索 引擎 中 用 户 兴 趣 模 型 研 究
林 国 , 李伟 超
( 州航 空工业 管理 学院 计算 中心 , 南 郑 州 4 0 1 ) 郑 1 河 5 0 5
新 动 作 做 出反 应 。
当前 , 用 的信 息 检 索 系 统 对用 户本 身 的个 性 需 求 没 通 有 给予 较 大 的关 注 , 们 大 多 通 过 改 进 当 前 的 检 索 模 型 、 它
优化信息处 理过 程等 方 面的工 作来 提 高检索 的准确性 。 这 类 搜 索 引擎 系统 中 没 有 考 虑 到 用 户 的 检 索 行 为 、 史 , 历 用 户也 不 能方 便 地 发 现 其 最 新 兴 趣 偏 好 点 。用 户 兴 趣 模 型是 用 来 描 述 用 户 潜 在 兴 趣 需 求 的 模 型 , 主要 功 能 是 捕 其 获用户查询需求及其 兴趣偏好 , 同时 记 录 、 理 用 户 兴 趣 管 偏 好 。在 信 息 查 询 系统 中引 进 用 户 兴 趣 模 型 , 助 于 为 用 有 户 提 供 个 性 化 的信 息 查 询 服 务 , 以实 现 自适 应 信 息 搜 索 。
不 同 知识 结 构 的用 户 对 文 档 相 关 性 的 判 断 和对 检 索
结 果 的 要求 是 各 不 相 同 的 , 使 同 一 个 用 户 , 不 同 的 时 即 在
期 其 兴 趣 的侧 重也 是 不 同 的 。用 户 兴 趣 模 型 是 为 用 户 提
供 个性 化 服务 信 息 检 索 或 信 息 过 滤 系统 的核 心 组 成 部 分 , 它 能 够 获 取 每个 用 户 不 同 的信 息 需 求 , 踪用 户 的兴 趣 与 跟 行 为 , 此 对 每个 用 户 需 要 分 别 建 立 用 户 描 述 文 件 , 即 因 也 个 性 化 服 务 文 件 , 文 件 用 来 保 存 用 户 的 兴趣 偏 好 。 该 目前 , 掘 用 户兴 趣 主 要 有 两 种 方 式 : 式 获 取 和 隐 发 显 式 获 取 。显 式 获 取是 指用 户 主动 提 供 自己 的兴 趣 偏 好 , 进
索精度。 ຫໍສະໝຸດ 户 提 供 主 动 的 个 性 化 信 息服 务 。
现 有 的个 性 化 服务 系 统 在 某 些 方 面 已 经 取 得 了较 满
意 的效 果 , 比如 服 务 的 个 性 化 、 能 化 、 智 自适 应 性 等 , 仍 但 然 存 在 一 些 不 足 之 处 : 个 性 化 程 度 不 高 ; 用 户 兴 趣 描 ① ② 述 文 件 可 存 放 在 服 务 器 端 、 户 端 或 代 理 端 ; 用 户 的 兴 客 ③
趣 可 划 分 为 近 期 兴 趣 和 长期 兴趣 ; 用 户 模 型 中 对 用 户 兴 ④
趣信 息 的学 习效 率 较 低 ; 用户 兴 趣 模 型 更 新 较 慢 。 ⑤
2 个 性 化 搜 索 引擎 中 的用 户 兴 趣 模 型 1 现 有 用 户 兴 趣 模 型 的 不 足
2 1 用 户 兴 趣 模 型 的 基 本 结 构 .
文献 标 识 码 : A
文 章 编 号 : 6 2 7 0 ( 0 2 0 80 2 3 1 7 —8 0 2 1 ) 0 —0 60
由于 用 户 兴趣 模 型可 以定 位 用 户 的 信 息 需求 , 因此 可 为 用
0 引 言
用 户 兴 趣 模 型 是 实 现 搜 索 引 擎 个 性化 服务 的起 点 , 也 是搜 索 引擎 个 性 化 服 务 的 基 础 和 核 心 。 用 户 兴 趣 模 型 的 质量 直 接 关 系 到个 性 化 服 务 的质 量 , 户 兴趣 模 型 与用 户 用 的检 索 需 求 相 结 合 可 以更 加 逼 近 用 户 “ 实 ” 信 息需 求 , 真 的 通 过 对 检 索 结 果 进 行 过 滤 和 筛 选 , 以提 高 搜 索 引擎 的 搜 可
长期 兴 趣 建 立 用 户兴 趣 模 型 , 并分 别 对其 进 行 了 更新 优 化 ; 最后 , 出 了个 性 化 搜 索 引 擎 的 具 体 工作 过 程 。 提
关 键 词 : 户兴 趣 模 型 ; 性化 服 务 ; 索 引擎 ; 期 兴 趣 ; 用 个 搜 短 长期 兴趣
中 图分 类 号 : 3 1 TP 0
信息过滤技术是对个体 对象进 行信息 筛选 、 滤 , 过 信
息 过 滤 更 注 重 用 户 的 长 期 兴 趣 需 求 。 早 期 的用 户 模 型 是 信 息 过 滤 技 术 中 的 一 个 核 心 问题 , 时 的用 户 模 型 是 用 来 当
建 立 个 性 化 人 机 界 面 的 。个 性 化 人 机 界 面 是 一 个 接 口部
而获取用户的个性化向量 ; 隐式 获 取 是 通 过 用 户访 问 的 相
分 , 提 供 用 户 与 系 统 的 交 互 接 口 , 性 化 人 机 界 面 与 用 它 个 户 进 行 交 互 , 交 互 的 过 程 中 学 习 用 户 的 行 为 , 学 习 用 在 并
户 对 事 务 进 行 处 理 的 经 验 , 对用 户 将 要 出现 的新 行 为 或 以
基 金 资 助 : 南 省 基 础 与 前 沿 技 术 研 究 计 划 项 目( 1 3 0 1 3 4 河 12 0 4 0 0 )
摘 要 : 个 性 化 搜 索 引擎 中的 用 户 兴趣 模 型进 行 了分析 研 究 。 首先 , 析 了现 有 用 户 兴趣 模 型 的不 足 , 出 了 用 P 对 分 指
兴 趣 模 型 的基 本 结 构 , 用 P 兴趣 模 型 的特 征 提 取 采 用基 于 词 频 统 计 的 TF I 对 —DF算 法 ; 后 , 用 用 户 的 短 期 兴 趣 和 然 利
软 件 导 刊
SO t r f wa e Gui e d
v011 . lN O 8
Aug 2 2 . 01
个 性 化 搜 索 引擎 中 用 户 兴 趣 模 型 研 究
林 国 , 李伟 超
( 州航 空工业 管理 学院 计算 中心 , 南 郑 州 4 0 1 ) 郑 1 河 5 0 5
新 动 作 做 出反 应 。
当前 , 用 的信 息 检 索 系 统 对用 户本 身 的个 性 需 求 没 通 有 给予 较 大 的关 注 , 们 大 多 通 过 改 进 当 前 的 检 索 模 型 、 它
优化信息处 理过 程等 方 面的工 作来 提 高检索 的准确性 。 这 类 搜 索 引擎 系统 中 没 有 考 虑 到 用 户 的 检 索 行 为 、 史 , 历 用 户也 不 能方 便 地 发 现 其 最 新 兴 趣 偏 好 点 。用 户 兴 趣 模 型是 用 来 描 述 用 户 潜 在 兴 趣 需 求 的 模 型 , 主要 功 能 是 捕 其 获用户查询需求及其 兴趣偏好 , 同时 记 录 、 理 用 户 兴 趣 管 偏 好 。在 信 息 查 询 系统 中引 进 用 户 兴 趣 模 型 , 助 于 为 用 有 户 提 供 个 性 化 的信 息 查 询 服 务 , 以实 现 自适 应 信 息 搜 索 。
不 同 知识 结 构 的用 户 对 文 档 相 关 性 的 判 断 和对 检 索
结 果 的 要求 是 各 不 相 同 的 , 使 同 一 个 用 户 , 不 同 的 时 即 在
期 其 兴 趣 的侧 重也 是 不 同 的 。用 户 兴 趣 模 型 是 为 用 户 提
供 个性 化 服务 信 息 检 索 或 信 息 过 滤 系统 的核 心 组 成 部 分 , 它 能 够 获 取 每个 用 户 不 同 的信 息 需 求 , 踪用 户 的兴 趣 与 跟 行 为 , 此 对 每个 用 户 需 要 分 别 建 立 用 户 描 述 文 件 , 即 因 也 个 性 化 服 务 文 件 , 文 件 用 来 保 存 用 户 的 兴趣 偏 好 。 该 目前 , 掘 用 户兴 趣 主 要 有 两 种 方 式 : 式 获 取 和 隐 发 显 式 获 取 。显 式 获 取是 指用 户 主动 提 供 自己 的兴 趣 偏 好 , 进
索精度。 ຫໍສະໝຸດ 户 提 供 主 动 的 个 性 化 信 息服 务 。
现 有 的个 性 化 服务 系 统 在 某 些 方 面 已 经 取 得 了较 满
意 的效 果 , 比如 服 务 的 个 性 化 、 能 化 、 智 自适 应 性 等 , 仍 但 然 存 在 一 些 不 足 之 处 : 个 性 化 程 度 不 高 ; 用 户 兴 趣 描 ① ② 述 文 件 可 存 放 在 服 务 器 端 、 户 端 或 代 理 端 ; 用 户 的 兴 客 ③
趣 可 划 分 为 近 期 兴 趣 和 长期 兴趣 ; 用 户 模 型 中 对 用 户 兴 ④
趣信 息 的学 习效 率 较 低 ; 用户 兴 趣 模 型 更 新 较 慢 。 ⑤
2 个 性 化 搜 索 引擎 中 的用 户 兴 趣 模 型 1 现 有 用 户 兴 趣 模 型 的 不 足
2 1 用 户 兴 趣 模 型 的 基 本 结 构 .
文献 标 识 码 : A
文 章 编 号 : 6 2 7 0 ( 0 2 0 80 2 3 1 7 —8 0 2 1 ) 0 —0 60
由于 用 户 兴趣 模 型可 以定 位 用 户 的 信 息 需求 , 因此 可 为 用
0 引 言
用 户 兴 趣 模 型 是 实 现 搜 索 引 擎 个 性化 服务 的起 点 , 也 是搜 索 引擎 个 性 化 服 务 的 基 础 和 核 心 。 用 户 兴 趣 模 型 的 质量 直 接 关 系 到个 性 化 服 务 的质 量 , 户 兴趣 模 型 与用 户 用 的检 索 需 求 相 结 合 可 以更 加 逼 近 用 户 “ 实 ” 信 息需 求 , 真 的 通 过 对 检 索 结 果 进 行 过 滤 和 筛 选 , 以提 高 搜 索 引擎 的 搜 可
长期 兴 趣 建 立 用 户兴 趣 模 型 , 并分 别 对其 进 行 了 更新 优 化 ; 最后 , 出 了个 性 化 搜 索 引 擎 的 具 体 工作 过 程 。 提
关 键 词 : 户兴 趣 模 型 ; 性化 服 务 ; 索 引擎 ; 期 兴 趣 ; 用 个 搜 短 长期 兴趣
中 图分 类 号 : 3 1 TP 0
信息过滤技术是对个体 对象进 行信息 筛选 、 滤 , 过 信
息 过 滤 更 注 重 用 户 的 长 期 兴 趣 需 求 。 早 期 的用 户 模 型 是 信 息 过 滤 技 术 中 的 一 个 核 心 问题 , 时 的用 户 模 型 是 用 来 当
建 立 个 性 化 人 机 界 面 的 。个 性 化 人 机 界 面 是 一 个 接 口部
而获取用户的个性化向量 ; 隐式 获 取 是 通 过 用 户访 问 的 相
分 , 提 供 用 户 与 系 统 的 交 互 接 口 , 性 化 人 机 界 面 与 用 它 个 户 进 行 交 互 , 交 互 的 过 程 中 学 习 用 户 的 行 为 , 学 习 用 在 并
户 对 事 务 进 行 处 理 的 经 验 , 对用 户 将 要 出现 的新 行 为 或 以
基 金 资 助 : 南 省 基 础 与 前 沿 技 术 研 究 计 划 项 目( 1 3 0 1 3 4 河 12 0 4 0 0 )
摘 要 : 个 性 化 搜 索 引擎 中的 用 户 兴趣 模 型进 行 了分析 研 究 。 首先 , 析 了现 有 用 户 兴趣 模 型 的不 足 , 出 了 用 P 对 分 指
兴 趣 模 型 的基 本 结 构 , 用 P 兴趣 模 型 的特 征 提 取 采 用基 于 词 频 统 计 的 TF I 对 —DF算 法 ; 后 , 用 用 户 的 短 期 兴 趣 和 然 利