基于结构挖掘的排序算法研究综述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
权 威 性等 重要 指 标 引入 We b挖 掘及 其 结果 的排 序 中是
关 键 字 出现 的频 率 .将 影 响搜 索 结 果 的 客观 性 和 准 确
G o o g l e 、 Ya h o o 、 搜狐 、 百度等。 这 些搜索 引擎 使用 起来 简
单, 并 且 还融 人 了高 级检 索 、 分 类 查找 等 功能 。 方 便 了用
性 。因此 , 如 何将 查 询 主题 的相 关性 和搜 索 页面 本身 的
w e b p a g e s i n c r e a s i n g , t h e e x p l o s i v e g r o w t h i n i n f o r m a t i o n b r o u g h t i n on c v e n i e n c e or f p e o p l e o t i f n d i n or f m a t i o n . T h e i n t od r u c t i o n o f We b d a t a m i n i n g i mp r o v e d he t r e t r i e v a l q u a l i t y . E s p e c i a l l y t h e a p p l i c a i t o n s o f We b s t r u tu c r e mi n i n g i n s e a r c h i n g e n g i n e h e l p s u s e r q u i c k l y i f n d h t e u s e f u l i n f o ma r t i o n f n 0 m l h e
【中图分类号 】 T P 3 【文献标识码 】 A
T h e S o r t i n g Al g o r i t h ms ’ R e s e a r c h R e v i e w B a s e d o n t h e S t r u c t u r e Mi n i n g
爆炸 式 增长 , 也 为人 们 的信息 查询 带 来 了不便 。 We b数据 挖掘 技术 的 引入提 高 了检 索质量 , 特 别是 We b 结 构挖 掘在
搜索引擎中的应用 , 很好地帮助用户快速从搜索结果 中锁定对 自己真正有用的信息。 本文对基于结构挖掘的排序算
法进 行 了大 量搜 集分 析 , 并进 行 了归纳 总 结。 【 关键词 l 结 构挖 掘 ; P a g e R a n k ; H I T S
L / u Ho n g - l i a n
( A b a T e a c h i n g C o l l e g e S i c h u a n We n c h u a n 6 2 3 0 0 2 )
【 A b s t r o c l 】 Wi t h t h e r a p i d d e v e l o p m e n t e f h t e I n t e m e t . W e b h a s b e c o m e a n i m p o r t a n t w a y t o o b t a i n i n f o r m a t i o n f o r p e o p l e . H o w e v e r , w i t h t h e n u m b e r o f
体系 结构 ・ 控 制 技术 ・C o n t r o l T e c h n i q u e
基 于结构挖掘 的排序 算法研 究综述
刘 红 莲
( 阿坝 师范 高等 专科 学校 四川 汶川 6 2 3 0 0 2 )
【 摘
要 】 随着 I n t e r n e t 的迅猛 发展 , We b成 为 了人 们 获取信 息 的重 要途 径 。但是 , 网页 数量 的与 日剧增 , 信息 量 的
网页数 量 已超过 1 万亿 。 要 从如 此 巨大 的网络 资源 中快 速查 找 到所 需 的信 息 是一 项具 有 挑 战性 的任 务 . 它需 要

个强 大 的搜 索 引擎 。 目前 , 网络上 流行 的搜索 引擎 有
的排名 靠前 , 这 种 方法 简单 、 有效 。 但 如果 站点有 意提 高
【 K e y w o r d s】 s t r u c t u r e m i n i n g ; p a g e a r n k ; H I T S
1 引言
随 着全球 网络 的迅猛 发 展 , We b成 为 了人们 获取 信 息 的重 要途 径 。网络 上 的页 面与 日俱 增 , 截止 2 0 0 8年 。
合 用户 需求 的页 面排在 搜 索结 果 的最靠 前 的位 置 . 是 提 高搜索 引擎 能 力 的重要 研究 内容 , 它 可让 用户 更快 捷 地
获 取所 需 的检索 信息 。 传 统 的 We b搜索 引 擎 排序 算 法大 多 都是 基 于关 键
字匹配的, 关 键 字 出 现 频 率 高 的 页 面 往 往 在 搜 索 结 果 中
s e a r c h r e s u l t s v e r y w e பைடு நூலகம் 1 . T h e a u t h o r r e s e a r c h e d a n d on c c l u d e d t h e s o r t i n g a l g o r i t h ms b a s e d o n t h e s t r u c t u r e mi n i n g .
相关文档
最新文档