基于XSLT的Web包装器环境
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在 因特 网的迅速发展和应用 中, HTML成为信息发 布 的主要载体 。HTML着重描述信息的表现形式 , 于用 户 便
可分 为 两 个 方 面 : 是 一
We 包装 器 的描 述 方 式 b 和运 行 环 境 ; 是 We 二 b
包装 器 的 生 成技 术。本 文侧 重 于前 者 。包 装 器 描 述 一般 有 四种 实现 方
通过浏览器访问 , 它的信 息组织 方式不便 于程序进行 加 但
工处理 。随着互联 网的功 能从信 息发布 扩展到服务 提供 , 人们开始通过 X ML和 We evc 等技术来改进信 息组 bS ri s e 织方式 , 构建更 易于集成 的系统 。考 虑到 网上仍 然存在 大 量 HTML页面和 We b应用 , 要在 新系统 中利用 这些 现有 资源 , 就需 要通 过 We 包装 器( bWrp r 将页 面转 化 b We a p ) e 为结构化 数据 ( X ) 如 ML 。例如 , 包装 多个 基 于 We b的产
摘
要 : b包装器将 网页内容转换为 XML格式 , We 用于 系统集成。进 行 XML转换的 X L S T技术 能较 好地 支持 包装
器 的 信 息抽 取 和 组 织 。 本 文从 包含 查 询接 口 、 果模 式和 映 射 规 则 的 包装 器 描 述 文 件 ( ML 出发 , 出 了 自动 生成 可执 结 X ) 给
LI AO n - u 。 AO a - u n Lig r i XI Tin y a
( 清华大学 自动化 系 C MS工程研究中心 , I 北京 1 08 ) 0 0 4
( MI nier gR smr e t 。 eat e t f uo ai ,s gu nvr t。ej g10 8 C ia C SE g ei ee _ C ne D prm n tm t n T i h aU i sy B tn 00 4。hn ) n n h r oA o n ei i
关键词 : b包装 器; S , XMLS hm We XL T; ce a
Ke ywod : e a p r r sW bwr p ;XS ;XM S h m e L c e a
中图分类号 : 3 1 TP 1
文献标 识码 : A We b包 装 器 的 研 究
1 引言
W r p e e c i t n i c r r t s t eq ey i t ra e ,r s l s h a n p i u e . Th sXM f ei s d t e e t a p rd s rp i o p a e h u r n e f c o n o s e u t c e sa d ma p n r ls m g i i ue g nr e l s o a
行代 码的技 术方案。包装 器的执行及 其生成过程 完全基 于 XS T技术 , L 系统具有较 强的可移植性 。提 出“ 元数 据对齐” 方 法进行 内容辅助定位 , 高了对 页面变化的容忍度。原型 系统的 实现验证 了以上技 术的可行性 。 提
Abta t C n et g W e a e no XM L,W e a p r a u p r h tg aino xsi y t s sr c: o v ri b p g sit n bwr p esc ns p o t ei e r t f it s se .XS T i s t n o e g n m L am a tXM L rn fr t n Is c p bl is i no a in e ta t n a d ro g nz t n s o g o tn ilfr wr p es ta so ma i . t a a it n ifr t xr ci n e r a iai h w o d p e t o a p r. o ie m o o o o a
e e ua l o ea tmaial.W rp re eu ina dc d e eaina eal a e nsa d r LT,whc e tr sg e t x c tbecd uo tc l y a p x c t n eg n rt r l b sdo tn adXS e o o o ihfa u e r a o tbl y p ra it .A n e tb sd lc t gmeh d cl d “ e - t inn ’ sas u o wad t mp o e w a p r ’tlr i o c tn-a e oa i t o al n e M t Da Al i ’i lo p tfr r o i r v a a g g r p s oe— e a c o tec a g so e g s Ie sa d tc nq e r aiae n tei lme tt n o h r ttp . n et h h n e f W b p e. d n e h iu saev l td i h mpe n ai ftep oo :0 710 2 0 ) 90 1- 3 1 0-3 X(0 6 0 —0 5 0
基 于 XS T 的 W e L b包 装 器 环境
A LT— s d W e r p e v r n e t XS — e Ba b W a p r En io m n
廖灵睿 。 肖田元
维普资讯
C 31 5 / N4 —2 8 TP
I S 1 0 — 3 X S N 0 7 1 O
计 算机 工程 与科 学
COMPUTE E R NGI ERI NE NG & S ENCE CI
20 0 6年第 2 8卷第 9期
Vo . 8, . , 0 6 1 2 No 9 2 0
可分 为 两 个 方 面 : 是 一
We 包装 器 的描 述 方 式 b 和运 行 环 境 ; 是 We 二 b
包装 器 的 生 成技 术。本 文侧 重 于前 者 。包 装 器 描 述 一般 有 四种 实现 方
通过浏览器访问 , 它的信 息组织 方式不便 于程序进行 加 但
工处理 。随着互联 网的功 能从信 息发布 扩展到服务 提供 , 人们开始通过 X ML和 We evc 等技术来改进信 息组 bS ri s e 织方式 , 构建更 易于集成 的系统 。考 虑到 网上仍 然存在 大 量 HTML页面和 We b应用 , 要在 新系统 中利用 这些 现有 资源 , 就需 要通 过 We 包装 器( bWrp r 将页 面转 化 b We a p ) e 为结构化 数据 ( X ) 如 ML 。例如 , 包装 多个 基 于 We b的产
摘
要 : b包装器将 网页内容转换为 XML格式 , We 用于 系统集成。进 行 XML转换的 X L S T技术 能较 好地 支持 包装
器 的 信 息抽 取 和 组 织 。 本 文从 包含 查 询接 口 、 果模 式和 映 射 规 则 的 包装 器 描 述 文 件 ( ML 出发 , 出 了 自动 生成 可执 结 X ) 给
LI AO n - u 。 AO a - u n Lig r i XI Tin y a
( 清华大学 自动化 系 C MS工程研究中心 , I 北京 1 08 ) 0 0 4
( MI nier gR smr e t 。 eat e t f uo ai ,s gu nvr t。ej g10 8 C ia C SE g ei ee _ C ne D prm n tm t n T i h aU i sy B tn 00 4。hn ) n n h r oA o n ei i
关键词 : b包装 器; S , XMLS hm We XL T; ce a
Ke ywod : e a p r r sW bwr p ;XS ;XM S h m e L c e a
中图分类号 : 3 1 TP 1
文献标 识码 : A We b包 装 器 的 研 究
1 引言
W r p e e c i t n i c r r t s t eq ey i t ra e ,r s l s h a n p i u e . Th sXM f ei s d t e e t a p rd s rp i o p a e h u r n e f c o n o s e u t c e sa d ma p n r ls m g i i ue g nr e l s o a
行代 码的技 术方案。包装 器的执行及 其生成过程 完全基 于 XS T技术 , L 系统具有较 强的可移植性 。提 出“ 元数 据对齐” 方 法进行 内容辅助定位 , 高了对 页面变化的容忍度。原型 系统的 实现验证 了以上技 术的可行性 。 提
Abta t C n et g W e a e no XM L,W e a p r a u p r h tg aino xsi y t s sr c: o v ri b p g sit n bwr p esc ns p o t ei e r t f it s se .XS T i s t n o e g n m L am a tXM L rn fr t n Is c p bl is i no a in e ta t n a d ro g nz t n s o g o tn ilfr wr p es ta so ma i . t a a it n ifr t xr ci n e r a iai h w o d p e t o a p r. o ie m o o o o a
e e ua l o ea tmaial.W rp re eu ina dc d e eaina eal a e nsa d r LT,whc e tr sg e t x c tbecd uo tc l y a p x c t n eg n rt r l b sdo tn adXS e o o o ihfa u e r a o tbl y p ra it .A n e tb sd lc t gmeh d cl d “ e - t inn ’ sas u o wad t mp o e w a p r ’tlr i o c tn-a e oa i t o al n e M t Da Al i ’i lo p tfr r o i r v a a g g r p s oe— e a c o tec a g so e g s Ie sa d tc nq e r aiae n tei lme tt n o h r ttp . n et h h n e f W b p e. d n e h iu saev l td i h mpe n ai ftep oo :0 710 2 0 ) 90 1- 3 1 0-3 X(0 6 0 —0 5 0
基 于 XS T 的 W e L b包 装 器 环境
A LT— s d W e r p e v r n e t XS — e Ba b W a p r En io m n
廖灵睿 。 肖田元
维普资讯
C 31 5 / N4 —2 8 TP
I S 1 0 — 3 X S N 0 7 1 O
计 算机 工程 与科 学
COMPUTE E R NGI ERI NE NG & S ENCE CI
20 0 6年第 2 8卷第 9期
Vo . 8, . , 0 6 1 2 No 9 2 0