chp09_网上信息搜索
网络商务信息的收集处理与发布
补充内容:网络市场调研
(2)网络市场调研的特点
(1)及时性
(2)经济性
网络市场调研的 特点
(3)交互性
(4)吸引性
(5)可检验性和可控制性差
(6)调研内容和对象的限制性
表:网络市场调研与传统市场调研的优势比较
网上市场调研
调研费用 较低,主要是设计费和数据处理费, 每份问卷所要支付的费用几乎为零。
2、网络商务信息的分级
• 第一级是免费商务信息, 这些信息主要是社会公益性的
信息。
• 第二级是收取较低费用的信息,这些信息是一般性的普 通类信息。
• 第三级是收取标准信息费的信息,是属于知识、经济类
的信息,收费采用成本加利润的资费标准。 • 第四级是优质优价的信息,这类信息是有极高使用价值 的专用信息,是信息库中成本费用最高的一类信息,可 为用户提供更深层次的服务。
信息存储
下载全文
信息整理
将获取和储存 的信息条理化 及有序化。包 括:明确信息
信息加工处理
进行综合设计, 形成新的信息 产品,如调查 报告、营销规 划、销售决策、 新的人事安排 等等
摘取资料
下载图像 下载并编辑
来源;分类;
初步筛选等
举例1:心欣平台的竞争者及客户调研分析
供应,主动
客户是谁?
竞争者是谁?
1、http://www.oqss.com/Buy.htmOQSS在线问卷调查软件 2、http://www.sojump.com/问卷星专业问卷调查网站
性传播疾病的网络资源
最新 进 展等有 详细 介 绍 。 由美 国 制定 的性 传 播疾 病 治 疗 指 南可 在网上 免 费下 载 , 有 的是 2 1 现 00年 1 2月 1 日发 7 布 的最新 指南 , 指南 是世 界各 国制定 性病 治疗 指南 的主 该 要参 考依 据 。世 界 卫 生组 织 (t : w . h. t) 国 h p ∥w w w oi / 是 t n 际最 大 的公共 卫生 组织 , 网站不 仅 提供 来 自 13 会 员 其 9个 国 的监 测卫生 状况 的数 据及分 析 , 还提 供性 传播 疾病 控 制
传播疾病 的网页 (t : a i d 1 . i a eus pc hp ∥hr n .i u w .d/t i t dm b o d -
t e.t1提 供 了丰富 的临床病 例资 料 。 u sh ) r m 中国皮肤性 病 网( t : W .h ae a CB c/ ) h p ∥W W ci dr .O .n t n m 是 由第 四军 医大学创 建 的 目前 国 内较 完 善 的 皮肤 性 病 学
有 : ei l m tx( t :/ w . em tx og ) M d M d a I ai h p /w w m d a i r 、 e— c r t r. /
s p h p ∥W W m dcp .o /) D r G i ht: c e( t : W . es ecm 、 e u e(t ∥ a t a m d p
百度新首页如何添加网址
网址就在这里添加的。假设我们要添加去哪儿,如
下图二,输入去哪儿后,网址就自动出来了。最后
记得点击确定就可以了。 这时,在回到百度首页,你就会看到刚才添加
的网址在上面了。你也试着添加自己喜欢的网址
吧。这样是不是很简单呢?
本店资源来源于互联网版权为原作者所有请下载试用者二十四小时后删除试用后请购买正版的源自文库源
百度新首页如何添加网址
z9c9e 网址之家 http://www.hao268.com/
百度是我们常用的搜索网站。可能还有一些人
不知道,在百度首页添加网址吧,下面一步步教你
怎么做。 登陆百度首页,如下图。
如果你有百度账号的话,将网址添加到百度首
页是很方便的,如果没有,就需要点击右上角的注
册,如下图。 百度账号提供了两种方式注册,如下图,一种
是邮箱,还有一种就是手机号。 成功注册后,就需要给自己取一个名字,记住
了,百度账号的名字一旦取好了就不能再更改了。
如下图,这是我登陆后的界面,当然,我的账户用
的稍微早一点。 这时,你就可以选择我的导航右边的:添加。
中科曙光HPC培训教程汇总:D09-HPC集群常见问题及解决
排除法 故障现象往往是问题表象所在,找出可能造成问题的各种因素,分析 之间的逻辑关系,一步一步排除直到找到问题关键所在。
部分常见问题的分析思路
典型问题一 提交任务无法运行
排查思路:
◦ 检查应用日志是否有错误信息输出 ◦ 检查系统环境是否正常,包括:
排查思路:
◦ 检查系统是否有硬件报错: mcelog中记录硬件告警、服务器温度过热等
◦ 检查内存插法是否符合标准: dmidecode |grep -P -A5 "Memory\s+Device"|grep Size|grep -v Range
◦ 检查是否有任务抢占 ◦ 对比正常情况下同样的任务,检查任务参数是否设置合理 ◦ 共享存储压力过大
◦ 操作系统版本 ◦ 节点列表hosts文件 ◦ 用户信息配置 ◦ 环境变量 ◦ 共享存储挂载 ◦ 网络配置 ◦ 调度系统配置
HPC集群运维的规范
有风险的操作前需要获取用户授权,并提前做好备份等必要准备 工作
◦ 有风险的操作包括:重启系统、重启服务、修改配置 ◦ 需要备份的内容:
/etc目录 PBS记账文件 /opt/gridview/pbs/dispatcher/server_priv/accounting Maui配置文件 /opt/gridview/pbs/dispatcher-sched/maui.cfg PBS服务设置 qmgr -c‘p s’> qmgr.ps MySQL数据文件 mysqldump --socket=/opt/gvmysql/my_mysql.sock -uroot -p gv_local > gv_local.sql
LexisNexis数据库的检索研究
() 3 化学 数据库
因特网上的化学信息资料浩如烟海 ,熟练掌握 并灵活运用因特网的信息搜索方法。对广大化学工 作者及时找到有价值的信息资料 ,获取最新 化学情 报和信息文献有着重大的实用价值。要想得 心应手 地从网上查到所需资料 ,除了掌握一些检索方法和 技巧外 , 必须 亲 自动 手实践 , 断从 实践 中总结经 还 不 验, 找到更适合 自己的检索方法 , 网络信息更好地 让 服务我们的工作。
参考 文 献 1 张颖 .ne t It me 信息 检 索 的方 法 与 技 巧 . 宁 商 务 职 业 辽 学 院 学 报 ( 会 科 学 版 )2 0 ( ) 社 ,0 3 1
① 化学品结构与性质数据库 :剑桥结构数据库
(t :w wcd. m. . ) 有 机 化 合 物 数 据 库 ht l w . cc a u ; pl c a ck ( t :w wc b . uc e i r/m /m .i 1 ; 合 ht I w . y d /h m s yc pc phm ) 化 pl d e t 物基 本性质 数据 库 (t /hm idr a oto ) ht / e f e. msfcr 。 p:c n c .n
飞客病毒查杀方法
各位:
近期,飞客蠕虫病毒的活动日益活跃,针对用户可能被感染飞客蠕虫病毒,现在提供该木马病毒查杀解决方案如下,供大家参考。
电脑主机在感染飞客蠕虫(Conficker)病毒后,存在远程控制、窃密、泄密等潜在危害,并可能通过发起大范围的网络欺诈和网络攻击等手段危及我省政务信息网及公共互联网安全。
飞客蠕虫主要利用Windows操作系统MS08-067漏洞来传播,同时也能借助任何有USB接口的硬件设备来感染。这个蠕虫利用的是一个已知的被用于windows 2000,windows xp,windows vista,windows server2003和windows server 2008操作系统的服务器服务漏洞。Linux和macintosh操作系统不会受到这个病毒的影响。
一、被感染症状:
1、帐户锁定策略被自动复位。
2、某些微软Windows服务会自动禁用,如自动更新,后台智能传输服务(BITS ),WindowsDefender和错误报告服务。
3、域控制器对客户机请求回应变得缓慢。
4、系统网络变得异常缓慢。这可以从检测的网络流量图和windows任务管理器中看出。
5、与杀毒软件,windows系统更新有关的网站无法访问。
6、发射暴力密码破解攻击管理员密码以帮助它穿越并扩散到管理员共享。
二、检测方法:
第一种方法:
输入:/infection_test/cfeyechart.html网址,打开网页。若能看到六个图标,说明就没感染“飞客”病毒,若上一排图标左右两个不显示,那么就中了“飞客”病毒A或B变种,若上一排图标三个不显示那就中了“飞客”病毒C变种。
Check Point发布系列网络安全设备_惠普全线商用台式机新品发布_用友U9发布
微软全球企业应用ISV高级总监Alexandre Pombo表示,作为用友与微软全球战略合作 伙伴的最新合作成果,U9完全基于.NET平 台,融合了多项微软最新技术,顺应了中国 企业管理需求和世界应用软件行业的发展趋势, 具有世界级的技术水准。
业用户的dx系列和面向高端企业用 户的dc系列,它们均采用了惠普在 商用个性化探索中的最新成果,如 3D硬盘数据保护、Recovery系统恢 复,立卧可转换式机箱设计等功能 强大的升级配置。
dx2系列在环保方面具有颇多 新意:采纳专用高效节能电源系 统、屏幕可自动休眠,以及硬盘. 系统待机模式,提高节约电力力度 和效率;同时,减少生产和包装使 用资源,实行可回收再利用设计, 以减少对自然资源的破坏,提高再 循环利用率。
用友U9发布
用裹裹裟未黧嚣磷誉煮翟姜
级——全球第一款完全基于SOA架构的企业管理 软件UFIDA U9上市发布会”。
U9面向大中型和中型制造、流通、服务等 企业,以“实时企业,全球商务”为产品理念, 基于SOA架构,具有按需应用、业务驱动、国际 化的最佳实践三大特性,支撑企业全面应用,包 括供应链、制造、财务、成本、质量、资产、服 务、人力资源、协同、知识管理、门户等多个方 向和多个层面,支持多组织、多地点、多帐簿、 多语言、多会计制度。
无任何网络提供程序接受指定的网络路径
无任何网络提供程序接受指定的网络路径“无任何网络提供程序接受指定的网络路径”问题的几个解决方法服务器访问内网共享文件时,即在运行中输入\\\\192.168.1.11时提示“无任何网络提供程序接受指定的网络路径”在网上查了好多办法试了都没能解决。
因为考虑到之前的网络共享都可以使用,最近给系统做过一次升级,其中有一个补丁是关于TCP/IP的安全补丁,我估计和这个有关系,所以再尝试了所有我能找到的方法外,就用windowupdate查找了系统需要的补丁,然后打完所有的补丁,当时是周六,打完补丁后重启了服务器,然后看了看服务器的运行状况,没问题后就断开了,想着可能这个问题还没有解决,今天上服务器一看,前几天困扰的问题竟然已经解决了,由此得出结论,估计就是系统补丁的问题。
为了其他朋友遇到类似问题的解决,把解决这类问题的方法简单列一下:
2.worktation、erver服务无法系统,找到与自己系统相同的系统,进入
SYSTEM32/DRIVERS文件夹,找到RDBSS.SYS和MR某SMB.SYS文件。拷备到自己系统的对应位置就可以了。启动WORKSTATION服务。3.卸载网卡,重新安装。
4.网络连接属性中的“Microoft网络客户端”和“Microoft网络的文件和打印机共享”选中。
分类:Server
局域网内无法访问某一台计算机,提示“无任何网络提供程序接受指
定的网络路径”;具体是这样的,都处在同个局域网(同个网段),A计
算机和其他计算机可以互相访问,B计算机和其它计算机也可以互相访问,但是A和B却不能访问,A和B能够互相ping通,且能够互相进行远程
HP LoadRunner 9.5 下载、安装、破解图解
官方下载需要注册。
4.同意后,即进入下载页面==》
5.根据需要,选择windows(T7177-15008.zip)或Linux(T7717-15009.iso)系统下的安装文件。
PS:不知道为什么两系统的安装程序大小相差这么大。
这里以Windows系统为例。
二、安装篇
1.用虚拟光驱加载T7177-15008.iso文件。
推荐使用:Virtual Drive Manager V1.3.1(此程序绿色、小巧)
注意:装载后,不要关闭此程序。将其最小化(到任务栏)。
安装完成后,不要直接关闭,先将镜像文件卸载,否则直接关闭程序会出错。
点击完整安装程序。
3、系统弹出
需要安装以上插件。
先安装.NET Framework v3.5。(需要联网下载)
4、重启后继续安装
Next
Next
输入用户信息
Next
选择完全安装
Next
根据需要选择安装组件。
Next
选择安装路径。
Next
Next
进行安装。
安装完成。
5、Finish后,系统自动打开LoadRunner Licenses Information窗口。
并提示你的Lincense只有10天试用时间。
此时可启动LR了。
点击下载:lm70.rar点击下载:mlr5lprg.rar 点击下载:lr删除注册表.rar 下载后解压。
2、将两个dll文件复制到如下目录(及LR的安装目录),覆盖原文件。
注意先将LR关闭。否则无法覆盖:
如图,选择CONFUGURATION > LoadRunner License。
别急!
这里应该是有试用的License。
4、现在,我们需要把试用的License删除掉。
大数据分析_RDBMS与MapReduce的竞争与共生
1
大数据时代的来临
1.1 数据量的增长 在科学研究 (天文学、生物学、高能物理等 )[1]、计算机仿真、互联网应用、电子商务等领域 , 数据量呈现 快速增长的趋势 . 比如 : 在科学研究方面 , 大型强子对撞机每年积累的新数据量为 15PB 左右 (http://www-conf. slac.stanford.edu/xldb07/xldb_lhc.pdf);在电子商务领域,沃尔玛公司(Wal-Mart)每天通过 6 000 多个商店,向全球 客户销售超过 2.67 亿 (267Million)件商品(Data-Intensive Supercomputing: The Case for DISC. CMU Tech Report 2007),为了对这些数据进行分析,HP 公司为沃尔玛公司建造了大型数据仓库系统,数据规模达到 4PB,并且仍在 不断扩大. 除了上述典型例子 ,我们还可以列举出大规模数据的几个主要来源 :(1) 传感器数据 (sensor data):分布在不 同地理位置上的传感器 , 对所处环境进行感知 , 不断生成数据 . 即便对这些数据进行过滤 , 仅保留部分有效数据 , 长时间累积的数据量也是非常惊人的;(2) 网站点击流数据(click stream data):为了进行有效的市场营销和推广, 用户在网上的每个点击及其时间都被记录下来 ;利用这些数据 ,服务提供商可以对用户存取模式进行仔细的分 析,从而提供更加具有针对性的服务;(3) 移动设备数据(mobile device data):通过移动电子设备包括移动电话和 PDA、导航设备等 ,我们可以获得设备和人员的位置、移动、用户行为等信息 ,对这些信息进行及时的分析 ,可 以帮助我们进行有效的决策,比如交通监控和疏导系统;(4) 射频 ID 数据 (RFID data):RFID 可以嵌入到产品中, 实现物体的跟踪.一旦 RFID 得到广泛的应用,将是大量数据的主要来源之一. 随着数据生成的自动化以及数据生成速度的加快,需要处理的数据量急剧膨胀. 1.2 数据分析的新趋势:超越常规报表的深度分析需求的增长 为了从数据中发现知识并加以利用 ,指导人们的决策 , 必须对数据进行深入的分析 ,而不是仅仅生成简单的 报表.这些复杂的分析必须依赖于复杂的分析模型,很难用 SQL 来进行表达,统称为深度分析(deep analysis). 如图 1 所示,人们不仅需要通过数据了解现在发生了什么,更需要利用数据对将要发生什么进行预测,以便 在行动上做出一些主动的准备[2].比如通过预测客户的流失预先采取行动,对客户进行挽留. 这里,典型的 OLAP 数据分析操作(对数据进行聚集、汇总、切片和旋转等)已经不够用,还需要路径分析、 时间序列分析、图分析、 What-if 分析以及由于硬件 /软件限制而未曾尝试过的复杂统计分析模型[2]等,典型的 例子包括时间序列分析和图分析等:(1) 时间序列分析(time series analysis):商业组织积累了大量的交易历史信 息 , 企业的各级管理人员希望从这些数据中分析出一些模式 , 以便从中发现商业机会 , 通过趋势分析 , 甚至预先 发现一些正在涌现出来的机会 .比如在金融服务行业 ,分析人员可以开发针对性的分析软件 , 对时间序列数据进 行分析,寻找有利可图的交易模式(profitable trading pattern),经过进一步验证之后,操作人员可以使用这些交易 模式进行实际的交易,获得利润;(2) 大规模图分析和网络分析(large-scale graph and network analysis):社会网络 (social network)虚拟环境本质上是对实体连接性的描述 . 在社会网络中 , 每个独立的实体表示为图中的一个节 点 , 实体之间的联系表示为一条边 . 通过社会网络分析 , 可以从中发现一些有用的知识 , 比如发现某种类型的实 体(有一种类型的实体把各个小组连接在一起,称为网络中的关键实体).这些信息可以用于产品直销、组织和个 体行为分析、潜在安全威胁分析等领域.随着社会网络规模的增长,从几何角度看,图的节点和边都不断增长.使
临床实习护生应用网络资源情况调查
表 1 应 用 网 络情 况
随着计算 机技 术 和 It nt 络 的飞速 发 展 , ne e 网 r 尤其是 近 几年循证护 理 的发 展 , 上知识量 大 , 围广 , 新速度 快 , 网 范 更
维普资讯 http://www.cqvip.com
中国高等医学教育
2O O6年
第 8期
・
9 ・ 3
ck .n int, 3 hdck.e) 有 8个学 生 能 写 出几 个常用 的 医学 网站。
这表 明护理学生对 医学护理 网站还不够 熟悉 了解 , 其是 医 尤 学文献检索 , 只有 2 个护理学 生曾听说 过美 国国立 医学 图书 馆的医学文献检 索系统 , 但没有用过 。
而且 方 便 、 捷 , 此 从 网上 获 取 知 识 是 二 十 一 世 纪 不 断 学 快 因
习主要途径及解决 护 理 问题 主要方 法。来自百度文库文 通过 对临床 实 习护理学生应用 网络资源情况调查 , 旨在 了解 网络在护理 学 生 中应用情况 , 为进 一步 指导 学生 应用 医学 网络信 息资源 , 培养护理学生信息 素质… , 为终身学 习打下扎实基础。
8 % ,5 没 上 过 网 。 每 周 上 网 时 间 、 8 1人 网龄 、 网 目的 见 表 1 上 。 这表示护理学生上 网者较多 , 网龄 较 长 , 能 掌 握 尚好 , 上 技 但
我国网络市场调查存在的问题及对策研究
我 国网络市场调查存在 的问题及对策研 究
李 龙江 ’ 党存红
(. 1 中共甘 肃省委党校 ,甘 肃兰州 7 07 ) 30 0 (. 2 兰州城 市学院,甘 肃兰州 7 07 ) 3 00
摘
要:市场调查是 现代企 业 了解 市场行情,制定营销策略 的一种重要方法。 网络市场调查
是适应信息传播媒体 变革的一种崭新 的调查方 式。 文章分析 了网络环境 下市场调查 的优势和 弊端 , 并针对 当前的网络 市场调查方法 ,提 出 了在 网络环境 下进行 市场调查的一些新 思路和新方法。 关键词:市场调查; 网络调查 ;对策研究
一
、
网络市场 调查简介
( )网络市场调 查的含义பைடு நூலகம் 一
网络市场调查是基 于互联 网系统 地进行营销信息的收集 、整理 、分析和研 究的过程以及利用各种 网站 的搜索引擎寻找竞争环境信息、客户 信息、供求信息的行为。网络市场调查顺应信息传播媒体 的发展 ,可 以有效利用互联网发掘和 了解顾客需要、市场机会 、竞争对手 、行业潮流、分销渠道 以及战略合作伙伴等
中文分词技术在搜索引擎中的探讨
GU Aih a Z AO a 2 Z - u H Qu n HOU a P NG u j g W E i X Y n - ig Z h n - o g T E Y -i n IL V ig yn OU S e g rn
(.nomainE gn eigCo eeo n z o nv ri ,a g h uJa gu 50 ; 1 Ifr t n iern H g f o Ya g h uU iesyY n z o in s ̄2 0 9 t 2 Chn hp uligHev n u tyGr u f h stt 2 ,a gh uJa gu 5 0 ; . iaS ib i n a yId s o po eI tue7 3Y n z o in s ̄2 0 1 d r t n i 3S h o fr t n S i c n eh oo y o n h n e c e sU ie s y Y c e gJ a g u2 4 0 ) .c o l n o ma o ce ea d T c n lg fYa c e g T a h r n v ri , a h n in s , 0 2 I i n t n 2
o e l g wih n w o d. fd a i t e w r n
基于Shark-Search和Hits算法的主题爬虫研究
21 0 0年 儿 月
计 算 机 技 术 与 发 展
O0M UTER TECHN0U0 GY AND DEVEL 0PM匪NT
Vo . 0 No 1 12 .1 No . 2 1 v 0 0
基 于 S a k—S ac hr erh和 Hi 算 法 的 主 题 爬 虫 研 究 t s
法 的基 本 思 想 。
基 于 we 链 接 评价 的策 略主要 是依据 网页之 间 b
的链接引用关 系来 判断网页之间 的重要程度 。 目前 的
Hi 首先根 据 查询 的关 键 词确 定 一 网络 子 图 G t s
( E( V, )V为 网路子图 的结点集 , E为边集 ) 然后通 过 , 迭代计算得 出每一个 网页 的权威值 和 中心值 , 具体步
题 爬 虫 ( oi lC a l ) 称 聚 焦 爬 虫 ( oue T pc rwe 又 a r F cs d
们提供丰 富信息的同时 , 又使人们 面临挑战 , 一方面 网
上 的信息多种多样、 丰富多彩 , 而另一方面用户通过传
统搜索引擎来获取信息 却越来越 困难 。因此 , 人们 迫
( ,nhr t t可 以简单地计 算 出邻 近链接 的主题相 q aco—e ) x
关性得分 : ni b rod ci — r = 卢 。i q aco)+( e h oh o(h d u1 g l ) s m( , hr n 1
教你利用现有SLIC2.0 BIOS平稳升级SLIC2.1
教你利用现有SLIC2.0 BIOS平稳升级SLIC2.1(9.23更新,解决phoenix压缩
BIOS修改中)
BIOS
本帖最后由 r300 于 2009-9-23 16:25 编辑
更新进行中,文章末尾新方法。。。
对于修改BIOS后提示校验错误无法刷新的BIOS,可以尝试BIOS下的刷新工具
phlash16.exe。
本文首发BIOS之家(ID:r300),转贴请务必注明出处和原作者。
这篇文章只是提供大家一种思路,并不是所有的BIOS都适用于此方法,对于无法用此方法修改的BIOS,还有其他方法可以尝试,请大家参考“BIOS之家”其他文章,或请求他人帮助修改。
对于一些BIOS无法搜索到关键字问题(BIOS模块压缩),在阅读了BIOS之家诸位前辈的文章后,终于有了思路,现提供Phoenix BIOS的解决思路(参看例3)。
感谢大家的支持,文章发布后,收到了不少朋友的消息,有些朋友不太敢修改,想让我帮忙。我很乐意帮助大家修改,不过无奈请求的人太多,自己的时间精力又实在有限,所以只能帮助极少部分朋友,对于没有回复的朋友希望你们能理解。我会尽量完善文章,争取把易出错的地方写到最详细,步骤写到最简明,再次谢谢大家的理解。
该方法其实主要是针对笔记本Phoenix BIOS的,因为Phoenix没有其他简易的修改办法。这个方法不对BIOS进行整体编辑,只要确保修改位置正确,没有修改到其他非SLIC部分,即便
修改错误也是绝对不会出现开不了机的现象的。相对其他对BIOS进行整体编辑的办法来说,这
个很安全的,修改时注意胆大心细即可。
outlook错误代码
一、FOXMAIL发送邮件常见出错代码:
按照下列“Q”代表问题,“A”代表解答。
Q:the server says:550 relaying mail to <> is not allowed
Q:The server says:550 <>... relaying denied
Q:the server says:550 5.7.1 relaying not permitted:
A:使用某些Smtp服务器时,限制了收件人的地址,只能换一个Smtp服务器。
Q:The server says:550 <>:local user only
Q:The server says:550 <>:Invalid User
Q:The server says:550 Invalid recipient
A:使用,,和之类的Smtp服务器时,只能用自身的信箱发信,所以要在Outlook Express的“帐户属性”中的“个人信息”里面填写正确的邮件地址。
Q:the server says:551 delivery not allowed to non-local recipient
Q:The server says:553 Relay restriction.
Q:The server says:553 From <>, message blocked.
Q:The server says:553 sorry,you are not allow to use this SMTP to relay your eami
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011年1月9日
9.1 信息搜索工具(8)
2. 网页目录 (Web directory)
网页目录主要是由编辑人员按主题人工创建的网页 分类目录,不是用网上机器人自动生成的网页分类 目录,也称主题目录(subject directory)
编辑人员按照某些准则,对网站进行审核,确定是否要编 入到目录,并按主题对网页进行分类,然后输入到数据 库,以供用户使用 主题目录是图书馆中早已有之的图书资料管理方法 如把万维网看成是 一本超大型图书,网页目录就是这本书 前面的目录 网页目录的编排和布局则不一定像书目录那样千篇一律
2011年1月9日 多媒体文化基础 2 of 74
概要
网上信息是网上文件所含内容的描述
网上信息(web-based information)
网上信息搜索是查找多媒体文件信息的过程
文字搜索(text search[1])——搜索文字文件的信息 图像搜索(image search)——搜索图像文件的信息 声音搜索(audio search)——搜索声音文件的信息 视像搜索( video search)——搜索影视文件的信息 搜索工具有哪些 搜索工具的特性 搜索信息的方法 搜索工具的使用
多媒体文化基础 18 of 74
2011年1月9日
9.1 信息搜索工具(16)
Web of Science数据库
Web of Science的用户界面(2010-01-26)
2011年1月9日
多媒体文化基础
19 of 74
9.1 信息搜索工具(17)
5. 网页搜索门户
网页门户(Web portal)
提供的信息和资料极具权威性 专题数据库类型
公共数据库(public database):包含公共资料,由政府机构 和非营利组织管理和维护,通常出现在Web上 私有数据库(proprietary database)/商业数据库(business database):包含公共数据库中没有的专业资料,由公司管 理和维护,通常需要账户或授权的IP地址才能登录和使用
多媒体文化基础
14 of 74
9.1 信息搜索工具(12)
3. 专题数据库
1. 数据库是什么 数据库(database)
由数据库管理系统(DBMS)创建和管理的数据集合,可快 速和准确地搜索和获取所需的信息 DBMS是数据库和用户之间的接口软件,用于组织、创建、 存储、修改、查询、搜索、分类、备份、格式和打印数据 库中的数据,维护数据的安全和数据的完整性 每一个记录包含若干个域(field),每个域都有自己的名称 和数据类型[1] 优点是便于搜索、排序、重新组合或其他操作
信息搜索的必备知识
2011年1月9日
多媒体文化基础
3 of 74
9.1 信息搜索工具(1)
两种类型的搜索信息方法
主题搜索(subject search)
主题是用简明的术语或短语描述信息资源的标题 主题搜索是搜索编辑人员(如图书管理员)赋予信 息资源的标题,搜索范围限定到描述信息资源的 术语或短语 关键字是用于概括信息资源核心内容的字词 关键字词可出现在标题、摘要和正文的任何地方 关键字搜索是搜索包含关键字的信息资源
关键字搜索(keyword search)
2011年1月9日
多媒体文化基础
4 of 74
9.1 信息搜索工具(2)
四种类型的信息搜索工具 (information search tool)
网页目录——主题搜索工具
网页目录像书前面的目录,列出每一篇、每一章、 每一节的标题和相应的页码 网页索引像英文书后面的索引[1],列出书中所 有关键词和每个关键字所在的所有页码
多媒体文化基础 22 of 74
2011年1月9日
9.2 信息搜索方法(1)
信息搜索过程
信息搜索过程可归纳为五个步骤:充分准备、 明智决策、细心构思、用好工具和反复查询
充分准备 (信息描述语句)
明智决策 (用什么搜索工具)
门户网站(Web portal('s) site)
2011年1月9日
多媒体文化基础
20 of 74
9.1 信息搜索工具(18)
网页搜索门户(Web search portal)
网页门户和网页索引相结合的信息搜索工具,如
Google Directory http://directory.google.com/ MSN http://cn.msn.com/,http://www.msn.com/ Yahoo! Search http://cn.yahoo.com/,http://www.yahoo.com/ Gigablast http://www.gigablast.com/
数据库中的数据以记录(record)形式组织
2011年1月9日
多媒体文化基础
15 of 74
9.1 信息搜索工具(13)
数据库中的记录组成示例 域名 (field) 记录1 记录2 …… 记录n … … … … … … 作者 (author) … … 书名 (title) … … 出版商 (publisher) … … 出版地 (place of publication) … … 日期 (date) … … 页数 (page) … …
2011年1月9日
多媒体文化基础
16 of 74
9.1 信息搜索工具(14)
2. 专题数据库(specialized database) 也称专业数据库,垂直门户——vortal (vertical portal的简写) 针对某个题目收集的资料库
由各行各业的专家、教授、研究人员、政府机构、商业团 体创建,他们对某个特定题目有专门的知识和深入的研究
网页目录在网页上呈现的形式
2011年1月9日
多媒体文化基础
12 of 74
9.1 信息搜索工具(10)
网页目录示例(2010年2月)(http://dir.yahoo.com/)
2011年1月9日 多媒体文化基础 13 of 74
9.1 信息搜索工具(11)
网页目录的特点
第9章 网上信息搜索
林福宗 清华大学 计算机科学与技术系 linfz@mail.tsinghua.edu.cn 2010年6月
多媒体文化基础
第9章 网上信息搜索
9.1 信息搜索工具 9.2 信息搜索方法 9.3 网页评估方法 9.4 网页搜索方法 9.5 图像搜索方法 9.6 影视搜索方法 9.7 音乐搜索方法 9.8 多媒体搜索引擎
查准率(precision)
查询速度
2011年1月9日
多媒体文化基础
9 of 74
9.1 信息搜索工具(7)
网页索引的特点
网页索引是查找网页的最好工具,尤其是查找包 含关键字(keyword)、短语(phrase)和引述(quote) 的网页 网页索引是用搜索引擎创建的,能较及时地对新 创建和更新的网页做索引 给用户返回的查询结果中,通常有与查询请求不 相关或相关性很小的网页 虽然创建网页索引的原理相同,但各个公司开发 的搜索引擎的性能不同,包括搜索速度、搜索范 围、搜索算法和排名算法,呈现给用户的结果也 就不同。虽然差别不是很大,但比较明显
多媒体文化基础 8 of 74
搜索引擎可分成两种类型
2011年1月9日
9.1 信息搜索工具(6)
网页索引的性能
查全率(recall)
搜索引擎返回的匹配文档数量占所有相匹配文档总量 的比例。例如,总共有100个相匹配的文档,搜索引擎 只返回其中的80个文档,则其查全率是80% 搜索引擎列出的文档与查询内容相匹配的程度。列出 的匹配文档越多,说明查准率越高。例如,搜索引擎 列出80个文档,若其中有20个文档包含搜索字词,则 其查准率为25% 查询速度的衡量比较困难
企业创建和维护的按主题分类的网页目录 向用户提供的服务包括新闻、天气预报、电子邮件、讨论 组、在线购物、娱乐站点和与其他站点的链接 支持“网页门户”的网站 它将各种应用系统、数据资源集成到服务机上 国内的门户网站:新浪、网易、搜狐、腾讯QQ、Tom、凤 凰网、新华网、阿里巴巴、中华网和中国网络电视台等 Web网站[1]都应属于“门户网站”,有大有小
主题目录是网页搜索工具,但不是网页索引工具
2011年1月9日
多媒体文化基础
11 of 74
9.1 信息搜索工具(9)
网页目录的结构
网页目录通常采用分层结构 层次越高的主题,覆盖的网页范围越大 层次越低的主题,覆盖的网页范围越小 最低层的主题就是具体的网页信息,包括网页名称、说明 和网址 基本上都是二维的 有的主题(主目录)在窗口的左侧,列表(子目录)在窗口右侧 有的主题(主目录)在窗口上部,列表(子目录)在窗口的下部 有的主题放在按钮上,而列表(子目录)在下拉菜单上
如果把万维网看成是一本“超大型的书”,那么 网页索引就是这本书后面的“索引” 网页索引放在“索引数据库”里 网页索引包含“所有”网页的关键字和每个关键 字所在的“所有”网页地址和简短说明 按照网页索引提供的信息,可找到包含这个关键 字的所有网页
多媒体文化基础 6 of 74
Leabharlann Baidu
2011年1月9日
网页索引——关键字搜索工具
专题数据库——基本属于关键字搜索工具 网页搜索门户——主题搜索和关键字搜索相 结合的搜索工具
多媒体文化基础 5 of 74
2011年1月9日
9.1 信息搜索工具(3)
1. 网页索引
索引(index)是由关键字和关联数据组成的列 表,说明信息及其存储位置 网页索引(Web index)是万维网上的网页或网 站信息的列表
多媒体文化基础 17 of 74
2011年1月9日
9.1 信息搜索工具(15)
3. 专题数据库示例
ScienceDirect
http://www.info.sciencedirect.com/ http://www.sciencedirect.com/ 世界著名的学术期刊出版商荷兰Elsevier公司出 版的全文数据库 收录1995年以来Elsevier出版的1600多种电子期 刊,原文以html和pdf格式存储 该数据库涵盖20多个学科,包括数学、物理学、 化学、天文学、医学、生物化学、生命科学、计 算机科学、环境科学、材料科学、社会科学、工 程和技术、能源和动力等 既可搜索又可浏览,打印也很方便
可更有针对性地快速获取某个主题的概貌 需要高水平的编辑人员、选编网页时不抱成见 信息质量比较高,与查询请求的相关性比较大 网页目录结构很清晰,浏览很方便 呈现给用户的网页数目比搜索引擎提供的少 浏览网页目录时,需要多次点击连接对象才能找 到具体的网页信息 网页目录更新周期长,而网页地址变动快
2011年1月9日
9.1 信息搜索工具(4)
网页索引用搜索引擎创建 搜索引擎的工作原理
搜索引擎(search engine)是由网爬虫、索引器、数据库、 查询和网页排名等部件组成的程序
2011年1月9日
多媒体文化基础
7 of 74
9.1 信息搜索工具(5)
搜索网页:使用 网爬虫(crawlers)/网蜘蛛(spiders) 不停地在网上搜索网页,并将搜索到网页暂时存 放到网页库 创建索引:通过索引器(indexer)分析网页、抽出 词汇、创建索引,并将索引存入索引数据库,以 备用户查询 接收查询:当用户查询时,把查询请求告诉查询 引擎(query engine),将查询结果返回给用户 独立搜索引擎(individual search engine),简称为 搜索引擎,拥有自己的网页索引数据库,如 Google、必应和百度 元搜索引擎(meta search engine),没有自己的网 页索引数据库
2011年1月9日
多媒体文化基础
21 of 74
9.2 信息搜索方法
成功的信息搜索需要两个方面的努力, 一个是提高搜索工具的性能,另一个是 提高使用搜索工具的技能 在提高搜索工具性能方面,科学技术人 员已经做了非常出色的工作,而且还在 孜孜不倦地继续努力 在提高使用搜索工具的水平方面,除了 要理解搜索工具的知识外,还要靠自己 在实践中不断地摸索、总结和提高