超星发现系统

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
——杨晓光 北京航空航天大学航空推进系教授 博士生导师
图书馆馆长
国外主要发现系统
国外发现系统对比
产品 全球用户数量 国外代表性用户 大陆地区用户
300多家 哥伦比亚大学、普林斯顿 大学、密歇根大学、康奈 尔大学、悉尼大学等
Summon
400多家
EDS
利物浦大学、墨尔本大学、 北卡罗来纳大学、乔治亚大 学、詹姆斯麦迪逊大学等
读秀:
百链:
图书补缺
期刊等文献补缺
发现系统不是简单的整合
发现系统是知识挖掘与数据分析
从资源到知识的发现层次观
目录级发现 文献级发现
知识级发现
知识发现的主要方向
……
三、发现系统功能构想
500台服务器 1.2PB存储 8T内存 4000个CPU核心
10亿引文 2亿中文元数据 超星分布式存储
超星发 现系统
Primo Central
600多家 哈佛大学、英国牛津大学、 英国国家图书馆等
300家
400家
600家
北京大学、西安交通大学 、浙江大学。 •Summon:元数据仓
中山大学图书馆。
清华大学、上海交通大学。 •Primo:用户馆藏索引 •Primo Central:远程元数 据集中索引 •SFX:开放链接服务 •bX 学术推荐服务(可选) •MetaLib:联邦检索搜索引 擎(可选) •内嵌Oracle 使用许可
That is more than in the Previous 5,000 years.
新的科学技术知识 大约每2年翻一番
人类的学习和阅读迈进“无纸化时代”
数字资源浪潮
>1万个 数据库
疑惑
引自电子科技大学图书馆 秦鸿
我们如何面对?
‫ﻈ‬
基于知识挖掘的发现系统
发现的wenku.baidu.com义
意外惊喜
洞察全局 价值再生
每月更新300万条
精准地发现中文资源
专业级强大词表库支持精准发现
40万主题词表 600万作者库 3500条学科 分类表 2500万学术 专业词库 30万机构库
8万同义词表
20万刊名表
600个数据库收录 来源表
重要索引库
10亿条引文数据
完善的中文引证分析
参考与引证
文章被引用的生命曲线
《图书馆学导论》于良芝 2003 科学出版社
中文支持
支持中文简繁互检
支持Unicode,具备中文分词 支持中文切分和中文简繁体 与繁简通检功能。 汉字通检
国外发现系统的中文资源量
中文资源量在summon和超星发现系统中对比
Summon 超星发现系统
测试时间:2012年7月
中文资源量在primo和超星发现系统中对比
primo不支持空检索,通过检索词“文化”进行对比
可视化的知识关联图谱
知识点与知识点的关联
知识点与知识点的关联
知识点与人的关联
人与人的关联
不同时期图书馆学领域高产出作者变化
1990—1995年
2009—2013年
不同时期图书馆学领域研究热点变化
1990—1995年
2009—2013年
知识关联的意义在于 人与人、人与知识、知识与知识、 机构与人、机构与机构等之间的相 互关系。
发现
学术趋势分析
java研究变化趋势
多主题分析
网格计算与云计算发展相关性分析
手扶拖拉机:一个不靠谱的领域
湖南大学的学术产出趋势分析
清华大学的专利情况
智能的辅助搜索
同时检索了 “茅草枯”
无缝对接各类全文获取系统
无缝对接
OPAC:
数据库:
本馆纸书
CNKI、万方、维普、方正….
发现系统
子系统
•EDS Basic Index:元数据 仓 •360Link:期刊全文链接 •OPAC via EDS:整合图书 馆OPAC系统 •360Core:电子期刊导航 •EBSCO LinkSource:链接 解析器 •360Link Ebooks:电子 •EBSCO A-to-Z:资源导航 书链接 •360Core Ebooks:电子 •EHIS:联邦检索工具(可 图书导航 选)
200亿级搜索引擎 10亿数据实时分析 30000并发/毫秒级 200名研发人员 4个研究所 7年搜索与挖掘
资源补缺 云服务
整 合
知识挖掘 数据分析
百链
发现系统院校展示
北京航空航天大学
天津大学
北京师范大学
哈尔滨工业大学
吉林大学
电子科技大学
39所985院校中
采用超星发现系统已经有
31所

意外惊喜 洞察全局 价值再生
超星发现为创新插上飞翔的翅膀
谢谢
Primo 超星发现系统
测试时间:2012年9月7日
中文资源量在EDS和超星发现系统中对比
通过检索词“文化”进行对比 EDS 超星发现系统
测试时间:2012年9月5日
超星发现系统
西安交通大学 图书馆首页
全面地发现中文资源
元数据更新:两次/周
12年12月1日数据量
13年2月1日数据量
超星集团副总经理 叶艳鸣
‫ﻈ‬ ‫ﻈ‬
海量资源带来的困惑 基于知识挖掘的发现
‫ﻈ‬
海量资源带来的困惑
——由一组数字说起
估计现在一年全世界所 产生的新信息量大约有
4千万万亿(4X10 )
19
字节
引自Howie DiBlasi的“你知道吗”
2011年 全球信息总量突破
1.8千万亿兆
字节
这超过了人类过去 五千年信息量的总和
区分自引他引
自引量(3)
引文分析
实现期刊-期刊到图书-图书、图书-期刊、期刊-图书的
引用分析
完善中文期刊引用分析: 4000万到7600万 提供作者、出版社、刊名、作者单位、主题词、
分类等的引用分析
学科、
最终实现图书、期刊、学位论文、会议论文……之间
互引的立体引用关系
灵活的分面分析功能
相关文档
最新文档