孙建军:大数据时代科技情报工作的挑战与思考资料分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3 大数据的特征
非结构化数据的超大规模和增长
总数据量的80~90% 比结构化数据增长快10倍到50倍 是传统数据仓库的10倍到50倍 大数据的异构和多样性 很多不同形式(文本、图像、视频、机器数据) 无模式或者模式不明显 不连贯的语法或句义
体量Volume
多样性Variety
价值密度Value
2.1 数据开放大趋势下,科技情报服务机构如何确立优势?
学术信 息资源 开放 公共信 息资源 共享
情报加 工优势 资源独 占优势
科技大数 据体系建
设与开放
化
数据开放大趋势下,科技 情报机构社会责任:积极 建设科技大数据、推动其 开放化。
•科技信息资源开放化下,科技情报 机构依托于资源独占的优势不应、 也难以持续; •大数据时代的资源开放,强化了科 技情报机构的另一优势:资源融合 与深度加工。
…
电子商务
社交网络
21世纪是数据信息大发展的时 代,移动互联、社交网络、电子商务 等极大拓展了互联网的边界和应用范 围,各种数据正在迅速膨胀并变大。 互联网(社交、搜索、电商)、移动 互联网(微博)、物联网(传感器, 智慧地球)、车联网、GPS、医学影 像、安全监控、金融(银行、股市、 保险)、电信(通话、短信)都在疯 狂产生着数据。
淘宝、ebuy
…
移动互联
…
微博、Apps
1.2 数据增长统计
地球上至今总共的数据量:
TB
GB
1PB = 2^50字节 1EB = 2^60字节 1ZB = 2^70字节
EB PB
ZB
在2006 年,个人用户才刚刚迈进TB时代,全球 一共新产生了约180EB的数据; 5年后,这个数字达到了1.8ZB。 而有市场研究机构预测: 到2020 年,整个世界的数据总量将会增长44 倍, 达到35.2ZB(1ZB=10 亿TB)!
大量的不相关信息 对未来趋势与模式的可预测分析 深度复杂分析(机器学习、人工智能Vs传统商务智 能(咨询、报告等)
实时分析而非批量式分析
速度Velocity
数据输入、处理与丢弃 立竿见影而非事后见效
2、大数据时代科技情报工作面临的挑战
• 2.1 科技情报服务机构的优势转变问题 • 2.2 科技情报工作的重心转移问题 • 2.3 科技情报工作流程重构问题
大数据时代科技情报工作 挑战与思考
孙建军
南京大学信息管理学院
报告提纲
1. 大数据时代特征
2. 大数据时代科技情报工作面临的挑战3. 大数据时代科Fra bibliotek情报工作的思考
1.1 大数据时代的背景
“大数据”的诞生:
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的 程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸的学科如天文学 和基因学,创造出了“大数据”这个概念*。如今,这个概念几乎应用到了所有人类智力与发展的领域 中。
3. 数据时代科技情报工作的思考
思考2:提升科技情报深加工能力
多源数据深度融合
多源数据内在关联发现
3.大数据时代科技情报工作的思考
思考3:创新科技情报服务模式
轻量化科技情报服务模式 细粒度科技情报服务模式 一体化科技情报服务模式
谢 谢!
3、大数据时代科技情报工作的思考
• 3.1 建立全面、高质、开放的科技情报大数据保障体系 • 3.2 提升科技情报深加工能力 • 3.3 创新科技情报服务模式
3、大数据时代科技情报工作的思考
第三方分析报告
思考1:建立全面、高质、开放的科技情报大 数据保障体系
扩大数据的来源——全面 建立高效的数据质量评价体系——高质 降低数据获取的成本——开放
(Analytics)
2.3 科技情报工作流程重构问题
问题确 定
数据采 集
数据分 析
专家评 审
服务推 送
调查与 分析
专家识 别
结果可 视化
结果解 读
纳入用户、情报人员、数据工作者、专家的 科技情报工作流程重构。 •注重全流程中角色协作、快速迭代; •注重智能化、可视化技术应用; •情报服务延伸到客户需求各个环节。
2.2 科技情报工作的重心转移问题
科技解析 科技情报 (Intelligence) 科技信息 (Information)
科技情报服务的发展应深入到科 技解析阶段。科技情报工作应由 传统的“重数据分析轻情报解析” 向“重情报解析”转变。 另一方面,大数据时代科技情报资源更为复杂,科技情报 工作重心转移带来两个问题: (1)如何在减少数据处理与分析时间的同时,保证其质量? (2)情报解析工作如何纳入到整体流程中?