大数据环境下应用型本科院校图书馆建设的探讨
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学术 论 坛
大数据环境下应用型本科院校图书馆建设的探讨
晏伯 武
( 湖北理工 学院 计算机 学院, 湖北黄石 4 3 5 0 0 3 )
摘要: 本文探讨 了应用型本科 院校 图书馆的特点, 综述 了大数据相 关技术, 大数据来源, 及其 图书馆在新的环境 下的发来自百度文库方向, 并对其进
行 了展 望 。
! 竺 栅 【 _ … … …… …. … ………一
学术论坛
数据 。
2 . 3相 关技 术
和大数据的价值【 1 。
大数据技术涉及大数据 采集 , 大数据存储与管理 , 大数据计算 模式与系统 , 大数据分析与挖掘和大数据 隐私与安全等 方面, 大数
大数据的关键技术主要包括 : 大数据获取 , 大数据预处理 , 大数
4 O. 3 %【 。
是计算机有史以来全部信息量的总和 ” , 已经得 到验证 。 大数据的信 息量大 , 应当是达到P B 级 以上。 而对于大数据的定义 , 比较典型的描
述 是 由NS F ( 美国 国家科学基 金会) 提 出的 : 大 数据 是指 “ 由科学仪
研究实践的重要 内容。 互联 网的出现呈现取代传统广播 电视报刊 传 器 、 传感设备 、 互联网交易、 电子邮件 、 音视频软件、 网络点击流等多
统 的作用之势 , 如何在 “ 互联网+ ” 的环境下发展应用型本科院校图 书馆建设 , 值得研究 。 ”调查结果表明2 0 1 0 年起 , 国 民对 数字 阅读 方 式的接触率持续上涨 , 2 0 1 0 年为3 2 . 8 %, 2 0 1 1 年为3 8 . 6 %, 而2 0 1 2 年为
据应当理解为数据采集 、 数据存取、 数据 处理 、 数据挖掘等相关技术 据存储 , 大数据分析 , 大数据检索 , 大数据展 现与应用。 具体有云计
的融合。 云计算技术可以说是处理海量数据最为低成本和高效率解 算, 物联网技术, 移动计算技术。
决方案 , 通过云计算技术 , 可以把海量分散的数据从手机端、 电脑端 系统加 以高效分析 和计 算 , 提炼 出富有价值 的数据和信息 。
获得 者3 i m G r a y  ̄ 出的“ 新摩尔定律 ” : “ 每1 8 个月全球新增信息量
适 应新的环境增加更显著 , 互联 网得 到较好 的运 用 , 故图书馆的借 阅量 了出现下滑之势 。 尤 其是 随着 信息技术 , 物联 网, 大数据 , 云计 算技术的发展下, 如何跟上信息技术 发展地方本科 院校 图书馆成为
新 建应 用型本科院校大都是在原来高职高专 院校的基础上于 理 念 2 0 0 0 年前后升格 为本 科院校的 , 其专业建设学科建设等方面较新 , 2大数 据 及 其相 关技 术 注重在学术 、 工程基础上的强调技术和应用 。 图书馆作为现代高校
2 . 1大 数 据
的科研 、 教 学、 图书馆三大 块之 ~, 得 到较好 的发展 和建设。 但在 资
传统的图书馆 的功能主要体现为 “ 藏、 借、 阅、 管” , 而 由于网络 、
无线网、 移动终端的应用 , 现今图书馆 管理模式发生相应变 化, 追求
速) , 是指大量实 时数据 流的快速 收集、 创建 、 分析、 处理 、 传送的过 程。 Va l u e ( 价值) , 量大但密度很低, 需要从数据 中提炼出有价值的数
种数据源生成的大规模、 多元化、 复杂、 长期的分布式数据集” 。 大数
据的特点主要有4 V, 如图1 所示 : U P Vo l u me (  ̄i) , 在2 0 1 1 年, 全球的 数据总量就达到1 . 8 Z B, 而到了2 0 2 0 年, 全球数据总量将增 长5 O 倍。 Va r i e W( 多样) , 结构性数据 、 半结构数据 、 非结 构数据 。 Ve l o c i t y ( 高
储 技术是Go o g l e 的G 和Ha d o o p 的HDF S, 其 中, HD F S 是GF S 的
云计算技术的虚拟技术, 海量分布储存技术, 并行编程模式, 云
电脑端及其他智 能终端均传送至云平 台, 然后再通过一个大规模的 物联网技术主要包括F 融D 技术 , 近场通信技术 , 传感器 网络技
金方面存在不足状态 , 馆合 、 图书 、 电子资源建设和其发展速度相对 滞后 。 在另一方 面, 现今的情 况是相关资源增加了, 尤其是 电子资源
大数据是信息 技术继P C, 互联 网, wE B1 . 0 , 移动通信 , WE B 2 . 0 Z后 的第五次浪潮 , 2 0 1 2 年被认为大数据的起始分水岭年。 图灵奖
关键 词 : 图书馆 ; 大数 据 ; 云计 算 中图分类号: T P 3 9
文献标识码: A
文章编号: 1 0 0 7 . 9 4 1 6 ( 2 0 1 7 ) 0 4 - 0 2 3 O ・ 0 2
1 应 用型 本 科 院 校图 书 馆 的特 点
立 了以用户为 中心 ” 以数据为根本 ” 以图书馆为枢纽的大数据研究
及其他智 能终端均传送至云平台 , 然后再通过一个大规模 的分布式 技术平台管理技术。 云计算技术, 可以把海量分散的数据从手机端、 ( 1 ) 大数据的存储技术采用冗余存储模式。 比 较有名的分布 式存 分 布式系统加以高效分析 和计算 , 提炼 出富有价值的数据和信息 。 开源 实现 。 为 了达 到方便管理数据的 目的 , 大数据不再采用传统 的 术和无线通信技术 。 移动计算关键技术如下 : 移动计算通信协议 , 情 单表数据存储结构 , 而是采用 由多维表组成 的按列存储的分布 式实 景感知 , 移动计算环境 , 无缝迁 移技术 。
据和信息 。 现 今新 的计算方法 , 机器学习一直在提高着数据的质量
在任何地点 、 任何时间舒适地使用 图书资源 。 高校图书馆的发展确
图 1大 数 据 的 3 V特 征
收 稿 日期 : 2 ( 1 1 7 - 0 3 — 2 2
基金 项 目: 湖北省教 育厅重点科技 项 目基金 资助项 目( No : D2 0 1 2 3 0 0 2 ) 。 作者简介: 晏 伯武( 1 9 6 9 一) , 男, 湖 北黄 冈人, 博 士, 湖北理 工学院教授, 研 究方向: 计 算机 应用, 微 电子 与 固体电子学。
大数据环境下应用型本科院校图书馆建设的探讨
晏伯 武
( 湖北理工 学院 计算机 学院, 湖北黄石 4 3 5 0 0 3 )
摘要: 本文探讨 了应用型本科 院校 图书馆的特点, 综述 了大数据相 关技术, 大数据来源, 及其 图书馆在新的环境 下的发来自百度文库方向, 并对其进
行 了展 望 。
! 竺 栅 【 _ … … …… …. … ………一
学术论坛
数据 。
2 . 3相 关技 术
和大数据的价值【 1 。
大数据技术涉及大数据 采集 , 大数据存储与管理 , 大数据计算 模式与系统 , 大数据分析与挖掘和大数据 隐私与安全等 方面, 大数
大数据的关键技术主要包括 : 大数据获取 , 大数据预处理 , 大数
4 O. 3 %【 。
是计算机有史以来全部信息量的总和 ” , 已经得 到验证 。 大数据的信 息量大 , 应当是达到P B 级 以上。 而对于大数据的定义 , 比较典型的描
述 是 由NS F ( 美国 国家科学基 金会) 提 出的 : 大 数据 是指 “ 由科学仪
研究实践的重要 内容。 互联 网的出现呈现取代传统广播 电视报刊 传 器 、 传感设备 、 互联网交易、 电子邮件 、 音视频软件、 网络点击流等多
统 的作用之势 , 如何在 “ 互联网+ ” 的环境下发展应用型本科院校图 书馆建设 , 值得研究 。 ”调查结果表明2 0 1 0 年起 , 国 民对 数字 阅读 方 式的接触率持续上涨 , 2 0 1 0 年为3 2 . 8 %, 2 0 1 1 年为3 8 . 6 %, 而2 0 1 2 年为
据应当理解为数据采集 、 数据存取、 数据 处理 、 数据挖掘等相关技术 据存储 , 大数据分析 , 大数据检索 , 大数据展 现与应用。 具体有云计
的融合。 云计算技术可以说是处理海量数据最为低成本和高效率解 算, 物联网技术, 移动计算技术。
决方案 , 通过云计算技术 , 可以把海量分散的数据从手机端、 电脑端 系统加 以高效分析 和计 算 , 提炼 出富有价值 的数据和信息 。
获得 者3 i m G r a y  ̄ 出的“ 新摩尔定律 ” : “ 每1 8 个月全球新增信息量
适 应新的环境增加更显著 , 互联 网得 到较好 的运 用 , 故图书馆的借 阅量 了出现下滑之势 。 尤 其是 随着 信息技术 , 物联 网, 大数据 , 云计 算技术的发展下, 如何跟上信息技术 发展地方本科 院校 图书馆成为
新 建应 用型本科院校大都是在原来高职高专 院校的基础上于 理 念 2 0 0 0 年前后升格 为本 科院校的 , 其专业建设学科建设等方面较新 , 2大数 据 及 其相 关技 术 注重在学术 、 工程基础上的强调技术和应用 。 图书馆作为现代高校
2 . 1大 数 据
的科研 、 教 学、 图书馆三大 块之 ~, 得 到较好 的发展 和建设。 但在 资
传统的图书馆 的功能主要体现为 “ 藏、 借、 阅、 管” , 而 由于网络 、
无线网、 移动终端的应用 , 现今图书馆 管理模式发生相应变 化, 追求
速) , 是指大量实 时数据 流的快速 收集、 创建 、 分析、 处理 、 传送的过 程。 Va l u e ( 价值) , 量大但密度很低, 需要从数据 中提炼出有价值的数
种数据源生成的大规模、 多元化、 复杂、 长期的分布式数据集” 。 大数
据的特点主要有4 V, 如图1 所示 : U P Vo l u me (  ̄i) , 在2 0 1 1 年, 全球的 数据总量就达到1 . 8 Z B, 而到了2 0 2 0 年, 全球数据总量将增 长5 O 倍。 Va r i e W( 多样) , 结构性数据 、 半结构数据 、 非结 构数据 。 Ve l o c i t y ( 高
储 技术是Go o g l e 的G 和Ha d o o p 的HDF S, 其 中, HD F S 是GF S 的
云计算技术的虚拟技术, 海量分布储存技术, 并行编程模式, 云
电脑端及其他智 能终端均传送至云平 台, 然后再通过一个大规模的 物联网技术主要包括F 融D 技术 , 近场通信技术 , 传感器 网络技
金方面存在不足状态 , 馆合 、 图书 、 电子资源建设和其发展速度相对 滞后 。 在另一方 面, 现今的情 况是相关资源增加了, 尤其是 电子资源
大数据是信息 技术继P C, 互联 网, wE B1 . 0 , 移动通信 , WE B 2 . 0 Z后 的第五次浪潮 , 2 0 1 2 年被认为大数据的起始分水岭年。 图灵奖
关键 词 : 图书馆 ; 大数 据 ; 云计 算 中图分类号: T P 3 9
文献标识码: A
文章编号: 1 0 0 7 . 9 4 1 6 ( 2 0 1 7 ) 0 4 - 0 2 3 O ・ 0 2
1 应 用型 本 科 院 校图 书 馆 的特 点
立 了以用户为 中心 ” 以数据为根本 ” 以图书馆为枢纽的大数据研究
及其他智 能终端均传送至云平台 , 然后再通过一个大规模 的分布式 技术平台管理技术。 云计算技术, 可以把海量分散的数据从手机端、 ( 1 ) 大数据的存储技术采用冗余存储模式。 比 较有名的分布 式存 分 布式系统加以高效分析 和计算 , 提炼 出富有价值的数据和信息 。 开源 实现 。 为 了达 到方便管理数据的 目的 , 大数据不再采用传统 的 术和无线通信技术 。 移动计算关键技术如下 : 移动计算通信协议 , 情 单表数据存储结构 , 而是采用 由多维表组成 的按列存储的分布 式实 景感知 , 移动计算环境 , 无缝迁 移技术 。
据和信息 。 现 今新 的计算方法 , 机器学习一直在提高着数据的质量
在任何地点 、 任何时间舒适地使用 图书资源 。 高校图书馆的发展确
图 1大 数 据 的 3 V特 征
收 稿 日期 : 2 ( 1 1 7 - 0 3 — 2 2
基金 项 目: 湖北省教 育厅重点科技 项 目基金 资助项 目( No : D2 0 1 2 3 0 0 2 ) 。 作者简介: 晏 伯武( 1 9 6 9 一) , 男, 湖 北黄 冈人, 博 士, 湖北理 工学院教授, 研 究方向: 计 算机 应用, 微 电子 与 固体电子学。