信息计量学实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
黑龙江大学
实验报告
黑龙江大学教务处
一、实验目的
通过实验了解并掌握信息计量学中的六个重要的定律,文献增长定律,文献老化定律,洛特卡定律,齐普夫定律,引文分析规律,布拉德福定律。
二、实验设备、材料
计算机、原始分析数据、Excel表、Ucinet6.0软件等
三、实验内容与实验步骤
实验一:文献累积增长定律
一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。
二,文献积累增长定律的定义:
三,根据文献积累增长定律的定义可知的对象是关于云计算论文在年限的发表量的累积。
1.对发表年的数据在Excel中进行分类汇总,局部效果图如1-1所示:
图1-1:分类汇总
2.统计出不同出版年的年发表论文量,并通过Excel表格的计算公式C3=C2+B3,生成发
表论文的累积量。如图1-2所示:
图1-2:文献累积量图
3.对图1-2中的极端特别数据进行剔除或不选,选取适当的文献出版年和对应的发表论文累积量,在Excel选择插入图表,选择XY散点图,下一步,下一步,添加标题,去除网格线(可选),在
Excel中生成效果图,如图1-3所示和图1-4所示:
图1-3:定律效果图一
图1-4:定律效果图一
实验二:文献老化定律
一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。
二,文献老化定律的定义:米哈伊洛夫定义为,科学文献随其‘年龄’的增长,失去了作为科学情报源的价值,以及因此越来越少被科学家和专家们利用。半衰期,表示已发表的文献情报中有一半已不适用的时间。莱普斯指数等于出版年不超过五年的被引文献数量除以被引文献总量的百分比。
三,根据文献老化定律的定义和对半衰期与莱普斯指数的了解,首先需要获取被引证文献的出版,对出版进行数据的分析。
1.登陆中国社会科学研究评价中心:/操作图一如:2-1所示:
图2-1:操作图一2.进入新版系统入口:操作图二如:2-2所示:
图2-2:操作图二3.单击“高级检索”,进入高级检索页面,
图2-3:操作图三
4,选择检出的结果集,操作图四,如图2-4所示:
图2-4:操作图四5,下载选中的结果集,操作图五,如图2-5所示:
图2-5:操作图五
如图2-6所示:
图2-6:效果图
4.查看数据表很容易知道:较新的一半是4年之内发表的,所以半衰期是4。
5.普赖斯指数是五年之内发表的总文献量/总文献量=23/44=0.522727273。
实验三:布拉德福定律
一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。
二,布拉德福定律的定义:相关论文在期刊中不是均匀分布的,而是具有明显的集中与分散规律,英国著名文献学家布拉德福最早发现文献的集中与分散规律,并提出了著名的“布拉德福定律”。
三,根据布拉德福定律的定义,实验的主要研究对象是文献发表所在的期刊,统计出不同期刊的刊载文献的数量,体现文献的集中与分散规律。
1,从数据源中抽出文献来源的数据,在Excel表中对文献来源的期刊进行分类汇总计数,效果图,如图3-1:
图3-1:效果图
2,通过Excel表计算出论文发表数量、期刊累积量、期刊累积量的对数、发表论文累
积量等数据项,形成如图3-2所示:
图3-2实验数据表
3,选择刊累积量的对数、发表论文累积量数据项让后再Excel表格中插入图片,xy散点图,本实验分别选取了数据的前1/3部分,前2/3部分,还有全部反别做出了如下效果图3-3,3-4,3-5所示:
图3-3效果图一
图3-4效果图二
图3-5效果图三
实验四:齐普夫定律
一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。
二,齐普夫定的定义:是对文献信息词频分布规律的总结,在这里就不赘言了。
三,根据齐普夫定律,研究的是文献中的词频和序号这两个变量之间的关系。
1、抽出数据源中关键字,在Excel表进行分列处理,然后将关键字复制到同一列数据栏中,对数据进行排序,然后进行分类汇总,计算出不同关键字在所选文献中出现的次数,制作出如图4-1所示的数据表
图4-1数据表
2,选取序号和关键字出现的数量进行,图表的插入,添加趋势线,显示公式,本次实现做了了两个,分别取出数据的全部和除去前10项数据,效果图如图4-2,4-3所示:
图4-2效果图一
图4-3效果图二
实验五:洛特卡定律
一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。
二,洛特卡定律的定义:从科学文献作者与其撰写的论文的纷乱现象中首先发现了“平方反比”的数量关系,提出了至今为止被人称为‘经典’的洛特卡定律。
三,洛特卡定律研究作者与写作文献数量之间的关系,分析出高产作者是所有文献作者总数的平方根。
1,对高产作者的统计,抽出作者数据项,对数据进行分列,将作者数据集中到一列数据栏中,进行分类汇总,按章数量进行汇总,统计出写不同篇数文章的作者人数,形成
如图5-1所示的数据表: