常用统计软件应用

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.加权平均数 目前常用的EXCEL 2007版本还没有加权平均数的函数, 不过可以根据加权平均数的公式利用其它函数计算得来。 例2,某班级要评奖学金,奖学金最终由各科成绩总和 加总的智育分、德育分和体育分、奖励分,4部分组成的综 合分数决定,见下表。综合成绩由4部分成绩加权平均而成, 权重分别是0.4,0.2,0.2和0.2。按照加权平均法计算加权 平均得分。
本案例中运行结果见下图,Z1:Z20中即为每个小区间 的频数。比如Z1单元格中的28,表示原始数据575个数字, 落入到第一个小区间[0,0.05]中的个数是28个。
(二)频数分布图的制作 1.选中数据分布表 案例中为Y1:Z20。
2.选择插入【图表】,选中【柱形图】,绘制初始 柱状图
初始柱状图还不是频数分布图,因为分类轴不是分组 区间,因此还需要进一步调整。。
常用统计软件应用
第一节 EXCEL软件 第二节 SPSS软件 第三节 R软件
1
第一节 EXCEL软件
一、产生随机数 统计中,有时需要生成各种分布的随机数做模拟分析, 利用EXCEL软件可以产生一些常用分布的随机数。EXCEL中 产生随机数有两种方法:一是使用数据分析插件,一种是 直接利用函数在单元格中产生。鉴于数据分析插件需要软 件安装标配基础上额外加载,本节介绍直接利用函数在单 元格中产生随机数。 (一)产生均匀分布的随机数 rand函数的功能是产生0―1之间的服从均匀分布的随
机数,语法使用规则是:=rand( )。该函数语法表达式括 号中为空,没有参数,直接在单元格中运行即可。如下图所 示,直接在A1单元格中输入“=rand( )”,敲击回车即可得 到一个介于0-1之间的均匀分布的随机数。
(二)产生正态分布的随机数 正态分布也称高斯分布,大多数随机变量的分布都是
正态分布,正态分布的外观形状像一座山,以中心对称。 统计中经常需要大量服从正态分布的数据来模拟分析,一 个正态分布由均值和标准差完全决定。
norminv函数是产生一个服从正态分布的随机数,语法 适用规则是:=norminv(参数1,参数2,参数3),参数1是 随机数,参数2是均值,参数3是标准差。例如利用插入函 数向导,产生一个服从均值是0,标准差是1的正态分布随 机数字,如下页。
二、制作频数分布表和频数分布图 在面对大量、杂乱无章的数据时,通过制作频数分布表 和频数分布图可以直观地观察出这些数据的分布状况和特征,
3.调整水平分类轴为分组区间。设置结果如下图。
最终绘制成功后的频数分布图结果如下图。横坐标是分 组小区间的分割点,纵坐标是频数(个数)。比如:横坐标 中的第一个0.05表示区间[0,0.05],柱状图的高度对应着 刻度是25,即:原始数据区域575个数据落入到区间[0,0.05] 的频数(个数)是25个。
22 12
30个人身高数据(单位cm)
176 167 190 158 178 168 177 156 180 188 167 179 166 150 163 178 194 188 160 159 178 170 175 174 167 166 189 172 179 169
该样本的均值由average函数来完成。调用average函 数使用向导,设置第一行参数为数据区域A2:F6,即可得 到结果。如图10.15所示。
(一)频数分布表的制作 先确定原始数据区间跨度,然后将区间跨度分割成若干 个小区间,依次计算原始数据落入到每个小区间的个数(频 数),这些小区间和对应的频数就组成了频数分布表。 EXCEL中的Frequency函数用于制作频数分布表,其使用 语法规则是:=frequency(参数1,参数2),参数1是一个数据 区域,参数2是一个分组区域。案例中,数据区域是A1:W25共 575个数据。操作步骤如下: 1.确定原始数据区间跨度 使用最大值函数max和最小值函数min确定,如下图所示,
调用插入函数向导,调出frequency函数设置向导界面, 界面中第一行参数输入数据区域范围A1:W25,第二行参数输 入分组区域范围Y1:Y20,如下图所示。
4.计算每个小区间的频数 运行frequency函数,输出结果。 此步骤和其他函数用法也不一样,需要同时按下 shift+enter+ctrl三个键,才能正确输出结果。
79 81 88 76
87 85 90 83
78 72 82 78
6ห้องสมุดไป่ตู้ 72 85 75
智育 分 448 404 421 374 369 449 411 426 394 374
德育 分 8 71 86 67 21 77 97 92 7 27
体育 分
奖励分
10 50
12 5
9 67
2 57
0 70
1 45
姓名
王瑞叶 王震 张伟
张梦伟 夏芳芳 吕蒙蒙 沈雪莹
朱娜 王浩浩 何永康
物流 管理 92 93 88 78 72 91 87 81 84 73
班级成绩表
统计 学
英语
数据 库
配送管 理
85 88 96 87
75 79 90 67
78 86 86 83
74 70 84 68
77 67 85 68
84 92 94 88
数据区间跨度是[0,1]。
2.划分适当的小区间,制作分组区域 根据原始数据个数,划分适当的小区间,一般10个、 20个、50个小区间不等。本案例中575个数据,[0,1]划分
成20个小区间,每个分割点是0.05为增量的等差数列,将 此数列放在Y1:Y20的区域中作为分组区域,如下图。
3.调用frequency函数 调用frequency函数比较特殊,需要事先选定和分组 区域范围一样的区域,见下图,选中Z1:Z20区域。
三、数据分布特征测定的几种函数应用
(一)测定中心趋势的函数 测定中心趋势的统计量主要有均值(简单算术平均数、 加权平均数)、分位数(中位数和四分位数)和众数。 EXCEL中都有对应的函数来实现这种统计量的计算。 1.简单算术平均数 简单算数平均数,由于所有数据相加除以个数得来。 例1,随机抽取30个在校大学生,得到身高数据如下表 所示,计算30个人的平均身高。
相关文档
最新文档