统计学实训报告

统计学实训报告
统计学实训报告

四川师范大学经济与管理学院统计分析实训报告册

课程名称统计分析软件应用实训

国际经济与贸易

班级2015 级4班

学生姓名杨冬梅

学号2015120429

指导老师张谦

实训

、实训目的

利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。

二、实训内容、步骤、结果分析

(一)基本函数使用

1.实训内容

(1)计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的3

个同学;

(2)求这3门课的平均分和标准差、最大值、最小值、峰度、偏度;

表1某班学生期末成绩单

2.实训步骤

(1) 先使用AVERAG E数,计算出学号为301的平均分,然后使用填充柄计算出其

他同学的平均分。选中A1: F21,选择自定义排序,按“平均分”降序排序,再突

出显示单元格,分别筛选出排名最靠前和靠后的三名同学,用红色字体突出显示成绩

最好的三位同学,用蓝色字体显示成绩最差的三名同学。

(2) 用AVERAG E数计算出全班数学、语文、外语的平均数;

用STDEVS数计算出全班数学、语文、外语的标准差;

用MA)函数计算出全班数学、语文、外语的最大值;

用MIN函数计算出全班数学、语文、外语的最小值;

用KURT S数计算出全班数学、语文、外语的峰度系数;

用SKEV函数计算出全班数学、语文、外语的偏度系数。

3.实验结果分析

(1)计算出全班每位同学的平均分,降序排序后,筛选出成绩最好的三名同学为310,307,317 ;成绩最差的三名同学306,305,311。

(2)①用AVERAGE S数计算出全班数学、语文、外语平均分分别为

76.2,77.15,76.85 ;

②用STDEV函数计算出全班数学、语文、外语标准差分别为11.16667976,

9.477258098; 10.8592672;

③用MAX函数计算出全班数学、语文、外语最大值分别为98,92,96 ;

④用MAN函数计算出全班数学、语文、外语最小值分别为56,50,58 ;

⑤用KURT函数计算出全班数学、语文、外语峰度系数分别为

-0.312074338,2.503166848 , -0.780748813,分别为平峰、尖峰、平峰分布;

⑥用SKEV?数计算出全班数学、语文、外语偏度系数分别为0.255195107, -1.057909963,0.098244068,分别为右偏、左偏、右偏分布。

(二)计算各种平均指标

1.实训内容

(1)(算术平均数)中国股市中的10种股票在2014年9月1日收盘价如表, 求该10种股票价格当日的平均价格。

(2)(加权平均数)某公司员工工资情况如下表,计算平均工资。

(3) (调和平均数)成都某小区菜市芹菜的价格,早上 3.8元/kg ,中午3.5 元/kg ,晚上2.9元/kg 。如果早、中、晚各买1KG 求平均价格。

(4) (几何平均数)孙女士到中国银行存入一笔资金,按复利计算, 10年的

年利率分别是2.88%有3年,2.79%有2年,3.6%有 2年,5%有 3年。计算 其平均存

款利率。

(5) (中位数、众数)根据上面(1)的股票价格求中位数。根据上面(2) 员工工资表计算众数。

2. 实训步骤

(1) 在EXCEL 中依次输入当天十只股票的价格,用 AVERAG E 数计算当天十 支股票平均价格。

(2) 输入各组组中值,计算出各组xf 值和合计xf 值,再用合计xf 值除以权 数40,得到加权平均数,即该公司的平均工资。

(3) 用HARMEA S 数计算出调和平均数。

(4)

在EXCEL 中输入十年的年利率,用GEOMEA S 数计算出十年的几何平均 数利率。 (5) 先排序,再用MEDIAN S 数计算出当日十支股票的中位数。 筛选工资频数 的最大值,用黄色填充该单元格,则该频数对应的工资水平计算为众数。

3. 实训结果分析

101.63

(1)计算出当天十支股票平均价格结果为

计算出该公司的平均工资为1767.50。

计算出调和平均数结果为3.36。

(4) 计算出十年的平均利率为3.53%

C

1J 43?

计算出中位数为97.695,计算出众数为1850。

(三)计算各种离散指标 1.实训内容

(1) (极差)景经理在2013年度工资收入分别是 5280、6421、7345、4888、 7243、6896、5889、7124、7586、9200、7854、8455,计算其工资收入的极 差。 (2) (标准差和方差)根据(二)(2)题的员工工资表计算员工工资收入的 方差和标准

差。

(3) (离散系数)根据(二)(2)题的员工工资表计算员工工资收入的离散 系数。

2. 实训步骤

(1) 在EXCEL 表格中输入2013年度每个月的工资,用MAX (B1B12)-MIN (B1 :

B12)函数,得到其工资极差。

(2) 先计算出所有工资的加权平均数平均数,在组中值后一列,计算出

“ =B20*(C20-$C$25)A2 ”的值,即每个分组与均值的的加权离差平方和, 然后在D25单元格用SUM 函数求和D20 D24的值,即所有分组的加权离差 平方和之和,在D26单元格计算“ =D25/(B25-1) ”的值,得到方差,在D27 单元格用SQRT 函数计算出

标准差。

(3) 先计算出工资的加权平均数,再用 差除以加权平均数,得到离散系数。

3. 实训结果分析

(1)如图,得到其工资极差为4312元,

li* 亠

A I NVL R

-kM 忙芒.2;和 h

1 il r

F r

H 勵丁硏

7^43

丘口9而

7131

iiC 恤

781-1

..

需*别7

.1 枫 £ nrr?]

计算得到员工工资的方差为12250,标准差为110.67972。

计算得到工资的离散系数为0.0626194,说明员工工资分布较集中。

STDE\g 数计算出标准差,再用标准

这说明其月收入差距较大。

10

(四) 利用描述统计工具进行指标分析 (1) 实训内容

现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、

3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、 2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、 3176、1459、1097、1396,使用描述统计工具对工资进行统计。

(2) 在EXCEL S 中输入数据,选择数据分析中的描述统计,选择计算区域为A1: A30单元格,

选中汇总统计和平均数置信度,点击确定,得到描述统计的结果。

(3)实训结果分析

如图所示,得到描述统计结果:平均数为

1902.2 ;标准误差为141.7646 ;

中位数为1694.5 ;众数为1097;标准差为776.4767 ;方差为602916;峰度为 -0.6732,即平峰分布;偏度为0.832503,即右偏分布;最小值为1082,最大值 为3569;区域为2487,即极差为2487; 工资总和为57066;由平均数和置信度 可计算得到,在95%勺置信度度水平下的区间估计为 2192.14-1612.26 。

1902, 2 141. 7646 16Q4. 3 1097 776. 4767 602916 -0. 6732 Ch 832503 24S7 1032 3o69 57066 30 2眇 0412

三、实训总结

1. 我通过利用Excel 掌握了建立数据文件、数据整理、数据描述与显示等 操作。能熟练

计算各种平均指标、离散指标,会应用基本统计函数,会 使用Excel 描述统计工具进

行统计分析。

2. 我学会了利用众数、中位数、分位数、均值、几何平均数等来测度数据 的集中趋势,

利用极差、方差、标准差、离散系数。偏度和峰度系数等 来测度数据的离散程度,进而更好的把握和分析数据。

实训

一、实训目的

掌握用Excel 进行统计分组。掌握频数分布表和直方图数据分析基本技巧和 操作方法。利

3107、 2874、

实训步骤

差 俣数差

均准位

数准差

度域

和测信

平标中众标方哇偏区最履求观S

用统计图表工具进行数据直观分析。掌握Excel柱形图、条形图、

折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。

二、实训内容、步骤及结果分析

1.函数法进行统计分组、编制频数分布表、绘制直方图

(1)实训内容

在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和

FREQUENCY等函数,但要根据变量值的类型不同而选择不同的函数。

某区共有30家企业,他们类型情况如下表,试编制此区企业类型的频数分布表,并生成直方图和拆线图(要求合并在一张图上)。

(2)实训步骤

a)先在EXCEL中分别输入该地区30家企业的类型,用COUNTI函数计算大

型企业、中型企业和小型企业的数量,制作出该地区企业类型情况的频率分布表。

利用数据分析工具,选择直方图,选择数据区域,点击确定,得到直方 图,再把直方图的分类间距调整为 0。

选中该地区企业类型情况的频率分布表,点击插入图表,制作出折线图,

调整横纵轴距离。

实训结果分析

如图,得到该地区企业类型情况的频率分布表、直方图和折线图,可以看 出该地区的企

业以大中型企业为主。

W -IL L J J '4,.. r 去

2. 其他图形 (1)实训内容

(2)实训步骤

在EXCEL 中输入该地三大产业情况基本数据,选中输入的数据,插入条形 图,编辑条

形图横纵轴坐标序列,横轴为各产业所占比率,纵轴为年份。 选中该地区2008年三大产业分布数据,插入饼状图。 选中所输入的数据,插入折线图。

b) C) 根据某地三大产业情况基本数据,

a) b )

2.

3.

(3) 实训结果分析

如图所示,得到该地区三大产业分布情况的条形图、饼图和折线图。

Au

?nu

从折线图和条形图可以看出,该地区近二十年来产业结构发生了巨大的变化。 第一产业比重持续下降,第二产业持续增大,第三产业比重总体上也不断增大; 其中,第二产业比重最大。第二、三产业比重的变化,反映了该地区产业结构在 逐步优化。从饼图可以看出,

2008年该地区的第二产业所占比最大,达到了 48% 第三产业次之,说明了该地区的产业结

构仍以第二产业为主导,

第三产业水平还

不够高,仍需转变发展方式,促进产业结构调整。

三、实训总结

通过本节实训练习,我学会了频数分布表和直方图数据分析基本技巧和操作 方法,学会

了利用统计图表工具进行数据直观分析。

我掌握了 Excel 柱形图、条形图、折线图、饼图、散点图、面积图、环形图 等各种图形工具的使用方法和统计作用。

通过折线图能直观看出数据的发展趋势;直方图应用比较广泛,但可能造成 数据丢失;饼图可以形象直观地看出各组成部分所占比例,便于比较等。

!<■ 1

AH*

tw

JM-ll

■ ■二Pa ■?

Illi fli :

1. <

■m

E W * 3 £|壬 E A- g

*■ *11 +?二

一、实训目的

掌握Excel 软件中假设检验方法(单样本t 检验)及置信区间应用。

二、实训内容

在正常生产情况下,某厂生产的一种无缝钢管服从正态分布。 从某日生产的

钢管中随机抽取10根,测得其内径分别为:

53.8、54.0、55.1、54.2、52.1、54.2、55.0、55.8、55.4、55.5 (单位:mm

(一) 区间估计

建立该批无缝钢管平均内径95%勺置信区间。 (二) 假设检验

若该日无缝钢管的内径服从均值为 54mmi 勺正态分布。试在5%勺显著性水平 下检验该日产品的生产是否正常? (三) 用P 值检验

对第(二)题的假设检验采用 P 值检验方法进行检验

三、实训步骤

(一)区间估计

(1) 在EXCEL 中输入10个样本数据,利用AVERAG E 数计算出其均值,再利 用STDEV S 数得到其标准差。

(2) 查t 分布表,得到显著性水平 =0.05下自由度为9的t 值 (3) 根据公式x t 卓写出置信区间

n yf n

(二) 假设检验 提出原假设和备择假设。 根据(一)得到样本均值和样本标准差,计算出检

验统计量

(3)、用t 和获?7 1)相比得出结论。

2

(三) 用P 值检验

(1) 进入EXCEL 界面,插入函数f (x ),在函数分类中点击“统计”,并在函数 名单下

选择“ TDIST ”,然后点击确定。

(2) 在弹出的对话框的“ X ”栏中输入计算出的t 的绝对值“ 1.4728 ”。在

“Deg_freedom”(自由度)栏中,输入自由度“ 9”。在“ Tails ”栏中,输 入“ 2”。

实训

(1)

(2

四、实训结果及分析

(一)区间估计:

由于样本数据为10,为小于30的小样本,且其总体方差??未知,则用样本 方差??代替总体方差??,故样本经过标准化的随机变量服从自由度为(n-1 )的 t 分布。

n

X i

由抽样结果计算得到,X -J —

n

(n

I (Xi X)2

h ----------

n 1

545. 1

mm

1.094887107(mm

根据=0.05查t 分布表得到t _(n "2

-1) =t 0.025(9) = 2.2622 ,则平均内径的置信

区间为

S

X t 〒

54. 51

即(53.73,55.29),该批无缝钢管平均内径95%勺置信区间为53.73-55.29mm 。

2. 2622

^4887^

54.51 0.783249885

9

(二)假设检验 依题意建立如下原假设与备择假设:

该日产品的生产是正常的

H0 u=54

H i : 54

该日产品的生产不正常的

根据样本数据得到:由于*30为小样本, X 54.51,x 54. 51 计算检验统计量为:-一占

545—54 1. 444 S/府 1.0948810

根据自由度n-1=10-1=9,查t 分布表得:t_(n - 1) = t 0.025 (9) = 2.2622 ,

~2

由于t 1.44 t 0.025(9) = 2.2622 ,所以不拒绝原假设,样本提供的数据还不足以推翻原假设,即该日产品的生产正常。

3.

I

.用;t-专主由

计?结味[■ 0.913552313

取洎

由于P 值=0.912552913>0.05,所以不拒绝原假设,样本提供的数据还不足 以推翻原假设,即该日产品的生产正常。

五、实训总结

在进行区间估计时,应首先分析题目条件,看原总体是否服从正态分布、总 体方差是否已

知、用于构造估计量的样本是大样本还是小样本等几种情况, 不同的条件下样本数据服从不同的分布形态。在写出置信区间后,注意结合 题目分析其现实意义。 在进行假设检验时,同样要考察所抽取的样本是否为大样本、是否服从正态

分布、总体方差是否已知等几种情况。不用的假设条件下,在对总体进行假 设检验时,所

采用的检验步骤和检验统计量不同。此外,在提出假设时,主 义原假设和备择假设的选取。

在利用P 值进行决策时,P 值越小,说明观测到的数据与H0之间不一致的程 度就越大,检验的结果也就越显著。不论是单侧检验,还是双侧检验,用

P

值进行决策的原则为:如果 P 值< ,拒绝H0;如果P 值> ,不拒绝HO

(三)用P 值检验

Excel 计算的P 值结果为0.912552913,如图所示。

T. D15T

1. 4T3S

Q

呈-1.472B

9

TPCTT D.

旳罰

走0左见¥主t-井帀

1. 2.

问施肥的方式和水温对产量的影响是否显著(

=5% ?

一、目的要求

掌握Excel 软件中方差分析应用(单因素方差分析和双因素方差分析)

二、实训内容

(一)单因素方差分析

某城市东西南北5个地区发生交通事故的次数如下表所示。由于是随机抽样, 有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、 发生事故少(如东部)。试以=5%勺显著水平检验各地区平均每天交通事故次数 是否相等?

表1

某城市5个地区交通事故发生次数

(二)双因素方差分析

某农科所实训在水溶液中种植西红柿,

温。3种施肥方式一开始就给可溶性的肥料;每两个月给

1/2的溶液;每月给以

1/4的溶液。水温分别为4C 、10C 、16C 、20C 。实验结果的产量如下表所示。

表2 不同水温水平不同施肥方式下的西红柿产量

实训四

采用了 3种施肥方式和4种不同的水

H1: ui(i=1,2,3,4

,5)不完全相等

各地区平均每天交通事故次数不相等

三、实训步骤

(一)单因素方差分析

在EXCEL 中输入数据,点击数据分析,选择方差分析,在弹出的对话框中的

“输入区域”选择样本数据所在的单元格,在“ ”方框中输入“0.05 ”,点击确定,

得到方差分析结果。

□际疋付干銀一幵0? 请出it 叩 '?>

瑜士区瞰加I CI0工作咒sa

(b ;

□ Willi 1(£)

(二)双因素方差分析

在EXCEL 中输入数据,点击数据分析,选择无重复因素方差分析,在弹出的 对话框中的“输入区域”选择样本数据所在的单元格,在“ ”方框中输入“0.05 ”, 点击确定,得到方差分析结果,如下图所示。

方粉忻-无涯養碍彩油i

n 饭却。

0?:

讥晦_

输岀选项

0新工(^去组 O 新二戈城也

四、实训结果及分析 (一)单因素方差分析 1.提出假设:

TWO

H0 : 1 2 3 4 各地区平均每天交通事故次数相等

H1: ui(i=1,2,3,4 ,5)不完全相等

各地区平均每天交通事故次数不相等

用Excel 给出单因素方差分析的计算结果,如下图:

草1曲*方崖密斬

SUMMALV

A4

S'

S ■坍

J13

5 空

】理

U 17

4 H

a

副 iriMV

f

F P-H 1U £ F cjic

4

16F613 floPWl

?

■內

21

5 M?G4

*计

根据方差分析表得出如下结论:

由于 F 3.676135

F o.o5(4,21) 2.8401

即各地区平均每天交通事故次数不相等。

(二)双因素方差分析

首先对两个因素分别提出如下假设:

H1 : ui(i=1,2,3,4) 对列因素提出假设:H 0 :

1 2

施肥方式对产量没有显著影响

不完全相等施肥方式对产量有显著影响 用

Excel 给出无重复双因素方差分析的计算结

果,如下图:

+ttJ l

f q

tii

Ri 3

农 1

li 2 3

IS 1

R a 3 弟

10 1

til 3 21

7

1

■ 1 4 础

1134

亚血

号z 1 51 12乃

剧a 4 5?

13 ns 甘斤

s 5 r S£

出 海

f

IP'=vilj

Fcrit

n

2

3 W

71.4 3.MF 那

03

2

0 25 D.2 a.a?s97& $.143253

?.5

6

125

£lt

ao2

11

对行因素提出假设:H 0 : 1 2 气温对产量没有影响 H 0 :

1

2

3

4

5

不成立,表明

1、 2、 3、

4、 5

之间的差异是显著的,

拒绝原假设,即

不完全相等

气温对产量有影响

H1: ui (i=1,2,3)

根据方差分析表得出如下结论:

之间的差异是显著的,即气温对产量有影响。

0.2 F 0. 05( 6,11) 5. 143253 ,所以不拒绝原假设,表明

间的差异是不显著的,即施肥方式对产量没有显著影响。

五、实训总结

通过本章实训, 我学会了用方差分析来检验总体均值是否相等。 到的变量的多少, 方差分析主要有单因素方差分析和双因素方差分析。 差分析是研究一个分类的自变量与一个数值的因变量之间的关系, 双因素方差分 析则是研究两个分类的自变量同因变量之间的关系。

对于双因素方差分析, 当研究的两个因素之间无交互作用时, 称为无交互作 用的双因素方差分析或无重复双因素方差分析, 当所研究的两个因素之间有交互 作用时,称为有交互作用的双因素方差分析或可重复双因素方差分析。

由于 F R 78. 4 F 0.05(3,11)

4. 757063 ,所以拒绝原假设,表明

1

2、 3、 4

由于 F C

1、 2、 3

根据所涉及 单因素方

一、实训目的

实训五

掌握Excel软件中回归分析及相关分析应用

二、实训内容

零售商要了解每周的广告费X及消费额丫之间的关系,记录如表所示。

表1 每周广告费X与消费额丫数据表

(1)

(2)

(3)

(4) 画出散点图;

计算相关系数,并进行相关系数的显著性检验( 求出

线性回归方程,并评价其拟合程度;

请对回归系数作统计检验。(=5%。

=5%

三、实训步骤

(1)画出散点图:在Excel中输入表格数据,插入散点图,点击“设计”的“选择数

据”,然后点击左栏添加,选中横纵坐标所在单元格,单击确定。

如图所示:

"d古祢憎. aMTMEiag E

r :

fEt254l(K&基=&田广甘gm占5H 的HS

国=au. 3?j, li. lei..

產匚40% a冏… ——' 亀特

(2)计算相关系数:点击数据,选择数据分析,在弹出的对话框中下拉选中“相关系数”,点击确定,然后在弹出的对话框中,输入输入区域数据和输出区域单元格,点击

确定,得到相关系数分析表。

諭*蚤-

I )'Tlf; +

?=!nu

<> *±riE':

■■■

(3)求出线性回归方程:点击数据,选择数据分析,在弹出的对话框中下拉选中“回归”,

点击确定,然后在弹出的对话框中,分别在X和丫值的输入

相关主题
相关文档
最新文档