统计学例题-方差分析、相关分析、卡方检验和交互分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 相关分析
例 1、10 对夫妇的一个随机样本给出了如下的结婚年龄数据
结婚时丈夫的年龄 y 结婚时妻子的年龄 x
24 22 26 20 23 21 24 25 22 23 24 18 25 22 20 23 19 24 23 22
1) 计算样本相关系数 r; 2) 求总体相关系数 的 95%置信区间;
文档收集于互联网,已重新整理排版.word 版本可编辑.欢迎下载支持.
第一章 方差分析
例 1、1977 年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了 50 位全日制工作的妇女
样本,她们的年收入(单位:千美元)数据整理后归纳如下:
完成的学历年数
收入平均值 X ( )
初中(8 年)X1
7.8
,即Y=
-220X+
根据公式2、3,得VAR( )=
≈156.3549577
n=10.,n-2=8;当df=8时, =2.306
的0.05置信区间求解方法如下:
-2.036<=
<=2.306,得
140.57769.
由于原假设 =0落入了这个置信区间,所以接受原假设,认为 系数不显著,收入与性
别无关。
高中(12 年)X2
9.7
大学(16 年)X3
14.0
1835 2442 4707
解: : = :三组收入均值有显著差异
F=
,即组间均方/组内均方
其中,组间自由度 =3-1=2,组内自由度 由于样本均值 =(7.8+9.7+14.0)/3=10.5
=(50-1)╳3=147
所以组间偏差平方和 =50
15
1) 陈述 H0 ;
2) 计算 2 和 H0 的概值。
解:(1) :性别与希望看到的电视节目类型无关
性别与希望看到的电视节目类型不完全无关
(2)理论频数表如下:
频次
性别
男
女
希望看到的节目类型
赛事直播
257
239
新闻报道
57.5
53.5
专题报道
37.8
35.2
合计
496 111 73
3文档来源为:从网络收集整理.word 版本可编辑.
=50*( + + )=1009
组内偏差平方和 =
=1835+2442+4707=8984
所以,F =
≈ 8.2548419 >
(2,147)=3.07
拒绝原假设;认为不同学历的妇女收入存在差异。
例 2、月Leabharlann Baidu入数据:
男:2500,2550,2050,2300,1900 女:2200,2300,1900,2000,1800
文档收集于互联网,已重新整理排版.word 版本可编辑.欢迎下载支持.
精彩赛事集锦 开幕式和闭幕式 其他 合计
40.4
37.6
101
94
24
23
518
482
78 195 47 1000
所以 =
+
自由度 df=1*5=5;
+...≈16.>
=11.07
所以拒绝原假设,备择假设 成立,性别与希望看到的电视节目类型是有关联的。
4文档来源为:从网络收集整理.word 版本可编辑.
=2.306,所以
:
se( )=0.332
-2.036<=
<=2.306
得
1.062072
(3) :夫妻的结婚年龄之间没有线性相关,
夫妻的结婚年龄之间不完全没有线性相关, ≠0
根据第(2)题的计算结果,
1.062072
由于
的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄
之间没有线性相关关系。
第三章 卡方检验和交互分析
例 1、为了研究性别和“最希望看到的有关奥运会的电视节目类型”之间的关系,2004 年在 10 城市调查
了 1000 个样本,调查数据如下:
频次
性别
男
女
希望看到的节目类型
赛事直播
261
235
新闻报道
69
42
专题报道
33
40
精彩赛事集锦
36
42
开幕式和闭幕式
87
108
其他
32
3) 以 5%的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。
解:(1) =
2文档来源为:从网络收集整理.word 版本可编辑.
文档收集于互联网,已重新整理排版.word 版本可编辑.欢迎下载支持.
由于 =22, =23; =
≈0.3426
(2)由于 se( )=
,n=10,df=8
如果用 Y 表示收入,哑变量 X 表示性别(X=1 为女性),计算 Y 对 X 的回归方程,并在 5%的水平下
检验收入是否与性别无关(先求回归系数的置信区间)。
解:令Y= + X+
根据最小二乘法,可知 = (1)
VAR( )= (2)
1文档来源为:从网络收集整理.word 版本可编辑.
文档收集于互联网,已重新整理排版.word 版本可编辑.欢迎下载支持.
= (3)
计算如下:
:收入与性别无关
收入与性别不完全无关
Y
2500 2550 2050 2300 1900 2200 2300 1900 2000 1800
X
0
0
0
0
0
1
1
1
1
1
240 290 -210 40
-360 160 260 -140 -40 -240
=2150 =0.5
根据公式1,得 =-220;