统计学例题_方差分析、相关分析、卡方检验和交互分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 方差分析
例1、1977年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了50位全日制工作的妇女
样本,她们的年收入(单位:千美元)数据整理后归纳如下: (
解:: =
:三组收入均值有显著差异
F =
,即组间均方/组内均方
其中,组间自由度
=3-1=2,组内自由度
=(50-1)╳3=147
由于样本均值=(7.8+9.7+14.0)/3=10.5 所以组间偏差平方和=50=50*(
+
+
)=1009
组内偏差平方和=
=1835+2442+4707=8984
所以, F =
≈ 8.2548419 >
(2,147)=3.07
拒绝原假设;认为不同学历的妇女收入存在差异。
例2、月收入数据:
男:2500
,2550,2050,2300,1900 女:2200,2300,1900,2000,1800
如果用Y 表示收入,哑变量X 表示性别(X =1为女性),计算Y 对X 的回归方程,并在5%的水平下检验收入是否与性别无关(先求回归系数的置信区间)。
解:令Y=+X+
根据最小二乘法,可知= (1)
VAR()= (2)
=
(3)
计算如下:
:收入与性别无关 收入与性别不完全无关
=2150=0.5
根据公式1,得=-220;,即Y=-220X+
根据公式2、3,得VAR()=≈156.3549577
n=10.,n-2=8;当df=8时,=2.306
的0.05置信区间求解方法如下:
-2.036<=<=2.306,得140.57769.
由于原假设=0落入了这个置信区间,所以接受原假设,认为系数不显著,收入与性别无关。
第二章相关分析
例1、10对夫妇的一个随机样本给出了如下的结婚年龄数据
2) 求总体相关系数 的95%置信区间;
3) 以5%的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。
解:(1) =
由于=22,=23;=≈0.3426
(2)由于se()=,n=10,df=8=2.306,所以:
se()=0.332
-2.036<=<=2.306
得 1.062072
(3):夫妻的结婚年龄之间没有线性相关,
夫妻的结婚年龄之间不完全没有线性相关,≠0 根据第(2)题的计算结果, 1.062072
由于
的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄
之间没有线性相关关系。
第三章 卡方检验和交互分析
例1、为了研究性别和“最希望看到的有关奥运会的电视节目类型”之间的关系,2004年在10城市调查
了1000个样本,调查数据如下:
1) 陈述0H ;
2) 计算2 和0H 的概值。
解:(1):性别与希望看到的电视节目类型无关 性别与希望看到的电视节目类型不完全无关
所以=
+ +...≈16.63431164>=11.07
自由度df=1*5=5; 所以拒绝原假设,备择假设
成立,性别与希望看到的电视节目类型是有关联的。