方差检验和拟合优度检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2000年12月
北京大学光华管理学院 王明进 陈 奇志
小结:双样本方差的检验
双样本方差的检验; F分布; 更多的例子… 后面的内容,让我们记住卡方!
2000年12月
北京大学光华管理学院 王明进 陈 奇志
25
Scott Marketing Research Co.
Scott公司进行了一项市场份额的研究。在过去的 一年里,公司A的市场份额稳定在30%,公司B在50%, 公司C在20%。最近公司C开发了一种“新型”产品并 取代了当前市场的产品。Scott受雇于公司C,为它判 断新产品是否使市场份额发生了改变。 Scott公司通过问卷调查了一组200名的顾客群体, 询问他们对公司A、B、C的购买偏好,结果48人选择 A,98人选择了B,54人选择了C。根据这些数据, Scott公司需要判断市场份额是否已经发生了变化。 你如何解决该类问题?
22
北京大学光华管理学院 王明进 陈 奇志
t-¼ ë Ñ é : Ë « Ñ ù ± ¾ µ È · ½ ² î ¼ Ù É è ± ä Á ¿ 1 ± ä Á ¿ 2 30.51667 27 11.20515 6.975385 12 14 8.914028 0 24 2.994072 0.003147 1.710882 0.006294 2.063898
Байду номын сангаас12
小结:单样本方差的检验
2 2 H0 : 2 0 , H1 : 2 0 ; 2 2 H0 : 2 0 , H1 : 2 0 ; 2 2 H0 : 2 0 , H1 : 2 0 ;
它们的拒绝域的形状分别是什么?怎样 确定拒绝域? 此时对总体和样本有什么要求?
F-¼ ë Ñ é
Ë « Ñ ù ± ¾ · ½ ² î · Ö Î ö ± ä Á ¿ 1 ± ä Á ¿ 2 30.51667 27 11.20515 6.975385 12 14 11 13 1.606385 0.206377 2.63465
24
Æ ½ ¾ ù · ½ ² î ¹ Û ² â Ö µ df F P(F<=f) µ ¤ Î ² F µ ¤ Î ² Á Ù ½ ç
2000年12月
² Æ Î ñ ¼ Æ » ® È Ë Ô ± 30.51667 0.966314 30.8 #N/A 3.34741 11.20515 0.139288 -0.46508 10.9 24.4 35.3 366.2 12 Æ ½ ¾ ù ± ê × ¼ Î ó ² î Ö Ð Ö µ Ä £ Ê ½ ± ê × ¼ Æ « ² î Ñ ù ± ¾ · ½ ² î · å Ö µ Æ « Ð ±¶ È Ç ø Ó ò × î Ð ¡ Ö µ × î ´ ó Ö µ Ç ó º Í ¼ Æ Ê ý 27 0.705862 26.25 25.5 2.641095 6.975385 0.869936 1.243047 9 23.9 32.9 378 14
» á ¼ Æ Ê ¥ Æ ½ ¾ ù ± ê × ¼ Î ó ² î Ö Ð Ö µ Ä £ Ê ½ ± ê × ¼ Æ « ² î Ñ ù ± ¾ · ½ ² î · å Ö µ Æ « Ð ±¶ È Ç ø Ó ò × î Ð ¡ Ö µ × î ´ ó Ö µ Ç ó º Í ¼ Æ Ê ý
7
北京大学光华管理学院 王明进 陈 奇志
再看卡方分布...
自由度为n-1的卡方分布 以及其上下分位数
21-(n-1)
2(n-1)
2000年12月
北京大学光华管理学院 王明进 陈 奇志
8
方差的区间估计
P{ 12 / 2 (n 1) (n 1) s 2
2
2 / 2 ( n 1) } 1
2000年12月
北京大学光华管理学院 王明进 陈 奇志
20
谁的起薪更高一些?
《财富》杂志1995年6月26日刊载了会计师 和财务计划人员的起始年薪。他们分别 抽取了12名会计师和14名财务计划人员 作为样本,得到他们的起始年薪如教材 292页所述。 问题:能否说这两种职业的平均起薪有明 显差异?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 21
2000年12月
北京大学光华管理学院 王明进 陈 奇志
19
两个总体的方差的单边检验
根据你对假设检验过程的理解,你能够 写出下面两个检验的拒绝域吗?
2 2 H 0 : 12 2 , H 1 : 12 2 ; 2 2 H 0 : 12 2 , H 1 : 12 2 ;
(n 1) s 2 (n 1) s 2 2 P{ 2 2 } 1 / 2 (n 1) 1 / 2 (n 1) 所以 2的一个置信区间是
2 (n 1) s 2 ( n 1 ) s 2 2 2 / 2 (n 1) 1 / 2 (n 1)
2000年12月 北京大学光华管理学院 王明进 陈 奇志 10
该机器是否合格?
检验假设:H0: 20.25, H1: 2>0.25; 拒绝域的形状: s2>c, c=? 根据抽样分布确定拒绝域为
(n 1) s 2 2 (n 1) 0.25
此时犯第一类错误的概率不会超过,为 什么?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 13
选择哪个公司的校车服务?
Dullus县学校要更新明年的校车服务合同,需 要从Milbank和Gulf Park两家公司中选择一个。 选择校车运送或者到达时间的方差作为衡量公 司服务质量的指标。学校需要了解这两家公司 的服务质量是否相同,如果相同,他们就会选 择价格较低的一家。他们调查了M公司的25个 到达时间以及G公司的16个到达时间,分别得 到样本的方差是48和20。他们是否有充分的理 由认为两家公司的服务质量不同?
第五讲
方差检验和拟合优度检验
2000年12月
2000年12月 北京大学光华管理学院 王明进 陈 奇志 4
关于方差…
方差刻画了什么? 一种零件的尺寸的方差; 一种股票收益率的方差;... 方差的点估计: 样本方差 n 2 2
s
1 n 1
( x x)
i 1 i
方差的区间估计呢?
23
Æ ½ ¾ ù · ½ ² î ¹ Û ² â Ö µ º Ï ² ¢ · ½ ² î ¼ Ù É è Æ ½ ¾ ù df t Stat P(T<=t) t µ ¤ Î ² Á Ù P(T<=t) t Ë « Î ² Á Ù
2000年12月
² î
µ ¤ Î ² ½ ç Ë « Î ² ½ ç
北京大学光华管理学院 王明进 陈 奇志
2000年12月 北京大学光华管理学院 王明进 陈 奇志 2
第四讲复习(续)
置信区间和假设检验的关系; 置信系数是1-的置信区间和显著水平是 的双边检验的拒绝域有什么关系? 匹配样本(双样本)的均值检验问题; 检验的P值。
2000年12月 北京大学光华管理学院 王明进 陈 奇志 3
2000年12月 北京大学光华管理学院 王明进 陈 奇志 17
确定我们的拒绝域
拒绝域应为
2 s1 2 s2 2 s1 2 s2
F (n1 1, n2 1) 或者
2 2
F1 (n1 1, n2 1) 1/F (n2 1, n1 1)
2
对选择校车问题,使用显著水平0.10,则
2000年12月 北京大学光华管理学院 王明进 陈 奇志 6
如何得到方差的置信区间?
为了求置信区间,我们需要什么?
为此,我们需要对总体的分布做哪些要求?对 于饮料的灌装量,这种要求是否合理?
关于样本方差的抽样分布的一个结果
(n 1) s 2
2
2000年12月
~ 2 (n 1)
2000年12月
北京大学光华管理学院 王明进 陈 奇志
9
灌装量方差的90%置信区间
如何得到自由度为17的卡方分布的上下0.05分 位数?(查表得到分别为8.67176, 27.5871) 灌装量方差的置信水平是90%置信区间是 (0.246492,0.784155) 问题: 1)怎么解释以上区间的含义? 2)给定显著水平0.10, 能否拒绝原假设H0: 2=0.30, 为什么?拒绝域是什么?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 27
检验方法
计算观测频数和期望频数以及它们之差; 拒绝域的形状是 k
2 s1 2 s2 2 s1 2 s2
F0.05 (24,15) 2.29或者
F0.95 (24,15) 1 / F0.05 (15,24) 1 / 2.11 0.4739
北京大学光华管理学院 王明进 陈 奇志 18
(见P.680-681)
2000年12月
对校车选择的建议
根据上面的分析,你对Dullus学校选择校 车有什么建议?你的根据是什么?
第四讲复习
单样本均值的检验:大样本、小样本; 单样本比率的检验:大样本; 双样本均值的检验:大样本、小样本; 双样本比率的检验:大样本; 问题: 大样本和小样本下对总体的先验认识可 以有哪些区别?
北京大学光华管理学院 王明进 陈 奇志 1
2000年12月
第四讲复习(续)
问题: 在构造拒绝域时,为什么统计量的抽样 分布是重要的? 问题: 对第7章中的概念你是否有了更新的认 识呢?
2 1 2 s2
~ F (n1 1, n2 1)
即自由度为n1-1和n2-1的F分布。
2000年12月 北京大学光华管理学院 王明进 陈 奇志 16
关于F分布...
自由度为n和m的F分布。 如何找到分位数?
F1-
F
一个重要的性质:
F (n, m) 1/ F1 (m, n)
2000年12月 北京大学光华管理学院 王明进 陈 奇志 5
自动饮料机的例子
某种自动饮料机的饮料灌装量的方差是一个重要的技 术指标,方差太大,意味着可能经常出现过度灌装或 者灌装不足,这会引起饮料机的拥有者或者顾客的不 满。在对某一特定的机器灌装量的测试中,由18杯饮 料组成的随机样本得到样本方差是0.40。 问题: 1)该机器灌装量的方差的点估计是多少? 2)该方差的置信水平为90%的置信区间是什么? 3)如果一个可以接受的方案是方差不超过0.25,根据 测试的结果你是否认为该机器不合格?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 14
怎样用模型来刻画我们的问题?
我们的总体是什么? 对总体假定是服从正态分布的,可以吗? 2 2 X1 ~ N (1, 1 ); X 2 ~ N (2 , 2 ) 2 2 检验假设: H0 : 12 2 , H1 : 12 2 拒绝域的形状是什么?
2 s1 2 s2
c1 或
2 s1 2 s2
c2 , 如何确定c1 , c2 ?
15
2000年12月
北京大学光华管理学院 王明进 陈 奇志
下一步,我们需要知道...
在H0成立时, s12 / s22 的抽样分布是什么? 已有的结果: 当样本容量为n1和n2的独立简单随机 样本分别取自两个方差相等的正态总体 时, s
2000年12月 北京大学光华管理学院 王明进 陈 奇志 11
取显著水平=0.05时
拒绝域为
s2
0.25 ( n 1) 0.25 17 2 (n 1)
27.5871
0.405693
可以认为该机器不合格吗?
2000年12月
北京大学光华管理学院 王明进 陈 奇志
2000年12月 北京大学光华管理学院 王明进 陈 奇志 26
建立我们的模型
总体是什么?用什么分布描述? 多项分布(二项分布的推广) 检验假设: H0: PA=0.30 PB=0.50 PC=0.20; H1: 总体比例已经发生改变。 检验的思路: 如果H0是对的,那么200人中的观测结果不会 与期望的结果相差太大。
北京大学光华管理学院 王明进 陈 奇志
小结:双样本方差的检验
双样本方差的检验; F分布; 更多的例子… 后面的内容,让我们记住卡方!
2000年12月
北京大学光华管理学院 王明进 陈 奇志
25
Scott Marketing Research Co.
Scott公司进行了一项市场份额的研究。在过去的 一年里,公司A的市场份额稳定在30%,公司B在50%, 公司C在20%。最近公司C开发了一种“新型”产品并 取代了当前市场的产品。Scott受雇于公司C,为它判 断新产品是否使市场份额发生了改变。 Scott公司通过问卷调查了一组200名的顾客群体, 询问他们对公司A、B、C的购买偏好,结果48人选择 A,98人选择了B,54人选择了C。根据这些数据, Scott公司需要判断市场份额是否已经发生了变化。 你如何解决该类问题?
22
北京大学光华管理学院 王明进 陈 奇志
t-¼ ë Ñ é : Ë « Ñ ù ± ¾ µ È · ½ ² î ¼ Ù É è ± ä Á ¿ 1 ± ä Á ¿ 2 30.51667 27 11.20515 6.975385 12 14 8.914028 0 24 2.994072 0.003147 1.710882 0.006294 2.063898
Байду номын сангаас12
小结:单样本方差的检验
2 2 H0 : 2 0 , H1 : 2 0 ; 2 2 H0 : 2 0 , H1 : 2 0 ; 2 2 H0 : 2 0 , H1 : 2 0 ;
它们的拒绝域的形状分别是什么?怎样 确定拒绝域? 此时对总体和样本有什么要求?
F-¼ ë Ñ é
Ë « Ñ ù ± ¾ · ½ ² î · Ö Î ö ± ä Á ¿ 1 ± ä Á ¿ 2 30.51667 27 11.20515 6.975385 12 14 11 13 1.606385 0.206377 2.63465
24
Æ ½ ¾ ù · ½ ² î ¹ Û ² â Ö µ df F P(F<=f) µ ¤ Î ² F µ ¤ Î ² Á Ù ½ ç
2000年12月
² Æ Î ñ ¼ Æ » ® È Ë Ô ± 30.51667 0.966314 30.8 #N/A 3.34741 11.20515 0.139288 -0.46508 10.9 24.4 35.3 366.2 12 Æ ½ ¾ ù ± ê × ¼ Î ó ² î Ö Ð Ö µ Ä £ Ê ½ ± ê × ¼ Æ « ² î Ñ ù ± ¾ · ½ ² î · å Ö µ Æ « Ð ±¶ È Ç ø Ó ò × î Ð ¡ Ö µ × î ´ ó Ö µ Ç ó º Í ¼ Æ Ê ý 27 0.705862 26.25 25.5 2.641095 6.975385 0.869936 1.243047 9 23.9 32.9 378 14
» á ¼ Æ Ê ¥ Æ ½ ¾ ù ± ê × ¼ Î ó ² î Ö Ð Ö µ Ä £ Ê ½ ± ê × ¼ Æ « ² î Ñ ù ± ¾ · ½ ² î · å Ö µ Æ « Ð ±¶ È Ç ø Ó ò × î Ð ¡ Ö µ × î ´ ó Ö µ Ç ó º Í ¼ Æ Ê ý
7
北京大学光华管理学院 王明进 陈 奇志
再看卡方分布...
自由度为n-1的卡方分布 以及其上下分位数
21-(n-1)
2(n-1)
2000年12月
北京大学光华管理学院 王明进 陈 奇志
8
方差的区间估计
P{ 12 / 2 (n 1) (n 1) s 2
2
2 / 2 ( n 1) } 1
2000年12月
北京大学光华管理学院 王明进 陈 奇志
20
谁的起薪更高一些?
《财富》杂志1995年6月26日刊载了会计师 和财务计划人员的起始年薪。他们分别 抽取了12名会计师和14名财务计划人员 作为样本,得到他们的起始年薪如教材 292页所述。 问题:能否说这两种职业的平均起薪有明 显差异?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 21
2000年12月
北京大学光华管理学院 王明进 陈 奇志
19
两个总体的方差的单边检验
根据你对假设检验过程的理解,你能够 写出下面两个检验的拒绝域吗?
2 2 H 0 : 12 2 , H 1 : 12 2 ; 2 2 H 0 : 12 2 , H 1 : 12 2 ;
(n 1) s 2 (n 1) s 2 2 P{ 2 2 } 1 / 2 (n 1) 1 / 2 (n 1) 所以 2的一个置信区间是
2 (n 1) s 2 ( n 1 ) s 2 2 2 / 2 (n 1) 1 / 2 (n 1)
2000年12月 北京大学光华管理学院 王明进 陈 奇志 10
该机器是否合格?
检验假设:H0: 20.25, H1: 2>0.25; 拒绝域的形状: s2>c, c=? 根据抽样分布确定拒绝域为
(n 1) s 2 2 (n 1) 0.25
此时犯第一类错误的概率不会超过,为 什么?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 13
选择哪个公司的校车服务?
Dullus县学校要更新明年的校车服务合同,需 要从Milbank和Gulf Park两家公司中选择一个。 选择校车运送或者到达时间的方差作为衡量公 司服务质量的指标。学校需要了解这两家公司 的服务质量是否相同,如果相同,他们就会选 择价格较低的一家。他们调查了M公司的25个 到达时间以及G公司的16个到达时间,分别得 到样本的方差是48和20。他们是否有充分的理 由认为两家公司的服务质量不同?
第五讲
方差检验和拟合优度检验
2000年12月
2000年12月 北京大学光华管理学院 王明进 陈 奇志 4
关于方差…
方差刻画了什么? 一种零件的尺寸的方差; 一种股票收益率的方差;... 方差的点估计: 样本方差 n 2 2
s
1 n 1
( x x)
i 1 i
方差的区间估计呢?
23
Æ ½ ¾ ù · ½ ² î ¹ Û ² â Ö µ º Ï ² ¢ · ½ ² î ¼ Ù É è Æ ½ ¾ ù df t Stat P(T<=t) t µ ¤ Î ² Á Ù P(T<=t) t Ë « Î ² Á Ù
2000年12月
² î
µ ¤ Î ² ½ ç Ë « Î ² ½ ç
北京大学光华管理学院 王明进 陈 奇志
2000年12月 北京大学光华管理学院 王明进 陈 奇志 2
第四讲复习(续)
置信区间和假设检验的关系; 置信系数是1-的置信区间和显著水平是 的双边检验的拒绝域有什么关系? 匹配样本(双样本)的均值检验问题; 检验的P值。
2000年12月 北京大学光华管理学院 王明进 陈 奇志 3
2000年12月 北京大学光华管理学院 王明进 陈 奇志 17
确定我们的拒绝域
拒绝域应为
2 s1 2 s2 2 s1 2 s2
F (n1 1, n2 1) 或者
2 2
F1 (n1 1, n2 1) 1/F (n2 1, n1 1)
2
对选择校车问题,使用显著水平0.10,则
2000年12月 北京大学光华管理学院 王明进 陈 奇志 6
如何得到方差的置信区间?
为了求置信区间,我们需要什么?
为此,我们需要对总体的分布做哪些要求?对 于饮料的灌装量,这种要求是否合理?
关于样本方差的抽样分布的一个结果
(n 1) s 2
2
2000年12月
~ 2 (n 1)
2000年12月
北京大学光华管理学院 王明进 陈 奇志
9
灌装量方差的90%置信区间
如何得到自由度为17的卡方分布的上下0.05分 位数?(查表得到分别为8.67176, 27.5871) 灌装量方差的置信水平是90%置信区间是 (0.246492,0.784155) 问题: 1)怎么解释以上区间的含义? 2)给定显著水平0.10, 能否拒绝原假设H0: 2=0.30, 为什么?拒绝域是什么?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 27
检验方法
计算观测频数和期望频数以及它们之差; 拒绝域的形状是 k
2 s1 2 s2 2 s1 2 s2
F0.05 (24,15) 2.29或者
F0.95 (24,15) 1 / F0.05 (15,24) 1 / 2.11 0.4739
北京大学光华管理学院 王明进 陈 奇志 18
(见P.680-681)
2000年12月
对校车选择的建议
根据上面的分析,你对Dullus学校选择校 车有什么建议?你的根据是什么?
第四讲复习
单样本均值的检验:大样本、小样本; 单样本比率的检验:大样本; 双样本均值的检验:大样本、小样本; 双样本比率的检验:大样本; 问题: 大样本和小样本下对总体的先验认识可 以有哪些区别?
北京大学光华管理学院 王明进 陈 奇志 1
2000年12月
第四讲复习(续)
问题: 在构造拒绝域时,为什么统计量的抽样 分布是重要的? 问题: 对第7章中的概念你是否有了更新的认 识呢?
2 1 2 s2
~ F (n1 1, n2 1)
即自由度为n1-1和n2-1的F分布。
2000年12月 北京大学光华管理学院 王明进 陈 奇志 16
关于F分布...
自由度为n和m的F分布。 如何找到分位数?
F1-
F
一个重要的性质:
F (n, m) 1/ F1 (m, n)
2000年12月 北京大学光华管理学院 王明进 陈 奇志 5
自动饮料机的例子
某种自动饮料机的饮料灌装量的方差是一个重要的技 术指标,方差太大,意味着可能经常出现过度灌装或 者灌装不足,这会引起饮料机的拥有者或者顾客的不 满。在对某一特定的机器灌装量的测试中,由18杯饮 料组成的随机样本得到样本方差是0.40。 问题: 1)该机器灌装量的方差的点估计是多少? 2)该方差的置信水平为90%的置信区间是什么? 3)如果一个可以接受的方案是方差不超过0.25,根据 测试的结果你是否认为该机器不合格?
2000年12月 北京大学光华管理学院 王明进 陈 奇志 14
怎样用模型来刻画我们的问题?
我们的总体是什么? 对总体假定是服从正态分布的,可以吗? 2 2 X1 ~ N (1, 1 ); X 2 ~ N (2 , 2 ) 2 2 检验假设: H0 : 12 2 , H1 : 12 2 拒绝域的形状是什么?
2 s1 2 s2
c1 或
2 s1 2 s2
c2 , 如何确定c1 , c2 ?
15
2000年12月
北京大学光华管理学院 王明进 陈 奇志
下一步,我们需要知道...
在H0成立时, s12 / s22 的抽样分布是什么? 已有的结果: 当样本容量为n1和n2的独立简单随机 样本分别取自两个方差相等的正态总体 时, s
2000年12月 北京大学光华管理学院 王明进 陈 奇志 11
取显著水平=0.05时
拒绝域为
s2
0.25 ( n 1) 0.25 17 2 (n 1)
27.5871
0.405693
可以认为该机器不合格吗?
2000年12月
北京大学光华管理学院 王明进 陈 奇志
2000年12月 北京大学光华管理学院 王明进 陈 奇志 26
建立我们的模型
总体是什么?用什么分布描述? 多项分布(二项分布的推广) 检验假设: H0: PA=0.30 PB=0.50 PC=0.20; H1: 总体比例已经发生改变。 检验的思路: 如果H0是对的,那么200人中的观测结果不会 与期望的结果相差太大。