假设检验 卡方检验 独立性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
—检验
2
独立性检验
例 抛掷一枚六面体骰子,重复120次试验,各点数出现 的频数如下表所示 数字 观测频数 理论频数 1 26 20 2 24 20 3 22 20 4 16 20 5 18 20 6 14 20
在5%的显著水平下能否认为这个骰子质地均匀?
即要检验假设:
1 H 0 : p1 p2 p6 6 ( 02.05 (5) 11.07)
61 59 45
总和 57 61
47 165
(19 21.1)2 (28 20.4)2 (15 12.8)2 10.4 21.1 20.4 12.8 2 2 (4) 13.28. 自由度f (3 1)(3 1) 4. 0.05 (4) 9.49, 0.01
不吸烟的人 未患肺癌B 患肺癌B 概率 99.46% 0.54% 吸烟的人 未患肺癌B 患肺癌B 概率 97.72% 2.28%
患肺癌的概率,吸烟的人明显高于不吸烟的人. 直观感觉:吸烟对是否患肺癌有影响.
未患肺癌B 不吸烟A 吸烟 A 合计 7775 2099 9874
患肺癌 B 42 49 91
2 16.8 11.7, 拒绝H 0 , 认为骰子质地不均匀.
独立性检验
为了研究吸烟对患肺癌是否有影响, 随机调查了9965人, 调查结果如下:
未患肺癌 患肺癌 合计
不吸烟
吸烟 合计
7775
2099 9874
42
49 91
7817
2148 9965
吸烟是否对患肺癌有影响?
直观分析
样本反映总体的信息,由频率估计概率.
0.1112 12.1059 0.4061 44.1000 56.72.
2 取显著性水平 0.01, 临界值 0.01 (1) 6.635.
2 56.7 6.635
自由度f (2 1)(2 1) 1.
拒绝原假设H 0 , 认为吸烟对患肺癌有显著的影响.
ab ac a H 0成立, n n n
a(a b c d ) (a b)(a c )
ad bc
w |ad bc|
a c w1 | | ab cd
若w |ad bc|较大,则怀疑H 0不真.
w |ad bc|
?
n( ad bc ) 2 K ( a b )( a c )( b c )( b d )
7817 9874 P ( AB ) P ( A) P ( B ) 9965 9965
未患肺癌B 不吸烟A 吸烟A 合计 7775 (7745.6) 2099 (2128.4) 9874
患肺癌 B 42 (71.4) 49 (19.6) 91
合计 7817 2148 9965
2 2 2 2 (7775 7745.6) (42 71.4) (2099 2128.4) (49 19.6) 2 7745.6 71.4 2128.4 19.6
2
2 a c n ( ad bc ) 2 ? w1 | | K ab cd ( a b )( a c )( b c )( b d )
一般地,设随机变量X的可能取值为x1,x2, , xk . 做n次重复观测,x1, , xk出现的频数分别为m1, , mk .
可能取值 观测频数
m1 + m k n
x1 m1
x2 m2
…
xk mk
…
检验假设H 0:P ( X xi ) pi , i 1, 2,,k H 0成立的条件下,理论频数分别为 npi , i 1, 2,,k
例在某学校随机抽取了165位学生,调查他们对学校选课
制度的态度, 结果如下表所示,问学生的专业对选课制度 的态度是否相关?
专业 文科 理科 对选课制度的态度
wk.baidu.com艺体 总和
2
赞成 无所谓 反对 19(21.1) 28(20.4) 10(15.5) 20(22.6) 21(21.8) 20(16.6) 22(17.4) 10(16.8) 15(12.8)
2
2 5.06 11.7, 不拒绝H0 , 没有理由认为骰子不均匀.
例(续) 抛掷一枚六面体骰子,重复120次试验,各点 数出现的频数如下表所示 数字 观测频数 理论频数
2
1 28 20
2 10 20
3 22 20
4 18 20
5 30 20
6 12 20
1 (64 100 4 4 100 64) 16.8. 20
合计 7817 2148 9965
假设吸烟对是否患肺癌没有影响,即A与B独立. P ( AB) P ( A) P ( B)
P ( AB ) P ( A) P ( B ) P ( AB ) P ( A) P ( B ) P ( AB ) P ( A) P ( B )
7817 9874 事件AB发生的理论频数为nP ( AB ) 7746 9965
构造统计量
mi npi mi n pi npi pi i 1 i 1 n
2 k 2 k 2
2 在H0成立的条件下, 2近似服从( k 1). 2 ( 0.05 (5) 11.07)
1 (36 16 4 16 4 36) 5.06. 20
2
独立性检验
例 抛掷一枚六面体骰子,重复120次试验,各点数出现 的频数如下表所示 数字 观测频数 理论频数 1 26 20 2 24 20 3 22 20 4 16 20 5 18 20 6 14 20
在5%的显著水平下能否认为这个骰子质地均匀?
即要检验假设:
1 H 0 : p1 p2 p6 6 ( 02.05 (5) 11.07)
61 59 45
总和 57 61
47 165
(19 21.1)2 (28 20.4)2 (15 12.8)2 10.4 21.1 20.4 12.8 2 2 (4) 13.28. 自由度f (3 1)(3 1) 4. 0.05 (4) 9.49, 0.01
不吸烟的人 未患肺癌B 患肺癌B 概率 99.46% 0.54% 吸烟的人 未患肺癌B 患肺癌B 概率 97.72% 2.28%
患肺癌的概率,吸烟的人明显高于不吸烟的人. 直观感觉:吸烟对是否患肺癌有影响.
未患肺癌B 不吸烟A 吸烟 A 合计 7775 2099 9874
患肺癌 B 42 49 91
2 16.8 11.7, 拒绝H 0 , 认为骰子质地不均匀.
独立性检验
为了研究吸烟对患肺癌是否有影响, 随机调查了9965人, 调查结果如下:
未患肺癌 患肺癌 合计
不吸烟
吸烟 合计
7775
2099 9874
42
49 91
7817
2148 9965
吸烟是否对患肺癌有影响?
直观分析
样本反映总体的信息,由频率估计概率.
0.1112 12.1059 0.4061 44.1000 56.72.
2 取显著性水平 0.01, 临界值 0.01 (1) 6.635.
2 56.7 6.635
自由度f (2 1)(2 1) 1.
拒绝原假设H 0 , 认为吸烟对患肺癌有显著的影响.
ab ac a H 0成立, n n n
a(a b c d ) (a b)(a c )
ad bc
w |ad bc|
a c w1 | | ab cd
若w |ad bc|较大,则怀疑H 0不真.
w |ad bc|
?
n( ad bc ) 2 K ( a b )( a c )( b c )( b d )
7817 9874 P ( AB ) P ( A) P ( B ) 9965 9965
未患肺癌B 不吸烟A 吸烟A 合计 7775 (7745.6) 2099 (2128.4) 9874
患肺癌 B 42 (71.4) 49 (19.6) 91
合计 7817 2148 9965
2 2 2 2 (7775 7745.6) (42 71.4) (2099 2128.4) (49 19.6) 2 7745.6 71.4 2128.4 19.6
2
2 a c n ( ad bc ) 2 ? w1 | | K ab cd ( a b )( a c )( b c )( b d )
一般地,设随机变量X的可能取值为x1,x2, , xk . 做n次重复观测,x1, , xk出现的频数分别为m1, , mk .
可能取值 观测频数
m1 + m k n
x1 m1
x2 m2
…
xk mk
…
检验假设H 0:P ( X xi ) pi , i 1, 2,,k H 0成立的条件下,理论频数分别为 npi , i 1, 2,,k
例在某学校随机抽取了165位学生,调查他们对学校选课
制度的态度, 结果如下表所示,问学生的专业对选课制度 的态度是否相关?
专业 文科 理科 对选课制度的态度
wk.baidu.com艺体 总和
2
赞成 无所谓 反对 19(21.1) 28(20.4) 10(15.5) 20(22.6) 21(21.8) 20(16.6) 22(17.4) 10(16.8) 15(12.8)
2
2 5.06 11.7, 不拒绝H0 , 没有理由认为骰子不均匀.
例(续) 抛掷一枚六面体骰子,重复120次试验,各点 数出现的频数如下表所示 数字 观测频数 理论频数
2
1 28 20
2 10 20
3 22 20
4 18 20
5 30 20
6 12 20
1 (64 100 4 4 100 64) 16.8. 20
合计 7817 2148 9965
假设吸烟对是否患肺癌没有影响,即A与B独立. P ( AB) P ( A) P ( B)
P ( AB ) P ( A) P ( B ) P ( AB ) P ( A) P ( B ) P ( AB ) P ( A) P ( B )
7817 9874 事件AB发生的理论频数为nP ( AB ) 7746 9965
构造统计量
mi npi mi n pi npi pi i 1 i 1 n
2 k 2 k 2
2 在H0成立的条件下, 2近似服从( k 1). 2 ( 0.05 (5) 11.07)
1 (36 16 4 16 4 36) 5.06. 20