-《独立性检验》3

合集下载

人教版数学选择性必修三8.3.2独立性检验课件

人教版数学选择性必修三8.3.2独立性检验课件
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
每周平均体育运动时间
不超过4小时
每周平均体育运动时间
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
零假设为H0:该校学生的每周平均体育运动时间与性别无关.
结合列联表可算得
300× 45×60−30×165 2
(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成
每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周
平均体育运动时间与性别有关”.
附:
α
0.100
0.050
0.010
0.005

2.706
3.841
≈1.871×10-4.
∵1.871×10-4<2.706=x0.1,
根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,
即选报文、理科与对外语的兴趣无关.
总结提升
独立性检验的关注点
在2×2列联表中,如果两个分类变量没有关系,
则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;
合计
数学优秀
267
93
360
数学非优秀
99
781
880
合计
366
将表中数据代入公式,得
874
1240
32

数学:1.1《独立性检验》教案(3)(新人教B版选修1-2)

数学:1.1《独立性检验》教案(3)(新人教B版选修1-2)

1.1独立性检验教学目标:通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用。

教学重点:通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用。

教学过程(一)、x 2检验的基本步骤1、建立虚无假设:观察的结果与期望的结果无差异。

2、确定检验水平等级 P=0.05 或P=0.01 3、应用公式计算∑-=ee f f f x 202)(其中:f 0 观察实际的次数f e :期望次数(理论次数)4、根据计算得出x 2值和df 值(自由度)查x 2值表.查出:x 2(df )0.01或x 2(df )0.05的值。

5、用x 2值与x 2(df )0.01或x 2(df )0.05值比较大小。

若x 2≥x 2(df )0.01 p ≥0.01 差异非常显著 否定虚无假设 x 2 ≤ x 2(df )0.05 p ≤0.05 差异显著 否定虚无假设 x 2 < x 2(df )0.05 p>0.05 差异不显著 承认虚无假设(二)、例1、对某一电教媒体能否在课堂教学使用的问卷调查中,有44名教师发表了意见,其中很同意者23人,同意者13人,不同意者6人,很不同意者2人。

问各类意见之间4df 解:11444====n N f e 态度等级数观察总人数 df=n-1=4-1=31、建立虚无假设:观察的结果与期望的结果无差异2、确定检验水平等级 P=0.013、计算x 2值09.2311)112(11)116(11)1113(11)1123()(2222202=-+-+-+-=-=∑e e f f f x4、查x 2值表:x 2 (3)0.01=11.3455、比较大小 ∵23.09>>11.345 ∴P <0.07 差异非常显著结论:意见差异非常大,且同意的意见占很大优势。

(二)统计数是百分数例2、对某校50名学生问卷“你对录像中关于**原理的理解程度?”统计如下,全部理解12%;大部分理解24%;部分理解36%;少部分理解18%;完全不理解10%。

高中数学人教课标版选修2-3《独立性检验的基本思想及其初步应用(第2课时)》课件

高中数学人教课标版选修2-3《独立性检验的基本思想及其初步应用(第2课时)》课件
但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后 还需要用独立性检验来确认.
知识回顾
问题探究
课堂小结
随堂检测
重点、难点知识★▲
探究二:什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
●活动一 理论学习,提升高度 1.定义: 利用随机变量 独立性检验. ●活动二 对比学习,提炼方法
检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
解:根据题中所给数据列出列联表
பைடு நூலகம்
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程 度上认为“秃顶与患心脏病有关”.
知识回顾
问题探究
课堂小结
随堂检测
探究一:我们主要从几个方面来研究两个分类变量之间有无关系?
●活动二 对比学习,提炼优缺点 根据数据有多大把握判断秃顶与患心脏病是否有关系? 在假设的前提下,
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
所以有99%的把握认为“秃顶与患心脏病有关”. 这里的数据来自于医院的住院病人,因此题目中的结论能够很好 地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出 现错误,除非有其它的证据表明可以进行这种推广.
3.2 独立性检验的基本思想及其初步 应用(第2课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样的变量
成为分类变量. 列出两个分类变量的频数表,称为列联表. 等高条形图是用来分析两个分类变量之间是否具有相关关系, 可以形象、直观地反映两个分类变量之间的总体状态和差异大小,

8.3.2独立性检验 课件—高二下数学人教A版(2019)选择性必修第三册

8.3.2独立性检验 课件—高二下数学人教A版(2019)选择性必修第三册

P( x )
2
临界值xα
的方法称为χ2独立性检验,
读作“卡方独立性检验”,
简称独立性检验.
概率值α越小,临界值xα越大.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立
性检验,读作“卡方独立性检验”,简称独立性检验.
犯错误的
概率
例2: 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,
甲校
乙校
合计
你认为“两校学生的数
学成绩优秀率存在差异”
这一结论是否有可能是
错误的?
因此,需要找到一种更为合理的推断方法,希望能对出现错误
判断的概率有一定的控制或估算。
本节课给到一个方法:独立性检验
独立性检验是一种“概率反证法”。依据是小概率原理(在一次实
验中几乎不可能发生)
找到了,假设不成立,嫌
疑人有罪。
例4 :为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机
抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,
如下表所示. 依据小概率值α=0.001的独立性检验,分析吸烟是否会增加
患肺癌的风险.
解:零假设为H0: 吸烟与患肺癌之间
无关联,由表中数据可得
9965(7775 49 42 2099)
数学成绩
不优秀
优秀
合计
甲校
乙校
合计
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优
秀率无差异根据表中的数据,计算得到
2
88

(33

7

10

38)
2
0.837 2.706 x0.1

独立性检验课件

独立性检验课件

独立性检验课件独立性检验课件独立性检验是统计学中一种常用的方法,用于确定两个或多个分类变量之间是否存在关联或独立性。

在实际应用中,独立性检验可以帮助我们了解两个变量之间的关系,从而为决策和预测提供依据。

本课件将介绍独立性检验的基本概念、常见方法和实际应用。

一、独立性检验的基本概念独立性检验是一种用于检验两个或多个分类变量之间是否存在关联的统计方法。

在独立性检验中,我们通常使用卡方检验来判断两个变量之间的关系。

卡方检验是一种非参数检验方法,不需要对数据的分布做出假设。

在进行独立性检验之前,我们首先需要明确两个变量的测量尺度,通常可以分为名义尺度和有序尺度。

名义尺度的变量是分类变量,没有顺序关系,例如性别、地区等;有序尺度的变量是有一定顺序关系的分类变量,例如教育程度、收入水平等。

二、常见的独立性检验方法1. 卡方检验卡方检验是一种常用的独立性检验方法,用于判断两个分类变量之间是否存在关联。

卡方检验的原理是比较实际观察值与理论期望值之间的差异,通过计算卡方统计量来判断差异是否显著。

卡方检验的步骤包括:建立原假设和备择假设、计算卡方统计量、确定临界值和拒绝域、比较计算值与临界值。

如果计算值大于临界值,则拒绝原假设,认为两个变量之间存在关联。

2. Fisher精确检验Fisher精确检验是一种用于小样本独立性检验的方法,适用于样本量较小或理论期望值较低的情况。

Fisher精确检验通过计算超几何分布的概率来判断两个变量之间的关系。

Fisher精确检验的步骤包括:建立原假设和备择假设、计算超几何分布的概率、确定显著性水平和拒绝域、比较计算值与临界值。

如果计算值小于临界值,则拒绝原假设,认为两个变量之间存在关联。

三、独立性检验的实际应用独立性检验在实际应用中具有广泛的应用价值。

以下是一些常见的实际应用场景:1. 市场调研市场调研是企业决策的重要环节,独立性检验可以帮助企业了解不同市场细分之间的关系。

例如,一家手机厂商想要了解不同性别消费者对手机品牌的偏好是否存在差异,可以通过独立性检验来判断两个变量之间是否存在关联。

高中数学 3.1独立性检验课件 新人教B版选修2-3

高中数学 3.1独立性检验课件 新人教B版选修2-3

响有没有关系.
[解析] 这是一个 2×2 列联表的独立性检验问题,由公式 知
χ2=3921×963×9×19166×7-681×573×24292≈1.780. ∵1.780<3.841,我们没有理由说“心脏搭桥手术”与“又 发作过心脏病”有关,可以认为病人又发作心脏病与否跟他做 过何种手术无关.
动,得到如下的列联表:
男 女 总计
爱好
40 20
60
不爱好
20 30
50
总计
60 50
110

χ2

nad-bc2 a+bc+da+cb+d



K2

110×60×405×0×306-0×205×0 202≈7.8.
附表:
P(K2ห้องสมุดไป่ตู้k)
0.050 0.010 0.001
χ
3.841 6.635 10.828
3.1 独立性检验 第三章
1 课前自主预习 2 课堂典例探究 3 课时作业
课前自主预习
饮用水的质量是人类普遍关心的问题.据统计,饮用优质 水的518人中,身体状况优秀的有466人,饮用一般水的312人 中,身体状况优秀的有218人.
人的身体健康状况与饮用水的质量之间有关系吗?
相互独立事件的概念与性质 1.定义:事件A是否发生对事件B发生的概率_没__有__影__响_, 即P(B|A)=__P__(B_)___,这时,我们称两个事件A,B相互独立, 并把这两个事件叫做相互独立事件. 2 . 性 质 : 当 事 件 A , B 相 互 独 立 时 , ____A____ 与 ____B____,____A____与____B____,___A_____与_____B___也相互 独立.

独立性检验(上课)PPT课件

独立性检验(上课)PPT课件

课堂讲练互动
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
探究学习
课堂讲练互动
探究
列联表
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
探究学习
课堂讲练互动
回顾:
独立性检验的步骤:
1、写出列联表; 2、作出假设; 3、求出 K2 的值. 4、下结论(利用临界值的大小来判断假设是否成立).
探究学习
课堂讲练互动
题型 独立性的检验 【变式】 为研究学生的数学成绩与对学习数学的兴趣是否有关,
对某年级学生作调查得到如下数据:
成绩优秀 成绩较差 总计
探究学习
课堂讲练互动
【示例】 某小学对232名小学生调查中发现:180名男 生中有98名有多动症,另外82名没有多动症,52名 女生中有2名有多动症,另外50名没有多动症,用 独立性检验方法判断多动症与性别是否有关系? 解: 由题可列出如下列联表:
多动症 无多动症 总计
男生 98
82 180
女生 2
解:列出2×2列联表: 有兴趣 无兴趣 总计
理 文 总计 138 73 211 98 52 150 236 125 361
探究学习
课堂讲练互动
解 列出2×2列联表
理 文 总计 有兴趣 138 73 211
无兴趣 98 52 150
代入公式得 K2 的观测值
总计 236 125 361
k=36123×6×13182×5×522-117×3×159082≈1.871×10-4.

独立性检验(课件)高二数学(人教A版2019选修第三册)

独立性检验(课件)高二数学(人教A版2019选修第三册)

|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.

人教B版高二数学选修 独立性检验(1)-3学习任务单

人教B版高二数学选修 独立性检验(1)-3学习任务单

《独立性检验(1)》学习任务单原创不容易,为有更多动力,请【关注、关注、关注】,谢谢!落红不是无情物,化作春泥更护花。

出自龚自珍的《己亥杂诗·其五》杭信一中何逸冬【学习目标】1.通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方法及初步应用;χ来分析两分类变量是否有关系;2.利用统计量2【课上任务】1.什么是分类变量?2.如何根据概率关系表示两个事件独立?3.如何制作两个分类变量的22⨯列联表?4.研究两个分类变量之间是否有关系的直观解决策略有哪些?5.独立性检验的基本思想是什么?(提出假设检验,构造统计量,利用统计量的值判断假设检验是否成立?)6.22⨯列联表独立性检验的一般步骤是什么?7.根据本节课所学的知识能进行简单的应用吗?【课后作业】8.作业11.调查者通过询问72名男女大学生在购买食品时是否看营养说明,得到的数据如下表所示:问大学生的性别与是否看营养说明之间有没有关系?9.作业22.在研究某种新措施対猪白痢的防治效果问题时,得到以下数据:试问新措施对防治猪白痢是否有效?【课后作业参考答案】作业1解: 根据列联表知28=a ,8=b ,16=c ,20=d ,72=n计算统计量416.8))()()(()(22≈++++-=d b c a d c b a bc ad n χ 635.6416.8>,%99的把握说性别与看营养说明有关。

作2解: 根据列联表知114=a ,,132=c ,18=d ,300=n计算统计量317.7))()()(()(22≈++++-=d b c a d c b a bc ad n χ 635.6317.7>,%99的把握说新措施对防治猪白痢有效。

【素材积累】1、走近一看,我立刻被这美丽的荷花引住了,一片片绿油油的荷叶层层叠叠地挤摘水面上,是我不由得想起杨万里接莲叶无穷碧这一句诗。

荷叶上滚动着几颗水珠,真像一粒粒珍珠,亮晶希望对您有帮助,谢谢 晶的。

3.1独立性检验

3.1独立性检验

n
n
同理可得:吸烟但未患病人数:n P( AB) n a b b d
n
n
不吸烟但患病人数: n P( AB) n c d a c
n
n
不吸烟且未患病人数:nຫໍສະໝຸດ P( AB) n c d b d
n
n
实际观测值
如果实际观测值与预 期估计值差异不“大”, 那么我们就可以认为 这些差异是由随机误 差造成的,即假设 H 0 不能被所给数据否定。 否则,应认为假设 H0 不能接受
将以上数据代入公式得:
2 11.8634,
吸烟
这个值是大还是小呢? 不吸烟
总计
患病 37 21 58
不患病 183 274 457
总计 220 295 515
统计学家估算出如下的概率: P( 2 6.635 ) 0.01
即在H0成立的情况下,2的值大于6.635的概率非常小,近似于0.01,即1%.
问题一:我们想要研究“吸烟与患呼吸道疾病的关系”时,需要研究 哪些量呢?
吸烟且患病的人数、不吸烟但患病的人数
为了研究这个问题,我们将是否吸烟与患病的数据用2×2列联表表示:
列联表:分类变量的汇总统计表(频数表)
一般地,假设有两个分类变量 X 和 Y,它们的取值分别为
{x1,x2}和{y1,y2},其样本频数表称为列联表 ,又称为 2×2 列联表,其形式为
(b n a b b d )2 (c n c d a c )2 (d n c d b d )2
n n
n n
nn
n a b bd
n cd a c
n cd bd
nn
nn
nn
化简得: 2 =
n(adb)c2

8.3.2独立性检验(解析版)

8.3.2独立性检验(解析版)

独立性检验【学习目标】1.了解独立性检验的基本思想、方法及其简单应用2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤【自主学习】知识点独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【合作探究】探究一 有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79, ∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=79×(21×29-23×6)244×35×27×52≈8.106.且P (K 2≥7.879)≈0.005即我们得到的K 2的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.归纳总结:(1)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k 的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.【练习1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得K 2的观测值k =189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.探究二 有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关? 解 列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.归纳总结:运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K 2的观测值k . (2)比较k 与k 0的大小作出结论.【练习2】第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动. (1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? 解 (1)(2)假设是否喜爱运动与性别无关,由已知数据可求得: K 2=30×(10×8-6×6)2(10+6)(6+8)(10+6)(6+8)≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.探究三 独立性检验的基本思想【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)K 2=1 000×(360×180-320×140)2500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.归纳总结:(1)解答此类题目的关键在于正确利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算k 的值,再用它与临界值k 0的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【练习3】下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:K 2的观测值k =830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)14×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.课后作业A组基础题一、选择题1.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们() A.在犯错误的概率不超过0.05的前提下可认为X与Y有关B.在犯错误的概率不超过0.05的前提下可认为X与Y无关C.在犯错误的概率不超过0.01的前提下可认为X与Y有关D.没有充分理由说明事件X与Y有关系【答案】A2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值() A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系”成立的可能性无关【答案】B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7.097,则这两个变量间有关系的可能性为()A.99% B.99.5%C.99.9% D.无关系【答案】A解析K2的观测值6.635<k<7.879,所以有99%的把握认为两个变量有关系.4.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0 B.1 C.2 D.3【答案】B解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A 与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B解析由K2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有把握认为种子是否经过处理跟是否生病有关. 二、填空题 6.根据下表计算:K 2的观测值k ≈________(保留3位小数). 【答案】 4.514解析 k =300×(37×143-85×35)2122×178×72×228≈4.514.7.如果K 2的观测值为6.645,可以认为“x 与y 无关”的可信度是________. 【答案】 1%解析 查表可知可信度为1%.8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,有________把握认为课外阅读量大与作文成绩优秀有关. 【答案】 99.5%解析根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【答案】 4.8825%解析由公式计算得K2的观测值k≈4.882,∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题10.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得数据,试问:在出错概率不超过0.025的前提下,能否判断“文科学生总成绩不好与数学成绩不好有关系”?解依题意,计算随机变量K2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”.11.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:请问喜欢吃零食与性别是否有关?解K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),把相关数据代入公式,得 K 2的观测值k =85×(5×28-40×12)217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 12.在某校对有心理障碍学生进行测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?解 对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23.其观测值分别为k 1,k 2,k 3.由表中数据列出焦虑是否与性别有关的2×2列联表可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.B组能力提升一、选择题1.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:0010并计算得到219.05K≈,下列小波对地区A天气判断不正确的是()A. 夜晚下雨的概率约为1 2B. 未出现“日落云里走”夜晚下雨的概率约为5 14C. 有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D. 出现“日落云里走”,有99.9%的把握认为夜晚会下雨【答案】:D【分析】把频率看作概率,即可判断,A B的正误;根据独立性检验可判断,C D的正误,即得【答案】.【详解】由题意,把频率看作概率可得:夜晚下雨的概率约为252511002+=,故A正确;未出现“日落云里走”夜晚下雨的概率约为255254514=+,故B正确;由219.0510.828K≈>,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确;故D错误.故选:D.2.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算2K的观测值为7,根据这一数据分析,下列说法正确的()附:A. 有99%以上的把握认为英语词汇量与阅读水平无关B. 有99.5%以上的把握认为英语词汇量与阅读水平有关C. 有99.9%以上的把握认为英语词汇量与阅读水平有关D. 在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关 【答案】:D 【分析】由题意()26.6350.01P K ≥=,由独立性检验的原理即可得解.【详解】由题意27K =,()26.6350.01P K ≥=,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,有99%的把握认为英语词汇量与阅读水平有关. 故选:D.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:由22()()()()()n ad bc a b c d a c b d χ-=++++算得,22110(40302020)7.860506050χ⨯⨯-⨯=≈⨯⨯⨯.附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”;C. 有99%以上的把握认为“爱好该项运动与性别有关”;D. 有99%以上的把握认为“爱好该项运动与性别无关”.【答案】:C【分析】根据给定的2K的值,结合附表,即可得到结论.【详解】由22110(40302020)7.8 6.63560506050χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%以上的把握认为“爱好该项运动与性别有关.故选:C.4.在一次独立性检验中得到如下列联表:若这两个分类变量A和B没有关系,则a的可能值是() A. 200 B. 720C. 100D. 180【答案】:B 【分析】令2k 的观测值为零,解方程即得解.【详解】当a =720时,k =0,易知此时两个分类变量没有关系. 故【答案】为B5.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A. 25 B. 45C. 60D. 75【答案】:BC 【分析】设男生的人数为()5n n N*∈,列出22⨯列联表,计算出2K 的观测值,结合题中条件可得出关于n 的不等式,解出n 的取值范围,即可得出男生人数的可能值.【详解】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<,即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC. 二、填空题6.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.(参考公式与数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)()20P K k ≥0.05 0.01 0.005 0.001 0k3.841 6.635 7.879 10.828【答案】:有依题意,可知国内代表乐观人数60人,不乐观人数40人,国外乐观人数40人,不乐观人数60人,总计乐观人数100人,不乐观人数100人,所以,而,所以有99.5%以上的把握认为持乐观态度和国内外差异有关.7.给给给给给给给 给线性回归方程y bx a =+必过点(),x y ;给相关系数r 越小,表明两个变量相关性越弱; ()22200606040408100100100100K ⨯-⨯==⨯⨯⨯87.879>给相关指数2R 越接近1,表明回归的效果越好;给在一个2×2列联表中,由计算得2K 的观测值k =13.079,则有99%以上的把握认为这两个变量之间没有关系;给设有一个线性回归方程35y x =-,则变量x 增加一个单位时,y 平均增加5个单位. 其中正确的说法有 (填序号).【答案】:给给对于给,应该是相关系数r 的绝对值越小,表明两个变量相关性越弱.所以它是错误的.对于给,应该是有99%以上的把握认为这两个变量之间有关系.对于给,应该是变量x 增加一个单位时,y 平均减少5个单位.故填给给.三、解答题8.随着现代教育技术的不断发展,我市部分学校开办智慧班教学,某校从甲乙两智慧班各随机抽取45名学生,调查两个班学生对智慧课堂的评价:“满意”与“不满意”,调查中发现甲班评价“满意”的学生人数比乙班评价“满意”的学生人数多9人,根据调查情况制成如下图所示的2×2列联表:(1)完成2×2列联表,并判断能否有97.5%的把握认为评价与班级有关系?(2)从甲乙两班调查评价为“不满意”的学生中按照分层抽样的方法随机抽取7人,现从这7人中选派3人到校外参加智慧课堂研究活动,求其中至少有2人选自乙班学生的概率. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】:(1)表格见解析,有97.5%的把握认为评价与班级有关系;(2)67. 【分析】 (1)首先根据题意填写22⨯列联表,再计算2 5.031 5.024=>K 即可得到结论.(2)首先根据题意得到甲班选取2人,乙班选取5人,再计算概率即可.【详解】(1)完成列联表如下:2290(3915306)=5.031 5.024********⨯-⨯=>⨯⨯⨯K . 所以有97.5%的把握认为评价与班级有关系.(2)抽样比17213==,甲班选取2人,乙班选取5人,则1232553767C C CpC+==.9.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A、B、C三种样式,且每个盲盒只装一个.(1)若每个盲盒装有A、B、C三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是多少?(2)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人购买了该款盲盒,在这些购买者当中,女生占23;而在未购买者当中,男生女生各占50%.请根据以上信息填写下表,并分析是否有95%的把握认为购买该款盲盒与性别有关?参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:(3)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4、5、6周的数据求线性回归方程,再用第1、3周数据进行检验.①请用4、5、6周的数据求出y关于x的线性回归方程y bx a=+;(注:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-)②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?③如果通过②的检验得到的回归直线方程可靠,我们可以认为第2周卖出的盒数误差也不超过2盒,请你求出第2周卖出的盒数的可能取值;如果不可靠,请你设计一个估计第2周卖出的盒数的方案.【答案】:(1)29;(2)表格见解析,有95%把握认为购买该款盲盒与性别有关;(3)给2.514.5y x=+;给是可靠的;给第2周卖出的盒数的可能值为18、19、20、21.【分析】(1)用列举法写出所有基本事件,再从中找出满足要求的基本事件,用古典概型的公式即可求得结果;(2)通过计算,完成列联表,再计算出观测值2 4.714k ≈,比表中0.05所对应的数据3.841大,故得出结论“有95%把握认为购买该款盲盒与性别有关”;(3)给将第4、5、6周的数据代入公式,计算出b 和a ,写出回归直线方程;给将第1、3周的数据代入给所求出的回归直线方程进行检验,该方程可靠;给将2x =代入给所求出的回归直线方程,解得19.5y =,根据可靠性的要求,以及该应用题的实际要求,得出第2周卖出的盒数的可能取值.【详解】解:(1)由题意,基本事件空间为{}(,),(,),(,),(,),(,),(,),(,),(,),(,)A A A B A C B A B B B C C A C B C C Ω=,其中基本事件的个数为9,设事件D 为:“他恰好能收集齐这三种样式”,则()(){},,,D B C C B =,其中基本事件的个数为2, 则他恰好能收集齐这三种样式的概率29P =; (2)22200(40702070) 4.7141109060140k ⨯-⨯=≈⨯⨯⨯, 又因为4.714 3.841>,故有95%把握认为“购买该款盲盒与性别有关”;(3)给由数据,求得5x =,27y =,由公式求得 222(45)(2527)(55)(2627)(65)(3027)5(45)(55)(65)2b --+--+--==-+-+-, 527514.52a =-⨯=, 所以y 关于x 的线性回归方程为 2.514.5y x =+;给当1x =时, 2.5114.517y =⨯+=,17162-<,同样,当3x =时, 2.5314.522y =⨯+=,22232-<,所以,所得到的线性回归方程是可靠的;给由给可知回归直线方程可靠,2x =时 2.5214.519.5y =⨯+=,设第二周卖出的盒数为()n n N ∈,则19.52n -≤,≤≤,n17.521.5给n能取18、19、20、21,即第2周卖出的盒数的可能值为18、19、20、21.【点睛】本题考查了古典概型的概率计算,独立性检验的实际应用,线性回归直线方程的求解及实际应用问题,综合性较强.10.阿基米德是古希腊伟大的哲学家、数学家、物理学家,对几何学、力学等学科作出过卓越贡献.为调查中学生对这一伟大科学家的了解程度,某调查小组随机抽取了某市的100名高中生,请他们列举阿基米德的成就,把能列举阿基米德成就不少于3项的称为“比较了解”,少于三项的称为“不太了解”.他们的调查结果如下:(1)完成如下2×2列联表,并判断是否有99%的把握认为,了解阿基米德与选择文理科有关?(2)在抽取的100名高中生中,按照文理科采用分层抽样的方法抽取10人的样本. (i )求抽取的文科生和理科生的人数;(ii )从10人的样本中随机抽取3人,用X 表示这3人中文科生的人数,求X 的分布列和数学期望.参考数据:22()()()()()n ad bc k a b c d a c b d -=++++,n a b c d =+++. 【答案】:(1)见解析;(2) (i )文科生3人,理科生7人 (ii )见解析【分析】(1)写出列联表后可计算2K ,根据预测值表可得没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )文科生与理科生的比为310,据此可计算出文科生和理科生的人数. (ii )利用超几何分布可计算X 的分布列及其数学期望.【详解】解:(1)依题意填写列联表如下:计算222()100(42182812) 3.382 6.635()()()()30705446n ad bc K a b c d a c b d -⨯-⨯==≈<++++⨯⨯⨯, ∴没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )抽取的文科生人数是30103100⨯=(人),理科生人数是70107100⨯=(人). (ii )X 的可能取值为0,1,2,3,则0337310C C 7(0)C 24P X ===⋅, 1237310C C 21(1)C 40P X ===⋅, 17213307(2)40C C P X C ⋅===, 3037310C C 1(3)C 120P X ===⋅. 其分布列为所以72171369()01232440401204010E X =⨯+⨯+⨯+⨯==.31。

独立性检验课件

独立性检验课件
样本数据应具有代表 性,不能以偏概全, 否则会影响检验结果 的准确性。
检验结果的解释应合 理,不能断章取义, 否则会影响结论的正 确性。
样本数据应真实可靠 ,不能弄虚作假,否 则会导致检验结果失 去意义。
局限性
独立性检验只能用于判断两个分 类变量之间是否独立,无法用于
判断其他变量之间的关系。
独立性检验对样本数据的分布有 一定要求,不适用于所有情况。
01
02
03
定义
Monte Carlo test是一种 通过随机抽样来近似解决 复杂数学问题的计算方法 。
原理
利用随机抽样来模拟样本 分布,从而得出一个近似 解。
应用场景
适用于处理复杂数学问题 、样本分布难以确定或无 法满足正态分布的情况。
03
实例分析
两个分类变量的相关性分析
总结词
通过卡方检验、列联表分析等方法,可 以研究两个分类变量之间的相关性。
THANKS FOR WATCHING
感谢您的观看
定义
Fisher's exact test是一种精确 的卡方检验,用于分析两个分类
变量之间的关联性。
公式
Fisher's exact test基于排列组 合原理,通过对样本数据的可能
情况进行计算,得出p值。
应用场景
适用于样本数据量较小、样本分 布不符合正态分布或近似正态分
布的情况。
Monte Carlo test
• 公式展示:皮尔逊相关系数定义为:r = (nΣ(xi-yi)(xi+yi)-Σ(xi-yi)²) / (√(nΣxi²-Σyi²)√(Σxi²+Σyi²-2Σ(xi*yi))),其中xi和yi分别表示X和Y的取值。

独立性检验课件

独立性检验课件

第四步:查对临界值表(教材),作出判断。
临界值表:
P(K 2 k0)
k0
0.10 2.706
0.05 3.841
0.025
2 5.024
0.010 6.635
0
0.005 7.879
0.001 10.828
探究 为调查吸烟是否对患肺癌有影响,某 肿瘤研究所随机地调查了9 965人,得到如下 结果 (单位: 人) :
练:为研究不同的给药方式(口服与注射) 和药的效果(有效与无效)是否有关,进行 了相应的抽样调查,调查的结果列在表中, 根据所选择的193个病人的数据,能否作出 药的效果和给药方式有关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
1.在调查中学生近视情况时,某校男生150名中有80名近视,女生140 名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,用 什么方法最有说服力 ( )
握认为“两个变量有关系”的方法,称为两个 分
类变量的独立性检验。
独立性检验
第一步:H0: 吸烟和患病之间没有关系 第二步:列出2×2列联表
吸烟 不吸烟
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
K2
n ad bc 2 a bc d a cb d
根据临界值表可知P(K 2 10.828) 0.001
56.631远大于10.828,所以有理由判断H
不成立,
0
所以吸烟与患癌症有关系。

8.3.2 独立性检验 课件-2022学年高二下学期数学人教A版(2019)选择性必修第三册

8.3.2 独立性检验 课件-2022学年高二下学期数学人教A版(2019)选择性必修第三册

例2 依据小概率值α=0.1的χ2 独立性检验,分析例1中的抽样数据,能否据 此推断两校学生的数学成绩优秀率有差异?
解:零假设为H0: 分类变 量X与Y相互独立,即两校 学生的数学成绩优秀率无 差异. 根据表中的数据,计 算得到
2 88(33 7 10 38)2
43 45 7117
α 0.1 0.05 0.01 0.005
由于P( X 0,Y 0) P( X 0)P(Y 0)
(a
b)(a n2
c)
则事件{X=0, Y=0}发生的频数的
期望值(或预期值)为 (a b)(a c) . n
X
X=0 X=1 合计
Y
Y=0 Y=1
a
b
c
d
a+c b+d
所以如果零假设H0成立,下面四个量的取值都不应该太大:
合计
a+b c+d a+b+c+d
思考 例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能 说明其中的原因吗?
事实上,如前所述,例1只是根据一个样本的两个频率间存在差异得出 两校学生数学成绩优秀率有差异的结论,并没有考虑由样本随机性可能导
致的错误,所以例1的推断依据不太充分,在例2中,我们用χ2独立性检验 对零假设H0进行了检验. 通过计算,发现χ2 ≈0.837小于α=0.1所对应的临界 值2.706,因此认为没有充分证据推断H0不成立,所以接受H0 ,推断出两 校学生的数学成绩优秀率没有显著差异的结论. 这个检验结果意味着,抽 样数据中两个频率的差异很有可能是由样本随机性导致的. 因此,只根据 频率的差异得出两校学生的数学成绩优秀率有差异的结论是不可靠的.
,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05.

独立性检验

独立性检验
一、有关概念:
1.定性变量与定量变量: 2.2×2 列联表:
二、独立性检验的简介: 三、检验独立性的方法:
1.频率法: 2.等高条形图法: 3.卡方检验:
(1)卡方检验简述: (2)操作步骤及三个细节: (3)书写格式:
概率与统计简述
样本
抽样
估计 推断
总体
回归分析 分布列及期望 相关分析
概率 计数
超几何分布与二项分布的关联
以下三种情况,按照二项分布来处理
频率代概率 总数一大批 抽取要放回 二项分布也
四大分布之间的关联图
正态分布
连续 二项分布 N →+∞ 超几何分布
(总数充分大) n=1
0—1分布

M N
1 10
1 100
,实际操作时,用二项分布近似来代替
正态分布的性质
1.对称性
f (x) , (x)
法3:相关系数 r 法 (参《必修3》P:92~93) 法4:关系式法:
主要是利用回归方程…… 法5:数表法:
主要观察是否具有单调性……
法3:相关系数 r ——衡量变量之间相关程度的指标
(1)计算公式:r
(2)性质:
n
(xi x)( yi y)
i1
n
n
(xi x)2 ( yi y)2
1
( x )2
e 2 2
2
2.渐近性
正态曲线是钟型 指数二次组合体
3.最大值 4.面积为1
要求概率求面积 左小右大总为 1 均值中众对称轴 比较方差武大郎 前数期望后方差 平方去π同上母
5.期望为μ,方差为δ2
小概率事件原理
一般的,当P(A)≤0.05(或0.01)时 可以认为在一次试验中事件A几乎是不可能发生的 但在多次重复试验中几乎是必然发生的

数学:3.2《独立性检验》课件(新人教A版选修2-3)

数学:3.2《独立性检验》课件(新人教A版选修2-3)
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量

2
a b c d a c b d
其中n a b c d
n ad bc
2
第四步:查对临界值表,作出判断。
复方江剪刀草 胆黄片 合计
有效 184 91 275
无效 61 9 70
2
合计 245 100 345
解:设H0:两种中草药的治疗效果没有差异。
345184 9 61 91 2 11.098 275 70 245 100
因当H0成立时,χ2≥10.828的概率为0.001,故有99.9%的把握 认为,两种药物的疗效有差异。
怎样描述实际观测值与估计值的差异呢? 统计学中采用
(观测值 预期值)2 用卡方统计量: 2 预期值 来刻画实际观测值与估计值的差异.
ab ac 2 ab bd 2 (a n ) (b n ) n n n n 2 ab ac ab bd n n n n n n cd ac 2 cd bd 2 (c n ) (d n ) n n n n cd ac cd bd n n n n n n
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例1.在500人身上试验某种血清预防感冒作用,把他们 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外500名未用血清的人的感冒记 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 未感冒 感冒 合计
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《独立性检验的基本思想及其初步应用》教学设计东北师范大学附属实验学校李宇一、教学内容与内容解析1.内容:独立性检验的基本思想及实施步骤2.内容解析:本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。

本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。

在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。

独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。

因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。

学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。

这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

教学重点:理解独立性检验的基本思想及实施步骤.二、教学目标与目标解析1.目标:①知识与技能目标通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。

②过程与方法目标通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。

利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。

这一直觉来自于观测数据,即样本。

问题是这种来自于样本的印象能够在多大程度上代表总体。

这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。

③情感态度价值观目标通过本节课的学习,加强数学与现实生活的联系。

以科学的态度评价两个分类变量有关系的可能性。

培养学生运用所学知识,解决实际问题的能力。

教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。

2.目标解析:独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力.新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。

从心理学的角度看,青少年有一种好奇的心态、探究的心理。

因此,紧紧地抓住学生的这一特征,利用学生身边的问题“玩电脑游戏与注意力集中是否有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析能力。

三、教学问题诊断分析1.本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。

2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。

所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个规则解决问题。

3.独立性检验难于理解的一个主要之处在于凭空出现一个2K,这个随机变量K2是怎样构造出来的,为什么如此构造?教材在这一部分处理上,是先进行某一临界值的讲解,而后再给出卡方临界值表,这对于学生是比较难于理解的,为什么就给出这么一个临界值呢?有这个问题的存在,学生对接下来所谈到的内容会有所怀疑,不一定十分认同。

为了突破这个难点,我采用“先入为主”的思想,把教材后面介绍的卡方临界值表提前讲解,用概率知识解读临界值表的含义,让学生先接受统计学上的知识,而后在应用过程中进一步理解,这样进行调整后,学生对独立性检验的思想的接受就更容易一些。

教学难点:①了解独立性检验的基本思想;②了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。

四、教学支持条件为了有效实现教学目标,考虑到学生的知识水平和理解能力,从学生的认知规律出发,让学生自主学习,运用探究式法,充分调动学生的积极性,让学生逐步领会独立性检验的基本思想,掌握独立性检验的方法。

五、教学过程设计⑴创设情境,提出问题创设情境:最新研究发现,花太多时间玩电脑游戏的儿童,患多动症的风险会加倍。

青少年的大脑会很快习惯闪烁的屏幕、变幻莫测的电脑游戏,一旦如此,他们在教室等视觉刺激较少的地方,就很难集中注意力。

研究人员对1323名年龄在7岁到10岁的儿童进行调查,并在孩子父母的帮助下记录了他们在13个月里玩电脑游戏的习惯。

同时,教师记下这些孩子出现的注意力不集中问题。

统计获得下列数据:根据这则网上收集到的新闻,利用上节课所学习的内容。

提出问题:“从这则新闻中可以得出哪些结论?有多大把握认为你所得出结论正确?”预设回答:玩电脑游戏与注意力集中有关系。

【设计意图】数学教学只有从问题开始才有其生命力,创设一个实际问题情境,既回顾了上节课的内容,又提出本节课研究的问题。

同时使学生体会数学的应用价值,感受学习数学新知识的必要性.学生在阅读完材料后就能回答出第一个问题,但对第二个问题就会没有解决的思路,这样可以让学生带着问题进入到下面的学习中,同时明确本节课的核心问题突出重点。

⑵探究归纳,解决问题①启发探究引导性语言:有多大把握认为“两个分类变量有关系”,这是个概率问题。

要研究两个分类变量有关系可以先研究其没有关系即是否独立,就是研究其独立的概率关系,在用频率代替概率后,假设H0:玩电脑游戏与注意力集中没有关系;用A表示不玩电脑游戏;用B表示注意力不集中;若H0成立⇔事件A与事件B独立⇔()()()P AB P A P B=提出问题:在假设H0成立的条件下,能推导出a,b,c,d有怎样的关系?学生活动:利用列联表推导。

预设回答:bcad≈。

【设计意图】要研究两个分类变量有关系是不容易解决的问题,本着“正难则反”的思想方法,借助反证法的思考模式,将问题转化为两个分类变量独立,利用事件独立的概率相关知识,用频率代替概率,利用列联表由学生自己动手推导出,在H0成立的条件下有bcad≈,进而引出随机变量K2公式中的部分结构ad bc-()。

②新知解读引导性提问:通过上述推导得到bc ad ≈,为表示其差异性,将其转化成||bc ad -,那么直观上||bc ad -的大小能说明什么?预设回答:||bc ad -值越小,越独立,两个分类变量关系越弱;||bc ad -值越大,越不独立,两个分类变量关系越强。

引导性语言:为了使不同样本的数据有一个统一而又合理的评判标准,统计学家们经过研究后构造了一个随机变量2K =2(),()()()()n ad bc a b a c c d b d -++++()n a b c d =+++ 随机变量2K 服从卡方分布,它类似我们前面学习过的正态分布。

同时统计学家们还得到了如下的卡方临界值表:以k 0=6.635为例,2( 6.635)0.01P K ≥≈,就是说在H 0成立的条件下,计算出随机变量2K 的观测值大于等于6.635的概率不超过0.01,也就是有99%的情况下其观测值是小于6.635的。

【设计意图】随机变量2K 的理解是本节课的难点之一,利用概率知识解读卡方临界值表中数据的含义,有助于学生理解独立性检验的基本思想。

本环节我没有按照教材的呈现顺序,而是将卡方临界值表提到前面来讲解,这样改变后能使学生首先了解随机变量K 2的含义,并能体会到如果K 2的观测值很大,就认为两个分类变量是有关系的合理性,为后面引出独立性检验的规则做好铺垫。

达到突破难点的目的。

③分组讨论提出问题:利用卡方临界值表和K 2的观测值k 判断:接受H 0?认为玩电脑游戏和注意力集中没有关系;还是拒绝H 0?认为玩电脑游戏和注意力集中有关系。

学生活动:利用卡方临界值表和K 2的观测值k 进行小组讨论,选择他们认为正确的结论。

【设计意图】让学生自己通过对卡方临界值概率的理解,亲身去体会是接受H 0还是拒绝H,实现教学重点,即理解独立性检验的基本思想。

本环节设计为由学生先进行小组讨论,有些学生不会利用所学知识来分析问题,通过小组讨论,用集体的力量来进行知识的学习,能增强学生对独立性检验的了解,并体会到合作的有效作用。

④总结提升引导性语言:通过上面的学习过程,你能归纳独立性检验的一般步骤吗?预设回答:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如注意力集中与注意力不集中);Ⅱ也有两类取值,即类1和类2(如玩电脑游戏与不玩电脑游戏)。

于是得到下列联表所示的抽样数据:要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:1.提出假设H:Ⅰ和Ⅱ没有关系;2.根据2×2列联表与公式计算K2的值;3.查对临界值,作出判断。

【设计意图】让学生再次经历问题解决的过程,既深化对该统计思想的理解,又掌握应用独立性检验解决问题的步骤。

⑶成果展示,巩固提升引导性语言:课前各小组都收集了你们感兴趣的分类变量的相关数据,利用本节课我们所学的独立性检验进行判断,看各自有对大的把握认为它们有关系?学生活动:小组内进行检验,而后每小组由一名学生进行研究成果展示。

【设计意图】各小组将各自收集的分类变量数据进行独立性检验,并将检验结果展示给全体同学,加深本组及其它各组学生对独立性检验思想的理解,体验数学在实际生活中的应用。

同时用学生收集的分类变量数据做练习,更能提高学生的参与兴趣。

⑷小结引申,构建体系由学生谈本节课学习的收获,并对所学内容进行归纳。

【设计意图】初步形成以科学的态度评价两个分类变量有关系的可能性。

六、目标检测设计作业为教材第97页习题3.2 第1、2题。

【设计意图】通过作业进一步构建独立性检验的思想体系。

相关文档
最新文档