4-§2 独立性检验
独立性检验
74
26
100
(3)根据列联表中的数据可得
K2
n(ad bc)2
100 (6410 1610)2
(a b)(c d)(a c)(b d ) 80 20 74 26
3600 7.4844 6.635 481
所以有 99%的把握认为该市一天空气中PM2.5浓度与SO2浓度 有关.
(2017年海南卷第19题)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对 比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其 频率分布直方图如图所示。
K2
n(ad bc)2
(a b)(c d )(a c)(b d )
P(K 2 k) k
0.050 0.010
0.001
3.841 6.635 10.828
(2)由所给数据,可得列联表为:
SO2
0,150
150, 475
合计
PM 2.5
0, 75
64
16
80
75,115
10
10
20
合计
若K2 < k,则认为“在犯错误的概率不超过a的前提下不能 推断这两个分类变量有关系”(或者可以表达为“没有1-a的 把握认为两个分类变量有关系”)
(2020年海南卷第19题)为加强环境保护,治理空气污染,环境监测部门对 某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
SO2 PM2.5 [0, 35] (35, 75]
独立性检验及其应用
一、定义:
利用随机变量K2 来判断“两个分类变量有关系” 的方法称为独立性检验
二、独立性检验的具体步骤:
1、完成列联表 2、根据实际问题的需要确定容许推断“两个分类变量有关系” 犯错误概率的上界a,然后查表确定对应的临界值k; 3、利用公式,计算随机变量K2; 4、若K2 > k ,则推断“在犯错误的概率不超过a的前提下认 为两个分类变量有关系”(或者可以表达为“有1-a的把握认 为两个分类变量有关系”);
《独立性检验》
《独立性检验》一、内容与内容解析《独立性检验》为新课标教材中新增加的内容. 虽然本节是新增内容,理论比较复杂,教学时间也不长(1-2课时),但由于它贴近实际生活,在整个高中数学中,地位不可小视.在近几年各省新课标高考试题中,本节内容屡屡出现,而且多以解答题的形式呈现,其重要性可见一斑.该内容是前面学生在《数学3》(必修)中的统计知识的进一步应用,并与本册课本前面提到的事件的独立性一节关系紧密,此外还涉及到与《数学2-2》(选修)中讲到的“反证法”类似的思想.本小节的知识内容如右图。
“独立性检验”是在考察两个分类变量之间是否具有相关性的背景下提出的,因此教材上首先提到了分类变量的概念,并给出了考察两个分类变量之间是否相关的一种简单的思路,即借助等高条形图的方法,随后引出相对更精确地解决办法——独立性检验。
独立性检验的思想,建立在统计思想、假设检验思想(小概率事件在一次试验中几乎不可能发生)等基础之上,通常按照如下步骤对数据进行处理:明确问题→确定犯错误概率的上界α及2K 的临界值0k →收集数据→整理数据→制列联表→计算统计量2K 的观测值k →比较观测值k 与临界值0k 并给出结论.本节的重点内容是通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤.二、目标与目标解析本节课的教学目标是主要有:1.理解分类变量(也称属性变量或定性变量)的含义,体会两个分类变量之间可能具有相关性;2.通过对典型案例(吸烟和患肺癌有关吗?)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法、步骤及应用。
3.鼓励学生体验用多种方法(等高条形图法与独立性检验法)解决同一问题,并对各种方法进行比较。
4.让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性(如统计可能犯错误,原因可能是收集的数据样本容量小或样本采集不合理,也可能是理论上的漏洞,如在一次实验中,我们假设小概率事件不发生,这一点本身就值得质疑). 其中第2条是重点目标,也是《课程标准》中明确指出的教学要求之一. 三、教学问题诊断分析基于对学生已有数学水平的分析,在本节新学内容时,有以下几点是初学者不易理解或掌握的:1.2K 的结构比较奇怪,来的也比较突然,学生可能会提出疑问.关于这个问题的处理,要首先利用好前面对“比例”或者两个分类变量“独立”的分析。
高中数学选修课件第一章:独立性检验
注意事项与误区提示
在进行独立性检验前,需要确保样本 的随机性和代表性,以避免因样本偏 差导致结果失真。
需要注意的是,独立性检验只能判断 两个变量之间是否存在统计上的独立 性,并不能说明它们之间是否存在因 果关系或其他形式的关联。
在解读结果时,需要注意概率值(p 值)或临界值表的具体含义和适用条 件,避免误用或滥用。
高中数学选修课件第一 章:独立性检验
汇报人:XX 20XX-01-30
contents
目录
• 独立性检验基本概念 • 独立性检验基本思想解读 • 独立性检验方法介绍及应用场景分析 • 独立性检验结果解读与注意事项 • 独立性检验在统计学中地位和作用 • 高中数学选修课程中其他相关知识点回
顾与拓展
01
在实际应用中,还需要结合其他统计 方法和专业知识进行综合分析和判断 。
05
独立性检验在统计学中地位和作用
独立性检验在统计学中地位
独立性检验是统计学 中一种重要的假设检 验方法。
在数据分析、市场调 研、医学研究等领域 具有广泛应用。
它用于判断两个或多 个分类变量之间是否 相互独立。
独立性检验对后续统计分析影响
高中数学选修课程中其他相关知识点梳理
排列组合与二项式定理
回顾排列组合的基本概念、计算公式及应用,掌握二项式定理的展开式及通项公式的应 用。
概率与统计的综合应用
梳理概率与统计在高中数学选修课程中的综合应用,如概率与统计在解决实际问题中的 结合,以及概率与统计在其他数学知识点中的交叉应用等。
数学建模与数学探究
独立性检验的基本思想
通过抽样调查获取数据,根据样本数据来判断两个分类变量 是否独立。
独立性检验的方法
通常采用列联表的形式整理数据,然后计算相关统计量的值 (如χ²值),并根据统计量的值及给定的显著性水平作出判 断。
独立性检验基本思想及应用
独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。
其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。
独立性检验的应用非常广泛。
在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。
在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。
此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。
独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。
零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。
独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。
2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。
表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。
3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。
期望频数是在两个变量独立情况下,各个类别的交叉数量。
4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。
计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。
其中,Σ表示对所有单元格进行求和。
5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。
通常,α的常见选择为0.05或0.01。
6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。
独立性检验的结果常常以卡方统计量和p值的形式呈现。
p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。
高中数学知识点精讲精析 独立性检验的基本思想
2.2 独立性检验的基本思想独立性检验的基本思想:① 独立性检验的必要性:列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体. ② 独立性检验的步骤(略)及原理(与反证法类似):【解析】1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2× 2列联表; (2)判断性别与休闲方式是否有关系。
【解析】(1)2× 2的列联表:(2χ2因为χ2,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”。
2.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?分析:由列联表中的数据可知,服用复方江剪刀草的患者的有效率为,服用胆黄片的患者的有效率为,可见,服用复方江剪刀草的患者与服用胆黄片的患者的有 效率存在较大差异.下面用进行独立性检验,以确定能有多大把握作出这一推断. 【解析】提出假设:两种中草药的治疗效果没有差异,即病人使用这两种药物中的何种药物对疗效没有明显差异.由列联表中的数据,求得 当成立时,的概率约为,而这里所以我们有的把握认为:两种药物的疗效有差异.2124(43332721) 6.20170546460⨯⨯-⨯=≈⨯⨯⨯5.024≥75%245≈9191%100=2χ0H 22345(18496191)11.09827570245100χ⨯⨯-⨯=≈⨯⨯⨯0H 210.828χ≥0.001211.09810.828χ≈>99.9%。
独立性检验
1
0.9
患肺癌 比例
0.8
0.7
0.6
0.5
0.4
0.3
0.2
不患肺癌 比例
0.1
0 不不不 不不
不吸烟
吸烟
等高条形图更清晰地表达了两种情况下患肺癌的比 例.
设计意图: 设计意图:
与表格相比,三维柱形图、 与表格相比,三维柱形图、二维条形图及等 高条形图能更直观地反映出相关数据的总体 状况.以上图形可以利用计算机做出, 状况.以上图形可以利用计算机做出,既省时 省力,又效果圆满。 省力,又效果圆满。真正体现电化教学的内 核与优势。学生通过数形结合, 核与优势。学生通过数形结合,容易得出直 观结论: 观结论:吸烟者和不吸烟者患肺癌的可能性 存在差异,吸烟者中患肺癌的可能性大。 存在差异,吸烟者中患肺癌的可能性大。即: 吸烟与患肺癌有关。 吸烟与患肺癌有关。
(上述结论由生思考后回答。) 上述结论由生思考后回答。)
为了使不同样本容量的数据有统一的评判标准, 为了使不同样本容量的数据有统一的评判标准 , 基于上述分析, 基于上述分析,我们构造一个随机变量
n(ad − bc )2 K2 = (a + b )(c + d )(a + c )(b + d )
其中n=a+b+c+d为样本容量. 其中n=a+b+c+d为样本容量. n=a+b+c+d为样本容量 问题三: 吸烟与患肺癌没有关系” 问题三:若H0:“吸烟与患肺癌没有关系”成 的值会怎样? 立,则 的值会怎样?
介绍分类变量、列联表的概念。 介绍分类变量、列联表的概念。 不患肺癌 患肺癌 不吸烟 7775 42 吸烟 2099 49 总计 91 9874 总计 7817 2148 9965
独立性检验课件
检验结果的解释应合 理,不能断章取义, 否则会影响结论的正 确性。
样本数据应真实可靠 ,不能弄虚作假,否 则会导致检验结果失 去意义。
局限性
独立性检验只能用于判断两个分 类变量之间是否独立,无法用于
判断其他变量之间的关系。
独立性检验对样本数据的分布有 一定要求,不适用于所有情况。
01
02
03
定义
Monte Carlo test是一种 通过随机抽样来近似解决 复杂数学问题的计算方法 。
原理
利用随机抽样来模拟样本 分布,从而得出一个近似 解。
应用场景
适用于处理复杂数学问题 、样本分布难以确定或无 法满足正态分布的情况。
03
实例分析
两个分类变量的相关性分析
总结词
通过卡方检验、列联表分析等方法,可 以研究两个分类变量之间的相关性。
THANKS FOR WATCHING
感谢您的观看
定义
Fisher's exact test是一种精确 的卡方检验,用于分析两个分类
变量之间的关联性。
公式
Fisher's exact test基于排列组 合原理,通过对样本数据的可能
情况进行计算,得出p值。
应用场景
适用于样本数据量较小、样本分 布不符合正态分布或近似正态分
布的情况。
Monte Carlo test
• 公式展示:皮尔逊相关系数定义为:r = (nΣ(xi-yi)(xi+yi)-Σ(xi-yi)²) / (√(nΣxi²-Σyi²)√(Σxi²+Σyi²-2Σ(xi*yi))),其中xi和yi分别表示X和Y的取值。
§2 独立性检验(2)
【分析理解】
未患肺癌情况 吸烟情况
患肺癌B1 未患肺癌B2 (B1 )
总计
吸 烟A1
56
1 932
1 988
不吸烟A2 ( A1 )
23
4 567
4 590
总 计由于根据表中的79数据计算出6 4的99值是频 6 578 先讨论 P( A1B率1 )值 P, 它( A1只)P是(B概1 )的率情的况估. 由计独值立,性因知此识即, 其使余变三量个式子可不考虑.
【复习回顾】
1.条件概率
已知B发生的条件下, A发生的概率, 称
A
B
为B发生时A发生的条件概率, 记为P(A B) .
AI B
当 P(B) 0
时,
我们有 P(A
B)=
P
(A I B) P(B)
.(
A
I
B也可记为 AB )
类似地,当 P(A) 0 时, A发生时B发生的条件概率 P(B A) = P(AB) .
(1)若有式子:an变 a量n之b •间a n不c 独则立可.认为A1与B1独立. P( A1B1 ) P( A1 )P(B1 )
(2)若有式子:b a b • b d nn n
则可认为A1与B2独立.
P( A1B2 ) P( A1 )P(B2 )
(3)若有式子:nc
c
n
d
•
a
n
c
则可认为A2与B1独立.
∴可以说多看电视与冷漠有关.
(2)20 11.90%, 58 • 88 18.1% Q 20 58 • 88 且相差较大,
168
168 168
168 168 168
∴可以认为少看电视与冷漠有关.
独立性检验
课题
1.1独立性检验
备课人
颜翠萍
课标要求
通过典型案例的探究,了解独立性检验(只要求 列联表)的基本思想、方法及初步应用。
主要问题
通过典型案例的探究,了解独立性检验(只要求 列联表)的基本思想、方法及初步应用。
次要问题
两事件独立的含义
内容导学
反思与总结
一、复习回顾:
1.古典概型:
(1)有限性:在一次实验中,可能出现的结果只有有限个,即只有有限个不同的基本事件;
二、导学内容:
问题1:两事件独立的含义:
例1把一颗质地均匀的骰子任意地掷一次,设事件A=“掷出偶数点”,事件B=“掷出3的倍数点”,试分析事件A与B及 与B的关系。
思考讨论A与B的关系:
1同时发生的事件是什么?事件A与B同时发生记作 ,简记AB,AB发生的概率是多少?
(2)等可能性:每个基本事件发生的可能性是均等的。
2.概率的古典定义:
在古典概型中,一次实验的基本事件总数为n,事件A包含的基本事件数为n,事件A的概率为P(A)=.
3.掷一颗骰子,观察掷出的点数,求掷得奇数点的概率为。
4.对立事件:不能同时发生且必有一个发生的事件叫做互为对立事件。事件A的对立事件记作 。
3. AB发生的概率与A和B发生的概率确有什么关系?
4.A与B独立的含义:
5.如何利用两事件相互独立的含义分析 与B的关系。
6.当A与B独立时的一般结论:
三.课堂小结
本节综述:
四.练习与巩固
独立性检验的基本思想课件
独立性检验的常用方法
卡方检验
适用情况
卡方检验主要用于比较观察频率和期望频率之间的差异,常用于检验两个分类变量之间是 否独立。
原理
卡方检验基于假设,即观察频率和期望频率之间的差异是由于随机误差引起的。如果差异 过大,则拒绝原假设,认为两个分类变量之间存在依赖关系。
计算方法
卡方检验的计算方法包括计算卡方统计量、计算自由度和计算p值。卡方统计量越大,说 明观察频率和期望频率之间的差异越大。自由度等于观察频数减去期望频数减去1。p值 表示拒绝原假设的依据,通常选择0.05作为显著性水平。
计算方法
Fisher's exact test的计算方法包括选择显著性水平、计算超几何分布函数和计算概率值。超几何分布函 数的参数包括观察频数、期望频数和总样本量。
McNemar's test
01
适用情况
McNemar's test主要用于分析两个配对分类变量之间的 关联性,例如同一受试者在不同时间点的测试结果。
独立性检验的发展趋势与未来展望
发展新的统计方法
针对独立性检验的局限性,未来研究可开发新的统计方法 ,提高检验效能和可靠性。
01
结合大数据技术
利用大数据技术,对海量数据进行独立 性检验,可更全面地揭示变量之间的关 系。
02
03
跨学科交叉
将独立性检验与其他学科领域相结合 ,如机器学习、人工智能等,可为其 提供新的应用场景和发展空间。
05
独立性检验的实例分析
两个分类变量的相关性分析
总结词
通过观察两个分类变量之间的相互关系,确 定它们之间是否有联系。
详细描述
在独立性检验中,我们需要观察两个分类变 量之间的关系。例如,我们可以观察吸烟习 惯和患肺癌的可能性之间的关系。通过分析 这些数据,我们可以得出吸烟习惯和患肺癌 之间是否有联系的结论。
独立性检验(2)PPT课件
在日常生活中,主要考虑分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?
性别是否对于喜欢数学课程有影响?等等.
2021
4
为调查吸烟是否对患肺癌有影响,某肿 瘤研究所随机地调查了9965人,得到如下 结果:其中吸烟者2148人,不吸烟者7817 人,吸烟的2148人中49人患肺癌, 2099不患肺癌;不吸烟的7817人中42人 患肺癌, 7775人不患肺癌。
两个定量变量的相关关系分析:回归分析(画散点图、
相关系数r、相关指数R2、残差分析)
2021
3
对于性别变量,其取值为男和女两种,这种变量的不 同“值”表示个体所属的不同类别,像这样的变量称 为分类变量. 分类变量也称为属性变量或定性变量,它们的取值一 定是离散的,而且不同的取值仅表示个体所属的类别, 如性别变量,只取男、女两个值,商品的等级变量只 取一级、二级、三级等等. 如是否吸烟、宗教信仰、是否患肺癌、国籍等等.
19
例3:气管炎是一种常见的呼吸道疾病,医药研究人 P(χ≥员x0对) 0两.50种0中.40草药0.2治5 疗0.1慢5 性0.1气0 管0.炎05 的0.疗025效0进.01行0 0对.00比5 0,.001
x所0 得0数.45据5 0如.70表8 1所.32示3 2,.07问2 :2.7它06 们3.8的41疗5.效024有6无.63差5 7异.87?9 10.828
2021
16
P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如
独立性检验
独立性检验
独立性检验,统计学的一种检验方式。
与适合性检验同属于X2检验,它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。
即为什么不能只凭列联表中的数据和由其绘出的图形下结论, 由列联表可以粗略地估计出两个变量(两类对象)是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体。
关于这一点,在后面的案例中还要进一步说明。
在H0成立的条件下,吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即aa+b≈c;c+d;a(c+d)≈c(a+b);ad-bc≈0.。
独立性检验课件
独立性检验课件独立性检验课件独立性检验是统计学中一种常用的方法,用于确定两个或多个分类变量之间是否存在关联或独立性。
在实际应用中,独立性检验可以帮助我们了解两个变量之间的关系,从而为决策和预测提供依据。
本课件将介绍独立性检验的基本概念、常见方法和实际应用。
一、独立性检验的基本概念独立性检验是一种用于检验两个或多个分类变量之间是否存在关联的统计方法。
在独立性检验中,我们通常使用卡方检验来判断两个变量之间的关系。
卡方检验是一种非参数检验方法,不需要对数据的分布做出假设。
在进行独立性检验之前,我们首先需要明确两个变量的测量尺度,通常可以分为名义尺度和有序尺度。
名义尺度的变量是分类变量,没有顺序关系,例如性别、地区等;有序尺度的变量是有一定顺序关系的分类变量,例如教育程度、收入水平等。
二、常见的独立性检验方法1. 卡方检验卡方检验是一种常用的独立性检验方法,用于判断两个分类变量之间是否存在关联。
卡方检验的原理是比较实际观察值与理论期望值之间的差异,通过计算卡方统计量来判断差异是否显著。
卡方检验的步骤包括:建立原假设和备择假设、计算卡方统计量、确定临界值和拒绝域、比较计算值与临界值。
如果计算值大于临界值,则拒绝原假设,认为两个变量之间存在关联。
2. Fisher精确检验Fisher精确检验是一种用于小样本独立性检验的方法,适用于样本量较小或理论期望值较低的情况。
Fisher精确检验通过计算超几何分布的概率来判断两个变量之间的关系。
Fisher精确检验的步骤包括:建立原假设和备择假设、计算超几何分布的概率、确定显著性水平和拒绝域、比较计算值与临界值。
如果计算值小于临界值,则拒绝原假设,认为两个变量之间存在关联。
三、独立性检验的实际应用独立性检验在实际应用中具有广泛的应用价值。
以下是一些常见的实际应用场景:1. 市场调研市场调研是企业决策的重要环节,独立性检验可以帮助企业了解不同市场细分之间的关系。
例如,一家手机厂商想要了解不同性别消费者对手机品牌的偏好是否存在差异,可以通过独立性检验来判断两个变量之间是否存在关联。
独立性检验(2)
新知初探·课前预习
题型探究·课堂解透
新知初探·课前预习
教材要点
要点 独立性检验的过程
独立性检验的步骤如下:
(1)提出统计假设H0:X与Y之间没有关系;
(2)利用公式χ2=
a+b
n ad−bc 2 c+d a+c
b+d
计算χ2的观测值;
(3)查临界值表❶确定临界值,然后作出判断.
A.在100个高血压患者中一定有肥胖的人 B.在100个肥胖的人中至少有99人患有高血压 C.在100个高血压患者中可能没有肥胖的人 D.肥胖的人至少有99%的概率患有高血压
答案:C
3.为了考察某种药物预防疾病的效果,进行动物试验后得到如下数 据.经过计算得χ2≈6.979,根据χ2临界值表,可以认为该种药物对预 防疾病有效果的把握为________.
方法归纳
(1)先利用3;d a+c
b+d
求出χ2的值.再利用临界值表来判
断有多大的把握判断两个事件有关.
(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与
判断.
巩固训练1 瓜子是一种深受大家喜爱的零食.某炒货店一个月(30 天)内不同口味的瓜子的销售情况如下表:
批注❶ (1)如果χ2>10.828,就有不少于99.9%的把握认为“X与Y之 间有关系”;(2)如果χ2>6.635,就有不少于99%的把握认为“X与Y之 间有关系”;(3)如果χ2>3.841,就有不少于95%的把握认为“X与Y之 间有关系”,如果χ2≤3.841,就认为还没有充分的证据显示“X与Y
服用药 未服用药
合计
患病 10 22 32
未患病 46 32 78
独立性检验的诠释与备考
独立性检验的诠释与备考
独立性检验,又称为卡方检验,是一种常用的统计技术,用于检验两个变量之间是否存在独立性的关系。
它的原理是比较两组数据之间的差异,从而判断数据是否独立。
首先,我们要明确独立性检验的定义:两个变量之间的独立性,指的是两个变量是否有着相互独立的关系,也就是说,这两个变量之间没有因果关系。
其次,我们要了解独立性检验的用途:它可以帮助我们确定两个变量之间是否存在相互独立的关系,也可以用来测试不同类别的变量之间的关系,从而推断出这两个变量是否有着相互独立的关系。
再次,我们要了解独立性检验的方法:它的基本步骤是:首先,确定两个变量的分类;其次,计算每类变量的频率;最后,使用卡方检验(Chi-Square Test)来检验两个变量是否相互独立。
最后,要了解独立性检验的备考方法:
1.了解变量的定义和分类:在备考独立性检验时,要先明确变量的定义和分类,以便于更好地理解相关的概念和计算公式。
2.研究卡方检验:卡方检验是独立性检验的基础,要了解它的概念以及计算公式。
3.练独立性检验:复时要多练独立性检验,比如说可以尝试某些实际例子,这样可以加深对独立性检验的理解。
总之,独立性检验是一种非常有用的统计技术,在备考时要搞清楚它的定义、用途和方法,并多练,以便在考试中取得良好的成绩。
§2 独立性检验(1)
不难发现:
85
在事件B发生的前提下, 事件A发生的概率为
85 90
=
100 90
= P(A I B) . P(B)
100
上面的问题是求已知B发生的条件下(即质量合格), A发生(即长度合格)的
概率, 称为B发生时A发生的条件概率, 记为:P(A B) = P(A I B) .
P(B)
【抽象概括1】
【分析理解】
令A={产品的长度合格}, B={产品的质量合格}, 则 A
B
A I B {_产__品__的__长__度__、__质_量__都__合__格__}.
AI B
现任取一件产品, 已知它的质量合格(即B发生), 则它的长度合格(即A发
85
93
90
85
生)的概率为___9_0_____; P( A) _1_00___; P(B) _1_0_0__;P( A I B) _1_0_0__ .
P(A)
对两个事件A, B, 如果 P(A B) =P(A), 则这意味着事件B发生
不影响事件A的概率. 设P(B)>0, 此时根据条件概率的计算公式,
P(A B) =P(A)= P(AB) , 我们能得到 P(AB)=P(A)gP(B).
P(B)
一般地, 对两个事件A, B, 如果P(AB)=P(A) P(B),则称A, B相 互独立.
互斥事件概率的加法公式 P( A B) P( A) P(B)
3.对立事件的概念
其中必有一个发生的两个互斥事件叫做对立事件.
P(A) 1 P(A)
【问题提出】
§2 独立性检验(1)
100件产品中有93件产品的长度合格, 90件产品的质量合格, 85件产
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2 独立性检验
17
反思与感悟 独立性检验可以通过2×2列联表计算χ2的值, 然后和临界值对照作出判断.
§2 独立性检验
18
跟踪训练3 为了研究人的性别与患色盲是否有关系,某研究所进 行了随机调查,发现在调查的480名男性中有39名患有色盲,520 名女性中有6名患有色盲,试问人的性别与患色盲有关系吗? 解 由题意列出2×2列联表:
§2 独立性检验
6
解 作列联表如下:
性格情况 考前心情是否紧张
考前心情紧张 考前心情不紧张
性格 内向 332 94
合计
426
性格 外向 213 381
合计
545 475
594 1 020
§2 独立性检验
7
反思与感悟 分清类别是作列联表的关键步骤.表中排成两 行两列的数据是调查得来的结果.
§2 独立性检验
20
当堂检测
自查自纠
1234
1.当χ2>3.841时,认为事件A与事件B( A )
A.有95%的把握有关
B.有99%的把握有关
C.没有理由说它们有关
D.不确定
§2 独立性检验
21
1234
2.为了考察中学生的性别与是否喜欢数学课程之间的关系,在 某校中学生中随机抽取了300名学生,得到如下列联表:
第三章——
§2 独立性检验
[学习目标] 1.理解列联表的意义,会根据列联表中数据大致判断两个变 量是否独立. 2.理解统计量χ2的意义和独立性检验的基本思想.
知识梳理
自主学习
知识点一 2×2列联表 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类 B,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样 数据:
§2 独立性检验
27
喜欢玩电 脑游戏
不喜欢玩 电脑游戏
总计
认为作业多 认为作业不多
10
2
3
7
13
9
总计 12 10 22
§2 独立性多少是否有关系? 22×10×7-3×22
解 由已知计算得 χ2= 12×10×13×9 ≈6.418.
∵χ2≥3.841, ∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.
a+bc+da+cb+d
否有关联. 知识点三 独立性检验
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)根据2×2列联表计算 χ2 的值;
(2)与课本给出的三个值比较大小,作出判断.
§2 独立性检验
5
题型探究
重点突破
题型一 2×2列联表 例1 某学校对高三学生作一项调查后发现:在平时的模拟考 试中,性格内向的426名学生中有332名在考前心情紧张,性格 外向的594名学生中在考前心情紧张的有213人.请作出考前心 情紧张与性格的列联表.
解 由公式得:χ2= 86×103×95×94 ≈38.459. ∵38.459>6.635, ∴有99%的把握说,学生学习数学的兴趣与数学成绩 是有关的.
§2 独立性检验
26
课堂小结 1.独立性检验的思想:先假设两个事件无关,计算统计量χ2 的值.若χ2值大于2.706,则认为两个事件有关. 2.独立性检验的步骤: (1)计算χ2的值; (2)和临界值比较作出判断.
§2 独立性检验
24
1234
4.为研究学生的数学成绩与对学习数学的兴趣是否有关,对 某年级学生作调查,得到如下数据:
兴趣浓厚的 兴趣不浓厚的
合计
成绩优秀 64 22 86
成绩较差 30 73 103
总计 94 95 189
§2 独立性检验
25
1234
学生的数学成绩好坏与对学习数学的兴趣是否有关? 189×64×73-22×302
§2 独立性检验
14
题型三 独立性检验 例3 某班主任对班级22名学生进行了作业量多少的调查, 数据如下表:在喜欢玩电脑游戏的12人中,有10人认为作业 多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3 人认为作业多,7人认为作业不多.
§2 独立性检验
15
(1)根据以上数据建立一个2×2列联表; 解 根据题中所给数据,得到如下列联表:
§2 独立性检验
3
Ⅱ
类1
类2
合计
类A
a
Ⅰ
类B
c
b
a+b
d
c+d
合计
a+c
b+d a+b+c+d
上述表格称为2×2列联表.其中|ad-bc|越小,Ⅰ与Ⅱ的关系 越弱;|ad-bc|越大,Ⅰ与Ⅱ的关系越强.
§2 独立性检验
4
知识点二 统计量χ2
nad-bc2
χ2=
,用 χ2 的大小可判断事件 A,B 是
甜食 413 530 178 670
591 1 200
§2 独立性检验
10
题型二 统计量χ2 例2 根据下表计算:
不看电视
男
37
女
35
看电视 85 143
χ2≈__________.(结果保留3位小数)
§2 独立性检验
11
300×37×143-85×352 解析 χ2= 122×178×72×228 ≈4.514. 答案 4.514
8
跟踪训练1 在一项有关医疗保健的社会调查中,发现调查 的男性为530人,女性为670人,其中男性中喜欢吃甜食的为 117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃 甜食的列联表. 解 作列联表如下:
§2 独立性检验
9
性别
喜欢甜食情况
男 女
喜欢 甜食 117 492
总计
609
不喜欢 总计
患色盲
未患色盲
总计
男性
39
女性
6
总计
45
441
480
514
520
955
1 000
§2 独立性检验
19
由公式得
1 000×39×514-441×62 χ2= 480×520×45×955 ≈28.225. 因为28.225>6.635, 所以有99%的把握认为人的性别与患色盲有关系.
§2 独立性检验
男 女 合计
喜欢数学
37 35 72
不喜欢数学
85 143 228
总计
122 178 300
§2 独立性检验
22
1234
你认为性别与是否喜欢数学课程之间有关系的把握有 (B) A.0 B.95% C.99% D.100%
§2 独立性检验
23
1234
3.某大学在研究性别与职称(分正教授、副教授)之间是否有关 系,你认为应该收集哪些数据? _女__正__教__授__人__数__、__男__正__教__授__人__数__、__女__副__教__授__人__数__、__男__副__教__授___ _人__数__.
§2 独立性检验
12
跟踪训练2 已知列联表:药物效果与动物试验列联表
服用药 未服药 总计
患病 10 20 30
未患病 45 30 75
则χ2≈__________.(结果保留3位小数)
总计 55 50 105
§2 独立性检验
13
105×10×30-20×452 解析 χ2= 30×75×55×50 ≈6.109. 答案 6.109