02【数学】1.2《独立性检测的基本思想及其初步应用》课件(新人教A版选修1-2)
合集下载
人教版选修1-21.2《独立性检验的基本思想及其初步应用》课件
{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)
为:
x
y
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
栏 目
总计 a+c b+d
a+b+c+d
链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
不合理的程度,由实际计算出k>6.635,说明假设不合理 接
的程度约为99%,即两个分类变量有关系这一结论成立的
可信度为99%,不合理的程度可查下表得出:
表格链接
栏 目 链 接
题型一 图形的应用
例1打鼾不仅影响别人休息,而且可能与患某种疾病有关,
图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色
区域的高度,如果两个高度相差比较明显(即a+a b和c+c d相差很大),就判 断两个分类变量之间有关系.
(2)独立性检验及其基本思想. ①独立性检验.
利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有
例2在调查的480名男士中有38名患有色盲,520名女士
中有6名患有色盲,能否在犯错误的概率不超过0.001的前
提下认为性别与患色盲有关系?
栏
目
分析:解答过程如下:
链 接
作出2×2列联表 ―→ 计算随机变量K2的值 ―→
对照临界值作出结论
解析:根据题目所给的数据作出如下的列联表:
冒记录作比较,提出假设H0:“这种血清不能起到预防感冒 的作用”.利用2×2列联表计算,得K2=3.918.经查对临界
为:
x
y
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
栏 目
总计 a+c b+d
a+b+c+d
链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
不合理的程度,由实际计算出k>6.635,说明假设不合理 接
的程度约为99%,即两个分类变量有关系这一结论成立的
可信度为99%,不合理的程度可查下表得出:
表格链接
栏 目 链 接
题型一 图形的应用
例1打鼾不仅影响别人休息,而且可能与患某种疾病有关,
图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色
区域的高度,如果两个高度相差比较明显(即a+a b和c+c d相差很大),就判 断两个分类变量之间有关系.
(2)独立性检验及其基本思想. ①独立性检验.
利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有
例2在调查的480名男士中有38名患有色盲,520名女士
中有6名患有色盲,能否在犯错误的概率不超过0.001的前
提下认为性别与患色盲有关系?
栏
目
分析:解答过程如下:
链 接
作出2×2列联表 ―→ 计算随机变量K2的值 ―→
对照临界值作出结论
解析:根据题目所给的数据作出如下的列联表:
冒记录作比较,提出假设H0:“这种血清不能起到预防感冒 的作用”.利用2×2列联表计算,得K2=3.918.经查对临界
高中数学 1.2独立性检验的基本思想及其初步应用课件 新人教A版选修1-2
首页 1 2 3
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
测一测 3
在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟 与患肺癌有关”的结论,并且在犯错误的概率不超过 0.01 的前提下认为这个 结论是成立的.下列说法中正确的是( ) A .在 100 个吸烟者中至少有 99 人患肺癌 B.如果 1 个人吸烟,那么这个人至少有 99%的概率患肺癌 C.在 100 个吸烟者中一定有患肺癌的人 D.在 100 个吸烟者中可能一个患肺癌的人也没有 解析 :K2 的观测值与临界值比较有多大把握是说两个分类变量之间的 关系 ,但不是因果关系,因此,A,B,C 均不正确,应选 D. 答案 :D
首页 1 2 3
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
3.独立性检验
定义 公式 利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独立性检 验 K
2
������ (������ ������ -������ ������ )2 = ,其中 (������ +������ )(������ +������ )(������ +������ )(������ +������ )
n=a+b+c+d.
①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误 具体 步骤 概率的上界 α.然后查表确定临界值 k0. ②利用公式计算随机变量 K2 的观测值 k. ③如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 α; 否则就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关 系”,或者在样本数据中没有发现足够证据支持结论“X 与 Y 有关系”.
【数学】1.2《独立性检验的基本思想及其初步应用》课件(新人教A版选修1—2)
a 与女生中喜欢数学课的人数比例 c 应该
ab
cd
相差很多,即 a ab
c
c d
a
ac bd
bc
d
应很大.
将上式等号右边的乘 式以 子常数因子
abcdabcd acbd
,
然后平方得
K2 abncadcabdc2bd,
其中 nabcd.因此 K2越大 ,"性别与喜 欢数学课之间"成 有立 关的 系可能.性越大
个柱体都能看到.
9000 8000 7000 6000 5000 4000 3000 2000 1000
0
不患肺癌 不吸烟
患肺癌 吸烟
图1.22
图1.2 2 是叠在一起的二维条形图,其中绿色
条高表示不患肺癌的人数,黑色条高表示患肺
癌的人数.从图中可以看出,吸烟者中患肺癌的
比例高于不吸烟者中患肺癌的比例.
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
不吸烟
吸烟
图1.23
为了更清晰地表达这个特征, 我们还可用如下的等 高条形图表示两种情况下患肺癌的比例.如图1.2 3 所示 , 在等高条形图中, 绿色的条高表示不患肺癌 的百分比;黑色的条高表示患肺癌的百分比.
所以在H
成立的条件下应有
0
a a b a c ,其中n a b c d为样本容 nn n
量,即 a b c da a ba c,即 ad bc.
因此,| ad bc | 越小,说明吸烟与患肺癌之间关
系越弱;| ad bc | 越大,说明吸烟与患肺癌之间
关系越强. 为了使不同样本容量的数据有统一的评判标
人教版高中数学选修1-2第一章第2节《独立性检验的基本思想及其初步应用》(共18张PPT)教育课件
作时间(单位:min)绘制了如图所示的茎叶图:
总计
第一种生产方式 15
5
20
第二种生产方式
5
15
20
总计
20
20
40
0.050 0.010 0.001 3.841 6.635 10.828
讲练结合
练习:某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调 查.现从高一年级学生中随机抽取 180 名学生,其中男生 105 名;在这 180 名学生中选择社 会科学类的男生、女生均为 45 名. (1)试问:从高一年级学生中随机抽取 1 人,抽到男生的概率约为多少? (2)根据抽取的 180 名学生的调查结果,完成下面的 2×2 列联表.并判断能否在犯错误的概 率不超过 0.025 的前提下认为科类的选择与性别有关?
条形图
柱形图
列联表
分类变量间的关系
独立性检验
2.条形图、柱形图、列联表:生活中,常常关心两个分类变量之间是否有关系.
抽样调查
样本
直观形象 易于观察
可靠?
列联表:列出两个分类变量的频数表称为列联表.
由于列联表中的数据是样本数据,它只是总体的代表,具有随机性.因此,需要用列 联表检验的方法提供所得结论犯错误概率的信息.
心
安
;
书
一
笔
清
远
,
盈
一
抹
恬
淡
,
浮
华
三
千
,
只
做
自
己
;
人
间
有
情
,
心
中
有
爱
,
携
一
米
高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt
与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.
由
于
k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.
人教版高中数学 选修1-2 第一章 2独立性检验的基本思想及其初步应用 (共38张PPT)教育课件
a+b c+d
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于
高二数学人教A版选修1-2课件:1.2 独立性检验的基本思想及其初步应用
1234
4.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)公式
K2=(������
+������
������ )(������
+(������������������)-(���������������+��� )���2���)(������+������),其中
知识精要
典题例解
迁移应用
某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情 紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,试利用列联表和等高条形图判断考 前心情紧张与性格类型是否有关系.
一二
知识精要
典题例解
迁移应用
解:考前心情紧张与性格类型列联表如下:
n=a+b+c+d
为样本容量.
目标导航
预习导引
1234
预习交流2 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以 上的把握认为这个结论是成立的.下列说法中正确的是( ) A.100个吸烟者中至少有99人患肺癌 B.1个人吸烟,那么这个人至少有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有 答案:D
y1
a c a+c
y2
b d b+d
总计
a+b c+d a+b+c+d
目标导航
预习导引
1234
预习交流1 下面是2×2列联表:
y1
人教A版高中数学选修1-2课件 1.2独立性检验的基本思想及其初步应用课件1
2.独立性检验与反证法的异同点 (1)思想类似:独立性检验的思想来自于统计学的假设检验思想, 它与反证法类似,假设检验和反证法都是先假设结论不成立, 然后根据是否能够推出“矛盾”来断定结论是否成立. (2)“矛盾”的含义不同:反证法中的“矛盾”是指不符合逻辑 的事件的发生;而假设检验中的“矛盾”是指不符合逻辑的小 概率事件的发生,即在结论不成立的假设下,推出利用结论成 立的小概率事件的发生.
表达式是
.
(2)在独立性检验中,选用K2作统计量,当K2满足条件 时,
在犯错误的概率不超过0.010的前提下认为事件A与B有关.
(3)式子|ad-bc|越大,K2的值就越
(填大或小).
【解析】(1)在2×2列联表中K2=
n(ad bc)2 .
(a b)(c d)(a c)(b d)
答案:K2=
【微思考】
(1)K2≥6.635是指两个分类变量有关系的概率为99%,这种理
解正确吗?
提示:不正确.K2≥6.635是指两个分类变量有关系这一结论成
立的可信度为99%而不是有关系的概率为99%. (2)等高条形图与列联表相比有何优点? 提示:更直观,更明了.
【即时练】
1.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确
认为打鼾与患心脏病之间 ( )
A.在犯错误的概率不超过0.05的前提下认为两者有关 B.约有95%的打鼾者患心脏病 C.在犯错误的概率不超过0.01的前提下认为两者有关 D.约有99%的打鼾者患心脏病
(2)(2014·执信高二检测)某食品厂为了检查甲乙两条自动包 装流水线的生产情况,随机在这两条流水线上各抽取40件产品 作为样本称出它们的质量(单位:克),质量值落在(495,510] 的产品为合格品,否则为不合格品.表1是甲流水线样本频数分 布表,图1是乙流水线样本频率分布直方图.
人教版高中数学选修1-2(A版)课件:第一章 1.2独立性检验的基本思想及其初步应用 (共92张PPT)
1、只要有坚强的意志力,就自然而然地会有能耐、机灵和知识。2、你们应该培养对自己,对自己的力量的信心,百这种信心是靠克服障碍,培养意志和锻炼意志而获得的。 3、坚强的信念能赢得强者的心,并使他们变得更坚强。4、天行健,君子以自强不息。5、有百折不挠的信念的所支持的人的意志,比那些似乎是无敌的物质力量有更强大 的威力。6、永远没有人力可以击退一个坚决强毅的希望。7、意大利有一句谚语:对一个歌手的要求,首先是嗓子、嗓子和嗓子……我现在按照这一公式拙劣地摹仿为:对 一个要成为不负于高尔基所声称的那种“人”的要求,首先是意志、意志和意志。8、执着追求并从中得到最大快乐的人,才是成功者。9、三军可夺帅也,匹夫不可夺志也。 10、发现者,尤其是一个初出茅庐的年轻发现者,需要勇气才能无视他人的冷漠和怀疑,才能坚持自己发现的意志,并把研究继续下去。11、我的本质不是我的意志的结果, 相反,我的意志是我的本质的结果,因为我先有存在,后有意志,存在可以没有意志,但是没有存在就没有意志。12、公共的利益,人类的福利,可以使可憎的工作变为可 贵,只有开明人士才能知道克服困难所需要的热忱。13、立志用功如种树然,方其根芽,犹未有干;及其有干,尚未有枝;枝而后叶,叶而后花。14、意志的出现不是对愿 望的否定,而是把愿望合并和提升到一个更高的意识水平上。15、无论是美女的歌声,还是鬓狗的狂吠,无论是鳄鱼的眼泪,还是恶狼的嚎叫,都不会使我动摇。16、即使 遇到了不幸的灾难,已经开始了的事情决不放弃。17、最可怕的敌人,就是没有坚强的信念。18、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下 去。19、意志若是屈从,不论程度如何,它都帮助了暴力。20、有了坚定的意志,就等于给双脚添了一对翅膀。21、意志坚强,就会战胜恶运。22、只有刚强的人,才有神 圣的意志,凡是战斗的人,才能取得胜利。23、卓越的人的一大优点是:在不利和艰难的遭遇里百折不挠。24、疼痛的强度,同自然赋于人类的意志和刚度成正比。25、能 够岿然不动,坚持正见,度过难关的人是不多的。26、钢是在烈火和急剧冷却里锻炼出来的,所以才能坚硬和什么也不怕。我们的一代也是这样的在斗争中和可怕的考验中 锻炼出来的,学习了不在生活面前屈服。27、只要持续地努力,不懈地奋斗,就没有征服不了的东西。28、立志不坚,终不济事。29、功崇惟志,业广惟勤。30、一个崇高 的目标,只要不渝地追求,就会居为壮举;在它纯洁的目光里,一切美德必将胜利。31、书不记,熟读可记;义不精,细思可精;惟有志不立,直是无着力处。32、您得相 信,有志者事竟成。古人告诫说:“天国是努力进入的”。只有当勉为其难地一步步向它走去的时候,才必须勉为其难地一步步走下去,才必须勉为其难地去达到它。33、 告诉你使我达到目标的奥秘吧,我唯一的力量就是我的坚持精神。34、成大事不在于力量的大小,而在于能坚持多久。35、一个人所能做的就是做出好榜样,要有勇气在风 言风语的社会中坚定地高举伦理的信念。36、即使在把眼睛盯着大地的时候,那超群的目光仍然保持着凝视太阳的能力。37、你既然期望辉煌伟大的一生,那么就应该从今 天起,以毫不动摇的决心和坚定不移的信念,凭自己的智慧和毅力,去创造你和人类的快乐。38、一个有决心的人,将会找到他的道路。39、在希望与失望的决斗中,如果 你用勇气与坚决的双手紧握着,胜利必属于希望。40、富贵不能淫,贫贱不能移,威武不能屈。41、生活的道路一旦选定,就要勇敢地走到底,决不回头。42、生命里最重 要的事情是要有个远大的目标,并借助才能与坚持来完成它。43、事业常成于坚忍,毁于急躁。我在沙漠中曾亲眼看见,匆忙的旅人落在从容的后边;疾驰的骏马落在后头, 缓步的骆驼继续向前。44、有志者事竟成。45、穷且益坚,不坠青云之志。46、意志目标不在自然中存在,而在生命中蕴藏。47、坚持意志伟大的事业需要始终不渝的精神。 48、思想的形成,首先是意志的形成。49、谁有历经千辛万苦的意志,谁就能达到任何目的。50、不作什么决定的意志不是现实的意志;无性格的人从来不做出决定。我终 生的等待,换不来你刹那的凝眸。最美的不是下雨天,是曾与你躲过雨的屋檐。征服畏惧、建立自信的最快最确实的方法,就是去做你害怕的事,直到你获得成功的经验。 真正的爱,应该超越生命的长度、心灵的宽度、灵魂的深度。生活真象这杯浓酒,不经三番五次的提炼呵,就不会这样可口!人格的完善是本,财富的确立是末能力可以慢 慢锻炼,经验可以慢慢积累,热情不可以没有。不管什么东西,总是觉得,别人的比自己的好!只有经历过地狱般的折磨,才有征服天堂的力量。只有流过血的手指才能弹 出世间的绝唱。对时间的价值没有没有深切认识的人,决不会坚韧勤勉。第一个青春是上帝给的;第二个的青春是靠自己努力的。不要因为寂寞而恋爱,孤独是为了幸福而 等待。每天清晨,当我睁开眼睛,我告诉自己:我今天快乐或是不快乐,并非由我所遭遇的事情造成的,而应该取决于我自己。我可以自己选择事情的发展方向。昨日已逝,
(新课程)高中数学《1.2 独立性检验的基本思想及其初步应用》课件 新人教A版选修1-2
(1)分类变量
变量的不同“值”表示个体所属的 不同类别 ,像这样的变 量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的 频数表 ,称为列联表.
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为 总计 a+b c+d
误区警示 因未理解P(K2≥k0)的含义而致错 【示例】 某小学对232名小学生调查中发现:180名男生中有98名 有多动症,另外82名没有多动症,52名女生中有2名有多动症, 另外50名没有多动症,用独立性检验方法判断多动症与性别 是否有关系?
[错解] 由题目数据列出如下列联表:
多动症 无多动症 总计
类别,而国籍变量则有多种类别.
2.独立性检验
定义 利用随机变量 K2 来判断“两个分类变量 有关系”的方法称为独立性检验
nad-bc2 K2= , a+bc+da+cb+d 公式 其中 n=
a+b+c+d
①根据实际问题的需要,确定容许推断“两个分类变量有 关系”犯错误概率的上界α.然后查表确定 临界值k0 . 具体 步骤 ②利用公式计算随机变量K2的 观测值k . ③如果 k≥k0 ,就推断“X与Y有关系”,这种推
k0
题型一 有关“相关的检验”
【例1】 某校对学生课外活动进行调查,结果整理成下表:
试用你所学过的知识进行分析,能否在犯错误的概率不超过 0.005的前提下,认为“喜欢体育还是文娱与性别有关系”? 体育 文娱 总计 男生 女生 总计 21 6 27 23 29 52 44 35 79
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, nad-bc2 ∴k= a+bc+da+cb+d 79×21×29-23×62 = ≈8.106. 21+23×6+29×21+6×23+29
人教A版高中数学选修1-2课件 1.2独立性检验的基本思想及其初步应用课件2
• [解析] 作列联表如下:
考前心情紧张
考前心情不紧 张
总计
性格内向 性格外向
332
213
94
381
426
594
总计 545 475 1 020
• 相应的等高条形图如图所示:
• 图中阴影部分表示考前心情紧张与考前心情 不紧张中性格内向的比例,从图中可以看出 考前紧张的样本中性格内向占的比例比考前 心情不紧张样本中性格内向占的比例高,可 以认为考前紧张与性格类型有关.
• 4.为了探究电离辐射的剂量与人体的受损程度是 否有关,用两种不同剂量的电离辐射照射小白 鼠.在照射后14天内的结果如下表所示:
死亡 存活 合计
第一种剂量 14
11
25
第二种剂量 6
19 25
合计
20 30 50
• 进行统计分析时的统计假设是________.
• [答案] 假设电离辐射的剂量与人体受损程度无 关.
• 牛刀小试
• 1.下表是一个2×2列联表:
y1
y2
x1
a 21
x2
2 25
总计 b 46
• 则表中a、b处的值分别为(
总计 73 27 100 )
• A.94,96
B.52,50
• C.52,54 D.54,52
• [答案] C
[解析] 由aa+ +221==b73 ,得ab= =5524 .
• 思维导航
• 日常生活及生产、科研中,经常需要考虑某 个量的变化是否由某种因素引起,与这种因 素的相关程度有多大?怎样判断呢?
• 新知导学
• 1.分类变量
• 分类变量也称为属性变量或定性变量,分类 变量的取值是离散的,其不同的取值仅表示 个体所属的__不__同_类__别___,除了起分类作用外, 无其他含义,有时也把分类变量的不同取值 用数字表示,但这些数字只起___区_分___作用, 无数值意义.
考前心情紧张
考前心情不紧 张
总计
性格内向 性格外向
332
213
94
381
426
594
总计 545 475 1 020
• 相应的等高条形图如图所示:
• 图中阴影部分表示考前心情紧张与考前心情 不紧张中性格内向的比例,从图中可以看出 考前紧张的样本中性格内向占的比例比考前 心情不紧张样本中性格内向占的比例高,可 以认为考前紧张与性格类型有关.
• 4.为了探究电离辐射的剂量与人体的受损程度是 否有关,用两种不同剂量的电离辐射照射小白 鼠.在照射后14天内的结果如下表所示:
死亡 存活 合计
第一种剂量 14
11
25
第二种剂量 6
19 25
合计
20 30 50
• 进行统计分析时的统计假设是________.
• [答案] 假设电离辐射的剂量与人体受损程度无 关.
• 牛刀小试
• 1.下表是一个2×2列联表:
y1
y2
x1
a 21
x2
2 25
总计 b 46
• 则表中a、b处的值分别为(
总计 73 27 100 )
• A.94,96
B.52,50
• C.52,54 D.54,52
• [答案] C
[解析] 由aa+ +221==b73 ,得ab= =5524 .
• 思维导航
• 日常生活及生产、科研中,经常需要考虑某 个量的变化是否由某种因素引起,与这种因 素的相关程度有多大?怎样判断呢?
• 新知导学
• 1.分类变量
• 分类变量也称为属性变量或定性变量,分类 变量的取值是离散的,其不同的取值仅表示 个体所属的__不__同_类__别___,除了起分类作用外, 无其他含义,有时也把分类变量的不同取值 用数字表示,但这些数字只起___区_分___作用, 无数值意义.
人教A版选修1-2《1.2独立性检验的基本思想及其初步应用》课件
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.01 6.635
解答
反思与感悟
准确读取频率分布直方图中的数据是解题的关键 .求概率时列举基本事件 一定要做到不重不漏,此处极容易出错.
跟踪训练 3
为调查某地区老年人是否需要志愿者提供帮助,用简单随
机抽样方法从该地区调查了500位老年人,统计结果如下表:
数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解答
反思与感悟
(1)等高条形图实质上是列联表中的数据的频率特征.
(2)由于高度相等的条形分别用两种不同颜色表示,其频率差异更能直观
地表现出来.
跟踪训练 1
网络对现代人的生活影响较大,尤其是对青少年,为了解
网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随
(1)根据已知条件完成下面的 2×2列联表,据此资料你是否认为“体育迷”
与性别有关?
非体育迷 体育迷 总计
男 女
总计
解答
(2)将日均收看该体育节目不低于 50分钟的观众称为 “超级体育迷”,已 知“超级体育迷 ”中有2名女性,若从“超级体育迷 ”中任意选取2人, 求至少有1名女性观众的概率.
2 n ad - bc 附:K2= ,其中 n=a+b+c+d 为样本容量. a+bc+da+cb+d
高条形图展示列联表数据的
频率 特征 .
a c 2.如果通过计算或等高条形图发现 和 相差很大,就判断两个分类 a+b c+d 变量之间 有关系 .
知识点三
独立性检验
1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立
性检验.
nad-bc2 2.K2= a+bc+da+cb+d .
1.2 独立性检验的基本思想及其初步应用 课件(人教A版选修1-2)
栏目 导引
第一章 统计案例
解:作列联表如下:
性格内向 性格外向
考前心情紧张
332
213
考前心情不紧张
94
381
总计
426
594
相应的等高条形图如图所示:
图中阴影部分表示考前心情
紧张与考前心情不紧张中性
格内向的比例,从图中可以
总计 545 475 1020
栏目 导引
第一章 统计案例
看出考前紧张的样本中性格内向占的比例比考 前心情不紧张样本中性格内向占的比例高,可 以认为考前紧张与性格类型有关.
栏目 导引
第一章 统计案例
变式训练 1.某学校心理教研室为了做好2012年高考前的 心理辅导,对高三学生作了一项调查发现: 在平时的模拟考试中,性格内向的学生426人 中有332人在考前心情紧张,性格外向的学生 594人中有213人在考前心情紧张,作出等高 条形图,利用图形判断考前心情紧张与性格 类型是否有关系.
栏目 导引
第一章 统计案例
x1 x2
总计
y1 a c
a+c
y2 b d
b+d
总计 a+b c+d
a+b+c+d
(3)与表格相比,图形更能直观地反映出两个分类变 量间是否相互影响,常用___等__高__条__形__图____展示列联 表数据的频率特征.
栏目 导引
第一章 统计案例
想一想 1.分类变量的值就是指的一些具体实数吗? 提示:这里的“变量”和“值”都应作为广义的 变量和值来理解,只要不属于同种类别都是变量 和值,并不一定是取具体的数值,如:男、女; 上、下;左、右等.
第一章 统计案例
1.2 独立性检验的基本思想 及其初步应用
栏目 导引
第一章 统计案例
解:作列联表如下:
性格内向 性格外向
考前心情紧张
332
213
考前心情不紧张
94
381
总计
426
594
相应的等高条形图如图所示:
图中阴影部分表示考前心情
紧张与考前心情不紧张中性
格内向的比例,从图中可以
总计 545 475 1020
栏目 导引
第一章 统计案例
看出考前紧张的样本中性格内向占的比例比考 前心情不紧张样本中性格内向占的比例高,可 以认为考前紧张与性格类型有关.
栏目 导引
第一章 统计案例
变式训练 1.某学校心理教研室为了做好2012年高考前的 心理辅导,对高三学生作了一项调查发现: 在平时的模拟考试中,性格内向的学生426人 中有332人在考前心情紧张,性格外向的学生 594人中有213人在考前心情紧张,作出等高 条形图,利用图形判断考前心情紧张与性格 类型是否有关系.
栏目 导引
第一章 统计案例
x1 x2
总计
y1 a c
a+c
y2 b d
b+d
总计 a+b c+d
a+b+c+d
(3)与表格相比,图形更能直观地反映出两个分类变 量间是否相互影响,常用___等__高__条__形__图____展示列联 表数据的频率特征.
栏目 导引
第一章 统计案例
想一想 1.分类变量的值就是指的一些具体实数吗? 提示:这里的“变量”和“值”都应作为广义的 变量和值来理解,只要不属于同种类别都是变量 和值,并不一定是取具体的数值,如:男、女; 上、下;左、右等.
第一章 统计案例
1.2 独立性检验的基本思想 及其初步应用
栏目 导引
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
看到这个课题,你能想到什么?
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查, 烟是否有关,进行了一次抽样调查,共调查了 515个成年人 其中吸烟者220 个成年人, 220人 515个成年人,其中吸烟者220人,不吸烟者 295人 295人。 调查结果:吸烟的220人中有37人患呼吸道疾 调查结果:吸烟的220人中有37人患呼吸道疾 220人中有37 183人未患呼吸道疾病 不吸烟的295 人未患呼吸道疾病; 295人中 病,183人未患呼吸道疾病;不吸烟的295人中 21人患病 274人未患病 人患病, 人未患病。 有21人患病,274人未患病。
1.2《独立性检验的 基本思想及其初步应用》
教学目标
• 1理解独立性检验的基本思想 • 2、会从列联表、柱形图、条形图直观判断吸 烟与患癌有关。 • 3、了解随机变量K2的含义。 • 理解独立性检验的基本思想及实施步骤。 理解独立性检验的基本思想及实施步骤。 • 教学重点 教学重点:理解独立性检验的基本思想。独 立性检验的步骤。 • 教学难点;1、理解独立性检验的基本思想; 教学难点 2、了解随机变量K2的含义;独立性检验的步 骤。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
数据整理
患病 吸烟 不吸烟 合计 37 21 58 未患病 183 274 457 合计 220 295 515
问题:判断的标准是什么?
吸烟与不吸烟,患病的可能性的大小是否有差异?
频率估计概率
患 病 吸 烟 不吸烟 16.82% 7.12% 未患病 83.18% 92.88% 合 计(n) 100%(220) 100%(295)
不吸烟也不患病的人数约为 n• •
怎样估计实际观测值与理论估计值的误差?
采用如下的量(称为χ2 统计量)来刻画这个差异:
+
+
+
化简得 χ2 =
χ2统计量
χ2 =11.8634
解决问题的思路
• • • • • 思路:反证法思想 (1)假设:H0:患病与吸烟无关 即 P(A)P(B)= P(AB) (2)在 H0成立的条件下进行推理 (3)如果实际观测值与由(2)推出的值 相差不大,则可以认为这些差异是由随机 误差造成的,假设H0不能被否定;否则, 假设H0不能被接受
通过图形直观判断 不患病 比例
患病 比例
解决问题:直观方法
吸烟的患病率 不吸烟的患病率
37/220 ≈16.82% 21/295 ≈7.12%
根据统计分析的思想,用频率估计概率 可知,吸烟者与不吸烟者患病的可能性 存在差异。 你能有多大把握认为“患病与吸烟有关”呢?
有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。 笛卡尔
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
一般地,对于两个研究对象Ⅰ 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类 取值,即类A 如吸烟与不吸烟); );Ⅱ 取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类 取值,即类1 如患病与不患病)。 )。于是得到 取值,即类1和2(如患病与不患病)。于是得到 下列联表所示的抽样数据: 下列联表所示的抽样数据:
1、所学的知识; 2、解决问题的思路; 3、假设检验原理。
193 × (58 × 31 − 40 × 64) 2 χ2 = ≈ 1.3896 < 2.706 122 × 71× 98 × 95
χ 2 > 1.3896 的概率大于10%, 当H0成立时,
这个概率比较大,所以根据目前的调查数 据,不能否定假设H0,即不能作出药的效 果与给药方式有关的结论。
小结:
例2:为研究不同的给药方式(口服与注射)和 药的效果(有效和无效)是否有关,进行了相 应的抽样调查,调查的结果列在下表中,根据 所选择的193个病人的数据,能否作出药的效果 与给药方式有关的结论? 有效 口服 注射 合计 58 64 122 无效 40 31 71 合计 98 95 193
解:提出假设 H0:药的效果与给药方式无关系。 根据列联表中的数据可以求出:
患病 吸烟 不吸烟 合计 37 21 58
未患病 183 274 457
合计 220 295 515
一般化:
P(A)、P(B)不知道,怎么办?
频率估计概率
P(ቤተ መጻሕፍቲ ባይዱ) ≈ P(B) ≈ P(AB) ≈ •
由此估计: 吸烟且患病的人数约为
n•
•
同理,吸烟但不患病的人数约为 n• •
不吸烟但患病的人数约为 n• •
卡方临界值表: 卡方临界值表:
P( χ ≥ x0 )
2
0.5 0.4 0.25 0.15 0.1 0.05 0.025 0.01 0.005 0.001 0.4 0.7 1.32 2.07 2.7 3.84 5.024 6.63 7.879 10.82 55 08 3 2 06 1 5 8
xo
则有99.9%的把握认为“ 99.9%的把握认为 有关系” (1)若观测值χ2>10.828. 则有99.9%的把握认为“Ⅰ与Ⅱ有关系”; 1)若观测值χ 若观测值 99%的把握认为 有关系” (2)若观测值χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”; 2)若观测值χ 6.635,则有99%的把握认为“ 若观测值 有关系” (3)若观测值χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”; 3)若观测值χ 2.706,则有90%的把握认为“ 若观测值 则 90%的把握认为 (4)若观测值χ2<2.706,则没有充分的证据显示“Ⅰ与Ⅱ有关 4)若观测值χ 2.706,则没有充分的证据显示“ 若观测值 则 但也不能作出结论“ 成立” 系”,但也不能作出结论“H0成立”, 没有关系。 即Ⅰ与Ⅱ没有关系。
能否用数量来刻画“有关” 能否用数量来刻画“有关”程度
问题的数学表述
• “患呼吸道疾病与吸烟有关”这句话是什么意思? 患呼吸道疾病与吸烟有关”这句话是什么意思? 患呼吸道疾病与吸烟有关
• “某成年人吸烟”记为事件 , “某成年人患病”记为事 记为事件A
件B
• 这句话的意思是:事件 与事件 有关。 这句话的意思是:事件A与事件 有关。 与事件B有关 • 问题的另一面是:事件A与事件 独立。 问题的另一面是:事件 与事件B独立。 与事件 独立
(3)查对临界值,作出判断。 查对临界值,作出判断。 由于抽样的随机性, 由于抽样的随机性,由样本得到的推断 χ 2 进行 有可能正确,也有可能错误。 有可能正确,也有可能错误。利用 独立性检验, 独立性检验,可以对推断的正确性的概率作 出估计,样本量n越大,估计越准确。 出估计,样本量n越大,估计越准确。
类1 类A 类B
总计 a c a+c
类2
b d b+d
总计 a+b c+d a+b+c+d
要推断“ 要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行: 有关系” 可按下面的步骤进行: 提出假设H 没有关系; (1)提出假设H0 :Ⅰ和Ⅱ没有关系;
χ2的值; 根据2 (2)根据2× 2列联表与公式计算 的值;