高中《第一章统计案例 独立性检验的基本思想及其初步应用》1116PPT课件 一等奖

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有什么优缺点? 答 优点:比较直观.
缺点:缺少精确性和可靠性. 问题 2 随机变量 K2 有何作用? 答 利用随机变量 K2=a+bcn+add-ab+cc2b+d(其中 n=a+b +c+d 为样本容量)可以来确定在多大程度上可以认为“两个 分类变量有关系”.
名师PPT课件
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人):
k 9965(7775 49 42 2099)2 56.632. 7817 2148 9874 91
如何看待这个值呢?
名师PPT课件
在H0成立P的(K情2 况 6下.63,5)统 0计.01学. 家研究出如(2下)的概率:
即在H0成立的情况下,K2的值大于6.635的概率非常小,近 似于0.01。而现在K2的值56.632远大于6.635, 故它是小概率事件, 所以我们认为H0 是不成立的 .但这种判断会犯错误,犯错误的 概率不会超过0.01,即我们有99%的把握认为H0 是不成立的!(即 吸烟与患肺癌有关系)
为此先假设 H0:吸烟与患肺癌没有关系, 看看能够推出什么样的结论。
为了统一评判名师P标PT课准件 ,我们构造一个随机变量
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d ) (1)
其中n a b c d为样本容量。
因此:若 H0成立,则K2应很小。
利用公式(1)计算得到 K2 的观测值为
如果吸烟与患病没有关系,那么在吸烟中患病和不患
病相应的比例差不多
a
c
a b c d a(c d) c(a b) ad bc 0
好好学习,天天向上! 优秀比赛PPT课件,适合公开课!

一般地,假设两个分类变量 名师PPT课件
X

Y,它们的值域分别为{x1,
x2}和{y1,y2},列出两个变量的频数表,称为列联表(如下图)
表1-9 吸烟与患肺癌列联表
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
那么吸烟是否对患肺癌有影响?
名师PPT课件
上面我们通过分析数据和图形,得到的直观印 象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢?
数据整理
名师PPT课件
吸烟 不吸烟
合计
患病
37 21 58
未患病
183 274 457
合计
220 295 515
问题:判断的标准是什么?
样本频数列联 表(也称为2×2 列联表)
名师PPT课件
吸烟与不吸烟,患病的可能性的大小是否有 差异?
频率估计概率
患 病 未患病 合 计(n)
吸 烟 16.82% 83.18% 100%(220) 不吸烟 7.12% 92.88% 100%(295)
案 例:某医疗机构为了了解呼吸道疾病与吸烟是否有 关,进行了一次抽样调查,共调查了515个成年人,其 中吸烟者220人,不吸烟者295人。
调查结果:吸烟的220人中有37人患呼吸道疾病,183人 未患呼吸道疾病;不吸烟的295人中有21人患病,274人 未患病。
根据这些数据,能否断定:患呼吸道疾病与吸 烟有关?
(3)如果k>2.706,就有90%的把握认为“X与Y有关系”;
(4)如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”。
例1.秃头与患名师心PPT脏课件病
在某医院,因为患心脏病而住院的665名男性病人中, 有214人秃顶;而另外772名不是因为患心脏病而住院的男 性病人中有175人秃顶。分别利用图形和独立性检验方法判 断秃顶与患心脏病是否有关系?你所得的结论在什么范围 内有效?
“优秀比赛PPT课件,适合公开课!”
名师PPT课件
1.2-1独立性检验的基本思想及 其初步应用
授课教师:李新安
名师PPT课件
1.分类变量和列联表
(1)分类变量 变量的不同“值”表示个体所属的 不同类别 ,像这样的变
量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的
称为列联表.
名师PPT课件
y1 y2
总计
x1 a b
a+b
x2 c d
c+d
总计 a+c b+d a+b+c+d
|ad-bc|越小,说明两个分类变量 x、y 之间的关系越弱;
|ad-bc|越大,说明两个分类变量 x、y 之间的关系越强.
探究点二 独立性名师检PPT验课件 问题 1 利用列联表及等高条形图判断两个分类变量是否有关
其次,在假设下,计算构造的随机变量K2,如果有观 测数据计算得到的K2≥k0,则我们有[1-P(K2≥k0)]*100%把 握说明假设不合理(即两个分类变量有关系)。 当K2≤k0,则我们没有[1-P(K2≥k0)]*100%把握说明假设不 合理。
具体作法是: 名师PPT课件
根据观测数据计算随机变量K2的值k,其值越大,说 明“X与Y有关系”成立的可能性越大。可以通过查阅 下表(表1-12)来确定断言“X与Y有关系”的可信程 表度1。-12
P(K 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例:
(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系”; (2)如果k>6.635,就有99%的把握认为“X与Y有关系”;
独立性检验的定义:
上面这种利用随机变量K2来确定在多大程度上可以认 为“两个分类变量有关系”的方法称为两个分类变量 的独立性检验。
独立性检名验师PP的T课件 基本思想:
类似于数学上的反证法,要确认“两个分类变量有关系”
这一结论成立的可信程度,
首先,假设该结论不成立,即假设结论“两个分类变量 没有关系”成立。
通过图形直观名师判PPT断课件
不患病
比例


患病

比例


名师PPT课件
解决问题:直观方法
吸烟的患病率 37/220 16.82%
不吸烟的患病率 21/295 7.12%
根据统计分析的思想,用频率估计概率 可知,吸烟者与不吸烟者患病的可能性 存在差异。
你能有多大把握认为“患病与吸烟有关”呢?
一般化: 名师PPT课件
相关文档
最新文档