独立性检验(文科)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题1:判断的标准是什么?
吸烟与不吸烟,患病的可能性的大小是否有差异? 说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大
问题2:差异大到什么程度才能作出 “吸烟与患病有关”的判断?
能否用数量刻画出“有关”的程 度?
假设H0:吸烟和患病之间没有关系 即H0:P(AB)=P(A)P(B) 其中A为某人吸烟,B为某人患病 列出2×2列联表
变式、把一颗质地均匀的骰子任意的掷 一次,设事件A=“掷出奇数点”, B=“掷出3的倍数点”,试分析事件A 与B的关系 思考:A 与B的关系
件A与B独立时, A 与B 也独立。
一般情况下,当事
事件A 与B,A与B ,
总结:事件A、B之间没有联系,互不影响, 即A是否发生对B发生的概率没有影响,是 判断A、B相互独立的依据。在实际问题中, 我们常根据实际问题的条件,利用直觉来 判断事件间的“相互独立性”,
变式:为研究不同的给药方式(口服与注射)和药的 效果(有效与无效)是否有关,进行了相应的抽样调 查,调查的结果列在表中,根据所选择的193个病人 的数据,能否作出药的效果和给药方式有关的结论? 有效 口服 注射 合计
解:
2
无效 40 31 71
2
合计 98 95 193
2
58 64 122
n31 (n n22 n12n21 ) 193 64 40 2 58 11 1.3896 122 71 98 95 n1 n2 n1n 2
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例 2. 在 500 人身上试验某种血清预防感冒作用,把他们 一年中的感冒记录与另外 500 名未用血清的人的感冒记 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 未感冒 使用血清 未使用血清 合计
试判断下列各对事件是否相互独立:
wenku.baidu.com
(1) 抛一枚硬币,抛两次时,“第一次掷出正 面”与“第二次掷出正面”。 (2) “甲厂的产品是次品”与“乙厂的产品是 次 品”。 (3) “甲射击一次击中目标”与“乙射击一次 击中目标”。
三、典例分析 例1、通过调查发现,某班学生患近视的 概率为0.4,现随机抽取该班的2名同学 进行体检,求他们都近视的概率。
解:
感冒 242 284 526
2
合计 500 500 1000
258 216 474
n( n n n n ) 因为7.075>6.635,故有 的把握认为该血清能起到预防感冒 n199% n 2 n1n 2
的作用。
1000258 284 242 2162 2 7.075 2 474 526 500 11 22 500 12 21
因1.3896<3.841,故不能作出药的效果与给药方式有关的结论。
课后练习: 课本第8页习题1-1A 3、 4 作业: 课本第9页习题1-1A
5、
一、概念引入
问题:把一颗质地均匀的骰子任意的掷
一次,设事件A=“掷出偶数点”, B=“掷出3的倍数点”,试分析事件A 与B的关系
二、概念展开
一般地,对于两个事件A,B,如果有 P(AB)=P(A)P(B) 这时就称事件A与B互相独立,简称A与B 独立。 其中,事件A,B同时发生记作A∩B,简记作 AB。
c
)
C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,
是指有5%的可能性使得推理出现错误 D、以上三种说法都不对
独立性检验
吸烟与呼吸道疾病列联表 患病 不患病 总计 吸烟 37 183 220 不吸烟 总计
通过公式计算
2
21 58
274 457
295 515
n( n n n n ) 11.8634 220 295 58 457 n1 n2 n1n 2
练习:某人看管三台机器,一天内不需 要维护的概率分别为0.9,0.8,0.85, 问:三台都需要维护与都不需要维护的 概率分别是多少?
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查, 共调查了515个成年人,其中吸烟者 220人,不吸烟者295人,调查结果是: 吸烟的220人中37人患病, 183人不患 病;不吸烟的295人中21人患病, 274 人不患病。
2
作为检验在多大程度上可以认为“两个变量 有关系”的标准 。
n( n11 n22 n12 n21 ) n1 n2 n1 n 2
2
2
通过对 统计量分布的研究,已
2 2
经得到
两个临界值: 3.841和6.635.当 3.841时, 有95%的把握说事件 A和B有关;当
6.635时,有 99%的把握说事件 A和B
本节研究的是两个分类变量的独立性检验问题。
为了研究这个问题,我们将上述问题用下表表示:
2×2列联 表
吸烟 不吸烟 总计
患病 37 21 58
不患病 183 274 457
总计 220 295 515
在不吸烟者中患病的比重是 7.12% 在吸烟者中患病的比重是 16.82% 思考:上述结论能说明吸烟与患病有关吗? 能有多大把握认为吸烟与患病有关呢?
2
有关;当 3.841时,认为 A与B无关。
2
在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是
(
A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺 病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系 时,我们说某人吸烟,那么他有99%的可能患肺病
根据这些数据能否断定:患肺癌与 吸烟有关吗?
两种变量:
定量变量:体重、身高、温度、考试成绩等等。 变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量的之间是否有关系
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、 变量 相关指数R 2、残差分析) 分类变量——独立性检验
若H0成立
a c ≈ , a+b c+d
a c + d ≈c a + b ,
ad bc
独立性检验
ad bc 0.
ad - bc 越小,说明吸烟与患肺癌之间的关系越弱, ad - bc 越大,说明吸烟与患肺癌之间的关系越强
引入一个随机变量:卡方统计量
2
nad bc a b c d a c b d 其中n a b c d
2
2
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患肺癌有关 结论的可靠 程度如何?
H0: 吸烟和患肺癌之间没有关系
吸烟 不吸烟 总计
吸烟与肺癌列联表 患肺癌 不患肺癌 总计 a b a+b c d c+d a+c b+d a+b+c+d
a 吸烟的人中患肺癌的比例: a b c 不吸烟的人中患肺癌的比例: cd
2 251537 274 11 22 12 21 183 21
2
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0 :Ⅰ和Ⅱ没有关系; (2)根据2× 2列表与公式计算 的值;
2
(3)查对临界值,作出判断。
由于抽样的随机性,由样本得到的推断 2 有可能正确,也有可能错误。利用 进 行独立性检验,可以对推断的正确性的概 率作出估计,样本量n越大,估计越准确。
患病 吸烟
不吸烟 总计
n11
不患病 n12
n22 n+2
总计 n1+
n2+ n
n21 n+1
其中n=n11+n12+n21+n22
怎样描述实际观测值与估计值的差异呢?
统计学中采用
2 ( 观测值 预期值 ) 用卡方统计量: 2 预期值 来刻画实际观测值与估计值的差异.
即
n(n11n22 n12n21 ) n1 n2 n1n 2