1.2独立性检验的基本思想及其初步应用(学、教案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2 独立性检验的基本思想及其初步应用
课前预习学案
一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本
思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 二、预习内容
1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.
温度/x C
21 23 25 27 29 32 35 产卵数/y 个 7
11
21 24 66
115
325
(学生描述步骤,教师演示)
2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.
课内探究学案
一、学习要求:
通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用
学习重点:
对独立性检验的基本思想的理解.
学习难点:
独立性检验的基本思想的应用.
二、学习过程:
知识点详解
知识点一:分类变量
对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
知识点二:列联表
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人):
吸烟与患肺癌列联表
不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计
9874
91
9965
像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验
这种利用随机变量K 2
来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
知识点四:判断结论成立的可能性的步骤
一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样
501001502002503003500
10203040
温度
产卵数
本频数列联表(称为2×2列联表)为:
若要推断的论述为
H1:“X与Y有关系”,
可以按如下步骤判断结论H1成立的可能性:
(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.
①在三维柱形图中,主对角线上两个柱形高度的乘积xd与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.
②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例
a a+
b ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例
c
c+d
.两个比例的
值相差越大,H1成立的可能性就越大.
(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
给出的检验随机变量K2的值k,其值越大,说明“X 与Y有关系”成立的可能性越大.当得到的观测数据x,b,c,d都不小于5时,可以通过查
五、几个典型例题:
例1 三维柱形图中柱的高度表示的是(A)
A.各分类变量的频数B.分类变量的百分比
C.分类变量的样本数D.分类变量的具体值
例2 分类变量X和Y的列联表如下
X.xd-bc越小,说明X和Y关系越弱
B.xd-bc越大,说明X和Y关系越强
C.(xd-bc)2越大,说明X和Y关系越强
D.(xd-bc)2越接近于0 ,说明X和Y关系越强
例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,不定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
解:根据题目所给数据建立如下列联表
根据列联表中的数据得到K 2
=170×(22×42-18×88)
110×60×40×130
≈2.158<2.706
因此没有充分的证据显示“性别与态度有关”.
例 4 打鼾不仅影响别人休息,而且可能与患某种病症有关.下表是一次调查所得的数
解:根据列联表中数据,得到,
K 2
=1633×(30×1355-224×24)2
1379×254×54×1579
=68.033.
因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关
课后练习与提高
(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy =e x .)