1.2独立性检验的基本思想及其初步应用(学、教案)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 2 独立性检验的基本思想及其初步应用

课前预习学案

一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本

思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 二、预习内容

1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.

温度/x C

21 23 25 27 29 32 35 产卵数/y 个 7

11

21 24 66

115

325

(学生描述步骤,教师演示)

2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.

课内探究学案

一、学习要求:

通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用

学习重点:

对独立性检验的基本思想的理解.

学习难点:

独立性检验的基本思想的应用.

二、学习过程:

知识点详解

知识点一:分类变量

对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

知识点二:列联表

为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人):

吸烟与患肺癌列联表

不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计

9874

91

9965

像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验

这种利用随机变量K 2

来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

知识点四:判断结论成立的可能性的步骤

一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样

501001502002503003500

10203040

温度

产卵数

本频数列联表(称为2×2列联表)为:

若要推断的论述为

H1:“X与Y有关系”,

可以按如下步骤判断结论H1成立的可能性:

(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.

①在三维柱形图中,主对角线上两个柱形高度的乘积xd与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.

②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例

a a+

b ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例

c

c+d

.两个比例的

值相差越大,H1成立的可能性就越大.

(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

给出的检验随机变量K2的值k,其值越大,说明“X 与Y有关系”成立的可能性越大.当得到的观测数据x,b,c,d都不小于5时,可以通过查

五、几个典型例题:

例1 三维柱形图中柱的高度表示的是(A)

A.各分类变量的频数B.分类变量的百分比

C.分类变量的样本数D.分类变量的具体值

例2 分类变量X和Y的列联表如下

X.xd-bc越小,说明X和Y关系越弱

B.xd-bc越大,说明X和Y关系越强

C.(xd-bc)2越大,说明X和Y关系越强

D.(xd-bc)2越接近于0 ,说明X和Y关系越强

例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,不定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.

解:根据题目所给数据建立如下列联表

根据列联表中的数据得到K 2

=170×(22×42-18×88)

110×60×40×130

≈2.158<2.706

因此没有充分的证据显示“性别与态度有关”.

例 4 打鼾不仅影响别人休息,而且可能与患某种病症有关.下表是一次调查所得的数

解:根据列联表中数据,得到,

K 2

=1633×(30×1355-224×24)2

1379×254×54×1579

=68.033.

因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关

课后练习与提高

(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy =e x .)

相关文档
最新文档