高中选修1-2 回归分析和独立性检验 知识总结与联系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
22211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧
---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例
【基础知识】
一、回归分析
1.两个变量的线性相关:判断是否线性相关 ①用散点图
(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r
(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱, $
n
i i
x y nx y
r -•=
∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:
两个变量具有线性相关关系,数据收集如下:
可用最小二乘法得到回归方程ˆy bx a =+,其中 】
3.回归分析的基本思想及其初步应用
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报. (2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。 4、回归效果的刻画:
用相关指数2R 来刻画回归的效果,公式是2
212
1
()1()
n i i i n
i
i y y R y y ==-=-
-∑∑
2R 的值越大,说明残差平方和越小,也就是说模型拟合效果好
二.独立性检验的基本思想及其初步应用
:
题型一相关关系的判断
【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正
确的是()
A.r2 ) B. r4 C. r4 D. r2 【变式1】根据两个变量x,y之间的观测数据画成 散点图如图所示,这两个变量是否具有线性相关关系 ________(填“是”与“否”). 】 题型二 线性回归方程 【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组 y 关于商品的价格x 的线性回归方程为________. (参考公式:b ^= ,a ^=y -b ^ x ) { 【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1 C .y =88+1 2x D .y =176 . 题型三 独立性检验 【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还 走斑马线 20 30 50 / 总计 60 50 110 由K 2=n ad -dc 2a +b c +d a +c b +d , 算得K 2=110×40×30-20×20 260×50×60×50≈. 附表: P (K 2≥k ) - k A. 有99%以上的把握认为“选择过马路的方式与性别有关” B. 有99%以上的把握认为“选择过马路的方式与性别无关” C. 在犯错误概率不超过%的前提下,认为“选择过马路的方式与性别有关” D. 在犯错误概率不超过%的前提下,认为“选择过马路的方式与性别无关 、 【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[,的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺分组 [, 29.90) [, 29.94) [, 29.98) [, . 30.02) [, 30.06) [, 30.10) [, 30.14) 频数 12 63 ` 86 182 92 61 4 分组 [, 29.90) [, < 29.94) [, 29.98) [, 30.02) [, 30.06) [, 30.10) [, … 30. 14) 频数 29 71 85 159 76 62 18 " (2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生 甲 厂 乙 厂 合 计 优质品 非优质品 【 合 计 附 错误!, ¥ P (K 2≥k ) ( k 巩固提高 1.下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; … ②设有一个回归方程y ^ =3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^ 必过(x ,y ); ④在一个2×2列联表中,由计算得K 2=,则有99%的把握确认这两个变量间有关系; 其中错误的个数是( ) A. 0 B. 1 C. 2 D. 3 2.已知回归直线斜率的估计值为,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=+4 B. y ^=+5 C. y ^=+ D. y ^ =+ 3. 从所得的散点图分析可知:y 与x 线性相关,且y =+a ,则a =( ) A. B. C. D. 4. 根据上表可得回归直线方程:y =+a ,据此模型预报身高为172 cm 的高三男生的体重为( ) A. kg B. kg * C. kg D. kg 5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^ =+.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. 6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( ) A .k≥ B .k < C .k≥ D .k < 7.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数