变量间的相关关系及统计案例复习ppt课件(自制) 通用
高考数学一轮复习人教B版理 10.4变量间的相关关系、统计案例 名师制作优质课件(32张)

������
∑ ������2 ������ -������������
2
,
������ = ������- ������ ������ .
������ ������ =1
^
(3)通过求 Q= ∑ (yi-a-bxi)2 的最小值而得到回归直线的方法,即 使得样本数据的点到回归直线的距离的平方和最小的方法叫做最 小二乘法.
合计 n1+ n2+ n
n11 n21 n+1
������ 1+ ������ 2+ ������ +1 ������ +2
������ (������ 11 ������ 22 -������ 12 ������ 21 )2
(其中 n=n11+n12+n21+n22 为样本容量).
(3)用X2的大小可以决定是否拒绝原来的统计假设H0,若X2值较大, 就拒绝H0,即拒绝事件A与B无关.
2 ������ 2
������
.
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对 值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常 当|r|大于r0.05时,表明有95%的把握认为两个变量之间具有线性相 关关系. (5)回归分析模型拟合效果的判断
^^
^ ^
������ = ������=1 ������
∑ (������������ -������)(������������ -������)
������=1
∑ (������������ -������)2
变量间的相关关系与统计案例 PPT

(2)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,就 称这两个变量之间具有线性相关关系,这条直线叫作回归直 线.
2. 回归分析
(1)最小二乘法
题型三 线性回归方程 【例3】 为了研究某种新上市产品的广告费与销售额之间的 关系,某统计局随机选取5家销售公司,由营业报告中查出其上 年度的广告费x(单位:万元)与销售额y(单位:百万元)之间有如 下的对应数据:
(1)以x为解释变量,y为预报变量,作出散点图; (2)求y与x之间的回归方程. 解析: (1)散点图如图所示:
解析:A中显然任给一个x都有唯一确定的y和它对应,是一种函数 关系;B也是一种函数关系;C中从散点图中可看出所有点看上去 都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关 的. 答案: C
3. (原创题)经研究表明,学生的体重y(单位:kg)与身高x(单位: cm)有很强的线性相关关系,其回归方程为y=0.75x-68.2,如果一 个学生的身高为170 cm,则他的体重( )
A.90% B.95% C. 97.5% D. 99.9%
解析:根据题中的等高条形图,由于用药的患者50人,因
此,在用药的患者中感冒病好的人数为50* 8
10
=40;在未用药的患者中感冒病好的人数为20*
3
10
=6.于是列联表如下
由K2= 7040146102
50204624
≈15.85>10.828. 因此,有99.9%的把握认为感冒病好与用药有关,故选D.
第3课时 变量间的相关关系、统计案例 ppt

• A.(2,1.8) • C.(3,2.5)
B.(4,3.2) D.(5,3.8)
解析: x =3, y =2.5,样本点中心为(3,2.5),回归直线过样本点 中心. 答案:C
• 4.独立性检验
• (1)分类变量:变量的不同“值”表不示同类个别体
所属的
,像这类变量称为分类变量.
• (2)列联表:列出两个分频类数变表 量的
,
称为列联表.假设有两个分类变量X和Y,它
们的可能取值分别为{x1,x2}和{y1,y2},其样 本频数列联表(称为2×2列联表)为
•
• 2×2列联表
y1 y2 总计 x1 a b a+b x2 c d c+d 构造一个随总机计变量aK+2=ca+bb+cnd+add-a+a+b+dcbc2 +b+c d,其中
• 答案:(1)D (2)D
• 题型二 线性回归分析
•
(2023·浙江宁波一模)以下是某地
搜集到的新房屋的销售价格y和房屋的面积x
的数据:
房屋面积 (m2)
115 110 80
135
10 5
销售价格 (万元)
24. 8
21. 6
18. 4
29. 2
22
• (1)画出数据对应的散点图;
• (2)求线性回归方程,并在散点图中加上回 归直线;
n= a+b+c+d
为样本容量.
• (3)独立性检验
• 利用随机K变2 量 来判断“两有个关分系类变量 ”的方法称为独立性检验.
• 对点演练
• (1)为了评价某个电视栏目的改革效果,在 改革前后分别从居民点抽取了100位居民进 行调查,经过计算K2≈0.99,根据这一数据 分析,下列说法正确的是
变量间的相关关系-PPT课件

.
8
二、合作探索,直观感知
• 问题探究:
在一次对人体年龄关系的研究中,研究人员获得了一 组样本数据: 根据数据,人体的脂肪含量与年龄之间有 怎样的关系?(同学们交流)
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
• 无相关性:因变量与自变量不具备相关性
小结:两个变量间的相关关系,可以借助散点
图直观判断
.
16
思考:在各种各样的散点图中,有些散点图 中的点是杂乱分布的,有些散点图中的点的 分布有一定的规律性,年龄和人体脂肪含量 的样本数据的散点图中的点的分布有什么特 点?
40 35 30 25 20 15 10
.
7
变量间相关关系的概念:自变量取值一定时,因变量的取值带有一定随 机性的两个变量之间的关系,叫做相关关系
请同学们回忆一下,我们以前是否学过变量间的关系呢?
两个变量间的函数关系.
相关关系与函数关系的异同点: 相同点:两者均是指两个变量间的关系. 不同点:①函数关系是一种确定的关系;相关关系是一种 非确定的关系.事实上,函数关系是两个非随机变量的关 系,而相关关系是随机变量与随机变量间的关系. ②函数关系是一种因果关系,而相关关系不一定是因果 关系,也可能是伴随关系.
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计 算机等现代化教学工具的必要性。 3、情感、态度与价值观: 类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直 线方程对实际问题进行分析和预测的意识,让学生动手操作,合作交流,激 发学生的学习兴趣。
.
2
高考数学一轮总复习 9.4变量间的相关关系与统计案例课件

4.了解回归分析的基本思想、方法及其简单应用.
完整版ppt
3
备考知考情
1.以客观题的形式考查求线性回归方程系数或利用线性回归 分析的方程进行预测,在给出临界值的情况下判断两个变量是否 有关.
2.在解答题中常与频率分布结合考查线性回归方程的建立及 应用和独立性检验的应用.
答案 C
完整版ppt
18
知识点二
独立性检验
4.在 2012 伦敦奥运会期间,某网站针对性别是否与看奥运会 直播有关进行了一项问卷调查,得出如下表格:
是否看奥运会直播
性别 男女
看奥运会直播
6 000 2 000
不看奥运会直播
2 000 2 000
完整版ppt
19
则 K2=( )
A.700 B.750
C.800 D.850
解析 由题意知,
K2=12
0006 000×2 000-2 000×2 0002 8 000×4 000×8 000×4 000
ห้องสมุดไป่ตู้
=750.
答案 B
完整版ppt
20
5.某校为了研究学生的性别和对待某一活动的态度(支持和
不支持两种态度)的关系,运用 2×2 列联表进行独立性检验,经
这类变量称为分类变量.
2.列联表:列出两个分类变量的频数表,称为列联表.假设
有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称为 2×2 列联表)为:
完整版ppt
11
y1
y2
x1
a
b
总计 a+b
第6讲 变量间的相关关系、统计案例学生

第6讲 变量间的相关关系、统计案例[玩前必备]1.两个变量的线性相关 (1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎨⎧b ^=∑n i =1(x i-x )(y i-y )∑n i =1(x i-x )2=∑ni =1x i y i-n x y ∑n i =1x 2i-n x2,a ^=y -b ^x .3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3)独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. 当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联; 当χ2>2.706时,有90%的把握判定变量A ,B 有关联; 当χ>3.841时,有95%的把握判定变量A ,B 有关联; 当χ>6.635时,有99%的把握判定变量A ,B 有关联.[玩转典例]题型一 相关关系判断例1 变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( ) A .r 2<r 1<0 B .0<r 2<r 1 C .r 2<0<r 1 D .r 2=r 1例2 四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:① y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( )A .①②B .②③C .③④D .①④ [玩转跟踪]1.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg2.(2015湖北)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 题型二 线性回归分析 例3 已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A .1.30 B .1.45 C .1.65 D .1.80例4 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[玩转跟踪]1.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程y =2.1x +0.85,则m 的值为( ) A .0.85 B .0.75 C .0.6 D .0.52.(15全国1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.nnnn表中w i =x i ,w =18∑=ni 1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为121()()=()niii nii u u v v u u β==---∑∑,α^=v -β^u .题型三 独立性检验分析例5 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”[玩转跟踪]1. 在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.(1)根据以上数据建立一个2×2列联表;(2)若认为“性别与患色盲有关系”,求出错的概率.2.(2017·全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).[玩转练习]1.(2017山东)为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为.已知,,.该班某学生的脚长为24,据此估计其身高为A .B .C .D .2.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元 3.(2014重庆)已知变量与正相关,且由观测数据算得样本的平均数3x =,,则由该观测数据算得的线性回归方程可能为A .0.4 2.3y x =+B .2 2.4y x =-C .29.5y x =-+D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b >x y y x ˆˆˆy bx a =+101225i i x ==∑1011600i i y ==∑ˆ4b =160163166170x y 3.5y =5.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是6.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑0.55=≈2.646.参考公式:相关系数()()ni it t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()niii ni i t t y y b t t ==--=-∑∑,=.a y bt -7.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i nii tty y b tt∧==--=-∑∑,ˆˆay bt =-8.(2019济南模拟)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有23是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表:(2)根据2×2列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).9.某省会城市地铁将于2019年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:11(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三基能力强化
3.(教材习题改编)对于事件A和事件B, 通过计算得到K2的观测值k≈4.514,下列说法正 确的是( )
A.有99%的把握说事件A和事件B有关 B.有95%的把握说事件A和事件B有关 C.有99%的把握说事件A和事件B无关 D.有95%的把握说事件A和事件B无关 答案:B
三基能力强化
课堂互动讲练
(2)设回归方程为y^ =b^ x+a^ .
10
xiyi-10 x y
i=1
由b^ =
10
xi2-10 x 2
i=1
=444844729.44--4444672622..468=7197.17.26≈0.4646. a^ = y - b^ x = 67.01 - 0.4646×66.8≈35.97.
课堂互动讲练
【解】 根据题目所给的数据作 出如下的列联表:
男 女 合计
色盲 38 6 44
不色盲 442 514 956
合计 480 520 1000
课堂互动讲练
根据列联表作出相应的二维条形 图: 6分
课堂互动讲练
从二维条形图来看,在男人中患色盲的比例 为43880,要比女人中患色盲的比例5620大.
答案:11.69
课堂互动讲练
考点一 相关关系的判断
判断两变量之间有无相关关 系,一种常用的简便可行的方法是 绘散点图.散点图是由数据点分布 构成的,是分析研究两个变量相关 关系的重要手段,从散点图中,如 果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量是 线性相关的.
课堂互动讲练
例1 某棉业公司的科研人员在7块并 排、形状大小相同的试验田上对某棉 花新品种进行施化肥量x对产量y影响 的试验,得到如下表所示的一组数据 (单位:kg).
n
xiyi-n x y
i=1
决问题.(1)利用公式 b=
,a= y -
n
xi2-n x 2
i=1
b x 来计算回归系数,有时为了方便,常制表对应 出 xiyi,xi2,以便求和应用公式.
课堂互动讲练
互动探究
在本例条件下,若该厂技改前 100吨甲产品的生产能耗为90吨标准 煤.试根据(2)求出的线性回归方 程,预测生产100吨甲产品的生产能 耗比技改前降低多少吨标准煤?
课堂互动讲练
例2 下表提供了某厂节能降耗技术改
造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗y(吨标准煤)的 几组对照数据.
x 3 45 6 y 2.5 3 4 4.5
课堂互动讲练
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘 法求出 y 关于 x 的线性回归方程y^=bx+a. (参考数值:3×2.5+4×3+5×4+6×4.5 =66.5)
课堂互动讲练
故所求的回归方程为: y^=0.4646x+35.97. (3)当 x=73 时, y^=0.4646×73+35.97≈69.9.
所以当父亲身高为73英寸时,估 计儿子身高约为69.9英寸.
课堂互动讲练
【名师点评】 求回归直线方 程,一般先要考查y与x是否具有线性 相关关系,若具有这样的关系,则可 利用公式求解,否则求得的函数关系 无实际意义.
课堂互动讲练
施化肥量 x
15
20
25
30
35
40
45
棉花产量 y
330
345
365
405
445
450
455
(1)画出散点图; (2)判断是否具有相关关系.
课堂互动讲练
【思路点拨】 用施化肥量x作为 横轴,产量y为纵轴可作出散点图,由 散点图即可分析是否具有线性相关关 系.
课堂互动讲练
【解】 (1)散点图如图所示,
i=1
i=1
课堂互动讲练
10
xiyi-10 x y
i=1
r=
10
10
( xi2-10 x 2)( yi2-10 y 2)
i=1
i=1
=
44842.4-10×4476.268 (44794-44622.4)(44941.93-44903.4)
= 667191.7.52764≈0.9804.
所以y与x之间具有很强的线性相关 关系.
课堂互动讲练
【思路点拨】 (1)先根据已知计算 相关系数r,判断是否具有相关关系.
(2)再利用公式求出回归方程进行回 归分析.
课堂互动讲练
【解】 (1) x =66.8, y =67.01,
10
x 2=4462.24, y 2≈4490.34, xi2=44794,
i=1
10
10
yi2=44941.93, xiyi=44842.4,
课堂互动讲练
(3)由经验确定回归方程的类型(如我们 观察到数据呈线性关系,则选用线性回归方 程y^ =b^ x+a^ ).
(4)按一定规则估计回归方程中的参数 (如最小二乘法).
(5)得出结果后分析残差是否有异常(个 别数据对应残差过大,或残差呈现不随机的 规律性等).若存在异常,则检查数据是否有 误,或模型是否适合等.
基础知识梳理
(2)回归方程 方程y^=bx+a 是两个具有线性相关关
系的变量的一组数据(x1,y1), (x2,y2),…,(xn,yn)的回归方程, 其中a,b是待定参数.
基础知识梳理
y -b x
基础知识梳理
相关关系与函数关系有什么 异同点?
【思考·提示】 相同点: 两者均是指两个变量的关系.
第3课时变量间的相关关系及 统计案例
基础知识梳理
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左上角 到右下角的区域.对于两个变量的这 种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从左下角 到右上角 的区域,两个变量的这种相 关关系称为负相关.
基础知识梳理
(3)线性相关关系、回归直线 如果散点图中点的分布从整体上 看大致在 一条直线附近 ,就称这两个 变量之间具有线性相关关系,这条直 线叫做回归直线. 2.回归方程 (1)最小二乘法 求回归直线使得样本数据的点到 回归直线的 距离的平方和最小的方法 叫做最小二乘法.
4.下列关系:①人的年龄与其拥有 的财富之间的关系;②曲线上的点与该 点的坐标之间的关系;③苹果的产量与 气候之间的关系;④森林中的同一树 木,其截面直径与高度之间的关系;⑤ 学生的身高与其学号之间的关系,其中 有相关关系的是________.
答案:①③④
三基能力强化
5 . 已 知 回 归 方 程 为 y^ = 0.50x - 0.81 , 则 x= 25 时 , y 的 估 计 值 为 ________.
课课堂互动讲 练堂互动讲练
例4 (解题示范)(本题满分12分) 在调查的480名男人中有38名患
有色盲,520名女人中有6名患有色 盲,分别利用图形和独立性检验的方 法来判断色盲与性别是否有关?你所 得到的结论在什么范围内有效?
课堂互动讲练
【思路点拨】 本题应首先作出 调查数据的列联表,再根据列联表画 出二维条形图,并进行分析,最后利 用独立性检验作出判断.
课堂互动讲练
考点四 独立性检验
利用图形来判断两个变量之间是 否有关系,可以画出三维柱形图、二 维条形图,仅从图形上只可以粗略地 估计两个分类变量的关系,可以结合 所求的数值来进行比较,作图时应注 意单位统一、图形准确,但不能给我 们两个分类变量有关或无关的精确的 可信程度,只有利用独立性检验的有 关计算,才能作出精确的判断.
基础知识梳理
4.独立性检验 (1)分类变量的定义 如果某种变量的不同“值”表示个 体所属的不同类别,像这样的变量称 为分类变量 . (2)2×2列联表 一般地,假设有两个分类变量X 和Y,它们的值域分别为{x1,x2}和 {y1,y2},其样本频数列联表(称为 2×2列联表)为
基础知识梳理
x1 x2 总计
课堂互动讲练
例3 测得某国10对父子身高(单位:英
寸)如下: (1)对变量y与x进行相关性检验; (2)如果y与x之间具有线性相关关
系,求回归方程; (3)如果父亲的身高为73英寸,估
计儿子的身高.
课堂互动讲练
父亲 身高 60 62 64 65 66 67 68 70 72 74 (x) 儿子 身高 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 (y)
由k≈27.1>10.828,所以我们有 99.9%的把握认为患色盲与性别有关 系,这个结论只对所调查的480名男人 和520名女人有效. 12分
课堂互动讲练
4
xiyi-4 x y
i=1
b=
4
=66.58-6-4×4×4.45.×52 3.5=0.7,
xi2-4 x 2
i=1
a= y -b x =3.5-0.7×4.5=0.35. 因此,所求的线性回归方程为y^=0.7x+0.35.
课堂互动讲练
【名师点评】 因本题中y对x的关系呈
线性关系,故可用一元线性相关的方法解
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
基础知识梳理
n(ad-bc)2 K2=(a+b)(c+d)(a+c)(b+d) ,用 它的大小可以决定是否拒绝原来的统计 假设H0,如果K2值较大,就拒绝H0,即 拒绝事件A与B无关 .
三基能力强化
1.下列两个变量之间的关系哪个不 是函数关系( )
不同点:①函数关系是一种 确定的关系,相关关系是一种非 确定的关系.②函数关系是一种 因果考 ?
基础知识梳理
3.回归分析 (1)定义:对具有相关关系 的两个 变量进行统计分析的一种常用方法. (2)样本点的中心 在具有线性相关关系的数据(x1, y1),(x2,y2),…,(xn,yn)中,回归 方程的截距和斜率的最小二乘估计公 式分别为: