变量间的相关关系(1)
2.3 变量间的相关关系
则������ =
^
66.5-4×4.5×3.5
^
������ = ������ − ������ ������ =3.5-0.7×4.5=0.35, 故线性回归方程为������ =0.7x+0.35. (3)根据线性回归方程的预测,现在生产 100 吨产品消耗的标准 煤的数量为 0.7×100+0.35=70.35, 故消耗能源减少了 90-70.35=19.65(吨).
2.3
变量间的相关关系
知识能力目标引航 1.了解相关关系、线性相关、回归直线、最小二乘法的定义. 2.会作散点图,能判断两个变量之间是否具有相关关系. 3.会求回归直线方程,并能用回归直线方程解决有关问题.
1.相关关系 (1)定义:如果两个变量中一个变量的取值一定时,另一个变量的 取值带有一定的随机性,那么这两个变量之间的关系,叫做相关关系. (2)两类特殊的相关关系:如果散点图中点的分布是从左下角到 右上角的区域,那么这两个变量的相关关系称为正相关,如果散点图 中点的分布是从左上角到右下角的区域,那么这两个变量的相关关 系称为负相关.
③代入公式计算������ , ������ 的值. ④写出回归直线方程. (2)求回归直线方程时应注意的问题:
^^
①用公式计算������ , ������ 的值时,要先算出������ ,然后才能算出������ . ②使用计算器能大大简化手工的计算,迅速得出正确的结果,但输入数 据时要细心,不能出任何差错;不同计算器的按键方式可能不同,可参考 计算器的使用说明书进行相关的计算.
^
86-4×4.5
2
=
66.5-63 =0.7, 86-81
^
利用回归方程,可以对总体进行估计,如回归方程为������ = ������ x+������ . 当 x=x0 时估计值为������0 = ������ x0+������ .
2.3.1变量间的相关关系
3、回归直线方程 (1)回归直线:观察散点图的特征,如果各点大致分 布在一条直线的附近,就称两个变量之间具有线性相关的 关系,这条直线叫做回归直线。 (2)最小二乘法
ˆ y bx a
n n (x i -x)(yi -y) x i yi -nxy b= i=1 = i=1 , n n 2 2 (x i -x) x i 2 -nx i=1 i=1 a=y-bx. 1 n 1 n 其中x= x i ,y= yi . n i=1 n i=1
(2)解:
X Y 66.5 X
i 1 i i
4
4
i 1
2 i
3 4 5 6 86
2 2 2 2
Y 3.5 ˆ 66.5 4 4.5 3.5 66.5 63 0.7 b 2 86 4 4.5 86 81
X 4.5
ˆ ˆ a Y bX 3.5 0.7 4.5 0.35
在收集大量数据的基础上,利用统计分析,发现规律, 对它们的关系作出判断。
2、两个变量的线性相关
(1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫 回归分析。通俗地讲,回归分析是寻找相关关系中非确 定关系的某种确定性。 (2)散点图
A、定义;B、正相关、负相关。
3、回归直线方程 注:如果关于两个变量统计数据的散点图呈现发散状,则 这两个变量之间不具有相关关系.
思考6:利用计算器或计算机可求得年龄和 人体脂肪含量的样本数据的回归方程为
y 0.577 x 0.448
由此我们可以根据一个人的年龄预测其体 内脂肪含量的百分比的回归值.若某人65岁, 则其体内脂肪含量的百分比约为多少?
第三节 变量间的相关关系-高考状元之路
第三节 变量间的相关关系预习设计 基础备考知识梳理1.两个变量的线性相关(1)正相关:在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从 到 的区域,对于两个变量的这种相关关系,我们将它称为负相关.(3)线性相关关系、回归直线: 如果散点图中点的分布从整体上看大致在 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法: 求回归直线使得样本数据的点到它的 的方法叫做最小二乘法.(2)回归方程:方程a x by ˆˆ+=是两个具有线性相关关系的变量的一组数据),(,),,(),,(2211n n y x y x y x 的回归方程,其中:ˆ,ˆb a是待定参数. ⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧-=⋅-====-∑∑-∑--∑==x b y a i y x n y x i n i i i n i b x n x x x y y x x n i i i n i n ˆˆ22211ˆ111)())((典题热身1.下列选项中,两个变量具有相关关系的是 ( )A .参加60年国庆阅兵的人数与观看第十一届全运会开幕布式的人数B .正方体的体积与棱长C .人体内的脂肪含量与年龄D .汶川大地震的经济损失与全球性金融危机的经济损失答案:C2.(2011.陕西高考)设),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( )A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在O 到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同答案:A3.设有一个回归直线方程为,5.12ˆx y-=则变量x 增加一个单位 ( ) A .y 平均增加1.5个单位B .y 平均增加两个单位C .y 平均减少1.5个单位D .y 平均减少两个单位答案:C4.在一次实验中,测得(x ,y)的四组值为(1,2),(2,3),<蝴_(4,5),则y 与x 之间的回归直线方程为 ( )1ˆ.+=x yA 2ˆ.+=x yB 12ˆ.+=x yC 1ˆ.-=x yD 答案:A5.(2011.辽宁高考)调查了某地若干户家庭的年收入x (单位;万元)和年饮食支出y(单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:,321.0254.0ˆ+=x y 由回归直线方程可知,家庭年收入每增加l 万元,年饮食支出平均增加 万元.答案:0,254课堂设计 方法备考题型一 利用散点图判断两个变量的相关关系画出散点图,判断它们是否有相关关系.题型二 求回归直线方程【例2】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据;(1)请画出表中数据的散点图;(2)请根据表中提供的数据,用最小二乘法求出y 关于x 的回归方程.ˆˆˆa x b y+= 题型三 利用回归直线方程对总体进行估计【例3】某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1000件时,单位成本平均变动多少?(3)假定产量为6000件时,单位成本为多少元?技法巧点(1)线性相关关系的理解:相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系,例如正方形面积S 与边长x 之间的关系2x s =就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系,例如商品的销售额与广告费是相关关系,两个变量具有相关关系是回归分析的前提. (2)求回归方程,关键在于正确求出系数b a b aˆ,ˆ,ˆ,ˆ由于的计算量大,计算时应仔细谨慎,分层进行,避免因计算产生错误.(注意回归直线方程中一次项系数为,ˆb 常数项为,ˆa 这与一次函数的习惯表示不同.)(3)回归分析是处理变量相关关系的一种数学方法,主要解决:①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察值,预测变量的取值及削断变量取值的变化趋势;③求出回归直线方程.失误防范1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.2.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.随堂反馈 1.(20】】.江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为 ( )1-=⋅x y A 1+=⋅x y B x y c 2188+=⋅ 176=⋅y D 答案:C2.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x 具有真相关关系,回归方程为.562.166.0ˆ+=x y若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为 ( )%83.A 0072.B 0076. c %66.D 答案:A3.(2011.广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y 之间的关系;小李这5天的平均投篮命中率为 ;用线性 回归分析的方程,预测小李该月6号打6小时篮球的投篮命中率为答案:53.0;5.0高效作业 技能备考一、选择题1.(201-1.福州模拟)已知变量x ,y 呈线性相关关系,回归方程为,25.0ˆx y+=则变量x ,y 是( ) A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系答案;A2.(2011.绍兴月考)对有线性相关关系的两个变量建立的回归直线方程x b a yˆˆˆ+=中,回归系数b ˆ( ) A .可以小于0 B .大于O C .能等于O D .只能小于0答案:A3.已知x 与y 之间的一组数据:则y 与x 的线性回归方程a x b yˆˆˆ+=必过 ( ) A .点(2,2) B .点(1.5,O) C .点(1,2) D .点(1.5,4)答案:D4.(2011.泰安模拟)下表是某厂l ~4月份用水量(单位:百吨)的一组数据:散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是,ˆ7.0ˆa x y+-=则 aˆ等于( ) 5.10.A 15.5.B 2.5.c 25.5.D答案:D5.对变量x ,y 有观测数据),10,,2,1)(,( =i y x i i 得散点图(1);对变量u ,v 有观测数据),10,,2,1)(,( =i v u i i 得散点图(2),由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关 B.变量_x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关答案:C6.(2011.青岛模拟)为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为⋅21l l 、已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s 、t ,那么下列说法正确的是 ( )A .直线1l 和2l 一定有公共点(s ,t)B .直线1l 和2l 相交,但交点不一定是(s ,t)C .必有21//l l 21.l lD 与必定重合答案:A二、填空题7.(2011.舟山适应性考试)人的身高与手的扎长存在相关关系,且满足264.31303.0ˆ-=x y(x 为身高,y 为扎长,单位:cm),则当扎长为24.8 cm 时,身高为 cm.答案:03.1858.(2011.芜湖模拟)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其线性回归方程是 答案:42347+=x y9.(2011.丽水调研)某单位为了了解用电量y 度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程,2ˆˆˆˆ-=+=b a x b y中预测当气温为-4℃时,用电量的度数约为 答案:68三、解答题10.(2011.台州模拟)在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y 与x 呈线性相关,试求回归方程.11.(2011.枣 庄模拟)在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.12.(2011.北京高考)以下茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树为19的概率. (注:方差],)()()[(1222212x x x x x x n s n -++-+-=其中x 为n x x x ,,,21 的平均数)。
(完整word)两个变量的相关关系
(完整word)两个变量的相关关系两个变量间的相关关系变量间的相互关系有两种:一类是确定性的函数关系,如正方形的边长和面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的。
例如,学生的总成绩和他的单科成绩,一般说来“总成绩高者,单科成绩也高”,我们说总成绩和单科成绩具有相关关系。
相关关系又分为两种:(1)正相关:两个变量具有相同的变化趋势。
(2)负相关:两个变量具有相反的变化趋势。
对相关关系的理解可以从下面三个角度把握:相关关系的概念:自变量取值一定时,因变量的取值带有一定的随机性,则两个变量之间的关系叫做相关关系.对相关关系的理解应当注意以下几点:其一是相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系。
因此,不能把相关关系等同于函数关系.相关关系与函数关系的异同点为:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系。
函数关系是自变量与函数值之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系。
然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄。
当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断。
我们再来认识生活中的确定两个变量间的相关关系的两个例子:【例1】“名师出高徒”可以解释为教师的水平越高,学生的水平也越高。
变量间的相关关系
2.正相关:在散点图中,点散布在从左下角到右上 角的区域,对于两个变量的这种相关关系,我们将 它称为正相关。
思考6:如图是高原含氧量与海拔高度的相关关系 的散点图,高原含氧量与海拔高度有何相关关系? 点的分布有何特点?
海平面以上,海拔高度 越高,含氧量越少。
点散布在从左上角到右 下角的区域内。
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:上图叫做散点图,你能描述一下散点图的含 义吗?
1.散点图:在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图.
脂肪含量
思考4:观察散点图的大致趋势,人的年龄的与人体 脂肪含量具有什么相关关系?
大体上看,随着年龄的增加,人体中脂肪百分比也 在增加。
年龄 23 脂肪 9.5
27 39 17.8 21.2
41 25.9
45
49 50
27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明 确的关系,我们需要对数据进行分析,通过作图可 以对两个变量之间的关系有一个直观的印象.以x轴 表示年龄,y轴表示脂肪含量,你能在直角坐标系 中描出样本数据对应的图形吗?
销售价格 12.2 15.3 24.8 21.6 18.4 29.2 22
(万元)
画出数据对应的散点图,并指出销售价格与房屋面积 这两个变量是正相关还是负相关.
解: 35
30 25 20 15 10 5 0
变量间的相互关系PPT教学课件
植
物Байду номын сангаас
的
受精 传粉 结果
开花
一
生
考点一: 识别种子的结构
种子的结构、功能和发育
结构 种皮
主要功能 保护
发育时的变化 脱落
胚芽 胚轴 胚 胚根
子叶
是新植株的 幼体
贮藏营养物质,为种 子萌发提供营养(双子 叶植物)
种子萌发时,转运营 养物质(单子叶植物)
发育成茎和叶 发育成连接根和
茎的部分 发育成根
逐渐消失
考点二、 种子的萌发
探究实验
1、提出问题
提出问题: 在哪种环境条件下种子才能萌发呢?
2、作出假设
如何作出假设?
讨论
请根据你的生活经验,举例说明以下条件 哪些是种子萌发的必要条件,哪些不是必要条 件?
1、土壤,2、空气,3、阳光,4、适宜的 温度,5、肥料,6、适量的水分
作出假设: 种子萌发需要水、空气和适宜的温度。
函数关系是一种因果关系,而相关关系 不一定是因果关系,也可能是伴随关系。
例如,有人发现,对于在校儿童,鞋的 大小与阅读能力有很强的相关关系,然而 学会新词并不能使脚变大,而是涉及到第 三个因素——年龄,当儿童长大一些以后, 他的阅读能力会提高,而且由于人长大脚 也变大。
如何分析变量之间是否具有相关的关系
B、空气
C、适宜的温度 D、有生命力的胚
4、小明帮父母收获时,发现有些“玉米棒子”上只有很少的玉米粒子。你认为造
成这些玉米缺粒最可能的原因是( ) [考点四]
A、水分不足
B、光照不足 C、无机盐不足 D、传粉不足
5、菜豆种子贮存营养物质的结构是由什么发育而来的( ) [考点四]
A、卵细胞
11.3变量间的相关关系
4
题型三
利用回归直线方程对总体进行估计
【例3】某企业上半年产品产量与单位成本资料如下: 月份 1 2 产量(千件) 2 3 单位成本(元) 73 72
3
4 5 6
4
3 4 5
71
73 69 68
(1)求出线性回归方程;
(2)指出产量每增加1 000件时,单位成本平均变 动多少? (3)假定产量为6 000件时,单位成本为多少元? 解
ˆ =1.23x+5 B. y
D. y ˆ =0.08x+1.23
当x=4时,y=1.23×4+0.08=5.
题型分类 深度剖析
题型一 利用散点图判断两个变量的相关性
【例 1】山东鲁洁棉业公司的科研人员在 7 块并排、 形状大小相同的试验田上对某棉花新品种进行施 化肥量 x 对产量 y 影响的试验,得到如下表所示的 一组数据(单位:kg).
归分析的前提.
2.求回归方程,关键在于正确求出系数 a ˆ ,由于 ˆ, b ˆ 的计算量大,计算时应仔细谨慎,分层进 a ˆ ,b
行,避免因计算而产生错误.(注意回归直线方程 中一次项系数为 b ˆ ,常数项为 a ˆ ,这与一次函数的 习惯表示不同.)
3.回归分析是处理变量相关关系的一种数学方法.主
4
思想方法
感悟提高
方法与技巧
1.线性相关关系的理解:相关关系与函数关系不同.
函数关系中的两个变量间是一种确定性关系.例如 正方形面积S与边长x之间的关系S=x2就是函数关系. 相关关系是一种非确定性关系,即相关关系是非随 机变量与随机变量之间的关系.例如商品的销售额
与广告费是相关关系.两个变量具有相关关系是回
i 1 i 1
2.3 变量间的相关关系
配人教版 数学 必修3
【示例】PM2.5是指空气中直径小于或等于2.5微米的颗粒 物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否 相关,现采集到某城市周一至周五某一时间段车流量与PM2.5 的数据如表:
时间
周一 周二 周三 周四 周五
车流量x/万辆
50 51 54 57 58
PM2.5的浓度y/ (微克·立方米-1) 69 70 74 78 79
配人教版 数学 必修3
2.3 变量间的相关关系
配人教版 数学 必修3
目标定位
重点难点
1.理解两个变量的相 重点:通过收集现实问题中两个有关联 关关系的概念. 变 量 的 数 据 直 观 认 识 变 量 间 的 相 关 关
2.会作散点图,并 系;利用散点图直观认识两个变量之间 利用散点图判断两 的线性关系;根据给出的线性回归方程
配人教版 数学 必修3
【分析】(1)利用描点法可得数据的散点图; (2)根据公式求出b^,a^,可写出线性回归方程; (3)根据(2)的线性回归方程,将 x=25 代入,求出 PM2.5 的浓度.
配人教版 数学 必修3 【解析】(1)散点图如图所示.
配人教版 数学 必修3
(2) x =50+51+554+57+58=54, -y =69+70+754+78+79=74,
A.①②
B.②③
C.③④
D.①④
配人教版 数学 必修3
【答案】D 【解析】y^=b^x+a^表示y^与 x 之间的函数关系,而不是 y 与 x 之间的函数关系.但它所反映的关系最接近 y 与 x 之间的真 实关系.故选 D.
配人教版 数学 必修3
4.如果在一次试验中,测得(x,y)的四组数值分别是 x 16 17 18 19 y 50 34 41 31
变量间的相关关系(全)
上述直线称为回归直线。
三.回归直线
3、如何求回归直线的方程
实际上,求回归直线的关键是如何用数学的方 法来刻画”从整体上看,各点到此直线的距离最 小”.
这样的方法叫做最小二乘法.
问题归结为:a,b取什么值时Q最小,即总体和最 小.下面是计算回归方程的斜率和截距的一般 公式.
根据最小二乘法和上述公式可以求回归方程.
回归直线方程: yˆ bx a
小结
1.变量之间除了函数关系外,还有相关关系,相关 关系是一种非确定关系.
2.散点图:表示具有相关关系的两个变量的一组数据 的图形,叫做散点图.
3.正相关与负相关.
4.回归直线:如果散点图中点的分布从总体上看大致在 一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线就叫回归直线。
(2)粮食产量与施肥量之间的关系 (3)人体内脂肪含量与年龄之间的关系
相关关系与函数关系的异同点: 相同点:均是指两个变量的关系. 不同点:函数关系是一种确定的关系;而 相关关系是一种非确定关系.
2、两个变量之间产生相关关系的原因是受许多不确 定的随机因素的影响。 3、需要通过样本来判断变量之间是否存在相关关系
__5_2____.
2.3.1变量之间的相关关系
在学校里,老师对学生经常这样说:”如果你的数 学成绩好,那么你的物理学习就不会有什么大问 题.”按照这种说法,似乎学生的物理成绩与数学 成绩之间存在着一种相关关系,这种说法有没有根 据呢?
1、变量之间除了函数关系外,还有相关关系。 例:(1)商品销售收入与广告支出经费之间的关系
根据上述数据,人体的脂肪含量与年龄之间 有怎样的关系?
1、散点图
表示具有相关关系的两个变量的一组数据的图 形,叫做散点图.
2(PPT)3-2.3变量间的相关关系(1)
这样的方法叫做最小二乘法
哲学原理:世界是一个普遍联系的整 体,任何事物都与其它事物相联系。
数学地理解世界
★数学学习与物理学习
★商业销售收入与广告之间
★粮食产量与施肥量之间
★人体脂肪含量与年龄之间
正位于一个干涸的海洋范围之内,看起来似乎是曾经的汪洋大海仅剩的一部分水域。而另一个由卡西尼雷达小组成员,加州理工的奥迪德·安罗森 (OdedAharonson)博士领衔的研究小组则认为土卫六正在经历和地球的米兰科维奇周期相类似的长期变化,这是由于轨道运行方面表现出来的长期规律性变 化引起的结果。这种长期的气候性变化将导致土卫六地表的液体在其南北半球之间来回迁移。根据这一模型,土卫六的南半球在大约万年前应当曾经拥有面 积广阔的巨大海洋。斯托芬博士表示:“土卫六表面的海洋正是孕育前生命化学环境的现成实验室,并且我们还知道它正以大约万年为周期在南北半球之间 进行迁移。”他说:“我很想仔细查看一下土卫六北半球的海洋以及南半球已经干涸的海洋遗迹,来了解一下这些前生命化学演化究竟已经进行到了何种地 步。”卡西尼小组已经基本证实了土卫六北半球海洋体系的稳定性。他们在过去一整个土卫六季节中(即地球上大约年)一直对这里的海洋进行持续的监视。 而此次发布的拍摄于年月日的这张图像中,科学家们发现北半球的湖泊岸线并未发生改变,这说明北半球的湖泊并非季节性事件。相比之下,年的一场暴风 雨之后,土卫六赤道附近出现了明显的变暗色区域。[]人们一直认为土卫六是太阳系中最大的卫星,并取名为泰坦。在希腊神话里,泰坦是一个巨人家族。 土卫六;电商补单论坛 / 电商补单论坛 ;是科学家认为的太阳系除地球外最有可能存在生命的星球。它是太阳系唯一拥有浓厚 大气层的卫星。与地球不同的是,地球的大气层主要由氮气和氧气组成,而土卫六的大气层则主要是甲烷。而且,浓密的大气反射了大部分的光线,造成反 温室效应,使得土卫六的地表十分寒冷,温度只有零下8摄氏度,不可能有液态水存在。但是年两个科学家研究小组提出,外星微生物或许生存在泰坦湖泊的 液态碳氢化合物里。科学家表示,乙炔在泰坦大气层形成,下降到泰坦表面。外星微生物吃下乙炔,同氢气发生化合作用,来获取能量。此后,泰坦表面发 现了数十个湖泊,科学家认为其中充满了液态乙烷和甲烷混合物。不过由于没有探测飞船对泰坦湖泊直接取样,没有人知道其中的乙炔具体含量。989年有科 学家估计,泰坦湖泊中的碳氢化合物液体内乙炔的含量仅为万分之几。由法国雷恩国立高等化学学院丹尼尔·考迪尔领导的科学家小组对泰坦湖泊乙炔含量进 行了新计算。他们根据探测土星系的卡西尼-惠更斯任务新近获得的数据,做出最新估计称泰坦湖泊含有更多的乙炔。如果泰坦上存在外星生物,湖泊内的 乙炔足以为任何饥饿的外星生物提供食物。年,卡西
变量之间的相关关系
变量间的相互关系是指两个或两个以上变量之间相联系的性质,主要有两种类型。
(1)因果关系:是指在两个有关系的变量中,因为一个变量的变化而引起另一个变量的变化。
应注意三点:第一,在两个变量中,只能一个是因,另一个是果,而不能互为因果。
第二,原因变量一定出现在结果变量之前。
第三,两者之间的变化关系是必然的,否则就不是因果关系。
社会现象的因果关系十分复杂,有一因一果、一果多因、一因多果以及多因多果等。
在社会调查研究中,调查者应注意区别事物之间因果关系的类型,对一果多因、一因多果以及多因多果等复杂的因果关系要仔细分析,逐一明确,这样才能清楚地认识社会现象和事物发展变化的规律。
(2)相关关系:是指变量的变化之间存在着非因果关系的一定联系和一定关系。
社会调查研究运用相关这一概念,其目的是了解社会现象和事物之间关系的密切程度,从中探寻其规律性。
变量之间的相关关系从变化的方向来看,可以分为正相关与负相关;从变化的表现形式来看,可以分为直线相关和曲线相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生同方向的变化,这种相关关系是正相关,也叫直接相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生反方向的变化,这种相关关系是负相关,也叫逆相关。
在社会调查研究中,掌握变量关系的正相关与负相关的概念,有利于了解社会现象和事物的发展方向和趋势。
当一个变量的数值发生变动(增加或减少),另一个变量的数值随着发生大致均等的变动时,这种关系称为直线相关;当一个变量的数值发生变动,另一个变量的数值随之发生不均等的变动时,这种关系称为曲线相关。
变量间的相关关系[1]1
变量间的相关关系一、选择题1.下列两个变量之间的关系中,哪个是函数关系( )A .学生的性别与他的数学成绩B .人的工作环境与健康状况C .女儿的身高与父亲的身高 D. 正三角形的边长与面积2.已知变量x ,y 呈线性相关关系,且回归方程为y ^=3-2x ,则变量x ,y 是( ) A .线性正相关关系 B .线性负相关关系C .线性相关D .由回归方程无法判断其正负相关 3.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由回归方程可以预报其体重( )A .为60.316 kg B. 约为60.316 kg C .大于60.316 kg D .小于60.316 kg 4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于( )A .10.5B .5.15C .5.2D .5.25 5.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温/℃ 18 13 10 4 -1 杯数2434395163若热茶杯数y 与气温x 近似地满足线性关系,则其关系式最接近的是( ) A .y =x +6 B .y =-x +42 C .y =-2x +60 D .y =-3x +78 二、填空题6.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下表:温度(x ) 0 10 20 50 70 溶解度(y )66.776.085.0112.3128.0则由此得到回归直线的斜率为________.(保留四位小数)7.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃) 18 13 10 -1 用电量(度)24343864由表中数据得线性回归方程y ^=bx +a 中b =-2,预测当气温为-4 ℃时,用电量的度数约为________.8.有10名同学高一(x )和高二(y )的数学成绩如下: 高一成绩x 74 71 72 68 76 73 67 70 65 74 高二成绩y 76757170767965776272(1)画出散点图;(2)求y 对x 的回归方程.。
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
(旧教材适用)2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例课件
抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经
计
算
得
-x
=
1 16
16
x
i
=
9.97
,
s
=
i=1
1 16
16
xi--x 2
=
i=1
0.050 0.010
k0
3.841 6.635
附:K2=a+bcn+add-ab+cc2b+d.
0.005 7.879
0.001 10.828
解析 根据题目所给数据得到如下 2×2 列联表:
乐观
不乐观
总计
国内代表
60
40
100
国外代表
40
60
100
总计
100
100
200
则 K2=20100×0×6100×0×601-004×0×104002=8>6.635,所以有 99%的把握认为是否
∵y 与 x 的相关系数近似为 0.9966,说明 y 与 x 的线性相关程度相当强,
∴可以用线性回归模型拟合 y 与 x 的关系.
(3)建立 y 关于 x 的回归方程,预测第 5 年的销售量约为多少?
参考数据:
∑4
i=1
yi--y 2≈32.7,
5≈2.24,i∑=4 1xiyi=418.
参考公式:
(3)回归分析 ①定义:对具有 □06 相关关系的两个变量进行统计分析的一种常用方法. ②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…, (xn,yn)中,-x =1n(x1+…+xn),-y =1n(y1+…+yn),a^ =-y -b^ -x ,(-x ,-y ) 称为样本点的中心.
变量间的相关关系
变量间的相关关系 【知识梳理】(1)相关关系:当自变量的取值一定时,因变量的取值带有 ,那么这两个变量之间的关系叫做 ,如果一个变量的值由小变大时,另一个变量的值也由小到大,这种相关称为 ,反之,如果一个变量的值由小变大,另一个变量的值由大到小,这种关系为 (2)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有 关系,这条直线叫做回归直线. (3)线性回归方程方程y=ˆbx+ˆa 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中ˆb , ˆa 是待定参数.ˆˆb a ⎧=⎪⎨=⎪⎩【基础练习】1.(2009·海南高考题)对变量x ,y 有观测数据(x 1,y 1)(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u 1,v 1)(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ) A .变量x 与y 正相关,u 与v 正相关 B .变量x 与y 正相关,u 与v 负相关 C .变量x 与y 负相关,u 与v 正相关 D .变量x 与y 负相关,u 与v 负相关2.已知关于某设备的使用年限x 与所支出的维修费用y(万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程ˆy=ˆb x +ˆa 表示的直线一定过定点________.3. (原创题)经研究表明,学生的体重y(单位:kg)与身高x(单位:cm)有很强的线性相关关系,其回归方程为y=0.75x-68.2,如果一个学生的身高为170 cm ,则他的体重( ) A. 一定是59.3 kg B. 一定大于59.3 kg C. 有很大的可能性在59.3 kg 左右 D. 一定小于59.3 kg 【互动探究】【例1】(1)如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?画出散点图,并判断它们是否有相关关系【例2】 三点(3,10),(7,20),(11,24)的回归方程是( )A.y ∧=-5.75+1.75xB.y ∧=1.75x +5.75C.y ∧=-1.75x +5.75 D.y ∧=-1.75x -5.75练习:一家保险公司调查其总公司营业部的加班程度,收集了5周中每周加班工作时间y (小时)与签发新保单数目x 的数据如下表:【例3】(2007·广东卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =ˆbx +ˆa ; (2)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)练习: (原创题)某服装厂引进新技术,其生产服装的产量x (百件)与单位成本y (元)满足回归直线方程y =149.36-16.2x ,则以下说法正确的是( ) A. 产量每增加100件,单位成本下降16.2元 B. 产量每减少100件,单位成本上升149.36元 C. 产量每增加100件,单位成本上升16.2元 D. 产量每减少100件,单位成本下降16.2元【当堂检测】1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形相对应的是( ) A .a —①,b -②,c -③ B .a -②,b -③,c -①C .a -②,b -①,c -③D .a -①,b -③,c -② 2.(2010·湖南,3)某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ∧=-10x +200 B.y ∧=10x +200 C.y ∧=-10x -200 D.y ∧=10x -200 3.设有一线性回归方程为y =2-1.5x ,则变量x 增加一个单位时,y 平均减少________个单位. 4.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的回归方程是( ) A.y ^=1.23x +4 B.y ^=1.23x +5 C.y ^=1.23x +0.08D.y ^=0.08x +1.235.若施化肥量x kg 与水稻产量y kg 在一定范围内线性相关,若回归方程为y ^=5x +250.当施化肥量为80 kg 时,预计水稻的产量为________.6. 实验测得4组(x,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为 ( ) A. y =x+1B. y =x+2C. y =2x+1D. y =x-17.具有线性相关关系的两个变量满足如下关系:A. y =0.56x +997.4B. y =0.63x -231.2C. y =50.2x +501.4D. y =60.4x +400.7 8. 一般来说,一个人的脚越长,他的身高就越高.现对10名成年人的脚长x 与身高y 进行测量,得如下数据(单位:作出散点图后,发现散点在一条直线附近.经计算得到一些数据:x =24.5,y =171.5,()()101iii x x y y =--=∑577.5, ()2101ii x x =-∑=82.5.某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长26.5 cm ,请你估计案发嫌疑人的身高为 cm.。
变量之间的相关关系
变量之间的相间确实存在关系,但又不 具备函数关系所要求的确定性,若它们的关系是 带有随机性的,就说两个变量具有相关关系. 注:相关关系是一种非确定性关系. 2、散点图:从一个统计数表中,为了更清楚地 看出x与y是否有相关关系,常将x的取值作为横 坐标,将y的相应取值作为纵坐标,在直角坐标 系中描点 i i ,这样的图形叫做散 点图.
温热度饮/℃杯数-5 与当0 天4气温7的对12比表15:19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的 一般规律;
变量之间的相关关系
【典型例题】 解:(1)散点图如图所示
变量之间的相关关系
【分类】
线性相关关系:
正相关:指的是两个变量有相同的变化趋势,即从 整体上来看一个变量会随着另一个变量变大而变大. 这在散点图上的反映就是散点的分布在斜率大于0的 直线附近;
40
35
30
25
20
15
10
5
0
0
10
20
30
40
50
60
70
变量之间的相关关系
【分类】
负相关:指的是两个变量有相反的变化趋势,即 从整体上来看一个变量会随着另一个变量变大而 变小,这在散点图上的反映就是散点的分布在斜 率小于0的直线附近.
1.2 1
0.8 0.6 0.4 0.2
0 0
0.1
0.2
0.3
0.4
0.5
0.6
变量之间的相关关系
【典型例题】
1、某机构曾研究温度对翻车鱼的影响,在一定温 度下,经过x单位时间,翻车鱼的存活比例为y,数 据如下: (0.10,1.00),(0.15,0.95),(0.20,0.95), (0.25,0.90),(0.30,0.85),(0.35,0.70), (0.40,0.65),(0.45,0.60),(0.50,0.55), (0.55,0.40) (1)请作出这些数据的散点图; (2)关于这两个变量的关系,你能得出什么结论?
变量之间的相关关系
概念辨析
练习:教材P85 1,2题
1.从现在我们掌握的知识来看,没有发现根据说 明“天鹅能够带来孩子”,完全可能存在既能吸 引天鹅和又使婴儿出生率高的第3个因素(如独特 的环境因素),即天鹅与婴儿出生率之间没有直 接的关系,因此“天鹅能够带来孩子”的结论不 可靠.而要证实此结论是否可靠,可以通过实验来 进行。相同的环境下将居民随机地分为两组,一 组居民和天鹅一起生活(比如家中都饲养天鹅), 而另一组居民的附近不让天鹅活动,对比两组居 民的出生率是否相同。
5 0
20 25 30 35 40 45 50 55 60 65 年龄
观察散点图的大致趋势, 两个变量的散点 图中点的分布的位置是从左下角到右上角 的区域,我们称这种相关关系为正相关。
思考4:如果两个变量成负相关,从整体上看这两 个变量的变化趋势如何?其散点图有什么特点?
运鱼车的单位时间与存活比例
思考5:根据有关数学原理分析,当
n
n
(xi x )( yi y )
xi yi nx y
b i1 n
(xi x )2
i1 n
, a y bx
xi2 nx 2
i1
时,总体偏差
Q
n
i 1
(yi yˆi )2
为最小,这样
i1
就得到了回归方程,这种求回归方程的 方法叫做最小二乘法.回归方程 y bx a 中,a,b的几何意义分别是什么?
脂肪含量
观察人体的脂肪含量百分比和年龄的样本数 据的散点图,这两个相关变量成正相关.我 们需要进一步考虑的问题是,当人的年龄增 加时,体内脂肪含量到底是以什么方式增加 呢?对此,我们从理论上作些研究.
40 35 30 25 20 15 10
变量间的相关关系
数学成绩
由散点图可见,两者之间具有正相关关系。
小结:用Excel作散点图的步骤如下 : (结合软件边讲边练)
(1)进入Excel,在A1,B1分别输入“数学成 绩”、“物理成绩”,在A、B列输入相应的数据。 (2)点击图表向导图标,进入对话框,选择“标准 类型”中的“XY散点图”,单击“完成”。 (3)选中“数值X轴”,单击右键选中“坐标轴格 式”中的“刻度”,把“最小值”、“最大值”、 “刻度主要单位”作相应调整,最后按“确定”。y 轴方法相同。
(3)从散点图可以看出,0 140 130 120 110 100 90 80 70 60 50 40 -10 0 10
^ Y=-2.352x+147.767
20
30
40
^ (4)当x=2时,y=143.063, 因此,这天大 约可以卖出143杯热饮。
练习:P96 小结:
解2:用Excel求线性回归方程,步 骤如下:
. (1)进入Excel作出散点图。
(2)点击“图表”中的“添加趋势 线”,单击“类型”中的“线性”,单 击“确定”,得到回归直线。 (3)双击回归直线,弹出“趋势线格 式”,单击“选项”,选定“显示公 式”,最后单击“确定”。
三、利用线性回归方程对总体进行估计
二、求线性回归方程
例2:观察两相关变量得如下表: x y -1 -9 -2 -7 -3 -5 -4 -3 -5 -1 5 1 3 5 4 3 2 7 1 9
求两变量间的回归方程
解1: 列表:
i 1
i
2 -2 -7 14
3 -3 -5 15
4 -4 -3 12
10
5 -5 -1 5
2
6 5 1 5
第84讲、成对数据的统计分析(学生版)2025高考数学一轮复习讲义
第84讲成对数据的统计分析知识梳理知识点一、变量间的相关关系1、变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.2、散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.3、相关系数若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x 与y的相关系数()nnii iixx y y x ynx yr ---==∑∑通常用r 来衡量x 与y 之间的线性关系的强弱,r 的范围为11r -≤≤.(1)当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.(2)r 越接近1,表示两个变量的线性相关性越强;r 越接近0,表示两个变量间几乎不存在线性相关关系.当||1r =时,所有数据点都在一条直线上.(3)通常当0.75r >时,认为两个变量具有很强的线性相关关系.知识点二、线性回归1、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+ 的求法为1122211()()nni i i ii i nni i i i x x y y x ynx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 其中,11n i i x x n ==∑,11ni i y y n ==∑,(x ,y )称为样本点的中心.2、残差分析对于预报变量y ,通过观测得到的数据称为观测值i y ,通过回归方程得到的 y 称为预测值,观测值减去预测值等于残差,ˆi e称为相应于点(,)i i x y 的残差,即有ˆi e =ˆi i y y -.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(1)残差图通过残差分析,残差点()ˆ,i i x e比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.(2)通过残差平方和21ˆ()ni i i Q y y==-∑分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.(3)相关指数用相关指数来刻画回归的效果,其计算公式是:22121ˆ()1()nii i n ii yyR yy ==-=--∑∑.2R 越接近于1,说明残差的平方和越小,也表示回归的效果越好.知识点三、非线性回归解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.1、建立非线性回归模型的基本步骤:(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;(6)消去新元,得到非线性回归方程;(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.知识点四、独立性检验1、分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表.一般地,假设有两个分类变量X 和Y ,它们的取值分别为{1x ,2x }和{1y ,2y },其样本频数列联表(称为2×2列联表)为1y 2y 总计1x aba b2x cd c d+总计a c+b d+n a b c d=+++从22⨯列表中,依据a a b +与cc d+的值可直观得出结论:两个变量是否有关系.2、等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.(2)观察等高条形图发现a a b +与cc d+相差很大,就判断两个分类变量之间有关系.3、独立性检验计算随机变量22()()()()()n ad bc a b c d a c b d χ-=++++利用2χ的取值推断分类变量X 和Y 是否独立的方法称为χ2独立性检验.α0.100.050.0100.0050.001x α2.7063.8416.6357.87910.828【解题方法总结】常见的非线性回归模型(1)指数函数型x y ca =(0a >且1a ≠,0c >)两边取自然对数,()ln ln x y ca =,即ln ln ln y c x a =+,令ln y yx x '=⎧⎨'=⎩,原方程变为ln ln y c x a ''=+,然后按线性回归模型求出ln a ,ln c .(2)对数函数型ln y b x a=+令ln y y x x'=⎧⎨'=⎩,原方程变为y bx a ''=+,然后按线性回归模型求出b ,a .(3)幂函数型ny ax =两边取常用对数,()lg lg n y ax =,即lg lg lg y n x a =+,令lg lg y y x x'=⎧⎨'=⎩,原方程变为lg y nx a ''=+,然后按线性回归模型求出n ,lg a .(4)二次函数型2y bx a=+令2y y x x'=⎧⎨'=⎩,原方程变为y bx a ''=+,然后按线性回归模型求出b ,a .(5)反比例函数型b y a x=+型令1y y x x '=⎧⎪⎨'=⎪⎩,原方程变为y bx a ''=+,然后按线性回归模型求出b ,a .必考题型全归纳题型一:变量间的相关关系例1.(2024·河北·高三校联考期末)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是()A .B.C.D .例2.(2024·天津蓟州·高三校考开学考试)对两个变量x ,y 进行线性相关检验,得线性相关系数10.8995r =,对两个变量u ,v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是()A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强例3.(2024·宁夏吴忠·高三盐池高级中学校考阶段练习)在如图所示的散点图中,若去掉点P,则下列说法正确的是()A.样本相关系数r变大B.变量x与变量y的相关程度变弱C.变量x与变量y呈正相关D.变量x与变量y的相关程度变强变式1.(2024·四川成都·高三统考阶段练习)已知建筑地基沉降预测对于保证施工安全,实现信息化监控有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间的变化趋势,并用相关指数、误差平方和、均方根值三个指标来衡量拟合效果.相关指数越接近1表明模型的拟合效果越好,误差平方和越小表明误差越小,均方根值越小越好.依此判断下面指标对应的模型拟合效果最好的是()A.相关指数误差平方和均方根值0.9498.4910.499B.相关指数误差平方和均方根值0.933 4.1790.436C.相关指数误差平方和均方根值0.997 1.7010.141D.相关指数误差平方和均方根值0.997 2.8990.326变式2.(2024·高三课时练习)甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则能体现A,B两变量有更强的线性相关性的是()A.甲B.乙C.丙D.丁变式3.(2024·河北石家庄·统考三模)观察下列四幅残差图,满足一元线性回归模型中对随机误差的假定的是()A.B.C.D.变式4.(2024·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关系数r,则线性相关程度最高的是()甲乙丙丁r0.870.910.580.83A.甲B.乙C.丙D.丁变式5.(2024·全国·高三专题练习)给出下列有关线性回归分析的四个命题:x y;①线性回归直线未必过样本数据点的中心()②回归直线就是散点图中经过样本数据点最多的那条直线;r 时,两个变量正相关;③当相关系数0④如果两个变量的相关性越强,则相关系数r就越接近于1.其中真命题的个数为()A.1B.2C.3D.4【解题方法总结】判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)样本相关系数:当r >0时,正相关;当r <0时,负相关;|r |越接近于1,相关性越强.(3)经验回归方程:当ˆ>0b时,正相关;当ˆ<0b 时,负相关.题型二:一元线性回归模型例4.(2024·天津蓟州·高三校考开学考试)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:天数(x 天)3456繁殖个数(y 千个)2.5344.5由最小二乘法得y 与x 的线性回归方程为 0.7y x a=+,则当7x =时,繁殖个数y 的预测值为()A .4.9B .5.25C .5.95D .6.15例5.(2024·湖南长沙·高三长郡中学校联考阶段练习)某社区为了丰富退休人员的业余文化生活,自2018年以来,始终坚持开展“悦读小屋读书活动”.下表是对2018年以来近5年该社区退休人员的年人均借阅量的数据统计:年份20182019202020212022年份代码x 12345年人均借阅量y (册)1y 2y 162228(参考数据:5190i i y ==∑)通过分析散点图的特征后,年人均借阅量y 关于年份代码x 的回归分析模型为 5y x m =+,则2024年的年人均借阅量约为()A .31B .32C .33D .34例6.(2024·辽宁·辽宁实验中学校考模拟预测)已知x ,y 的对应值如下表所示:x2468y 11m +21m +33m +11若y 与x 线性相关,且回归直线方程为 1.60.6y x =+,则m =()A .2B .3C .4D .5变式6.(2024·广西南宁·南宁二中校联考模拟预测)某单位在当地定点帮扶某村种植一种草莓,并把这种原本露天种植的草莓搬到了大棚里,获得了很好的经济效益.根据资料显示,产出的草莓的箱数x (单位:箱)与成本y (单位:千元)的关系如下:x 102030406080y1y 2y 3y 4y 5y 6y (1)根据散点图可以认为x 与y 之间存在线性相关关系,请用最小二乘法求出线性回归方程ˆˆˆybx a =+(ˆa ,ˆb 用分数表示)(2)某农户种植的草莓主要以300元/箱的价格给当地大型商超供货,多余的草莓全部以200元/箱的价格销售给当地小商贩.据统计,往年1月份当地大型商超草莓的需求量为50箱、100箱、150箱、200箱的概率分别为110,15,12,15,根据回归方程以及往年商超草莓的需求情况进行预测,求今年1月份农户草莓的种植量为200箱时所获得的利润情况.(最后结果精确到个位)附:()()61790i i i x x y y =--=∑,6154i i y ==∑,在线性回归直线方程ˆˆˆybx a =+中()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.变式7.(2024·江西·高三统考开学考试)某新能源汽车销售部对今年1月至7月的销售量进行统计与分析,因不慎丢失一些数据,现整理出如下统计表与一些分析数据:月份1月2月3月4月5月6月7月月份代号x1234567销售量y (单位:万辆)15.6m ns37.739.644.5其中31.2y =.(1)若m ,n ,s 成递增的等差数列,求从7个月的销售量中任取1个,月销售量不高于27万辆的概率;(2)若()721670.48i i y y =-=∑,x 与y 的样本相关系数0.99r =,求y 关于x 的线性回归方程ˆˆˆybx a =+,并预测今年8月份的销售量(ˆb 精确到0.1).附:相关系数()()niix x y y r --=∑ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii niix x y y bx x ==--=-∑∑,ˆˆay bx =-.2.65≈25.89≈.变式8.(2024·四川成都·高三石室中学校考开学考试)已知某绿豆新品种发芽的适宜温度在6~22℃℃之间,一农学实验室研究人员为研究温度x (℃)与绿豆新品种发芽数y (颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8~14℃℃的温度环境下进行实验,得到如下散点图:其中24y =,71()()70i i i x x y y =--=∑,721()=176i i y y =-∑.(1)运用相关系数进行分析说明,是否可以用线性回归模型拟合y 与x 的关系?(2)求出 y 关于 x 的线性回归方程y bx a =+$$$,并预测在19℃的温度下,种子的发芽的颗数.参考公式:相关系数()()niix x y y r --=∑y bx a =+$$$,其中121((niii nii x x y y bx x ==--=-∑∑ ,a y bx =-$$8.77≈.变式9.(2024·安徽亳州·蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x (单位:公顷)和野生动物数量y 的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样本数据(),i i x y (1,2,,40i = ),部分数据如下:x … 2.7 3.6 3.2 3.9…y…50.663.752.154.3…经计算得:401160==∑i i x ,4012400==∑i i y ,()4021160=-=∑i i x x ,()()4011280=--=∑i i i x x y y .(1)利用最小二乘估计建立y 关于x 的线性回归方程;(2)该小组又利用这组数据建立了x 关于y 的线性回归方程,并把这两条拟合直线画在同一坐标系xOy 下,横坐标x ,纵坐标y 的意义与植被覆盖面积x 和野生动物数量y 一致.设前者与后者的斜率分别为1k ,2k ,比较1k ,2k 的大小关系,并证明.附:y 关于x 的回归方程 y abx =+ 中,斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x y nx ybxnx==-⋅=-∑∑,a y bx =-$$,ni ix y nx yr -=∑【解题方法总结】求经验回归方程的步骤题型三:非线性回归例7.(2024·湖南·校联考模拟预测)若需要刻画预报变量w 和解释变量x 的相关关系,且从已知数据中知道预报变量w 随着解释变量x 的增大而减小,并且随着解释变量x 的增大,预报变量w 大致趋于一个确定的值,为拟合w 和x 之间的关系,应使用以下回归方程中的(0b >,e 为自然对数的底数)()A .w bx a=+B .ln w b x a=-+C .w a=-D .e xw b a-=+例8.(2024·全国·高三专题练习)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码x 的关系可以用模型21e c xy c =(其中e 为自然对数的底数)拟合,设ln z y =,得到数据统计表如下:年份2018年2019年2020年2021年2022年年份代码x12345云计算市场规模y /千万元7.4112036.666.7ln z y=22.433.64由上表可得经验回归方程0.52z x a =+,则2025年该科技公司云计算市场规模y 的估计值为()A . 5.08e B . 5.6e C . 6.12e D . 6.5e例9.(多选题)(2024·福建厦门·厦门一中校考三模)在对具有相关关系的两个变量进行回归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.下列选项为四个同学根据自己所得数据的散点图建立的非线性模型,且散点图的样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有()A .212y c x c x=+B .12x c y x c +=+C .()12ln y c x c =++D .21x c y c e+=变式10.(2024·全国·高三专题练习)已知变量的关系可以用模型e mx y k =拟合,设ln z y =,其变换后得到一组数据如下.由上表可得线性回归方程3z x a =+,则k =()x 12345z2451014A .3e -B .2e -C .2e D .3e 变式11.(2024·全国·高三专题练习)某校课外学习小组研究某作物种子的发芽率y 和温度x (单位:C )的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .()20y a bx b =+>C .e xy a b =+D .ln y a b x=+变式12.(2024·全国·高二专题练习)兰溪杨梅从5月15日起开始陆续上市,据调查统计,得到杨梅销售价格(单位:Q 元/千克)与上市时间t (单位:天)的数据如下表所示:时间t /(单位:天)102070销售价格Q (单位:元/千克)10050100根据上表数据,从下列函数模型中选取一个描述杨梅销售价格Q 与上市时间t 的变化关系:2,,,log t b Q at b Q at bt c Q a b Q a t =+=++=⋅=⋅.利用你选取的函数模型,在以下四个日期中,杨梅销售价格最低的日期为()A .6月5日B .6月15日C .6月25日D .7月5日变式13.(2024·四川泸州·高三四川省泸县第四中学校考开学考试)抗体药物的研发是生物技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗体药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为x (单位:mg ),体内抗体数量为y (单位:AU/mL ).101i ii t z=∑101ii t=∑101ii z=∑1021ii t=∑29.2121634.4(1)根据经验,我们选择d y cx =作为体内抗体数量y 关于抗体药物摄入量x 的回归方程,将d y cx =两边取对数,得ln ln ln y c d x =+,可以看出ln x 与ln y 具有线性相关关系,试根据参考数据建立y 关于x 的回归方程,并预测抗体药物摄入量为25mg 时,体内抗体数量y 的值;(2)经技术改造后,该抗体药物的有效率z 大幅提高,经试验统计得z 服从正态分布()20.48,0.03N :,那这种抗体药物的有效率z 超过0.54的概率约为多少?附:①对于一组数据()(),1,2,,10i i u v i =L ,其回归直线 vu a β=+ 的斜率和截距的最小二乘估计分别为µ1221ni i i nii u v nuvunuβ==-=-∑∑, av u β=- ;②若随机变量()2~,Z N μσ,则有()0.6826P Z μσμσ-<<+≈,(22)0.9544P Z μσμσ-<<+≈,(33)0.9974P Z μσμσ-<<+≈;③取e 2.7≈.变式14.(2024·江西赣州·高三校考阶段练习)为了研究某种细菌随天数x 变化的繁殖个数y ,收集数据如下:天数x 123456繁殖个数y612254995190(1)在图中作出繁殖个数y 关于天数x 变化的散点图,并由散点图判断ˆˆy bxa =+( ˆ,ab 为常数)与 21e ˆc xc y =( 12,c c 为常数,且 120,0c c >≠)哪一个适宜作为繁殖个数y 关于天数x 变化的回归方程类型?(给出判断即可,不必说明理由)(2)对于非线性回归方程 21e ˆc xc y =( 12,c c 为常数,且 120,0c c >≠),令ln z y =,可以得到繁殖个数的对数z 关于天数x 具有线性关系及一些统计量的值.xyz()621ii x x =-∑()()61ii i xx y y =--∑()()61ii i xx z z =--∑3.5062.83 3.5317.50596.5712.09(ⅰ)证明:“对于非线性...回归方程 21e ˆc x c y =,令ln z y =,可以得到繁殖个数的对数z 关于天数x 具有线性..关系(即ˆˆˆ,ˆˆ,z x βαβα=+为常数)”;(ⅱ)根据(ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程(系数保留2位小数).附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线方程ˆˆˆvu βα=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,niii nii u u v v v u u u βαβ==--==--∑∑.变式15.(2024·重庆沙坪坝·高三重庆八中校考阶段练习)在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布2(0.54,0.02)N ,而化肥施肥量因农作物的种类不同每亩也存在差异.(1)假设生产条件正常,记X 表示化肥的有效利用率,求(0.56)PX ≥;(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为x (单位:公斤),粮食亩产量为y (单位:百公斤)参考数据:101i ii x y =∑101ii x =∑101ii y =∑1021ii x=∑101ii i t z =∑101ii t =∑101ii z =∑1021ii t=∑65091.552.51478.630.5151546.5ln i i t x =,ln (1i zi y i ==,2,⋯,10).(i )根据散点图判断,y a bx =+与d y cx =,哪一个适宜作为该农作物亩产量y 关于每亩化肥施用量x 的回归方程(给出判断即可,不必说明理由);(ii )根据(i )的判断结果及表中数据,建立y 关于x 的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量y 的值.(e 2.7)≈附:①对于一组数据(,)(1i i u v i =,2,3,⋯,)n ,其回归直线ˆˆˆvu βα=+的斜率和截距的最小二乘估计分别为121ˆni i i nii u v nuvunu β==-=-∑∑,ˆˆˆv u αβ=-;②若随机变量2(,)X N μσ ,则()0.6827P X μσμσ-<<+≈,(22)0.9545P X μσμσ-<<+≈.变式16.(2024·重庆·高三校联考开学考试)某公司为了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响.对公司近12年的年研发资金投入量xi 和年销售额yi 的数据,进行了对比分析,建立了两个模型:①2ˆˆy x αβ=+,②ˆˆe x t y λ+=$,其中α,β,λ,t 均为常数,e 为自然对数的底数,并得到一些统计量的值.令()2,,l 1n ,2,3,,12i i i i x i u v y =⋅⋅⋅==,经计算得如下数据:xy()1221i i x x =-∑()1221i i y y=-∑uv20667724604.20()1221ii uu=-∑()()121iii u u y y =--∑()1221ii v v =-∑()()121iii x x v v =--∑312502153.0814(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据分析及表中数据,建立y 关于x 的回归方程;(ⅱ)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 是多少亿元?附:①相关系数()()niix x y y r --=∑ˆˆy abx =+$中公式分别为()()()1122211ˆˆˆ,n niii ii i nniii i x x y y x y nx ybay b x x x xnx====---⋅===-⋅--∑∑∑∑;②参考数据: 4.499830849.4868,e 90=⨯≈≈.变式17.(2024·江苏镇江·江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数y 与温度x 有关,现将收集到的温度i x 和产卵数()1,2,,10i y i = 的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.101ii x=∑101ii t=∑101ii y=∑101ii z=∑()1021ii x x =-∑36054.5136044384()1021ii tt=-∑()()101ii i tt y y =--∑()()101iii x x zz =--∑()()101iii x x y y =--∑3588326430表中1011ln ,10i i i ii t z y z z ====∑(1)根据散点图判断,,y a bx y n =+=+21e c xy c =哪一个适宜作为y 与x 之间的回归方程模型并求出y 关于x 回归方程;(给出判断即可,不必说明理由)(2)某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中共有8个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.附:对于一组数据()()()1122,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121,niii nii u u v v v u u u βαβ==--==--∑∑.变式18.(2024·广西南宁·南宁三中校考一模)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018-2022年中国车载音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1-5.年份代码x12345车载音乐市场规模y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型x y a b =⋅拟合y 与x 的关系,请建立y 关于x 的回归方程;(2)根据上述数据求得y 关于x 的回归方程后,预测2024年的中国车载音乐市场规模.参考数据:v51i ii x v=∑0.524e 0.472e 71.61.9433.82 1.7 1.626.84其中ln i i v y =,5115i i v v ==∑.参考公式:对于一组数据()11,u v ,()22,u v ,L ,(),n n u v 其回归直线ˆˆˆv u αβ=+的斜率和截距的最小二乘法估计公式分别为 121ni ii ni i u v nu vu nuβ==-⋅=-∑∑,ˆˆv u αβ=-.变式19.(2024·安徽合肥·合肥市第八中学校考模拟预测)当前移动网络已融入社会生活的方方面面,深刻改变了人们的沟通、交流乃至整个生活方式.4G 网络虽然解决了人与人随时随地通信的问题,但随着移动互联网快速发展,其已难以满足未来移动数据流量暴涨的需求,而5G 作为一种新型移动通信网络,不但可以解决人与人的通信问题,而且还可以为用户提供增强现实、虚拟现实、超高清(3D )视频等更加身临其境的极致业务体验,更重要的是还可以解决人与物、物与物的通信问题,从而满足移动医疗、车联网、智能家居、工业控制、环境监测等物联网应用需求,为更好的满足消费者对5G 网络的需求,中国电信在某地区推出了六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如下表:套餐A B C D E F 月资费x (元)384858687888购买人数y (万人)16.818.820.722.424.025.5对数据作初步的处理,相关统计量的值如下表:61iii v ω=∑61ii v=∑61ii ω=∑621ii v=∑75.324.618.3101.4其中ln ,ln i i i i v x y ω==,且绘图发现,散点()(),16i i v i ω≤≤集中在一条直线附近.(1)根据所给数据,求出y 关于x 的回归方程;(2)已知流量套餐受关注度通过指标()36x T x y +=来测定,当()8568,7e 5e T x ⎛⎫∈ ⎪⎝⎭时相应的流量套餐受大众的欢迎程度更高,被指定为“主打套餐”.现有一家四口从这六款套餐中,购买不同的四款各自使用.记四人中使用“主打套督”的人数为X ,求随机变量X 的分布列和期望.附:对于一组数据()()()1122,,,,,,n n v v v ωωω ,其回归方程bv a ω=+的斜率和截距的最小二乘估计值分别为()()()121ˆˆ,niii ni i v v ba bvv v ωωω==-⋅-==--∑∑.【解题方法总结】换元法变成一元线性回归模型题型四:列联表与独立性检验例10.(2024·广东佛山·华南师大附中南海实验高中校考模拟预测)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是()A .样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B .样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C .样本中选择物理学科的人数较多D .样本中男生人数少于女生人数例11.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的33+模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理不选物理总计男生340110450女生140210350总计480320800表一选生物不选生物总计男生150300450女生150200350总计300500800表二试根据小概率值0.005α=的独立性检验,分析物理和生物选课与性别是否有关()附:()222.n ad bc n a b c d P x a b c d a c b d αχαχ-==+++=≥++++(),()()()()α0.150.100.050.0250.010.0050.001ax 2.0722.7063.8415.0246.6357.87910.828A .选物理与性别有关,选生物与性别有关B .选物理与性别无关,选生物与性别有关C .选物理与性别有关,选生物与性别无关D .选物理与性别无关,选生物与性别无关例12.(2024·全国·高三专题练习)通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有16的男大学生“不看”,有13的女大学生“不看”,若有99%的把握认为性别与是否看营养说明之间有关,则调查的总人数可能为()A .150B .170C .240D .175变式20.(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为()*5m m ∈N 人,男生中喜欢短视频的人数占男生人数的45,女生中喜欢短视频的人数占女生人数的35.零假设为0H :喜欢短视频和性别相互独立.若依据0.05α=的独立性检验认为喜欢短视频和性别不独立,则m 的最小值为()附:()()()()()22n ad bc a b c d a c b d χ-=++++,附表:α0.050.01x α3.841 6.635A .7B .8C .9D .10变式21.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:优秀非优秀合计甲班人数50乙班人数20。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
探究
年龄. 23 27 39 41 45 49 50 53 54 56 57 58
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 年龄 60 61 脂肪 35.2 34.6
如上的一组数据,你能分析人体的脂肪 含量与年龄之间有怎样的关系吗?
• 从已经掌握的知识来看,吸烟会损害身体的健康。 但是除了吸烟之外还有许多其他的随机因素影响身 体健康,人体健康是由很多因素共同作用的结果, 我们可以找到长寿的吸烟者,也更容易发现由于吸 烟而引发的患病者,吸烟与健康是一种相关关系, 所以吸烟不一定引起健康问题。
• 但吸烟引起健康问题的可能性大,因此“健康问 题不一定是由吸烟引起的,所以可以吸烟”的 说法是不对的。
变量间相关关系的概念: 自变量取值一定时,因变量的取 值带有一定随机性的两个变量之间的关系,叫做相关关系.
请同学们回忆一下,我们以前是否学过变量间的关系呢?
两个变量间的函数关系.
相关关系与函数关系的异同点: 相同点:两者均是指两个变量间的关系. 不同点:①函数关系是一种确定的关系;相关关系是一种 非确定的关系.事实上,函数关系是两个非随机变量的关 系,而相关关系是随机变量与随机变量间的关系. ②函数关系是一种因果关系,而相关关系不一定是因果关 系,也可能是伴随关系.
只有散点图中的点呈条状集中在某一直线 周围的时候,才可以说两个变量之间具有线性 关系,才有两个变量的正线性相关和负线性相 关的概念,才可以用回归直线来描述两个变量 之间的关系
脂肪含量
如何具体的求出这个回归方程呢? 方案一:采用测量的方法:先画一条直线,测 量出各点到它的距离,然后移动直线,到达一 个使距离之和最小的位置,测量出此时直线的 斜率和截距,就得到回归方程。
练习:
某地区的环境条件适合天鹅栖息繁衍,有人统计发现 了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个 村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低。于是, 他就得出一个结论:天鹅能够带来孩子。你认为这样得到的 结论可靠吗?如何证明这个结论的可靠性?
• 从已经掌握的知识来看,没有发现根据说明“天鹅能 够带来孩子”,完全可能存在既能吸引天鹅又使婴儿 出生率高的第三个因素(例如独特的环境因素),即 天鹅与婴儿出生率之间没有直接的关系,因此 “天鹅 能够带来孩子”的结论不可靠。
成正相关。但有的两个变量的相关,如下图所示:
如高原含氧量与海拔高 度的相关关系,海平面以上, 海拔高度越高,含氧量越少。
作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
O
思考:课本P86的思考题.
例1:5个学生的数学和物理成绩如下表:
我们还可以举出现实生活中存在的许多相关 关系的问题。例如: 1〉商品销售收入与广告支出经费之间的关系。
商品销售收入与广告支出经费之间有着密切的联系, 但商品收入不仅与广告支出多少有关,还与商品质 量、居民收入等因素有关。
2〉粮食产量与施肥量之间的关系。
在一定范围内,施肥量越大,粮食产量就越高。 但是,施肥量并不是决定粮食产量的唯一因素, 因为粮食产量还要受到土壤质量、降雨量、田 间管理水平等因素的影响。
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
整体上最接近
方案二: 在图中选取两点画直线,使得直线 两侧的点的个数基本相同。
脂肪
40 30 20 10
0 0
脂肪
20
40
60
80
方案三: 在散点图中多取几组点,确定几条直线的 方程,分别求出各条直线的斜率和截距的平均数, 将这两个平均数作为回归方程的斜率和截距。
1 、散点图:
将各数据在平面坐标系中的对应点画出来,得到表示 两个变量的一组数据的图形,这样的图形叫做散点图。
如下图:
脂肪含量 40
35 30 25 20 15 10 5
年龄
O 20 25 30 35 40 45 50 55 60 65
从刚才的散点图发现:年龄越大,体内脂肪含量越
高,点的位置散布在从左下角到右上角的区域。称它们
• 而要证实此结论是否可靠,可以通过试验来进行。 相同的环境下将居民随机地分为两组,一组居民和 天鹅一起生活(比如家中都饲养天鹅),而另一组 居民的附近不让天鹅活动,对比两组居民的出生率 是否相同。
回归直线
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
画出散点图,并判断它们是否有相关关系。
解:
80
物理成绩
75
70
65
60
55
50
数学成绩
40
50
60Hale Waihona Puke 708090
由散点图可见,两者之间具有正相关关系。
例2:有一个同学家开了一个小卖部,他为了研究气温 对热饮销售的影响,经过统计,得到一个卖出的热饮杯 数与当天气温的对比表: 摄氏温度 -5 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54
3〉人体内脂肪含量与年龄之间的关系。
在一定年龄段内,随着年龄的增长,人体内 的脂肪含量会增加,但人体内的脂肪含量还 与饮食习惯、体育锻炼等有关,可能还与个 人的先天体质有关。
你还能举出一些类似的例子吗?
应当说,对于上述各种问题中的两个变量之 间的相关关系,我们都可以根据自己的生活、学 习经验作出相应的判断,因为“经验当中有规 律”。但是,不管你经验多么丰富如果只凭经验 办事,还是很容易出错的。因此,在分析两个变 量之间的关系时,我们还需要有一些有说服力的 方法。
脂肪
40
30
20
脂肪
10
0
0
20
40
60
80
上述三种方案均有一定的道理,但可靠性不强, 我们回到回归直线的定义。
如果散点图中点的分布从整体上看大致在一条直线附近, 我们就称这两个变量之间具有线性相关关系,这条直线 就叫做回归直线。
求回归方程的关键是如何用数学的方法来刻画 “从整体上看,各点与直线的偏差最小”。
如果散点图中点的分布从整体上看大致在一条直 线附近,我们就称这两个变量之间具有线性相关 关系,这条直线就叫做回归直线。
这条回归直线的方程,简称为回归方程。
1.如果所有的样本点都落在某一函数曲线上,变 量之间具有函数关系
2.如果所有的样本点都落在某一函数曲线附近, 变量之间就有相关关系
3.如果所有的样本点都落在某一直线附近,变量 之间就有线性相关关系
2.3.1 变量间的相关关系
思考
在学校,老师经常对学生这样说:“如果 你的数学成绩好,那么你的物理学习就不会 有什么大问题。”按照这种说法,似乎学生 的物理成绩与数学成绩之间存在着一种相关 关系。这种说法有没有依据呢?
凭我们的学习经验可知,物理成绩确实 与数学成绩有一定的关系,但除此以外,还 存在其他影响物理成绩的因素。例如,是否 喜欢物理,用在物理学习上的时间等等。当 我们主要考虑数学成绩对物理成绩的影响时, 就是主要考虑这两者之间的相关关系。
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一 般规律;
解: (1)散点图
热饮杯数 160 150 140 130 120 110
100 90 80 70 60 50 40
温度
-10
0
10
20
30
40
(2)气温与热饮杯数成负相关,即气温越高,卖出去 的热饮杯数越少。
练习:
有关法律规定,香烟盒上必须印上“吸烟有害 健康”的警示语。吸烟是否一定会引起健康问题? 你认为“健康问题不一定是由吸烟引起的,所以可 以吸烟”的说法对吗?