第十章 第三节 变量间的相关关系

合集下载

高考数学(理)一轮复习课件:统计与概率-3变量间的相关关系与统计案例(人教A版)

高考数学(理)一轮复习课件:统计与概率-3变量间的相关关系与统计案例(人教A版)
第十章 统计与概率
第3课时 变量间的相关关系与统计案例
考纲下载 1.会作两个有关联变量的数据的散点图,会利用散点 图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方 程系数公式建立线性回归方程.
3.了解独立性检验(只要求 2×2 列联表)的基本思想、 方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
y2 总计
x1
a
x2
2
总计 b
21 73 25 27 46
则表中a、b处的值分别为( )
A.94、96
B.52、50
C.52、54
D.54、52
答案:C 解析:a=73-21=52,b=a+2=54,故选C.
5. [原创]某医疗研究所为了了解某种血清预防感冒的 作用,把 500 名使用过血清的人与另外 500 名未使用血清 的人一年中的感冒记录作比较,提出假设 H0:“这种血清 不能起到预防感冒的作用”,利用 2×2 列联表计算得 K2 ≈3.918,经查临界值表知 P(K2≥3.841)≈0.05.则下列结论 中,正确结论的序号是________.
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
随机变量 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d), 其中 n=a+b+c+d 为样本容量.
(3)独立性检验 利用随机变量 K2 来确定在多大程度上可以认为“两
个分分类类变变量量有有关关系系”的方法称为两个分类变量的独立性
nn
(xi - x )(y i- y )
ii==11
为:^b=
, ^a=y-y---^b^bx-x- .

第三节 变量间的相关关系-高考状元之路

第三节 变量间的相关关系-高考状元之路

第三节 变量间的相关关系预习设计 基础备考知识梳理1.两个变量的线性相关(1)正相关:在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从 到 的区域,对于两个变量的这种相关关系,我们将它称为负相关.(3)线性相关关系、回归直线: 如果散点图中点的分布从整体上看大致在 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法: 求回归直线使得样本数据的点到它的 的方法叫做最小二乘法.(2)回归方程:方程a x by ˆˆ+=是两个具有线性相关关系的变量的一组数据),(,),,(),,(2211n n y x y x y x 的回归方程,其中:ˆ,ˆb a是待定参数. ⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧-=⋅-====-∑∑-∑--∑==x b y a i y x n y x i n i i i n i b x n x x x y y x x n i i i n i n ˆˆ22211ˆ111)())((典题热身1.下列选项中,两个变量具有相关关系的是 ( )A .参加60年国庆阅兵的人数与观看第十一届全运会开幕布式的人数B .正方体的体积与棱长C .人体内的脂肪含量与年龄D .汶川大地震的经济损失与全球性金融危机的经济损失答案:C2.(2011.陕西高考)设),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( )A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在O 到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同答案:A3.设有一个回归直线方程为,5.12ˆx y-=则变量x 增加一个单位 ( ) A .y 平均增加1.5个单位B .y 平均增加两个单位C .y 平均减少1.5个单位D .y 平均减少两个单位答案:C4.在一次实验中,测得(x ,y)的四组值为(1,2),(2,3),<蝴_(4,5),则y 与x 之间的回归直线方程为 ( )1ˆ.+=x yA 2ˆ.+=x yB 12ˆ.+=x yC 1ˆ.-=x yD 答案:A5.(2011.辽宁高考)调查了某地若干户家庭的年收入x (单位;万元)和年饮食支出y(单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:,321.0254.0ˆ+=x y 由回归直线方程可知,家庭年收入每增加l 万元,年饮食支出平均增加 万元.答案:0,254课堂设计 方法备考题型一 利用散点图判断两个变量的相关关系画出散点图,判断它们是否有相关关系.题型二 求回归直线方程【例2】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据;(1)请画出表中数据的散点图;(2)请根据表中提供的数据,用最小二乘法求出y 关于x 的回归方程.ˆˆˆa x b y+= 题型三 利用回归直线方程对总体进行估计【例3】某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1000件时,单位成本平均变动多少?(3)假定产量为6000件时,单位成本为多少元?技法巧点(1)线性相关关系的理解:相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系,例如正方形面积S 与边长x 之间的关系2x s =就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系,例如商品的销售额与广告费是相关关系,两个变量具有相关关系是回归分析的前提. (2)求回归方程,关键在于正确求出系数b a b aˆ,ˆ,ˆ,ˆ由于的计算量大,计算时应仔细谨慎,分层进行,避免因计算产生错误.(注意回归直线方程中一次项系数为,ˆb 常数项为,ˆa 这与一次函数的习惯表示不同.)(3)回归分析是处理变量相关关系的一种数学方法,主要解决:①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察值,预测变量的取值及削断变量取值的变化趋势;③求出回归直线方程.失误防范1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.2.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.随堂反馈 1.(20】】.江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为 ( )1-=⋅x y A 1+=⋅x y B x y c 2188+=⋅ 176=⋅y D 答案:C2.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x 具有真相关关系,回归方程为.562.166.0ˆ+=x y若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为 ( )%83.A 0072.B 0076. c %66.D 答案:A3.(2011.广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y 之间的关系;小李这5天的平均投篮命中率为 ;用线性 回归分析的方程,预测小李该月6号打6小时篮球的投篮命中率为答案:53.0;5.0高效作业 技能备考一、选择题1.(201-1.福州模拟)已知变量x ,y 呈线性相关关系,回归方程为,25.0ˆx y+=则变量x ,y 是( ) A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系答案;A2.(2011.绍兴月考)对有线性相关关系的两个变量建立的回归直线方程x b a yˆˆˆ+=中,回归系数b ˆ( ) A .可以小于0 B .大于O C .能等于O D .只能小于0答案:A3.已知x 与y 之间的一组数据:则y 与x 的线性回归方程a x b yˆˆˆ+=必过 ( ) A .点(2,2) B .点(1.5,O) C .点(1,2) D .点(1.5,4)答案:D4.(2011.泰安模拟)下表是某厂l ~4月份用水量(单位:百吨)的一组数据:散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是,ˆ7.0ˆa x y+-=则 aˆ等于( ) 5.10.A 15.5.B 2.5.c 25.5.D答案:D5.对变量x ,y 有观测数据),10,,2,1)(,( =i y x i i 得散点图(1);对变量u ,v 有观测数据),10,,2,1)(,( =i v u i i 得散点图(2),由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关 B.变量_x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关答案:C6.(2011.青岛模拟)为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为⋅21l l 、已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s 、t ,那么下列说法正确的是 ( )A .直线1l 和2l 一定有公共点(s ,t)B .直线1l 和2l 相交,但交点不一定是(s ,t)C .必有21//l l 21.l lD 与必定重合答案:A二、填空题7.(2011.舟山适应性考试)人的身高与手的扎长存在相关关系,且满足264.31303.0ˆ-=x y(x 为身高,y 为扎长,单位:cm),则当扎长为24.8 cm 时,身高为 cm.答案:03.1858.(2011.芜湖模拟)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其线性回归方程是 答案:42347+=x y9.(2011.丽水调研)某单位为了了解用电量y 度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程,2ˆˆˆˆ-=+=b a x b y中预测当气温为-4℃时,用电量的度数约为 答案:68三、解答题10.(2011.台州模拟)在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y 与x 呈线性相关,试求回归方程.11.(2011.枣 庄模拟)在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.12.(2011.北京高考)以下茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树为19的概率. (注:方差],)()()[(1222212x x x x x x n s n -++-+-=其中x 为n x x x ,,,21 的平均数)。

变量间的相关关系 课件

变量间的相关关系  课件
b.
(2)回归直线方程求解的方法步骤 根据最小二乘法的思想和公式,利用计算器或计算机,可
以方便地求出回归方程.
(3)利用回归直线对总体进行估计 利用回归直线,我们可以进行预测,若回归直线方程为y^ = bx+a,则 x=x0 处的估计值为:y^ 0=bx0+a.
特别提示:进行回归分析,通常先进行相关性检验,若能 确定两个变量具有线性相关关系,再去求其线性回归方程,否 则所求方程毫无意义.
一般规律吗? (2)求回归直线方程; (3)预测当钢水含碳量为 1.6%时,应冶炼多少分钟?
思路点拨:先画出散点图,求出回归直线方程,再进行预 测.
【解析】(1)以 x 轴表示含碳量,y 轴表示冶炼时间,可作 散点图,如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性 相关.
(2)列出下表,并用科学计算器进行计算:
10
10
10
x =159.8, y =172,x2i =265 448,y2i =312 350,xiyi=287 640
i=1
i=1
i=1
设所求的回归直线方程为y^ =bx+a,其中 a,b 的值使 Q=
10
(yi-bxi-a)2 的值最小.
i=1
10
xiyi-10 x y
i=1
b^ =
≈1.27,
记 x =1ni=n1xi, y =1ni=n1yi,则( x , y )为样本点的中心,回归直
线一定过这一点,对于单变量样本数据而言,平均数是样本 数据的中心,类似地,对于双变量样本点而言,回归直线是 样本点的中心.
2.怎样画出散点图和回归直线?
【答案】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将 n 个数据点(xi,yi)(n=1,2,3,…,n)描在平面直角坐 标系中. (3)描的点可以是实心点,也可以是空心点. (4)画回归直线时,一定要画在多数点经过的区域.实际画 线时,先观察有哪两个点在直线上即可. (5)具体作回归直线时,用一把透明的直尺边缘在这些点间 移动,使它尽量靠近或通过大多数点,然后画出直线.

知识讲解_变量间的相关关系_基础

知识讲解_变量间的相关关系_基础

变量的相关关系编稿:丁会敏审稿:静伟【学习目标】1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线程、线性回归分析的意义;4.掌握对两个变量进行线性回归的法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线程;【要点梳理】【高清课堂:变量的相关关系400458 知识讲解1】要点一、变量之间的相关关系变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。

1.函数关系函数关系是一种确定性关系,如y=kx+b,变量x取的每一个值,y都有唯一确定的值和它相对应。

2.相关关系变量间确定存在关系,但又不具备函数关系所要求的确定性相关关系分为两种:正相关和负相关要点诠释:对相关关系的理解应当注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.3.散点图将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。

通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。

要点二、正相关、负相关(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。

变量间的相关关系课件

变量间的相关关系课件
前降低了多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
分析:(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平
^^
面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数 ,
的值;(3)实际上就是求当 x=100 时,对应的 y 的值.
解:(1)散点图,如图所示.
42.
y 40 41 41
42
43 44
5
5
16
0
45
16
2
45
16
3
164
46
45.
5
(1)画出散点图.
(2)判断变量 x,y 是否具有相关关系?如果具有相关关系,那么是正相
关还是负相关?
分析:对于给定一组观察数据,可以借助作散点图这样有效的手段进
行处理.
解:(1)画出散点图.
(2)具有相关关系.根据散点图,左下角到右上角的区域,变量 x 的
的值由以下公式给出:

^
∑ ( -)( -)
= =1
∑ ( -)
2

∑ -n
= =1


=1
^
=1
2 -n2
,
^
= - ,
^
^
其中, 是回归方程的斜率, 是回归方程在 y 轴上的截距.
1.散点图
剖析:(1)将样本中的 n 个数据对(xi,yi)(i=1,2,…,n)描在平面直角
坐标系中,所得图形叫做散点图(scatterplot).
(2)散点图形象地反映了各对数据的密切程度.根据散点图中点
的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.

【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

求得回归方程^y=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 y(min) 62
75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为__6_8__.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
[解析] 由-x =30,得-y =0.67×30+54.9=75. 设表中的“模糊数字”为 a, 则 62+a+75+81+89=75×5,∴a=68.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
返回导航
5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了 50 名 男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评 价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客 30 20
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
考点一
相关关系的判断——自主练透
(1)(2021·四 川 资 阳 模
拟)在一次对人体脂肪含量和年龄关
系的研究中,研究人员获得了一组样
本数据,并制作成如图所示的人体脂
肪含量与年龄关系的散点图.根据该
图,下列结论中正确的是 ( )
返回导航
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽取 20 个作
为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中 xi 和 yi 分别表 示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计
20
20
20
算得xi=60,yi=1 200,

变量间的相关关系讲义

变量间的相关关系讲义

变量间的相关关系讲义变量间的相关关系讲义一、基础知识梳理知识点1:变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。

当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。

相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系。

注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。

点睛:两个变量相关关系与函数关系的区别和联系相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。

知识点2.散点图.1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图。

2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合。

3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内。

如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从左上角到右下角的区域。

变量间的相关关系 课件

变量间的相关关系 课件

4.回归直线方程 (1)回归直线:如果散点图中点的分布从整体上看大致 在_一__条__直__线__附近,就称这两个变量之间具有_线__性__相__关__关 系,这条直线叫做回归直线. (2)回归方程:_回__归__直__线__的方程,简称回归方程. (3)回归方程的推导过程: ①假设已经得到两个具有线性相关关系的变量的一组 数据(x1,y1),(x2,y2),…,(xn,yn). ②设所求回归方程为_^y_=__^b_x_+__^a_,其中^a,^b是待定参数.
【解】 (1)画散点图如图. 由图可知y与x具有线性相关关系.
(2)列表、计算:
i1
2
3
4
5
6
7
xi 10
20
30
40
50
60
70
yi 62
68
75
81
89
95
102
xiyi 620 1 360 2 250 3 240 4 450 5 700 7 140
10
10
x =55, y =91.7, xi2 =38 500, xiyi=55 950
9 90 115 10 350
10 100 122 12 200
◆用公式求回归方程的一般步骤:
(1)列关于xi,yi,xiyi的表格.
(2)计算
x

y

n
, n
xi2
xiyi.
i 1
i 1
(3)代入公式计算bˆ ,aˆ的值.
(4)写出回归方程.
【注意】
求回归方程前,需要:
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般 由题目给出).
i 1

变量间的相关关系

变量间的相关关系

1221ni iiniix y nxybx nxa y bx==⎧-⎪⎪=⎨-⎪⎪=-⎩∑∑其中1111,n ni ii ix x y yn n====∑∑以上方法称为最小二乘法。

典例精讲题型1相关关系的判断例1.(★)观察两相关变量得如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1y -9 -7 -5 -3 -1 1 5 3 7 9画出散点图,判断它们是否有线性相关关系.【思路点拨】建系→描点→观察→结论.【解】由数据可得相应的散点图(如图所示):由散点图可知,两者之间不具有线性相关关系.点评:以x为自变量,考查因变量y的变化趋势,从而作出判断变式训练:(★★)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方y Λ=bx +a ;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【思路点拨】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画出散点图; (2)应用计算公式求得线性相关系数b 、a 的值;(3)实际上就是求当x =100时,对应的yΛ的值. 【解】(1)散点图如图所示:(2)由题意,得41i ii x y=∑i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+6=4.54 y =2.5+3+4+4.5=3.54421ii x=∑=32+42+52+62=86.266.5-4 4.5 3.566.5-63===0.786-4 4.586-81b ⨯⨯⨯=- =3.5-0.7 4.5=0.35a y b x ⨯故线性回归方程为yΛ=0.7x +0.35.(3)根据回归方程预测现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35(吨), 故生产能耗减少了90-70.35=19.65(吨). 点评: 求线性回归直线方程的步骤如下:课堂检测(★★) 10min1 . 下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值 B.正方形边长和面积C.正n边形的边数和它的内角和 D.人的年龄和身高2.某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x,则下列说法中正确的是()A.劳动生产率为1000元时,月工资为130元B.劳动生产率提高1000元时,月工资提高约为130元C.劳动生产率提高1000元时,月工资提高约为80元D.月工资为210元时,劳动生产率为2000元3.设有一个回归方程为y=2-1.5x,则变量x每增加一个单位时,y平均()A.增加1.5单位B.增加2单位C.减少1.5单位D.减少2单位4.正常情况下,年龄在18岁到38岁的人们,体重y(kg)依身高x(cm)的回归方程为y=0.72x-58.5。

(旧教材适用)2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例课件

(旧教材适用)2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例课件

抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95




-x

1 16
16
x
i

9.97

s

i=1
1 16
16
xi--x 2

i=1
0.050 0.010
k0
3.841 6.635
附:K2=a+bcn+add-ab+cc2b+d.
0.005 7.879
0.001 10.828
解析 根据题目所给数据得到如下 2×2 列联表:
乐观
不乐观
总计
国内代表
60
40
100
国外代表
40
60
100
总计
100
100
200
则 K2=20100×0×6100×0×601-004×0×104002=8>6.635,所以有 99%的把握认为是否
∵y 与 x 的相关系数近似为 0.9966,说明 y 与 x 的线性相关程度相当强,
∴可以用线性回归模型拟合 y 与 x 的关系.
(3)建立 y 关于 x 的回归方程,预测第 5 年的销售量约为多少?
参考数据:
∑4
i=1
yi--y 2≈32.7,
5≈2.24,i∑=4 1xiyi=418.
参考公式:
(3)回归分析 ①定义:对具有 □06 相关关系的两个变量进行统计分析的一种常用方法. ②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…, (xn,yn)中,-x =1n(x1+…+xn),-y =1n(y1+…+yn),a^ =-y -b^ -x ,(-x ,-y ) 称为样本点的中心.

变量间的相关关系

变量间的相关关系

变量间的相关关系1、相关关系的理解我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。

生活中的任何两个变量之间是不是只有确定关系呢?如:学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。

这就是我们这节课要共同探讨的内容————变量间的相关关系。

例1、根据样本数据作出散点图,直观感知变量之间的相关关系。

在研究相关关系前,先回忆一下函数的表示方法有哪些——列表,画图象,求解析式。

下面我们就用这些方法来研究相关关系。

看这样一组数据:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,根据样本数据,人体的脂肪含量与年龄之间有怎样的关系?结论:随着年龄增长,脂肪含量在增加。

用x轴表示年龄,y轴表示脂肪。

一组样本数据就对应着一个点。

2、散点图这个图跟我们所学过的函数图象有区别,它叫作散点图。

3、判断正、负相关、线性相关:请观察这4幅图,看有什么特点?图1呈上升趋势,图2呈下降趋势。

这就像函数中的增函数和减函数。

即一个变量从小到大,另一个变量也从小到大,或从大到小。

对于图1中的两个变量的相关关系,我们称它为正相关。

图2中的两个变量的相关关系,称为负相关。

后面两个图很乱,前面两个图中点的分布呈条状。

从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。

我们称图1、2中的两个变量具有线性相关关系。

这条直线叫做回归直线。

图3、4中的两个变量是非线性相关关系1、找回归直线下面我们再来看一下年龄与脂肪的散点图,图12图图3图4从整体上看,它们是线性相关的。

如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。

这条直线可以作为两个变量具有线性相关关系的代表。

能否画出这条直线?多种方法展示总结:所有的点离这条直线最近的方案最好。

从整体上看,各点与此直线的距离和最小。

变量间的相关关系

变量间的相关关系

变量间的相关关系
答案:变量之间的关系是相关关系。

相关关系是客观现象存在的一种非确定的相互依存关系,即自变量的每一个取值,因变量由于受随机因素影响,与其所对应的数值是非确定性的。

相关分析中的自变量和因变量没有严格的区别,可以互换。

变量相关关系:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。

变量间的这种相互关系,称为具有不确定性的相关关系。

变量之间的相关关系

变量之间的相关关系
知识点——
变量之间的相间确实存在关系,但又不 具备函数关系所要求的确定性,若它们的关系是 带有随机性的,就说两个变量具有相关关系. 注:相关关系是一种非确定性关系. 2、散点图:从一个统计数表中,为了更清楚地 看出x与y是否有相关关系,常将x的取值作为横 坐标,将y的相应取值作为纵坐标,在直角坐标 系中描点 i i ,这样的图形叫做散 点图.
温热度饮/℃杯数-5 与当0 天4气温7的对12比表15:19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的 一般规律;
变量之间的相关关系
【典型例题】 解:(1)散点图如图所示
变量之间的相关关系
【分类】
线性相关关系:
正相关:指的是两个变量有相同的变化趋势,即从 整体上来看一个变量会随着另一个变量变大而变大. 这在散点图上的反映就是散点的分布在斜率大于0的 直线附近;
40
35
30
25
20
15
10
5
0
0
10
20
30
40
50
60
70
变量之间的相关关系
【分类】
负相关:指的是两个变量有相反的变化趋势,即 从整体上来看一个变量会随着另一个变量变大而 变小,这在散点图上的反映就是散点的分布在斜 率小于0的直线附近.
1.2 1
0.8 0.6 0.4 0.2
0 0
0.1
0.2
0.3
0.4
0.5
0.6
变量之间的相关关系
【典型例题】
1、某机构曾研究温度对翻车鱼的影响,在一定温 度下,经过x单位时间,翻车鱼的存活比例为y,数 据如下: (0.10,1.00),(0.15,0.95),(0.20,0.95), (0.25,0.90),(0.30,0.85),(0.35,0.70), (0.40,0.65),(0.45,0.60),(0.50,0.55), (0.55,0.40) (1)请作出这些数据的散点图; (2)关于这两个变量的关系,你能得出什么结论?

2013届高考北师大版数学总复习课件:10.3变量间的相关关系

2013届高考北师大版数学总复习课件:10.3变量间的相关关系

0+1+ 3+4 [解析] ∵ x = =2, 4 2.2+4.3+4.8+6.7 y= =4.5, 4 ∴a= y -0.95 x =4.5-0.95×2=2.6.
• 7.下面是水稻产量与施化肥量的一组观测 施化肥 数据: 15 20 25 30 35 40 45 量 水稻产 320 330 360 410 460 470 480 量
知识梳理 1.散点图 (1)将变量所对的点描出来,就组成了变量之间的一个图, 这种图为变量之间的 散点图 .
(2)从散点图上可以看出,如果变量之间存在着某种关系,这
光滑的曲线来 些点会有一个集中的大致趋势,这种趋势可用一条
近似,这种近似的过程称为曲线拟合.
若两个变量 x 和 y 的散点图中,所有点看上去都在一条直 线附近波动, 则称变量间是 线性相关 的. 若所有点看上去都 在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关 _________ 的.如果所有的点在散点图中没有显示任何关系,则称变量间 是不相关的.
[答案] C
[解析] 回归直线必过点(4,5),故其方程为 y-5=1.23(x -4),即 y=1.23x+0.08,故选 C.
• 2 . 对变量 x , y 有观测数据 (xi , yi)(i = 1,2 , …,10),得散点图1;对变量u,v有观测数 据 (ui , vi)(i = 1,2 , … , 10) ,得散点图 2. 由 这两个散点图可以判断.( )
2.回归方程 (1)最小二乘法 如果有 n 个点:(x1,y1),(x2,y2),…,(xn,yn)可以用下 面的表达式来刻画这些与 直线 y=a+bx 的接近程度: [y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2 使得上式达到最小值的 直线 y=a+bx 就是我们要求 的直线,这种方法称为最小二乘法.

第十章 统计与概率10-3变量间的相关关系与统计案例

第十章  统计与概率10-3变量间的相关关系与统计案例

第10章 第3节一、选择题1.(文)(2010·重庆文,5)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .35[答案] B[解析] 抽取比例为350 250 150=7 5 3,因为青年职工抽取7人,所以中年职工抽取5人,老年职工抽取3人,所以样本容量为7+5+3=15人,故选B.(理)设某项试验的成功率是失败率的2倍,用随机变量ξ去描述1次试验的成功次数,则P (ξ=0)和D (ξ)的值依次为( )A .1,6 B.12,12 C.13,29D.14,516[答案] C[解析] 由题意,设ξ的分布列为即“ξ=0”表示试验失败,“ξ 由p +2p =1,得p =13∴P (ξ=0)=13,又E (ξ)=0×13+1×23=23,∴D (ξ)=⎝⎛⎭⎫0-232×13+⎝⎛⎭⎫1-232×23=29 故选C.2.(2010·安徽江南十校联考)最小二乘法的原理是( ) A .使得∑i =1n[y i -(a +bx i )]最小B .使得∑i =1n[y i -(a +bx i )2]最小C .使得∑i =1n[y i 2-(a +bx i )2]最小D .使得∑i =1n[y i -(a +bx i )]2最小[答案] D[解析] 根据回归方程表示到各点距离最小的直线方程,即总体偏差最小,亦即∑i =1n[y i -(a +bx i )]2最小.3.(2010·银川模拟)下列四个命题正确的是( )①线性相关系数r 越大,两个变量的线性相关性越强,反之,线性相关性越弱; ②残差平方和越小的模型,拟合的效果越好;③用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好; ④随机误差e 是衡量预报精确度的一个量,它满足E (e )=0. A .①③ B .②④ C .①④D .②③[答案] B[解析] 线性相关系数r 满足|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱,故①错误;相关指数是度量模型拟合效果的一种指标.相关指数R 2越接近于1,模型的拟合效果越好,R 2越大,残差平方和就越小,故残差平方和越小的模型,拟合效果越好,故②对③错.故选B.4.若两个分类变量x 、y 的列联表为则变量y 与x A .99%以上B .95%以上C .99.5%以上D .95%以下[答案] B[解析] n =15+45+30+40=130,∴χ2=130×(15×40-45×30)260×70×45×85≈4.55>3.841,∴有95%以上的把握认为y 与x 有关系,故选B.5.(2010·北京延庆县模考)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2 3 4 6 4 1,第三组的频数为12,则本次活动参加评比作品总数、上交作品数量最多的组的作品件数依次为( )A .60、18B .60、20C .80、18D .80、30[答案] A6.(文)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )A.y ^=1.23x +4 B.y ^=1.23x +0.08 C.y ^=1.23x +0.8D.y ^=1.23x -0.08[答案] B[解析] 由条件知,x -=4,y -=5, 设回归直线方程为y ^=1.23x +a ,则 a =y --1.23x -=0.08.(理)(2010·延边州质检)两个相关变量满足如下关系:A.y ^=0.56x +997.4 B.y ^=0.63x -231.2 C.y ^=0.56x +501.4D.y ^=60.4x +400.7[答案] A[解析] x -=20,y -=1008.6,代入公式b ^=∑i =15(x i -x -)(y i -y -)∑i =15(x i -x -)2,及a ^=y --b ^x -中可得:b ^=0.56,a ^=997.4,故选A.7.(2010·山东省实验中学)设有n 个样本x 1,x 2,…,x n ,其标准差是S x ,另有n 个样本y 1,y 2,…,y n ,且y k =3x k +5,(k =1,2,…,n ),其标准差为S y ,则下列关系正确的是( )A .S y =3S x +5B .S y =3S xC .S y =3S xD .S y =3S x +5[答案] B[解析] S y 2=32S x 2,∴S y =3S x .[点评] 一般的数据x 1,x 2,…,x n 的平均数为x -,方差为S 2,则kx 1+b ,kx 2+b ,…,kx n +b 的平均数为k x -+b ,方差为k 2S 2.8.(2010·福州市质检)在某种新型材料的研制中,实验人员获得了下列一组实验数据:( )A .y =2x -2B .y =12(x 2-1)C .y =log 3xD .y =2x -2[答案] B[解析] 把表格中的数据代入选择项的解析式中,易得所求的最接近的一个函数是y =12(x 2-1).9.(文)(2010·厦门三中阶段训练)某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A.5B .4C .3D .2[答案] D[解析] 去掉最低分87,去掉最高分94(假设x ≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x ,∴x =2,符合题意,故选D.(理)(2010·福建省龙岩市质检)一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度数据的中位数之和是( )A.44 B .54 C .50D .52[答案] D[解析] 根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:19,20,21,23,24,37,33,32,31;观察乙树苗10次得到的树苗高度分别为:10,14,10,26,24,30,44,46,46,47,易得甲树苗高度的中位数为24,乙树苗高度的中位数为26+302=28,因此24+28=52.[点评] 在茎叶图中找中位数时,n 为奇数,前后各去掉n -12个,剩下一个即是;n 为偶数,前后各去掉n -22个,剩下两个的平均数即是,用这种方法找中位数,必须注意,茎叶图中数据是按规则从小到大排列的,否则去掉两端数字时,大的从大到小找,小的从小到大找.10.(09·上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3 [答案] D[解析] 逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,0,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.故选D.[点评] x -=2时,(x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),∵x i ∈N *,即x i ≤7.二、填空题11.(2010·广东文)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.[答案] 13 正[解析] 找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,中位数为13万元,且年平均收入增多时,年平均支出也增多,因此两者正相关.12.观察两相关变量得到如下数据:则两变量的回归直线方程为________. [答案] y ^=0.179+0.905x [解析] x -=4.5,y -=4.25,∑i =18x i 2=204,∑i =18x i y i =191,b ^=∑i =18x i y i -8x -y-∑i =18x i 2-8x -2=191-8×4.5×4.25204-8×4.52≈0.905,a ^=y --b ^x -=4.25-0.905×4.5≈0.179, ∴所求回归直线方程为y ^=0.179+0.905x .13.(2010·湖南考试院调研)在某赛季篮球比赛中,甲、乙两名运动员每场比赛的得分统计茎叶图如图所示,则发挥较稳定的运动员是________.[答案]甲14.(2010·辽宁省实验中学模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有________%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.独立性检验随机变量χ2值的计算公式:χ2=(a+b)(c+d)(a+c)(b+d).[答案]97.5三、解答题15.(2010·广东文,17)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.[解析](1)由于大于40岁的42人中有27人收看新闻节目,而20至40岁的58人中,只有18人收看新闻节目,故收看新闻节目的观众与年龄有关.(2)27×545=3,∴大于40岁的观众应抽取3名.(3)由题意知,设抽取的5名观众中,年龄在20岁至40岁的为a 1,a 2,大于40岁的为b 1,b 2,b 3,从中随机取2名,基本事件有:(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,b 2),(b 1,b 3),(b 2,b 3)共十个,设恰有一名观众年龄在20至40岁为事件A ,则A 中含有基本事件6个:(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),∴P (A )=610=35.16.(文)(2010·新课标全国理,19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[解析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.(理)(09·辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸的结果如下表:甲厂乙厂(1)(2)由于以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”..[解析] (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1000×(360×500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.17.(文)在10瓶饮料中,有2瓶是不合格产品,现质检员从这10瓶饮料中任意抽取2瓶进行检验.(1)求质检员检验到不合格产品的概率;(2)若把这10瓶饮料分成甲、乙两组,对其容量进行测量,数据如下表所示(单位:mL):[解析] (1)把10瓶饮料分别编号为1,2,3,4,5,6,7,8,a ,b .其中a ,b 表示不合格产品.则从中任意抽取两瓶饮料的基本事件有45个,即:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,a ),(1,b );(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,a ),(2,b );(3,4),(3,5),(3,6),(3,7),(3,8),(3,a ),(3,b );(4,5),(4,6),(4,7),(4,8),(4,a ),(4,b );(5,6),(5,7),(5,8),(5,a ),(5,b );(6,7),(6,8),(6,a ),(6,b );(7,8),(7,a ),(7,b );(8,a ),(8,b );(a ,b ).其中抽到不合格的事件有17个.∴质检员检验到不合格产品的概率为P =1745.(2)x -甲=257+259+260+261+2635=260,x -乙=258+259+259+261+2635=260,∴S 甲2=15[(257-260)2+(259-260)2+(260-260)2+(261-260)2+(263-260)2]=4,S 乙2=15[(258-260)2+(259-260)2+(259-260)2+(261-260)2+(263-260)2]=3.2.∵S 甲2>S 乙2,∴乙组饮料的容量更稳定些.(理)(2010·广东佛山)为了对2007年佛山市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学分数(已折算为百分制)从小到大排列是60、65、70、75、80、85、90、95,物理分数从小到大排列是72、77、80、84、88、90、93、95.(1)若规定85分(包括85分)以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率;(2)若这8位同学的数学、物理、化学分数事实上对应如下表:(3)求y 与x 、z 与x 的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.参考数据:x -=77.5,y -=85,z -=81,∑i =18 (x i -x -)≈1050,∑i =18 (y i -y -)2≈456,∑i =18 (z i-z -)≈550,∑i =18 (x i -x -)(y i -y -)≈688,∑i =18 (x i -x -)(z i -z -)≈755,∑i =18 (y i -y ^i )≈7,∑i =18 (z i -z^i )2≈94,1050≈32.4,456≈21.4,550≈23.5.[解析] (1)这8位同学中恰有3位同学的数学和物理分数均为优秀,则需要先从物理的4个优秀分数中选出3个与数学优秀分数对应,种数是C 43A 33(或A 43),然后将剩下的5个数学分数和物理分数任意对应,种数是A 55.根据乘法原理,满足条件的种数是C 43A 33A 55.这8位同学的物理分数和数学分数分别对应的种数共有A 88.故所求的概率P =C 43A 33A 55A 88=114. (2)变量y 与x 、z 与x 的相关系数分别是r =68832.4×21.4≈0.99,r ′=75532.4×23.5≈0.99 可以看出,物理与数学、化学与数学的成绩都是高度正相关.(3)设y 与x 、z 与x 的线性回归方程分别是y ^=bx +a ,z ^=b ′x +a ′根据所给的数据可以计算出,b =6881050=0.65,a =85-0.65×77.5=34.63, b ′=7551050=0.72,a ′-81-0.72×77.5=25.20 所以y 与x 和z 与x 的回归方程分别是y ^=0.65x +34.63,z ^=0.72x +25.20,又y 与x 、z 与x 的相关指数是R 2=1-7456≈0.98, R ′2=1-94550≈0.83 故回归模型y ^=0.65x +34.63比回归模型z ^=0.72x +25.20的拟合的效果好.。

人教版高考数学总复习第一部分考点指导第十章第三节变量的相关性与一元线性回归模型列联表与独立性检验

人教版高考数学总复习第一部分考点指导第十章第三节变量的相关性与一元线性回归模型列联表与独立性检验

i1
,其中 (yi yi )2 是残差平
(yi y)2
i1
i1
方和,R2 越大,残差平方和_越__小__,模型的拟合效果_越__好__.R2 越小,残差平方和
_越___大__,模型的拟合效果__越__差___.
5.列联表与独立性检验
(1)关于分类变量 X 和 Y 的抽样数据的 2×2 列联表:
【解析】选 C.因为 χ2=5,根据临界值表知 P(χ2≥3.841) =0.05,P(χ2≥6.635) =0.01,
故有 95%以上的把握认为“X 和 Y 有关系”.
4.(回归方程的性质)(多选题)在统计中,由一组样本数据(x1,y1),(x2,y2),…, (xn,yn)利用最小二乘法得到两个变量的经验回归方程为 = x+ ,,那么下列说法 正确的是( ) A.样本相关系数 r 不可能等于 1
X YY=0Y=1合计 X=0 a b a+b X=1 c d c+d
合计a+c b+dn=a+b+c+d
n(ad-bc)2
计算随机变量 χ2=
,利用 χ2 的取值推断
(a+b)(c+d)(a+c)(b+d)
分类变量 X 和 Y_是__否__独__立__的方法称为 χ2 独立性检验.
(2)独立性检验【3】 基于小概率值 α 的检验规则: 当 χ2≥xa 时,推断 H0 不成立,即认为 X 和 Y 不独立,该推断犯错误的概率不超过 α; 当 χ2<xa 时,没有充分证据推断 H0 不成立,可以认为 X 和 Y 独立. 利用 χ2 的取值推断分类变量 X 和 Y 是否独立的方法称为 χ2 独立性检验,简称独立 性检验.
x0 1 3 4 y 2.2 4.3 4.8 6.7

第十章 统计与概率10-3变量间的相关关系与统计案例

第十章  统计与概率10-3变量间的相关关系与统计案例

(3)利用回归直线方程对总体进行估计 ^ ^ ^ 若回归直线方程为y=bx+a,则在x=x0处的估计值: ^0=bx0+a. ^ y ^ (4)线性相关强度的检验: 对于变量x与y随机取到的n对数据(xi,yi),用y与x间 x y xi--yi--
i=1 n
的相关系数r= x y xi--2· yi--2
i=1 4 ^
所以,由最小二乘法确定的回归直线方程的系数 为:


(3)由(2)的回归方程及技改前生产100吨甲产 品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).

(2010·山东枣庄模考)某单位为了了解用电 量y(度)与气温x(℃)之间的关系,随机统计 了某4天的用电量与当天气温,并制作了对 照表: 18 13 10 -1 气温(℃)


疱疹面积不 疱疹面积小 合计 小于 2 于70mm 70mm2 注射药物 A a= b=
注射药物 nad-bc2 c= d= 2 附:χ = B a+bc+da+cb+d 合计
n=

[解析]
(1)
可以看出注射药物A后的疱疹面积的中位数 在65至70之间,而注射药物B后的疱疹面积 的中位数在70至75之间,所以注射药物A后 疱疹面积的中位数小于注射药物B后疱疹面 积的中位数. (2)表3: 疱疹面积 疱疹面积不 合计 小于 小于 70mm2 70mm2 100 注射药物A a=70 b=30 100 注射药物B c=35 d=65 105 95 合计 n=200
关关系,这条直线叫做回归直线. 数为:

(2)回归直线方程的求法——最小二乘法.
n n y x y xiyi-n x · xi--yi-- i=1 i=1 ^ = b= n n 2 2 x xi -n x xi--2 i=1 i=1 a=--b x ^ y ^ 1 n 1 n 其中 - = x i, - = y i,( - , - )称作样本点的中 x y x y n i=1 n i=1 心. ^ ^ a , b 表示由观察值用最小二乘法求得的a,b的估计 值,叫回归系数.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十章第三节变量间的相关关系
1.
其中两个变量x、y具有相关关系的图是() A.①②B.①④C.③④D.②③解析:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关.①②是不相关的.而③④是相关的.
答案:C
2.下列变量之间的关系是函数关系的是() A.已知二次函数y=ax2+bx+c,其中,a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食亩产量
解析:由函数关系和相关关系的定义可知,①中Δ=b2-4ac,因为a、c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数关系.②③④中两个变量之间的关系都是随机的、不确定的,所以不是函数关系.
答案:A
3.给出下列关系:
①正方形的边长与面积之间的关系;
②某化妆品的销售量与广告宣传费之间的关系;
③人的身高与视力之间的关系;
④雾天的能见度与交通事故的发生率之间的关系;
⑤学生与其学号之间的关系. 其中具有相关关系的是________.
解析:①正方形的边长与面积之间的关系是函数关系;
②化妆品的销售量与广告宣传费之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系;
③人的身高与视力之间的关系既不是函数关系,也不是相关关系; ④能见度与交通事故的发生率之间具有相关关系; ⑤学生与其学号之间的关系是一种确定的对应关系.
综合以上可知,②④具有相关关系,而①⑤是确定性的函数关系. 答案:②④
4.
则这两个变量间的线性回归方程为
( )
A.y ^=x 2
B.y ^=x
C.y ^=9x -15
D.y ^=15x -9 解析:根据数据可得x =4.5,y =25.5,

i =1n
x 2
i =204,∑
i =1
n
x i y i =1 296. b =
1
2
2
1
n
i i i n
i i x y n x y
x n x
==--∑


1 296-8×4.5×25.5
204-
8×4.52
=9,
a =y -
b x =25.5-9×4.5=-15. ∴y ^
=9x -15. 答案:C
5.下表是某厂1~4月份用水量(单位:百吨)的一组数据,
由其散点图知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^
=-0.7x +a ,则a =________.
∴a =y -b x =3.5-(-0.7)×2.5=5.25. 答案:5.25
6.在一段时间内,某种商品价格x (万元)和需求量y (吨)之间的一组数据为:
(1)画出散点图;
(2)求出y 对x 的回归直线方程,并在(1)的散点图中画出它的图象; (3)如果价格定为1.9万元,预测需求量大约是多少(精确到0.01吨)? 解:(1)散点图,如图.
(2)采用列表的方法计算a 与回归系数b .
x =15×9=1.8,y =1
5×37=7.4,
b =
62-5×1.8×7.4
16.6-5×1.82
=-11.5,
a =7.4+11.5×1.8=28.1, y 对x 的回归直线方程为 y ^
=a +bx =28.1-11.5x . (3)当x =1.9时,
y =28.1-11.5×1.9=6.25,
所以价格定为1.9万元时,需求量大约是6.25吨.
7.对有线性相关关系的两个变量建立的回归直线方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .大于0 C .能等于0 D .只能小于0 解析:因为b =0时,r =0,这时不具有线性相关关系,但b 能大于0也能小于0. 答案:A
8.已知回归方程y ^
=4.4x +838.19,则可估计x 与y 的增长速度之比约为________. 解析:x 与y 的增长速度之比即为回归方程的斜率的倒数14.4=1044=5
22.
答案:
522
9.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:
如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.
解析:由上表可得:y ^
=94.7x +1 924.7,当x 分别取9,10,11,12时,得估计值分别为:2 777,2 871.7,2 966.4,3 061.1,则总只数约为2 777+2 871.7+2 966.4+3 061.1≈11 676. 答案:11 676
10.2009年12月某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析. (1)如果按性别比例分层抽样,应选男女生各多少人;
(2)随机抽取8位,若这8位同学的数学、物理分数对应如表:
根据上表数据用散点图说明物理成绩y 与数学成绩x 之间是否具有线性相关性?如果具有线性相关性,求y 与x 的线性回归方程(系数精确到0.01).如果不具有线性相关性,请说明理由. 参考公式:
回归直线的方程是:y ^
=bx +a ,
其中b =∑i =1
n
(x i -x )(y i -
y )
∑i =1
n
(x i -x )2
,a =y -b x ,
y ^
i 是与x i 对应的回归估计值. 参考数据:
x =77.5,y =85,∑i =18
(x i -x )2≈1050,
∑i =1
8 (y i -y )2≈456,∑i =1
8
(x i -x )(y i -y )≈688,
1050≈32.4,456≈21.4,550≈23.5. 解:(1)选男生15×
840=3(人),选女生25×8
40
=5(人). (2)以数学成绩x 为横坐标,物理成绩y 为纵坐标作散点图如图.
从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理与数学成绩是高度正相关.
设y 与x 线性回归方程是y ^
=bx +a ,根据所给的数据,可以计算出
b =
688
1 050
≈0.66,a =85-0.66×77.5=33.85, 所以y 与x 的回归方程是y ^
=0.66x +33.85.。

相关文档
最新文档