【小初高学习】全国版2019版高考数学一轮复习第9章统计统计案例第3讲变量相关关系与统计案例增分练
高三数学一轮总复习第九章算法统计统计案例9.3变量间的相关关系与统计案例课件.ppt
中没有充分的证据显示说谎与性别有关。
答案:D
13
4.某考察团对全国10大城市的居民人均工资收入x(万元/年)与居民人均消费 y(万元/年)进行统计调查,发现y与x具有相关关系,且y对x的回归方程为 ^y =0.66x +1.562。若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工 资收入的百分比约为__________。
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
构造一个随机变量K2=
a+b
nad-bc2 c+da+cb+d
,其中n=a+b+c+d为样本容
量。
7
(3)独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验。
8
1个特值——K2值的作用 当K2≥3.841时,则有95%的把握说事件A与B有关; 当K2≥6.635时,则有99%的把握说事件A与B有关; 当K2≤2.706时,则没有把握认为事件A与B有关。
15
课堂学案 考点通关
考点例析 通关特训
16
考点一
相关关系的判断
【例1】 (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,
x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
1 2
x+1上,则这组样本数据的样本相关系数为( )
A.在此次调查中有 95%的把握认为是否说谎与性别有关
B.在此次调查中有 99%的把握认为是否说谎与性别有关
C.在此次调查中有 99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
2019-2020年新人教A版高考数学大一轮复习第九章统计统计案例第三节变量间的相关关系与统计案例课件理
i=1
i=1
^b=
=
,
n
xi- x 2
n
xi2-n x 2
i=1
i=1
^a= y -^b x .
n
xi- x yi- y
i=1
^a= y -^b x ,^b=
,
n
xi- x 2
i=1
其中 x =n1i=n1xi, y =n1i=n1yi,( x , y )称为样本点的中心.
A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关
解析:选 C.因为 y=-0.1x+1 的斜率小于 0,故 x 与 y 负相关.因 为 y 与 z 正相关,可设 z=^by+^a,^b>0,则 z=^by+^a=-0.1^bx+^b+^a, 故 x 与 z 负相关.
四基精演练 1.思考辨析(在括号内打“√”或“×”) (1)利用样本点的散点图可以直观判断两个变量的关系是否可以用 线性关系来表示.( √ ) (2)通过回归方程^y =^bx+^a 可以估计和观测变量的取值和变化趋 势.( √ ) (3)任何一组数据都对应着一个回归直线方程.( × ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值 越大.( √ )
第三节 变量间的相关关系与统计案例
教材细梳理
知识点 1 变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相 关关系.与函数关系不同,相关关系是一种__非__确__定__性____关系.
(2)在散点图中,点散布在从左下角到右上角的区域内,两个变量的 这种相关关系称为___正__相__关_____,点散布在左上角到右下角的区域内, 两个变量的相关关系称为___负__相__关_____.
2019版高考数学一轮复习第9章统计与统计案例9.1随机抽
解析 该地区不同学段学生视力情况有较大差异,不 适合采用简单随机抽样和系统抽样,又男、女生视力差别 不大,故不适合按性别分层抽样.故选 C.
(2)(2018·长春模拟)将高一(9)班参加社会实践编号为: 1,2,3,…,48 的 48 名学生,采用系统抽样的方法抽取一个 容量为 4 的样本,已知 5 号,29 号,41 号学生在样本中, 则样本中还有一名学生的编号是___1_7____.
②将 140 个人分成 20 组,每组 7 个人,并将每组 7 人 按 1~7 编号,在第一组中采用抽签的方法抽出 K 号 (1≤K≤7),则其余各组 K 号也被抽到,20 个人被选出.
③按 20∶140=1∶7 的比例,从科技人员中抽取 13 人, 从行政人员中抽取 4 人,从职员中抽取 3 人,从各类人员中 抽取所需人员时,均采用随机数表法,可抽出 20 人.
解析 从抽得号码的编号入手,若为系统抽样,则抽 样间隔应该相等,若可能为分层抽样,则一、二、三年级 应按 4∶3∶3 的比例进行抽取,即 1~108 号抽取 4 人,109~ 189 号抽取 3 人,190~270 号应抽取 3 人.故选 D.
3.小题热身 (1)(2013·全国卷Ⅰ)为了解某地区的中小学生的视力情 况,拟从该地区的中小学生中抽取部分学生进行调查,事先 已了解到该地区小学、初中、高中三个学段学生的视力情况 有较大差异,而男女生视力情况差异不大.在下面的抽样方 法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样
A.②①③ B.②③① C.①②③ D.③②① 解析 从简单随机抽样、系统抽样、分层抽样各自的 操作步骤入手.故选 C.
(2)(必修 A3P64A 组 T4)某初级中学有 270 人,其中一年 级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统 抽样三种方案,使用简单随机抽样和分层抽样时,将按一、 二、三年级依次统一编号为 1,2,…,270;使用系统抽样时, 将统一随机编号 1,2,…,270,并将整个编号依次分为 10 段,如果抽得号码有下列四种情况:
2019版高考数学(理)高分计划一轮:9.3 变量间的相关关系与统计案例
9.3 变量间的相关关系与统计案例[知识梳理]1.相关关系与回归方程 (1)相关关系的分类①正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1; ②负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. ②回归方程:两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^=i =1n(x i -x )(y i -y )i =1n (x i -x )2=∑i =1nx i y i -n x y ∑i =1n x 2i -n x 2,a ^=y -b ^x .其中,b ^是回归方程的斜率,a ^是在y 轴上的截距,x -=1n ∑n i =1x i ,y -=1n ∑ni =1y i ,(x -,y -)称为样本点的中心.说明:回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r =i =1n(x i -x )(y i -y )i =1n(x i -x )2i =1n(y i -y )2,用它来衡量两个变量间的线性相关关系.①当r>0时,表明两个变量正相关; ②当r<0时,表明两个变量负相关;③r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3)独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. [诊断自测] 1.概念思辨(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( ) (2)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( ) (3)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( )(4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )答案 (1)√ (2)√ (3)√ (4)× 2.教材衍化(1)(必修A3P 94A 组T 3)某种产品的广告费用支出x(单位:万元)与销售额y(单位:万元)之间有如下的对应数据:由最小二乘法得到线性回归直线方程y =b x +a ,则此直线一定经过点( ) A .(5,60) B .(5,50) C .(6,50) D .(8,70) 答案 B解析 回归直线样本点的中心为(x -,y -),而x -=15×(2+4+5+6+8)=5,y -=15×(30+40+60+50+70)=50,所以回归直线一定经过点(5,50).故选B.(2)(选修A1-2P 96T 2)通过随机询问72名不同性别的大学生在购买食物时是否看生产日期,得到如下列联表:则有答案 99.5%解析 由表中数据得k =72×(16×8-20×28)236×36×44×28≈8.416>7.879,所以可知有99.5%的把握认为性别与是否读生产日期有关.3.小题热身(1)设回归方程为y ^=3-5x ,则变量x 增加一个单位时 ( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位 答案 B解析 因为-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位.故选B.(2)(2018·西安模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.答案 68解析 由x -=30,得y -=0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68.题型1 相关关系的判断典例1对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②,由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关散点分布向右上升为正相关,反之为负相关.答案 C解析 题图①的散点分布在斜率小于0的直线附近,y 随x 的增大而减小,故变量x 与y 负相关;题图②的散点分布在斜率大于0的直线附近,u 随v 的增大而增大,故变量u 与v 正相关,故选C.典例2 甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:A .甲B .乙C .丙D .丁考查r 的取值与1的关系.答案 D解析 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A ,B 两个变量有更强的线性相关性,故选D.方法技巧判定两个变量正、负相关性的方法1.画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.见典例1.2.相关系数:r>0时,正相关;r<0时,负相关.3.线性回归直线方程中:b ^>0时,正相关;b ^<0时,负相关. 冲关针对训练下面是水稻产量与施化肥量的一组观测数据(单位:千克/亩):(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解 (1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.题型2 线性回归分析角度1 线性回归方程及应用典例(2014·全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=i =1n(t i -t )(y i -y )i =1n (t i -t )2,a ^=y -b ^t .收集相关数据,代入公式.解 (1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,i =17(t i -t )2=9+4+1+0+1+4+9=28,i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=i =17(t i -t )(y i -y )i =17(t i -t )2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3, 所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程, 得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 角度2 非线性回归模型的应用典例 (2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x.根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1(u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^u .(1)散点图趋势是曲线,推断y =c +d x 适宜;(2)将非线性回归方程y =c +d x 用换元法w =x 转化为线性回归方程y =c +dw ,进而求解.解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1(w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x. (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x)-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 方法技巧1.利用线性回归方程时的关注点(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y ^=b ^x +a ^必过样本点中心(x -,y -).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.见角度1典例.2.非线性回归方程的求法(1)根据原始数据(x ,y)作出散点图. (2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程.(4)在(3)的基础上通过相应变换,即可得非线性回归方程.见角度2典例. 冲关针对训练(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1(t i -t )2∑ni =1(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1 (t i -t )(y i -y )∑i =1(t i -t )2,a ^=y -b ^t . 解 (1)由折线图中数据和附注中参考数据得t =4,∑7i =1 (t i -t )2=28,∑7i =1(y i -y )2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1(t i -t )(y i -y )∑7i =1(t i -t )2=2.8928≈0.103,a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t. 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 题型3 独立性检验典例 (2018·广州测试)某企业生产的某种产品被检测出其中一项质量指标存在问题.该企业为了检查生产该产品的甲、乙两条流水线的生产情况,随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.若该项质量指标值落在(195,210]内,则为合格品,否则为不合格品.下表是甲流水线样本的频数分布表,下图是乙流水线样本的频率分布直方图.(1)根据上图,估计乙流水线产品的该项质量指标值的中位数;(2)若将频率视为概率,某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线分别生产出不合格品约多少件?(3)根据已知条件完成下面的2×2列联表,并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d).解 (1)设乙流水线产品的该项质量指标值的中位数为x ,因为0.48=(0.012+0.032+0.052)×5<0.5<(0.012+0.032+0.052+0.076)×5=0.86,所以(0.012+0.032+0.052)×5+0.076×(x -205)=0.5, 解得x =390019.(2)由甲、乙两条流水线各抽取50件产品可得,甲流水线生产的不合格品有15件,则甲流水线生产的产品为不合格品的概率为1550=310,乙流水线生产的产品为不合格品的概率为(0.012+0.028)×5=15.所以某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线生产的不合格品件数分别为5000×310=1500,5000×15=1000.(3)2×2列联表:则K2=50×50×75×25=3≈1.3,因为1.3<2.072,所以没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”.方法技巧独立性检验的一般步骤(1)根据样本数据列出2×2列联表;(2)计算随机变量K2的观测值k,查表确定临界值k0;(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.见典例.冲关针对训练(2017·洛阳模拟)某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据以上数据完成下列2×2列联表.(3)能否说有99%的亲属的饮食习惯与年龄有关?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d.解 (1)2×2(2)因为K 2的观测值k =12×18×20×10=10>6.635,所以能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.(3)这种说法不正确.能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,是这个论断成立的可能性大小的结论,与是否有“99%的亲属的饮食习惯与年龄有关”无关.1.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y^=b ^x +a ^.已知∑i =110x i =225,∑i =110y i =1600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170 答案 C解析 ∵∑i =110x i =225,∴x =110∑i =110x i =22.5.∵∑i =110y i =1600,∴y =110∑i =110y i =160. 又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴回归直线方程为y ^=4x +70.将x =24代入上式得y ^=4×24+70=166. 故选C.2.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 答案 B解析 由统计数据表可得x -=8.2+8.6+10.0+11.3+11.95=10.0,y -=6.2+7.5+8.0+8.5+9.85=8.0,则a ^=8.0-0.76×10.0=0.4,所以回归直线方程为y ^=0.76x+0.4,当x =15时,y ^=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B. 3.(2018·江西南城一中、高安中学联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”答案 C解析K2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.4.(2018·广东广州检测)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量 答案 D解析 K 2=52×(6×22-10×14)216×36×20×32,令5216×36×20×32=m ,则K 21=82m ,同理,K 22=m ×(4×20-12×16)2=1122m ,K 23=m ×(8×24-8×12)2=962m ,K 24=m ×(14×30-6×2)2=4082m ,∴K 24>K 22>K 23>K 21,则与性别有关联的可能性最大的变量是阅读量,故选D.[重点保分两级优选练]A 级一、选择题1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ 答案 D解析 由回归直线方程y ^=b ^x +a ^,知当b ^>0时,y 与x 正相关;当b ^<0时,y 与x 负相关.∴①④一定错误.故选D.2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3 答案 A解析 易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r 2<r 4<0<r 3<r 1.故选A.3.(2018·辽宁沈阳二中一模)某考察团对全国10大城市居民人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%答案 A解析 由7.675=0.66x +1.562,得x ≈9.262, 所以7.6759.262×100%≈83%.故选A.4.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的精确值为 ( ) A .3 B .3.15 C .3.5 D .4.5 答案 A解析 ∵x -=3+4+5+64=4.5,代入y ^=0.7x +0.35,得y ^=3.5,∴t =3.5×4-(2.5+4+4.5)=3.故选A.5.(2018·长春检测)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4 答案 A解析 由变量x 与y 正相关知C 、D 均错误,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A.6.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 D 选项中,若该大学某女生身高为170 cm ,根据回归方程只能近似认为其体重为58.79 kg ,但不是绝对的.故D 不正确.故选D.7.(2018·湖南邵阳调研)假设有两个分类变量X 和Y 的2×2列联表如下:A .a =45,c =15B .a =40,c =20C .a =35,c =25D .a =30,c =30 答案 A解析 根据2×2列联表与独立性检验可知, 当a a +10与c c +30相差越大时,X 与Y 有关系的可能性越大, 即a 、c 相差越大,a a +10与cc +30相差越大,故选A.8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a.若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16B.13C.12D.23 答案 B解析 由题意可知x -=4+5+6+7+8+96=132,y -=90+84+83+80+75+686=80.又点⎝ ⎛⎭⎪⎫132,80在直线y ^=-4x +a 上,故a =106. 所以回归方程为y =-4x +106.由线性规划知识可知,点(5,84),(9,68)在直线y =-4x +106的左下方.故所求事件的概率P =26=13.故选B.9.(2018·安徽皖南一模)下列说法错误的是( ) A .回归直线过样本点的中心(x -,y -)B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1C .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^平均增加0.2个单位D .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小 答案 D解析 回归直线过样本点的中心(x -,y -),A 正确;两个随机变量相关性越强,则相关系数的绝对值越接近1,B 正确;在线性回归方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报量平均增加0.2个单位,C 正确;对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,因此D 不正确.故选D.10.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′ 答案 C解析 x =216=72,y =136,代入公式求得b ^=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13,而b ′=2,a ′=-2,∴b ^<b ′,a ^>a ′,故选C.二、填空题11.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为________.①x ,y 是负相关关系;②在该相关关系中,若用y =c 1ec2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程. 答案 ①②解析 在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =c 1ec2x 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误.12.(2017·赣州模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i =13,∑6i =1x 2i =21,则实数b的值为________.答案 57解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t =∑6i =1x 2i 6=72,y =∑6i =1y i6=136,代入y =bt -13,得136=b ×72-13,解得b =57. 13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查对临界值表知P(K 2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,则他在一年中有95%的可能性得感冒;r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的命题的序号都填上) ①p ∧(綈q);②(綈p)∧q ;③(綈p ∧綈q)∧(r ∨s); ④(p ∨綈r)∧(綈q ∨s). 答案 ①④解析 由题意,得K 2≈3.918,P(K 2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.所以p 真,q 假,r 假,s 假.由真值表知①④为真命题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是________.①列联表中c 的值为30,b 的值为35; ②列联表中c 的值为15,b 的值为50;③根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,能认为“成绩与班级有关系”; ④根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,不能认为“成绩与班级有关系”. 答案 ③解析 由题意知,成绩优秀的学生数是30, 成绩非优秀的学生数是75,所以c =20,b =45, ①②错误;根据列联表中的数据,得到 K 2=105×(10×30-20×45)255×50×30×75≈6.1>5.024,因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”.故③正确,④错误.B 级三、解答题15.(2018·湖南百所重点中学诊断)已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高? (2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利润.相关公式:b=a ^=y --b ^x -.解 (1)由折线图可知5月和6月的平均利润最高.(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元), 第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元), 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元), 所以这3年的前7个月的总利润呈上升趋势.∴b ^=54-4×2.5×530-4×2.52=0.8,∴a ^=5-2.5×0.8=3,∴y ^=0.8x +3,当x =8时,y ^=0.8×8+3=9.4.∴估计第3年8月份的利润为9.4百万元.16.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg ,新养殖法的箱产量不低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg ”,C 表示事件“新养殖法的箱产量不低于50 kg ”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P(C)的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.4092. (2)根据箱产量的频率分布直方图得列联表K 2=200×(100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).。
2019版数学一轮高中全程复习方略课件:第九章 计数原理、概率、随机变量及其分布9-8
解析:(1)设 A 表示事件“观众甲选中 3 号歌手”,B 表示 事件“观众乙选中 3 号歌手”, 2 C1 2 C 2 4 3 则 P(A)=C2=3,P(B)=C3=5. 3 5 - ∵事件 A 与 B 相互独立,A 与- B 相互独立,则 A· B 表示事 件“甲选中 3 号歌手,且乙没选中 3 号歌手”. 2 2 4 - - ∴P(A B )=P(A)· P( B )=P(A)· [1-P(B)]=3×5=15. 即观众甲选中 3 号歌手且观众乙未选中 3 号歌手的概率是 4 . 15
解析:P(A|B)的含义是在事件 B 发生的条件下,事件 A 发 生的概率,即在“至少出现一个 6 点”的条件下,“三个点数都 不相同 ” 的概率,因为 “ 至少出现一个 6 点 ” 有 6×6×6 - 5×5×5=91 种情况,“至少出现一个 6 点,且三个点数都不相 60 1 同”共有 C3×5×4=60 种情况,所以 P(A|B)=91.P(B|A)的含义 是在事件 A 发生的情况下,事件 B 发生的概率,即在“三个点 数都不相同”的情况下,“至少出现一个 6 点”的概率,所以 1 P(B|A)=2.故选 A. 答案:A
9.3σ 原则 (1)P(μ-σ<X≤μ+σ)=0.682 6; (2)P(μ-2σ<X≤μ+2σ)=0.954 4; (3)P(μ-3σ<X≤μ+3σ)=0.997 4.
二、必明 2●个易要么发生,要么不发生,并且任何一次试验中某事件发生的概率 相等.注意恰好与至多(少)的关系,灵活运用对立事件. 2.二项分布要注意确定成功概率.
(2)设 C 表示事件“观众丙选中 3 号歌手”, C2 4 3 则 P(C)=C3=5, 5 依题意,A,B,C 相互独立,- A ,- B ,- C 相互独立, 且 AB- C ,A- B C ,- A BC,ABC 彼此互斥. 又 P(X=2)=P(AB- C )+P(A- B C)+P(- A BC) 2 3 2 2 2 3 1 3 3 33 =3×5×5+3×5×5+3×5×5=75, 2 3 3 18 P(X=3)=P(ABC)=3×5×5=75, 33 18 17 ∴P(X≥2)=P(X=2)+P(X=3)=75+75=25.
2020版高考数学一轮复习第9章统计与统计案例第3讲变量间的相关关系与统计案例理解析版
第3讲变量间的相关关系与统计案例[考纲解读] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;根据最小二乘法求出回归直线方程.(重点)2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.[考向预测] 从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测2020年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等.此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.1.相关关系与回归方程(1)相关关系的分类02右上角的区域内,如图1;①正相关:从散点图上看,点散布在从□01左下角到□04右下角的区域内,如图2.②负相关:从散点图上看,点散布在从□03左上角到□(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在□05一条直线附近,06回归直线.则称这两个变量之间具有线性相关关系,这条直线叫做□(3)回归方程①最小二乘法:使得样本数据的点到回归直线的□07距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n ),其回归方程为y ^=b ^x +a ^,则b ^=∑i =1nx i -xy i-y∑i =1nx i -x2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a ^=y -b ^x .其中,b ^是回归方程的□08斜率,a ^是在y 轴上的□09截距,x -=1n ∑n i =1x i ,y -=1n ∑n i =1y i ,□10(x -,y -)称为样本点的中心.说明:回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r =∑i =1nx i -x y i -y∑i =1nx i -x2∑i =1ny i -y2,用它来衡量两个变量间的线性相关关系.①当r>0时,表明两个变量□11正相关; ②当r<0时,表明两个变量□12负相关; ③r 的绝对值越接近1,表明两个变量的线性相关性□13越强;r 的绝对值接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的□01不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的□02频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=□03n ad -bc2a +bc +d a +cb +d,其中n =□04a +b +c +d 为样本容量.(3)独立性检验利用随机变量□05K 2来判断“两个分类变量□06有关系”的方法称为独立性检验.1.概念辨析(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( ) (2)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( ) (3)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) (4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )答案 (1)√ (2)√ (3)√ (4)×2.小题热身(1)设回归方程为y ^=3-5x ,则变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位 答案 B解析 因为-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位.故选B .(2)在下列各图中,两个变量具有相关关系的图是( )A .①② B.①③ C.②④ D.②③ 答案 D解析 ①为函数关系;②显然成正相关;③显然成负相关;④没有明显相关性. (3)下面是一个2×2列联表则表中a ,b 处的值分别为________. 答案 52,54解析 因为a +21=73,所以a =52.又因为a +2=b ,所以b =54.(4)已知x ,y 的取值如下表,从散点图可以看出y 与x 具有线性相关关系,且回归方程为y ^=0.95x +a ^,则a ^=________.答案 2.6解析 ∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.题型 一 相关关系的判断1.下列两变量中不存在相关关系的是( )①人的身高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销售额与广告费.A .①②⑤B .①③⑥C .④⑤⑥D .②⑥ 答案 A解析 根据相关关系的定义知,①②⑤中两个变量不存在相关关系.2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ 答案 D解析 由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3 答案 A解析 易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②中的样本点集中分布在一条直线附近,则r 2<r 4<0<r 3<r 1.故选A .判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.见举例说明3.(3)线性回归直线方程中:b ^>0时,正相关;b ^<0时,负相关.1.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n)都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1答案 D解析 所有点均在直线上,则样本相关系数最大即为1,故选D .2.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为________.①x,y 是负相关关系;②在该相关关系中,若用y =c 1e c2x 拟合时的相关系数的平方为r 21,用y ^=b ^x +a ^拟合时的相关系数的平方为r 22,则r 21>r 22;③x,y 之间不能建立线性回归方程. 答案 ①②解析 ①显然正确;散点图趋向于曲线而非直线,所以用y =c 1e c2x 拟合的效果比用y ^=b ^x +a ^拟合的效果要好,故②正确;x ,y 之间能建立线性回归方程,只不过预报精度不高,故③不正确.题型 二 回归分析角度1 线性回归方程及应用1.(2018·福州四校联考)某汽车的使用年数x 与所支出的维修总费用y 的统计数据如表:使用年数x/年 1 2 3 4 5维修总费用y/万元0.5 1.2 2.2 3.3 4.5 根据上表可得y关于x的线性回归方程y^=b^x-0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)( ) A.8年 B.9年 C.10年 D.11年答案 D解析由y关于x的线性回归直线y^=b^x-0.69过样本点的中心(3,2.34),得b^=1.01,即线性回归方程为y^=1.01x-0.69,由y^=1.01x-0.69=10得x≈10.6,所以预测该汽车最多可使用11年.故选D.2.某兴趣小组欲研究昼夜温差与患感冒人数之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程y^=b^x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式:b^=∑i=1nx i y i-n x-y-∑i=1nx2i-n x2,a^=y-b^x.参考数据:11×25+13×29+12×26+8×16=1092,112+132+122+82=498.解(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A)=515=13.(2)由表中2月份至5月份的数据可得x =11,y=24,∑4i=1x i y i=1092,∑i=14x2i=498,所以b^=∑i=14x i y i-4x-y-∑i=1nx2i-4x2=187,则a^=y-b^x=-307,所以y 关于x的线性回归方程为y^=187x-307.(3)当x=10时,y^=1507,⎪⎪⎪⎪⎪⎪1507-22=47<2;当x=6时,y^=787,⎪⎪⎪⎪⎪⎪787-12=67<2.所以,该小组所得线性回归方程是理想的.角度2 非线性回归模型的应用3.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x.根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -uv i -v∑ni =1u i -u2,α^=v -β^u .解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1w i -wy i -y∑8i =1w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x.(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x)-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.1.利用线性回归方程时的关注点(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y ^=b ^x +a ^必过样本点中心(x -,y -).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.2.非线性回归方程的求法(1)根据原始数据(x ,y)作出散点图. (2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程.(4)在(3)的基础上通过相应变换,即可得非线性回归方程.1.据某市地产数据研究显示,2018年该市新建住宅销售均价走势如图所示,3月至7月房价上涨过快,为抑制房价过快上涨,政府从8月开始采用宏观调控措施,10月份开始房价得到很好的控制.(1)地产数据研究发现,3月至7月的各月均价y(万元/平方米)与月份x 之间具有较强的线性相关关系,试建立y 关于x 的回归方程;(2)若政府不调控,依此相关关系预测12月份该市新建住宅销售均价.参考数据及公式:∑5i =1x i =25,∑5i =1y i =5.36,∑5i =1(x i -x )(y i -y )=0.64,回归方程y ^=b ^x +a ^中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1 x i -x y i -y ∑ni =1 x i -x 2,a ^=y -b^x .解 (1)x =255=5,y =5.365=1.072,∑5i =1 (x i -x )2=10,所以b ^=0.6410=0.064,a ^=y -b ^x =1.072-0.064×5=0.752.所以从3月份至7月份y 关于x 的线性回归方程为y ^=0.064x +0.752.(2)将x =12代入回归方程得y ^=0.064×12+0.752=1.52, 所以预测12月份该市新建住宅的销售均价为1.52万元/平方米.2.对某地区儿童的身高与体重的一组数据,我们用两种模型①y=bx +a ,②y=c e dx拟合,得到回归方程分别为y ^(1)=0.24x -8.81,y ^(2)=1.70e 0.022x,作残差分析,如下表:(1)求表中空格内的值;(2)根据残差比较模型①②的拟合效果,决定选择哪个模型;(3)若残差大于1 kg 的样本点被认为是异常数据,应剔除,剔除后对(2)所选择的模型重新建立回归方程.(结果保留到小数点后两位)附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为b ^=∑ni =1x i -xy i -y∑ni =1x i -x2,a ^=y -b ^x .解 (1)根据残差分析,把x =80代入y ^(1)=0.24x -8.81中,得y ^(1)=10.39. ∵10-10.39=-0.39, ∴表中空格内的值为-0.39.(2)模型①残差的绝对值的和为0.41+0.01+0.39+1.21+0.19+0.41=2.62, 模型②残差的绝对值的和为0.36+0.07+0.12+1.69+0.34+1.12=3.7. ∵2.62<3.7,∴模型①的拟合效果比较好,选择模型①.(3)残差大于1 kg 的样本点被剔除后,剩余的数据如下表:由公式b ^=∑ni =1x i -xy i -y∑n i =1x i -x2,a ^=y -b ^x ,得回归方程为y ^=0.24x -8.76. 题型 三 独立性检验1.假设有两个分类变量X 和Y 的2×2列联表如下:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为( ) A .a =45,c =15 B .a =40,c =20 C .a =35,c =25 D .a =30,c =30 答案 A解析 根据2×2列联表与独立性检验可知,当a a +10与cc +30相差越大时,X 与Y 有关系的可能性越大,即a ,c 相差越大,a a +10与cc +30相差越大.故选A. 2.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n ad -bc 2a +bc +d a +cb +d,解 (1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可.) (2)由茎叶图知m =79+812=80.列联表如下:(3)由于K 2的观测值k =40×15×15-5×5220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.独立性检验的一般步骤(1)根据样本数据列出2×2列联表;(2)计算随机变量K 2的观测值k ,查表确定临界值k 0;(3)如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过P (K 2≥k 0);否则,就认为在犯错误的概率不超过P (K 2≥k 0)的前提下不能推断“X 与Y 有关系”.1.(2018·河南洛阳模拟)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量K 2=n ad -bc 2a +bc +d a +cb +d,并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过( )A .0.10B .0.05C .0.025D .0.01 答案 A解析 由题意可得K 2=100×30×10-15×45245×55×75×25≈3.030>2.706,由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”出错的概率不超过0.10.故选A.2.某校拟在高一年级开设英语口语选修课,该年级男生600人,女生480人.按性别分层抽样,抽取90名同学做意向调查.(1)求抽取的90名同学中的男生人数;(2)将下列2×2列联表补充完整,并判断能否在犯错误的概率不超过0.025的前提下认为“该校高一学生是否愿意选修英语口语课程与性别有关”?附:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解 (1)该校高一年级的男、女生之比为600∶480=5∶4,所以按照分层抽样,男生应抽取50名.(2)2×2列联表如下:由K 2=n ad -bc 2a +bc +d a +cb +d,代入数据得K 2=90×25×10-25×30250×40×55×35=45077≈5.844>5.024. 所以在犯错误的概率不超过0.025的前提下可以认为“该校高一学生是否愿意选修英语口语课程与性别有关”.。
全国版2019版高考数学一轮复习第9章统计统计案例第3讲变量相关关系与统计案例学案201805092
第3讲 变量相关关系与统计案例板块一 知识梳理·自主学习[必备知识]考点1 变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.考点2 回归方程与回归分析 1.线性相关关系与回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i -x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x .3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:在具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,x =1n(x 1+…+x n ),y =1n(y 1+…+y n ),a ^=y -b ^x ,(x ,y )称为样本点的中心.(3)相关系数r =∑i =1n(x i -x )(y i -y)∑i =1n(x i -x )2∑i =1n(y i -y)2,当r >0时,两变量正相关,当r <0时,两变量负相关,当|r |≤1且|r |越接近于1,相关程度越强,当|r |≤1且|r |越接近于0,相关程度越弱.考点3 独立性检验 1.独立性检验的有关概念 (1)分类变量可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量. (2)2×2列联表假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d2利用随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量)来判断“两个变量有关系”的方法称为独立性检验.步骤如下:(1)计算随机变量K 2的观测值k ,查表确定临界值k 0:P(K 2≥k 0)0.5.40 0.25 0.15 0.10 0.05 0.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.879 10.82800则,就认为在犯错误的概率不超过P (K 2≥k 0)的前提下不能推断“X 与Y 有关系”.[必会结论]1.相关关系与函数关系的异同共同点:二者都是指两个变量间的关系;不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系.2.从散点图看相关性正相关:样本点分布在从左下角到右上角的区域内; 负相关:样本点分布在从左上角到右下角的区域内. 3.回归直线y ^=b ^x +a ^必过样本点的中心.[考点自测]1.判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (3)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) (4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )答案 (1)× (2)√ (3)√ (4)× 2.下面是一个2×2列联表y 1 y 2总计 x 1 a21 73 x 22225 47 合计b46120其中A .94 72 B .52 50 C .52 74 D .74 52 答案 C解析 由a +21=73,得a =52,a +22=b ,得b =74.故选C.3.[课本改编]四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ 答案 D解析 正相关指的是y 随x 的增大而增大.负相关指的是y 随x 的增大而减小,故不正确的为①④,故选D.4.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x (cm)160165170175180体重y (kg)6366 70 72 74 根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )A .70.09 kgB .70.12 kgC .70.55 kgD .71.05 kg 答案 B解析 x =160+165+170+175+1805=170,y =63+66+70+72+745=69.∵回归直线过点(x ,y ),∴将点(170,69)代入回归直线方程得y ^=0.56x -26.2,代入x =172 cm ,则其体重为70.12 kg.5.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算得K 2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).答案 有关解析 K 2>10.828就有99.9%的理由认为两个量是有关的.板块二 典例探究·考向突破 考向线性回归分析例 1 [2018·金华模拟]某百货公司1~6月份的销售量x 与利润y 的统计数据如下表:月份 1 2 3 4 5 6 销售量x (万件) 10 11 13 12 8 6 利润y (万元)2225 29 26 16 12(1)根据2至5月份的数据,求出y 关于x 的回归直线方程y =b x +a ;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?参考公式:b ^=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x -2,a ^=y --b ^x -.解 (1)根据表中2至5月份的数据, 计算得x -=11,y -=24,∑5i =2x i y i =11×25+13×29+12×26+8×16=1092,∑5i =2x 2i =112+132+122+82=498, 则b ^=∑5i =2x i y i -4x -y -∑5i =2x 2i -4x -2=1092-4×11×24498-4×112=187, a ^=y --b ^x -=24-187×11=-307.故y 关于x 的回归直线方程为y ^=187x -307.(2)当x =10时,y ^=187×10-307=1507,此时⎪⎪⎪⎪⎪⎪1507-22<2;当x =6时,y ^=187×6-307=787,此时⎪⎪⎪⎪⎪⎪787-12<2.故所得的回归直线方程是理想的. 触类旁通(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y ^=b ^x +a ^必过样本点中心(x ,y ).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.【变式训练1】 PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5浓度的数据如下表:时间 周一周二周三周四周五车流量x (万辆) 100102108114116PM2.5的浓度y (微克/立方米)7880 84889(1)根据上表数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若周六同一时间段车流量是200万辆,试根据(1)求出的线性回归方程预测,此时PM2.5的浓度为多少?( 参考公式:b ^=∑ni =1 (x i -x )(y i -y )∑ni =1 (x i -x )2,a ^=y -b ^x ;参考数据:∑5i =1x i =540,∑5i =1y i =420 ) 解 (1)由条件可知,x =15∑5i =1x i =5405=108,y =15∑5i =1y i =4205=84, ∑5i =1 (x i -x )(y i -y )=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144, ∑5i =1(x i -x )2=(-8)2+(-6)2+02+62+82=200.b ^=∑5i =1(x i -x )(y i -y )∑5i =1 (x i -x )2=144200=0.72, a ^=y -b ^x =84-0.72×108=6.24,故y 关于x 的线性回归方程为y ^=0.72x +6.24.(2)当x =200时,y ^=0.72×200+6.24=150.24,所以可以预测此时PM2.5的浓度约为150.24微克/立方米.考向两个变量的相关性命题角度1 相关关系的判断例 2 对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3答案 A解析易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.命题角度2 相关系数的意义例 3 [2017·全国卷Ⅰ]为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x=116∑i=116x i=9.97,s=116∑i=116(x i-x)2=116(∑i=116x2i-16x2)≈0.212,∑i=116(i-8.5)2≈18.439,∑i=116(x i-x-)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(x--3s,x-+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i,y i)(i=1,2,…,n)的相关系数r=∑i=1n(x i-x-)(y i-y-)∑i=1n(x i-x)2∑i=1n(y i-y-)2.0.008≈0.09.解(1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数r=∑i=116(x i-x-)(i-8.5)∑i=116(x i-x-)2∑i=116(i-8.5)2≈-2.780.212×16×18.439≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于x-=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(x--3s,x-+3s)以外,因此需对当天的生产过程进行检查.(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i=116x2i≈16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为115(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.考向独立性检验例 4 [2017·全国卷Ⅱ]海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法0.01).附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.62×0.66=0.4092.(2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法6238新养殖法34 66K 2=100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为 (0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).触类旁通利用统计量K 2进行独立性检验的步骤(1)根据数据列出2×2列联表; (2)根据公式计算K 2找观测值k ;(3)比较观测值k 与临界值表中相应的检验水平,作出统计推断.【变式训练2】 某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计男生 女生 合计附:K 2=(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .P(K 2≥k 0)0.50.40 0.25 0.15 0.10 0.05 0.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.879 10.828解 (1)从高一年级学生中随机抽取1人,抽到男生的概率约为180=12.(2)根据统计数据,可得2×2列联表如下:选择自然科学类选择社会科学类合计 男生 60 45 105 女生 30 45 75 合计9090180∴K 2=2105×75×90×90=7≈5.1429>5.024.∴在犯错误的概率不超过0.025的前提下可以认为科类的选择与性别有关.核心规律1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是处理变量相关关系的一种数学方法,主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.3.根据K 2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际. 满分策略1.相关关系与函数关系的区别相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系.例如正方形面积S 与边长x 之间的关系S =x 2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.板块三 启智培优·破译高考数学思想系列10———线性回归中的函数思想[2015·全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x -错误错∑8i =1(x i-x -)2∑8i =1(w i-w -)2∑8i =1(x i-x -)(y i -y -)∑8i =1(w i-w -)(y i -y -)46.65636.8289.8 1.61469108.8表中w i =x i ,w -=8∑i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u -)(v i -v -)∑ni =1(u i -u -)2,α^=v --β^u -. 解题视点 求解第(1)问时,利用散点图结合学过的函数图象直接判断即可.求解第(2)问时,根据题目提供的数据及公式求出相关量,就可写出回归方程.求解第(3)问中的第一小问时,把x =49直接代入回归方程求解出y 的预报值,再代入年利润z 与x ,y 的关系式求解即可;求解第二小问时,把y 与x 的关系式代入年利润z 与x ,y 的关系式,将z 转化为关于x 的二次函数求最值即可.解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1 (w i -w -)(y i -y -)∑8i =1 (w i -w -)2=108.81.6=68, c ^=y --d ^w -=563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6,年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.答题启示 利用回归方程可以进行预测和估计总体,回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制、依据自变量的取值估计和预报因变量值的基础和依据.解决此类问题的步骤为:(1)将表中的各对数据在平面直角坐标系中描点,得到散点图;(2)按求回归方程的步骤和公式,写出回归方程;(3)利用回归方程进行分析,分析中注意函数思想的应用.跟踪训练某品牌2017款汽车即将上市,为了对这款汽车进行合理定价,某公司在某市五家4S 店分别进行了两天试销售,得到如下数据:(1)分别以五家4S 店的平均单价与平均销量为散点,求出单价与销量的回归直线方程y ^=b ^x +a ^;(2)在大量投入市场后,销量与单价仍服从(1)中的关系,且该款汽车的成本为12万元/辆,为使该款汽车获得最大利润,则该款汽车的单价约为多少万元(保留一位小数)?附:b ^=∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2,a ^=y --b ^x -. 解 (1)五家4S 店的平均单价和平均销量分别为(18.3,83),(18.5,80),(18.7,74),(18.4,80),(18.6,78),∴x -=18.3+18.5+18.7+18.4+18.65=18.5,y -=83+80+74+80+785=79,∴b ^=-0.2×4+0×1+0.2×(-5)+(-0.1)×1+0.1×(-1)0.04+0+0.04+0.01+0.01=-20.1=-20.∴a ^=y --b ^x -=79-(-20)×18.5=79+370=449, ∴y ^=-20x +449.(2)设该款汽车的单价应为x 万元, 则利润f (x )=(x -12)(-20x +449) =-20x 2+689x -5388,f ′(x )=-40x +689,令-40x +689=0,解得x ≈17.2,故当x ≈17.2时,f (x )取得最大值.∴要使该款汽车获得最大利润,该款汽车的单价约为17.2万元.板块四 模拟演练·提能增分[A 级 基础达标]1.[2018·湖北模拟]已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 答案 C解析 因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.2.[2018·桂林模拟]根据如下样本数据:x 3 4 5 6 7 8 y4.2.5-0.50.5-2.0-3.0得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0C .a <0,b >0D .a <0,b <0答案 B解析 由表中数据画出散点图,如图,由散点图可知b <0,a >0.3.通过随机询问200名性别不同的大学生是否爱好踢键子运动,计算得到统计量K 2的观测值k ≈4.892,参照附表,得到的正确结论是( )P (K 2≥k )0.10 0.05 0.025 k2.7063.8415.024A B .有97.5%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关” 答案 C解析 因为K 2的观测值k ≈4.892>3.841,所以有95%以上的把握认为“爱好该项运动与性别有关”.4.[2018·洛阳模拟]为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程y ^=bx +a 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )A .线性相关关系较强,b 的值为1.25B .线性相关关系较强,b 的值为0.83C .线性相关关系较强,b 的值为-0.87D .线性相关关系较弱,无研究价值 答案 B解析 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y =x 的斜率要小一些,综上可知应选B.5.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:广告费用x 4 2 3 5 销售额y49263954根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5.6.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.答案 95%解析 由题意知,k =50×(13×20-10×7)223×27×20×30≈4.844,因为 5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.7.[2018·沧州七校联考]某单位为了制定节能减排的计划,随机统计了某4天的用电量y (单位:度)与当天气温x (单位:℃),并制作了对照表(如表所示).由表中数据,得线性回归方程y ^=-2x +a ^,当某天的气温为-5 ℃时,预测当天的用电量约为________度.x 18 13 10 -1 y24343864答案 解析 气温的平均值x -=14×(18+13+10-1)=10,用电量的平均值y -=14×(24+34+38+64)=40,因为回归直线必经过点(x -,y -),将其代入线性回归方程得40=-2×10+a ^,解得a ^=60,故回归方程为y ^=-2x +60.当x =-5时,y ^=(-2)×(-5)+60=70,所以当某天的气温为-5 ℃时,预测当天的用电量约为70度.8.已知x ,y 之间的一组数据如下表:x 2 3 4 5 6 y34689对于表中数据,现给出如下拟合直线:①y =x +1;②y =2x -1;③y =5x -5;④y =32x .则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).答案 ③解析 由题意知x -=4,y -=6,∴b ^=∑5i =1 (x i -x -)(y i -y -)∑5i =1(x i -x -)2=85,∴a ^=y --b ^x -=-25,∴y ^=85x -25,∴填③. 9.由某种设备的使用年限x i (年)与所支出的维修费y i (万元)的数据资料算得如下结果,∑i =15x 2i =90,∑i =15x i y i =112,∑i =15x i =20,∑i =15y i =25.(1)求所支出的维修费y 对使用年限x 的线性回归方程y ^=b ^x +a ^; (2)①判断变量x 与y 之间是正相关还是负相关; ②当使用年限为8年时,试估计支出的维修费是多少. 解 (1)∵∑i =15x i =20,∑i =15y i =25,∴x =15∑i =15x i =4,y =15∑i =15y i =5,∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=112-5×4×590-5×42=1.2, a ^=y -b ^x =5-1.2×4=0.2.∴线性回归方程为y ^=1.2x +0.2.(2)①由(1)知b ^=1.2>0,∴变量x 与y 之间是正相关.②由(1)知,当x =8时,y ^=9.8,即使用年限为8年时,支出的维修费约是9.8万元. 10.[2018·聊城模拟]在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1∶3,且成绩分布在[40,100],分数在80以上(含80)的同学获奖.按文、理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示.(1)求a 的值,并计算所抽取样本的平均值x -(同一组中的数据用该组区间的中点值作代表);(2)填写下面的2×2列联表,并判断能否有超过95%的把握认为“获奖与学生的文、理科有关”?文科生 理科生 合计 获奖 5 不获奖合计200K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828x -=45×0.1+55×0.15+65×0.25+75×0.3+85×0.15+95×0.05=69.(2)2×2列联表如下:文科生 理科生 合计 获奖 5 35 40 不获奖 45 115 160 合计50150200因为K 2=40×160×50×150=6≈4.167>3.841,所以有超过95%的把握认为“获奖与学生的文、理科有关”.[B 级 知能提升]1.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6.则实数a ^的值是( )A.116 B.18 C.14 D.12答案 B解析 依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18.2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10b乙班 c30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )附表:P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 答案 C解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A ,B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.3.[2018·赣州模拟]在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i=13,∑6i =1x 2i =21,则实数b 的值为________. 答案 57解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t =∑6i =1x 2i6=72,y =∑6i =1y i 6=136,代入y =bt -13,得136=b ×72-13,解得b =57. 4.某校开展“翻转合作学习法”教学试验,经过一年的实践后,对“翻转班”和“对照班”的220名学生的数学学习情况进行测试,按照大于或等于120分为“成绩优秀”,120分以下为“成绩一般”统计,得到如下的2×2列联表:成绩优秀 成绩一般 合计 对照班 20 90 110 翻转班 40 70 110 合计60160220秀与翻转合作学习法”有关;(2)为了交流学习方法,从这次测试数学成绩优秀的学生中,用分层抽样的方法抽出6名学生,再从这6名学生中抽出3名交流学习方法,求至少抽到一名“对照班”学生的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828解 (1)K 2=60×160×110×110=6≈9.167<10.828,∴在犯错误的概率不超过0.001的前提下,不能认为“成绩优秀与翻转合作学习法”有关.(2)设从“翻转班”中抽取x 人,从“对照班”中抽取y 人,由分层抽样的定义可知660=x 40=y20,解得x =4,y =2. 在这6名学生中,设“对照班”的2名学生分别为A 1,A 2,“翻转班”的4名学生分别为B 1,B 2,B 3,B 4.则所有的抽样情况如下,{A 1,A 2,B 1},{A 1,A 2,B 2},{A 1,A 2,B 3},{A 1,A 2,B 4}, {A 1,B 1,B 2},{A 1,B 1,B 3},{A 1,B 1,B 4},{A 1,B 2,B 3}, {A 1,B 2,B 4},{A 1,B 3,B 4},{A 2,B 1,B 2},{A 2,B 1,B 3}, {A 2,B 1,B 4},{A 2,B 2,B 3},{A 2,B 2,B 4},{A 2,B 3,B 4}, {B 1,B 2,B 3},{B 1,B 2,B 4},{B 1,B 3,B 4},{B 2,B 3,B 4}, 共20种.其中至少有一名“对照班”学生的情况有16种.记事件A 为至少抽到一名“对照班”学生交流学习方法,则P (A )=1620=45=0.8.5.[2018·太原模拟]假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)百度文库 - 让每个人平等地提升自我21 有如以下的统计数据: x (年)2 3 4 5 6 y (万元)2.23.8 5.5 6.5 7.0 已知∑i =1x 2i =90,∑i =1y 2i =140.8,∑i =1x i y i =112.3,79≈8.9,2≈1.4. (1)求x -,y -;(2)对x ,y 进行线性相关性检验;(3)如果x 与y 具有线性相关关系,求出回归直线方程;(4)估计使用年限为10年时,维修费用约是多少?解 (1)x -=2+3+4+5+65=4, y -=2.2+3.8+5.5+6.5+7.05=5. (2)因为∑5i =1x i y i -5x -y -=112.3-5×4×5=12.3, ∑5i =1x 2i -5x -2=90-5×16=10, ∑5i =1y 2i -5y -2=140.8-125=15.8, 所以r =12.310×15.8=12.3158≈0.987. 因为0.987>0.75,所以x 与y 之间具有很强的线性相关关系. (3)因为b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=12.310=1.23,a ^=y --b ^x -=5-1.23×4=0.08,所以所求的回归直线方程为y ^=1.23x +0.08.(4)当x =10时,y ^=1.23×10+0.08=12.38,即估计使用年限为10年时,维修费用约为12.38万元.。
高考数学一轮复习第9章统计与统计案例第3节变量间的相关关系、统计案例课件
附:
P(K2≥k0) 0.100 0.050 0.025 0.010 0.001
A.0.1%
k0 2.706 3.841 5.024 6.635 10.828 B.1%
C.99%
D.99.9%
C [因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1- 0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.]
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg 箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2的观测值k=20100×0×621×006×6-963×4×103482≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
() (4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优 秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ) [答案] (1)× (2)√ (3)√ (4)×
2.(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近
视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,
关关系,故①正确;由散点图知用y=c1ec2x拟合比用 ^y = b^ x+ ^a 拟合效果要好,
则R
2 1
>R
2 2
,故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③
错误.]
[规律方法] 判定两个变量正、负相关性的方法 1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从 左上角到右下角,两个变量负相关. 2相关系数:r>0时,正相关;r<0时,负相关. 3线性回归方程中: 时,正相关; 时,负相关.
2019版数学一轮高中全程复习方略课件:第九章 计数原理、概率、随机变量及其分布9-9
[变式练]——(着眼于举一反三) 1.(2018· 湖北黄冈调研)已知 6 只小白鼠中有 1 只感染了病毒,需 要对 6 只小白鼠进行病毒 DNA 化验来确定哪一只受到了感染. 下面是 两种化验方案:方案甲:逐个化验,直到能确定感染病毒的小白鼠为 止.方案乙:将 6 只小白鼠分为两组,每组三只,将其中一组的三只 小白鼠的待化验物质混合在一起化验,若化验结果显示含有病毒 DNA,则表明感染病毒的小白鼠在这三只当中,然后逐个化验,直到 确定感染病毒的小白鼠为止;若化验结果显示不含病毒 DNA,则在另 外一组中逐个进行化验. (1)求执行方案乙化验次数恰好为 2 次的概率; (2)若首次化验的化验费为 10 元,第二次化验的化验费为 8 元, 第三次及以后每次化验的化验费都是 6 元,求方案甲所需化验费的分 布列和期望.
6.两个常用结论 (1)均值与方差的关系 2 2 D(X)=E(X )-E (X). (2)超几何分布的均值 nM 若 X 服从参数为 N,M,n 的超几何分布,则 E(X)= N .
二、必明 2●个易误点 1.两点分布,二项分布,超几何分布的均值与方差的计算 公式容易记混淆,准确记忆公式是解题的必要条件. 2.在实际问题中注意深刻理解题意,准确判断实际问题是 何种类型的分布是解题的关键.
np=6 解析:由题意知 np1-p=3,
4.(2018· 湖北调研)已知随机变量 η 满足 E(1-η)=5,D(1 -η)=5,则下列说法正确的是( ) A.E(η)=-5,D(η)=5 B.E(η)=-4,D(η)=-4 C.E(η)=-5,D(η)=-5 D.E(η)=-4,D(η)=5
2019年高考数学一轮复习第9章算法初步、统计与统计案例第3节统计图表、用样本估计总体学案
第三节 统计图表、用样本估计总体[考纲传真](教师用书独具)1. 了解分布的意义与作用,能根据概率分布表画频率分布直方 图、频率折线图、茎叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差 3能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数 字特征•理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题. 双基自主测评I 自测巩固基础知识(对应学生用书第162页)[基础知识填充]极差第一步:求极差,决定组数和组距,组距= 极数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.频率 . 一 一.一组距,每个小矩形的面积表示样本落在该组内的频率.⑶ 频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点, 线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频 率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(4)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将各个数据的茎按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的右 (左)侧.2 •样本的数字特征(1)众数、中位数、平均数 数字特征 定义与求法优点与缺点众 数 一组数据中出现次数最多 的数通常用于描述出现次数最多的数,显然 它对其他数据信息的忽视使得无法客 观地反映总体特征中把一组数据按大小顺序排中位数是样本数据所占频率的等分线,1 •常用统计图表(1)频率分布表的画法:cP横轴表示样本数据,纵轴表示就得到频率分布折位数列,处在最中间位置的一 个数据(或两个数据的平 均数)它不受少数几个极端值的影响,这在某 些情况下是优点,但它对极端值的不敏 感有时也会成为缺点平 如果有n 个数据X 1,X 2,…,平均数和每一个数据有关,可以反映样 均 x n ,那么这n 个数的平均数本数据全体的信息,但平均数受数据中均 —1极端值的影响较大,使平均数在估计总 数X = =( X 1+ X 2+・・・+ X n )n体时可靠性降低 -①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s =1----------- 2 ----------------------------- 2 ------------------------------------------ 2斤[(X i — x ) + (X 2 — x ) +…+ (x n — x )]. ②方差:标准差的平方 S 21 一 一 一s 2= n 【(X 1— x )2 + (X 2— x )2+・・・+ (X n — x 口,其中 x i ( i = 1,2,3 ,…,n )是样本数据,(2) 数据X 1, X 2,…,X n 的方差为Si①数据X 1+ a , X 2+ a ,…,x n + a 的方差也为s 2; ②数据ax 1, ax 2,…,ax n 的方差为a 2s 2./ AX I[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“V”,错误的打“X”) (1) 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.高.()(4)茎叶图一般左侧的叶按从大到小的顺序写, 右侧的叶按从小到大的顺序写,的数据可以只记一次.()[解析](1)正确•平均数、众数与中位数都在一定程度上反映了数据的集中趋势.错误•方差越大,这组数据越离散. 正确.小矩形的面积=组距X 组距=频率.组距n 是样本容量,x 是样本平均数.[知识拓展]平均数、方差的公式推广(1)若数据X 1 , X 2,…,X n 的平均数为X ,那么mx + a , mx + a , mx + a ,… mx +a 的平均数是mx + a .(2) 一组数据的方差越大,说明这组数据越集中•()(3) 频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越相同⑷ 错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故⑷错误. [答案]⑴ V (2) X (3) V ⑷X2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图9-3-1所示,则这组数据的中位数和平均数分别是( )S 7 9 9 0 12 3 4 6图 9-3-1A. 91.5 和 91.5B. 91.5 和 92C. 91 和 91.5D. 92 和 92A [这组数据由小到大排列为 87,89,90,91,92,93,94,96.91 + 92所以中位数是 —=91.5 ,平均数 壬=87 + 89+ 90 + 91 [ 92 + 93+ 94 + 96 = 91.5.] 3. (2017 •全国卷I )为评估一种农作物的种植效果,选了n 块地作试验田.这 n 块地的亩产量(单位:kg )分别为X 1, X 2,…,X n ,下面给出的指标中可以用来评估这种农作物亩产 量稳定程度的是()A . X 1, X 2, …X n 的平均数 B . X 1, X 2, …X n 的标准差 C . X 1, X 2, …X n 的取大值 D . X 1,X 2, …X n 的中位数[因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差•故选B.]4.如图 9-3-2所示是一样本的频率分布直方图.若样本容量为 100,则样本数据在[15,20]内的频数是A. 50 B . 40 C . 30C [因为[15,20]对应的小矩形的面积为 1 — 0.04 X 5-0.1 X 5= 0.3,所以样本落在 [15,20]的频数为0.3 X 100= 30,故选C.]5•某校女子篮球队 7名运动员身高(单位:cm )分布的茎叶图如图 9-3-3,已知记录的平均D. 14身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为 __________ •)8 Q 1 17 I 2主 4 5图 9-3-312 [170 + 十(1 + 2 + X + 4+ 5+ 10+ 11) = 175, 1贝y — x (33 + x ) = 5,即 33+ x = 35,解得 x = 2.]7■片题型分类突破I 典例剖析 探求规律方法(对应学生用书第163页)频率分布直方图s 0.020.0 L o2D 30 40刃6070期)知齐数图 9-3-4(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;⑵ 已知样本中分数小于 40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于 70,且样本中分数不小于 70的男女生人数相等•试估计总体中男生和女生人数的比例.[解](1)根据频率分布直方图可知,样本中分数不小于 0.04) X 10= 0.6 ,所以样本中分数小于 70的频率为1 — 0.6 = 0.4 , 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为04⑵ 根据题意,样本中分数不小于 50的频率为(0.01 + 0.02 + 0.04 + 0.02) X 10= 0.9 ,分数在区间[40,50)内的人数为100— 100X 0.9 — 5 = 5,]題型1[► MS(2017 •北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比 例,使用分层抽样的方法从中随机抽取了 组: [20,30) , [30,40),…,[80,90]i 频率 0.04 ---------100名学生,记录他们的分数,将数据分成 7,并整理得到如图 9-3-4所示频率分布直方图:70的频率为(0.02 +5所以总体中分数在区间[40,50)内的人数估计为400X 100 = 20.(3)由题意可知,样本中分数不小于 70的学生人数为(0.02 + 0.04) X 10X 100= 60, 1所以样本中分数不小于 70的男生人数为60X 2 = 30, 所以样本中的男生人数为 30 X 2= 60, 女生人数为100- 60 = 40,所以样本中男生和女生人数的比例为60 : 40= 3 : 2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3 : 2.[规律方法]频率、频数、样本容量的计算方法图 9-3-5A. 0.001B. 0.1C. 0.2D. 0.3(2)(2016 •山东高考)某高校调查了 200名学生每周的自习时间(单位:小时),制成 了如图9-3-6所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据X 组距=频率频数 样本容量 =频率,频数频数=样本容量,样本容量X 频率=频数 易错警示:绘制频率分布直方图时的 3个注意点1制作好频率分布表后,可以利用各组的频率之和是否为 频率2频率分布直方图的纵坐标是 组距,而不是频率.1来检验该表是否正确;;i 注意中值估算法[跟踪训练](1)(2017 •河南新乡调研)统计新生婴儿的体重,其频率分布直方图如图 9-3-5 所示(每组含右端点,不含左端点 ),则新生婴儿体重在(2 700,3 000]克内的频率为()【导学号:79140329】频率分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5), [27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A. 56 B . 60⑴D (2) D [⑴每组的频率即为相应小长方形的面积,300X 0.001 = 0.3.(2)由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16 + 0.08 +0.04) X 2.5 = 0.7 ,则每周自习时间不少于22.5小时的人数为0.7 X 200= 140.故选D.]56= 42,|题型2|-T-茎叶图卜例§(1)某学生在一A. 117 B . 118 C . 118.5⑵(2017 •山东高考)如图(单位:件).若这两组数据的中位数相等,且平均值也相等,则9-3-8所示的茎叶图记录了甲、乙两组各5名工人某日的A.C.(1) 值分别为乙组91 7 y图9-3-83,53,7B (2)AB. 5,5D. 5,7[(1)22次考试中,所得分数最高的为98,最低的为56,所以极差为98 —C. 120D. 140图9-3-7D .119.5该门功课考试分数的极差与中位数之和为() 产量数据将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+ 76= 118.(2)甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y = 5.又甲、乙两组1 1数据的平均值相等,所以x (56 + 65 + 62 + 74 + 70 + x) = X (59 + 61 + 67 + 65 +5 578),所以x= 3.故选A.][规律方法]茎叶图中的两个关注点1重复出现的数据要重复记录,不能遗漏•2给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.易错警示:茎叶图中数字大小排列不一定从小到大排列,一定要看清楚[跟踪训练]下面是甲、乙两名运动员某赛季一些场次得分的茎叶图, 如图9-3-9所示,下列说法不正确的是_________ .(填序号)甲乙0g] 2 4 73 22 1 9 95 4 2 13 3 69 4 44152图9-3-9①甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运动员的成绩没有明显的差异;④甲运动员的最低得分为0分.②③④ [由图可知,甲运动员的成绩比较集中,且平均得分大约在30多分,乙运动员得分也大致对称,平均得分在20多分,甲运动员最低分10分,乙运动员最低分8 分, 故①正确.]样本的数字特征某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a, b), (a, b ) , (a, b), ( a , b) , ( a , b ), (a , b) , (a , b), (a , b ),(a , b), (a, b ) , ( a , b ) , (a , b) , (a , b ) , ( a , b) , (a , b),其中a, a分别表示甲组研发成功和失败;b, b分别表示乙组研发成功和失败.(1) 若某组成功研发一种新产品,则给该组记1分,否则记0分•试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2) 若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.[解](1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1 ,10 2其平均数为x甲=磐=2;15 3- 2 2- 方差为s社总1-3x 10+0-1心=!•―9 3乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1 ,其平均数为x乙= =匚;15 5 _2 2 (J方差为S乙=2 1-5 X 9+ 0-1 X6 =曇因为7甲〉7乙,s甲v s乙,所以甲组的研发水平优于乙组.(2)记E= {恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a, ¥),(石,b), (a, "b),————7(a , b) , (a, b ), (a, b ) , ( a , b),共7个,故事件E发生的频率为亦•将频率视为概率,即得所求概率为P(E)[规律方法]1.平均数、方差与标准差的意义平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式2. 利用频率分布直方图估计样本的数字特征的方法1中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.2平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和3众数:最高的矩形的中点的横坐标.3. 熟记求平均数,方差的公式.[跟踪训练](1)(2018 •江西九校联考)如图9-3-10是一名篮球运动员在最近6场比赛中所得分数的茎叶图,则下列关于该运动员所得分数的说法错误的是()图9-3-10A. 中位数为14B. 众数为13C. 平均数为15D. 方差为19(2)(2017 •贵州省适应性考试)一组样本数据的频率分布直方图如图9-3-11所示,试估计此样本数据的中位数为()100A. 13 B . 12 C . 11.52 D . -913+ 15(1) D (2) D [(1)由茎叶图知,该运动员所得分数的中位数为—=14,众数为13,8+ 13+ 13+ 15+ 20+ 21 1 2 2 2平均数为----------- 6 ---------------- = 15,方差为6【(8 - 15)2+ (13 —15)2+ (13 —15)2+ (15—15)2+ (20 —15)2+ (21 —15)2]=—,所以D 错误,故选D.3(2)由频率分布直方图可得第一组的频率是0.08,第二组的频率是0.32,第三组的0 1 100频率是0.36,则中位数在第三组内,估计样本数据的中位数为10+ X 4= ,0.36 9选项D正确.]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3讲 变量相关关系与统计案例板块四 模拟演练·提能增分[A 级 基础达标]1.[2018·湖北模拟]已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 答案 C解析 因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.2.[2018·桂林模拟]根据如下样本数据:得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0 D .a <0,b <0答案 B解析 由表中数据画出散点图,如图,由散点图可知b <0,a >0.3.通过随机询问200名性别不同的大学生是否爱好踢键子运动,计算得到统计量K 2的观测值k ≈4.892,参照附表,得到的正确结论是( )A B .有97.5%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关” 答案 C解析 因为K 2的观测值k ≈4.892>3.841,所以有95%以上的把握认为“爱好该项运动与性别有关”.4.[2018·洛阳模拟]为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程y ^=bx +a 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )A .线性相关关系较强,b 的值为1.25B .线性相关关系较强,b 的值为0.83C .线性相关关系较强,b 的值为-0.87D .线性相关关系较弱,无研究价值 答案 B解析 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y =x 的斜率要小一些,综上可知应选B.5.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5.6.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (k =-223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.答案 95%解析 由题意知,k =-223×27×20×30≈4.844,因为 5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.7.[2018·沧州七校联考]某单位为了制定节能减排的计划,随机统计了某4天的用电量y (单位:度)与当天气温x (单位:℃),并制作了对照表(如表所示).由表中数据,得线性回归方程y ^=-2x +a ^,当某天的气温为-5 ℃时,预测当天的用电量约为________度.答案 解析 气温的平均值x -=14×(18+13+10-1)=10,用电量的平均值y -=14×(24+34+38+64)=40,因为回归直线必经过点(x -,y -),将其代入线性回归方程得40=-2×10+a ^,解得a ^=60,故回归方程为y ^=-2x +60.当x =-5时,y ^=(-2)×(-5)+60=70,所以当某天的气温为-5 ℃时,预测当天的用电量约为70度.8.已知x ,y 之间的一组数据如下表:对于表中数据,现给出如下拟合直线:①y =x +1;②y =2x -1;③y =5x -5;④y =32x .则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).答案 ③解析 由题意知x -=4,y -=6,∴b ^=∑5i =1x i -x-y i -y-∑5i =1x i -x-2=85,∴a ^=y --b ^x -=-25,∴y ^=85x -25,∴填③. 9.由某种设备的使用年限x i (年)与所支出的维修费y i (万元)的数据资料算得如下结果,∑i =15x 2i =90,∑i =15x i y i =112,∑i =15x i =20,∑i =15y i =25.(1)求所支出的维修费y 对使用年限x 的线性回归方程y ^=b ^x +a ^; (2)①判断变量x 与y 之间是正相关还是负相关;②当使用年限为8年时,试估计支出的维修费是多少. 解 (1)∵∑i =15x i =20,∑i =15y i =25,∴x =15∑i =15x i =4,y =15∑i =15y i =5,∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=112-5×4×590-5×42=1.2, a ^=y -b ^x =5-1.2×4=0.2.∴线性回归方程为y ^=1.2x +0.2.(2)①由(1)知b ^=1.2>0,∴变量x 与y 之间是正相关.②由(1)知,当x =8时,y ^=9.8,即使用年限为8年时,支出的维修费约是9.8万元. 10.[2018·聊城模拟]在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1∶3,且成绩分布在[40,100],分数在80以上(含80)的同学获奖.按文、理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示.(1)求a 的值,并计算所抽取样本的平均值x -(同一组中的数据用该组区间的中点值作代表);(2)填写下面的2×2列联表,并判断能否有超过95%的把握认为“获奖与学生的文、理科有关”?K 2=n ad -bc 2a +b c +d a +cb +dx -=45×0.1+55×0.15+65×0.25+75×0.3+85×0.15+95×0.05=69.(2)2×2列联表如下:因为K 2=40×160×50×150=6≈4.167>3.841, 所以有超过95%的把握认为“获奖与学生的文、理科有关”.[B 级 知能提升]1.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6.则实数a ^的值是( )A.116B.18C.14D.12 答案 B解析 依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18.2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )参考公式:K 2=n ad -bc 2a +bc +d a +cb +d附表:B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 答案 C解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A ,B 错误.根据列联表中的数据,得到K 2=-255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.3.[2018·赣州模拟]在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i=13,∑6i =1x 2i =21,则实数b 的值为________. 答案 57解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t =∑6i =1x 2i6=72,y =∑6i =1y i 6=136,代入y =bt -13,得136=b ×72-13,解得b =57. 4.某校开展“翻转合作学习法”教学试验,经过一年的实践后,对“翻转班”和“对照班”的220名学生的数学学习情况进行测试,按照大于或等于120分为“成绩优秀”,120分以下为“成绩一般”统计,得到如下的2×2列联表:与翻转合作学习法”有关;(2)为了交流学习方法,从这次测试数学成绩优秀的学生中,用分层抽样的方法抽出6名学生,再从这6名学生中抽出3名交流学习方法,求至少抽到一名“对照班”学生的概率.附:K 2=n ad -bc 2a+bc +d a +cb +d解 (1)K 2=60×160×110×110=6≈9.167<10.828, ∴在犯错误的概率不超过0.001的前提下,不能认为“成绩优秀与翻转合作学习法”有关.(2)设从“翻转班”中抽取x 人,从“对照班”中抽取y 人,由分层抽样的定义可知660=x 40=y20,解得x =4,y =2. 在这6名学生中,设“对照班”的2名学生分别为A 1,A 2,“翻转班”的4名学生分别为B 1,B 2,B 3,B 4.则所有的抽样情况如下,{A 1,A 2,B 1},{A 1,A 2,B 2},{A 1,A 2,B 3},{A 1,A 2,B 4}, {A 1,B 1,B 2},{A 1,B 1,B 3},{A 1,B 1,B 4},{A 1,B 2,B 3}, {A 1,B 2,B 4},{A 1,B 3,B 4},{A 2,B 1,B 2},{A 2,B 1,B 3}, {A 2,B 1,B 4},{A 2,B 2,B 3},{A 2,B 2,B 4},{A 2,B 3,B 4}, {B 1,B 2,B 3},{B 1,B 2,B 4},{B 1,B 3,B 4},{B 2,B 3,B 4}, 共20种.其中至少有一名“对照班”学生的情况有16种.记事件A 为至少抽到一名“对照班”学生交流学习方法,则P (A )=1620=45=0.8.5.[2018·太原模拟]假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如以下的统计数据:已知∑i =1x 2i =90,∑i =1y 2i =140.8,∑i =1x i y i =112.3,79≈8.9,2≈1.4. (1)求x -,y -;(2)对x ,y 进行线性相关性检验;(3)如果x 与y 具有线性相关关系,求出回归直线方程; (4)估计使用年限为10年时,维修费用约是多少? 解 (1)x -=2+3+4+5+65=4,y -=2.2+3.8+5.5+6.5+7.05=5.(2)因为∑5i =1x i y i -5x -y -=112.3-5×4×5=12.3, ∑5i =1x 2i -5x -2=90-5×16=10, ∑5i =1y 2i -5y -2=140.8-125=15.8, 所以r =12.310×15.8=12.3158≈0.987.因为0.987>0.75,所以x 与y 之间具有很强的线性相关关系.(3)因为b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=12.310=1.23,a ^=y --b ^x -=5-1.23×4=0.08,所以所求的回归直线方程为y ^=1.23x +0.08.(4)当x =10时,y ^=1.23×10+0.08=12.38,即估计使用年限为10年时,维修费用约为12.38万元.。