2019年人教版A版高三数学(理)高考一轮复习10.4 变量间的相关关系、统计案例教学设计及答案
2019高三数学人教A版理一轮课件:第9章 第4节 变量间
4.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万 元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 ^ 回归直线方程:y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均约增加________万元.
0.254 [由题意知回归直线的斜率为 0.254, 故家庭年收入每增加 1 万元,年饮食支出平均约增加 0.254 万元.]
总计 a+c b+d a+b+c+d
nad-bc2 构造一个随机变量 K2=a+ba+cb+dc+d ,其中 n= a+b+c+d为样
本容量.
(3)独立性检验
2 K 利用随机变量 来判断“两个分类变量 有关系 ”的方法称为独立性检验.
^ [知识拓展] 1.b的几何意义:体现平均增加或平均减少. 2.由回归直线求出的数据是估算值,不是精确值.
[基本能力自测] 1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关 系.( ) )
^ ^ ^ (2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势. (
(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进 行相关性检验.( ) )
4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 不同类别 称为分类变量. (2)列联表:列出两个分类变量的 频数表 ,称为列联表.假设有两个分类 变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称 为 2×2 列联表)为 ,像这类变量
2×2 列联表 y1 x1 x2 a c y2 b d 总计 a+b c+d
8.1.1变量的相关关系-高中数学人教A版(2019)选择性必修第三册
变量间的相关关系
问题3 对于具有相关关系的两个变量,该如何作出判断?
① 经验判断;
② 数据判断:
样本数据分析
建立模型
估计或推断.
☆ 新知探究
散点图数据分析
探究 在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一
些年龄和脂肪含量的简单随机样本数据,如下表所示.表中每个编号下的
年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.
6
B )
A. 利息与利率
B. 居民收入与储蓄存款
C. 电视机产量与苹果产量
D. 某种商品的销售额与销售价格
②④
2. 下列两个变量之间的关系是相关关系的是_______.(填序号)
①角度和它的正切值;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
☆ 新知探究
(3)人的体重与饭量
相关关系
饭量会影响体重,但不是唯一因素,所以人的体重与饭量不是函数关系
非相关关系
(4)人的身高与视力
人的身高与视力无任何关系,所以不是函数关系.
☆ 新知探究
变量间的相关关系
确定性关系
两个
变量
间的
关系
(函数关系)
对于任意一个x都有唯一确定的y和它对应。
比如: 1、圆的周长L与半径r
判断下列两个变量之间是否是函数关系,如果是,写出它们的解析式:
(1)正方体的体积与棱长
(1)函数关系,
(2)汽车匀速行驶时的路程与时间
(2)函数关系,
函
数
关
系
(3)人的体重与饭量
(3)饭量会影响体重,但不是唯一因素,所以人的体重与饭量不是
人教A版高考总复习一轮文科数学精品课件 第10章 第4节 变量间的相关关系、统计案例
处于上涨趋势,最近五年的价格如下表:
年份编号
1
2
3
4
5
年份
2017
2018
2019
2020
2021Biblioteka 单价(元/千克)17
19
23
26
30
药材乙的收购价格始终为21元/千克,其亩产量的频率分布直方图如下:
(1)若药材甲的单价y(单位:元/千
克)与年份编号x具有线性相关关
系,请求出y关于x的线性回归方程,
并估计2022年药材甲的单价.
(2)用上述频率分布直方图估计药
材乙的平均亩产量,若不考虑其他
因素,试判断2022年该地区种植哪
种药材收益更高?并说明理由.
^
^
^
^
附:线性回归方程 = bx+,其中 =
∑ - ^
数据的相关系数最大,故选B.
规律方法 判断相关关系的方法
散点图法
(1)样本点都落在某函数的曲线附近,变量之间有相关关系
(2)样本点都落在某直线附近,变量之间有线性相关关系
(1)当 r>0 时,正相关
相关系数法 (2)当 r<0 时,负相关
(3)|r|越趋近于 1,相关性就越强
线性回归
方程法
^
^
^
^
^
^
^
^
∑ ( -)( -)
线 = x+的斜率和截距的最小二乘估计分别为 = =1
2
∑ ( -)
=1
∑ -
=1
∑ 2 -
高三数学人教版A版数学(理)高考一轮复习教案:10.4 变量间的相关关系、统计案例 Word版含答案
第四节 变量间的相关关系、统计案例 变量间的相关关系、统计案例 1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析了解回归分析的基本思想、方法及其简单应用.知识点一 回归分析 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^=y -b ^x .(3)通过求Q =∑ni =1(y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )x 0 1 3 4 y2.24.3 4.86.7A.3.25 C .2.2D .0解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A ,B ,C ,D ,E 5组(x ,y )数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D . 答案:D知识点二 独立性检验 独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:y1y2总计x1 a 2173x2222547总计 b 46120则表中a,b的值分别为A.94,72B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z 负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.考点二回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑8i =1(x i -x)2∑8i =1(w i -w)2∑8i =1(x i -x )(y i-y )∑8i =1(w i -w )(y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1 (w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^. (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i =1x 1y 1=66.5,∑4i =1x 21=32+42+52+62=86,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,所求的回归方程为y ^=0.7x +0.35.(2)x =100,y ^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三 独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50kg 为肥胖.常喝 不常喝 合计 肥胖 2 不肥胖 18 合计30已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2≥k 0 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知数据可求得K 2=30×(6×18-2×4)10×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表;②准确理解K2.提醒:准确计算K2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥402060走斑马线203050总计6050110K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.附表:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828A.有99%以上的把握认为“选择过马路的方式与性别有关”B.有99%以上的把握认为“选择过马路的方式与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:K2=110×(40×30-20×20)260×50×60×50≈7.8.P(K2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】(12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:喜欢“应用统计”课程不喜欢“应用统计”课程总计男生20525(1)判断是否有(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)[规范解答](1)由公式K2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,(3分) 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m个男生,则630=m20,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K2公式计算K2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习]某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:参加社团活动不参加社团活动合计学习积极性高 17825学习积极性一般 5 20 25 合计222850(1)加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d );其中n =a +b +c +d .P (K 2≥k 0)0.05 0.01 0.001 k 03.8416.63510.828解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(17×20-5×8)225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0A.a ^>0,b ^>0 B.a >0,b <0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4解析:依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .则下面的正确结论是( )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k 0=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本数据:得到的回归方程为y =b x +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:依题意得,a +b -25=0.9,故a ^+b ^=6.5①;又样本点的中心为(5,0.9),故0.9=5b ^+a ^②,联立①②,解得b ^=-1.4,a ^=7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x 2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为________. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计 男生 20 5 25 女生 10 15 25 总计302050(请用百分数表示).P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828解析:K 2=(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.x 2 3 4 5 6 y251254257a266解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析. 解:(1)2×2列联表如下:(2)因为K 2=30×(8-128)12×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑n i =1t 2i -n t 2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2.又l tt =∑n i =1t 2i -n t2=55-5×32=10,l ty =∑ni =1t i y i-n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:∵x =10.0,y =8.0,b ^=0.76,∴a ^=8-0.76×10=0.4,∴回归方程为y ^=0.76x +0.4,把x =15代入上式得,y ^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙 数学。
最新高考数学(理)一轮复习讲义 变量间的相关关系、统计案例
B.52,50
C.52,74
D.74,52
解析:选 C.因为 a+21=73,所以 a=52.又 a+22=b,所以 b=74.
3.(必修 3P90 例题改编)某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,
所得数据如表:
x 6 8 10 12 y23 5 6 则 y 对 x 的线性回归直线方程为( )
回归直线方程为^y=0.7x-2.3.故选 C.
一、思考辨析 判断正误(正确的打“√”,错误的打“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (4)事件 X,Y 的关系越密切,由观测数据计算得到的 K2 的观测值越大.( ) (5)通过回归方程y^=b^x+a^可以估计和观测变量的取值和变化趋势.( ) 答案:(1)× (2)√ (3)√ (4)√ (5)√ 二、易错纠偏 常见误区|K(1)混淆相关关系与函数关系; (2)对独立性检验 K2 值的意义不清楚; (3)不知道回归直线必过样本点中心. 1.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分 别反映的变量间的相关关系是( )
A.回归分析
B.均值与方差
C.独立性检验
D.概率
解析:选 C.“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.
2.(选修 23P97 练习改编)下面是 2×2 列联表:
y1 y2 合计
x1
a 21 73
x2
22 25
47
合计 b 46 120Fra bibliotek则表中 a,b 的值分别为( )
人教版高考数学理科一轮总复习配套课件11.9变量间的相关关系、统计案例
-3-
1.相关关系: 当自变量取值一定时, 因变量的取值带有一定随机性的两 个变量之间的关系叫做相关关系.与函数关系不同, 相关关系是一种
非确
定性关系 .
2.散点图: 表示具有相关关系的两个变量的一组数据的图形叫做散点 图, 它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点分 布在从左下角到右上角的区域, 则称两个变量 在从左上角到右下角的区域, 则称两个变量
������
, ������ = ������ − ������ ������ , 它主要用来估
^
计和预测取值, 从而获得对这两个变量之间整体关系的了解.
^ ^
想一想结合直线的点斜式方程, 你能推导出回归方程 ������ =
^
������ x+ ������ 经过的定点吗?
答案: 由������ = ������ − ������ ������ 得������ = ������ x+������ − ������ ������ , 即 ������ − ������ = ������ (x-������ ), 由此可知回
-4-
4.回归方程: ������ = ������ x+������ , 其中 ������ =
^
^ ^
^
������=1 ������
∑ ������������ ������������ -n������ ������ ^
2 ∑ ������2 ������ -n������ ������=1
关闭
^ ^ ^
^
������ =
^
4+2+3+5 4 ^
=3.5,������=
2019版高考数学一轮复习第十章概率与统计第五节变量的相关关系课件文【优质ppt版本】
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在⑤ 一条直线附近 ,就称这
两个变量之间具有线性相关关系,这条直线叫做回归直线.
(4)最小二乘法
求回归直线,使得样本数据的点到它的⑥ 距离的平方和最小 的方法
叫做最小二乘法.
(5)回归方程
方程 y^ =b^ xa+^ 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2), …,(xn,yn)的回归方程,其中 a^ ,b^ 是待定参数.
r的绝对值越接近于1,表明两个变量的线性相关性 越强 .r的绝对 值越接近于0,表明两个变量之间 几乎不存在线性相关关系 .通常 |r|大于或等于 0.75 时,认为两个变量有很强的线性相关性.
1.观察下列各图:
其中两个变量x,y具有线性相关关系的图是 ( C )
A.①② B.①④ C.③④ D.②③ 答案 C 由散点图知③④中x,y具有线性相关关系.
n
i n1x⑨i,y(1n i n1,y i,则 ) 将称为样x 本y 点的中心.
n
(3)相关系数:r
.
xi yi nxy
i1
当r>0时,表明两个变in1x量i2 ⑩nx2
正in1相yi2 关ny2
;
当r<0时,表明两个变量 负相关 .
.
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
58
答案 5.9
解析 x = 4 =23.53, 5= =4y 3, 49263958
4
∵回归直线经过点( x , y ),
∴43=10.6×3.5+a,∴a=5.9.
(新课标)2019届高考数学一轮复习第十一章统计11.3变量间的相关关系与线
③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①② C.①②④ B.①②③ D.①②③④
解: 由回归分析的方法及概念判断 ①②④ 正 确.故选 C.
【点拨】要注意函数关系与相关关系的区别: 函数关系是确定性关系,而相关关系是随机的、不 确定的.回归分析是对具有相关关系的两个变量进 行统计分析的一种常用方法.
已知数组(x1,y1),(x2,y2),„,(x10,y10)满足线性回归 ^ ^ 方程y=bx+a,则“(x0,y0)满足线性回归方程y=bx+a”是“x0 x1+x2+„+x10 y1+y2+„+y10 = ,y0= ”的( ) 10 10 A.充分不必要条件 B.必要不充分条件 C.充要条件 D.既不充分也不必要条件
第十一章 第一章
集合与常用逻辑用语 统 计
11.3 变量间的相关关系与线性回归方程
1.变量间的相关关系 常见的两变量之间的关系有两类:一类是确定性的函数关系,另一 类是________;与函数关系不同,相关关系是一种________关系,带有 随机性. 2.两个变量的线性相关 (1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就 称这两个变量之间具有____________,这条直线叫________. (2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么 两个变量的这种相关关系称为________;如果点分布在从左上角到右下 角的区域内,那么两个变量的这种相关关系称为________.
解:x0,y0 为这 10 组数据的平均值,又因为线性回归方程
— — — — ^ y=bx+a 必过样本中心(x,y),因此(x,y)一定满足线性回归方
2019高考数学一轮复习10.4变量间的相关关系、统计案例课件理新人教B
������
∑
(������������-������)2
������=1
=
������∑=1������������������������-������������ ������ ������∑=������1���������2��� -������������2
,
^^
������ = ������-������ ������.
) (4)事件X,Y关系越密切,则由观测数据计算得到的X2的值越大.(
)
(5)通过回归方程^������ = ^bx+^������可以估计和观测变量的取值和变化趋关闭
势(1).×( (2))√ (3)√ (4)√ (5)√
答案
-8-
知识梳理 考点自测
12345
2.已知变量 x 和 y 满足关系^������=-0.1x+1,变量^������与 z 正相关.下列结
线叫做 回归直线
.
-4-
知识梳理 考点自测
(2)回归方程^������ = ^bx+^������是两个具有线性相关关系的变量的一组
数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^������ ,
^
������ 是待定系数.
������
������
^
������
=
������∑=1(������������-������)(������������-45
1.判断下列结论是否正确,正确的画“√”,错误的画“×”.
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.( )
(2)利用散点图可以直观判断两个变量的关系是否可以用线性关 系表示.( )
高中数学人教A版必修三 变量间的相关关系PPT全文课件
乘法,使得样本数据的点到回归直线
的距离的平方和最小.
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
例:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响, 经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度/℃ -5 0 4 7 12 15 19 23 27 31 36
素的影响.
当自变量取值一定,因变量的取值带有一定随机性时, 两个变量之间的关系称为相关关系.
相关关系是一种不确定关系!!!
高中数学【人教A版必修】三 变量间的相关关系PPT全文课件【完 美课件 】
相关关系与函数关系的异同点:
相同点:均是指两个变量的关系. 不同点: 1.函数关系是一种确定的关系;而相关关系是一种非确定关系.
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
高中数学【人教A版必修】三 变量间的相关关系PPT全文课件【完 美课件 】
➢ 粮食产量与施肥量之间的关系.
在一定范围内,施肥量越 大,粮食产量就越高.但是,施 肥量并不是决定粮食产量的唯 一因素,因为粮食产量还要受 到土壤质量、降雨量、田间管 理水平等因素的影响.
高中数学【人教A版必修】三 变量间的相关关系PPT全文课件【完 美课件 】
➢ 人体内脂肪含量与年龄之间的关系.
1.了解变量之间的相关关系; 2.会区分变量间的函数关系与相关关系; 3.会作散点图,并由此对变量间的正相关或负相关作出直观 的判断; 4.会求线性回归方程,并会利用回归方程进行预测.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节变量间的相关关系、统计案例变量间的相关关系、统计案例1.变量间的相关关系(1)会作两个有关联变量的据的散点图,会利用点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系公式建立线性回归方程.2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.知识点一回归分析1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函关系,另一类是相关关系;与函关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y^=b^x+a^,其中b^=∑ni=1x i y i-n x y∑ni=1x2i-n x2,a^=y-b^x.(3)通过求Q=∑ni=1(y i-bx i-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函关系,两者的区别是函关系是一种确定的关系,而相关关系是一种非确定的关系,函关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本据点都不在直线上 .3.利用回归方程分析问题时,所得的据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y^=0.95x+a^,则a^=( )A.3.25C.2.2 D.0解析:∵回归直线必过样本点的中心(x,y),又x=2,y=4.5,代入回归方程,得a^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)据,去掉________组据后,剩下的4组据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D.答案:D知识点二独立性检验独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频列联表(称为2×2列联表)为:K2=(其中n=a+b+c+da +b a+c b+d c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:则表中a,bA.94,72 B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组据进行统计,获得如图所示的散点图,关于其相关系的比较,正确的是( )A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系为负,故x与y负相关;而y 与z正相关,故x与z负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系法:利用相关系判定,当|r |越趋近于1相关性越强.考点二 回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)据作了初步处,得到下面的散点图及一些统计量的值.x y w∑8i =1(x i -x )2∑8i =1(w i -w )2∑8i =1(x i -x )(y i -y )∑8i =1(w i -w )(y i -y )46.6563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =8∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明由)(2)根据(1)的判断结果及表中据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑ni=1u i-u v i-v∑ni=1u i-u2,α^=v-β^u.[解] (1)由散点图可以判断,y=c+d x适宜作为年销售量y 关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d^=∑8i=1w i-w y i-y∑8 i=1w i-w2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x 的回归方程为y^=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系b^,a^.(2)待定系法:利用回归直线过样本点中心求系.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照据.x 345 6y 2.534 4.5(1)y关于x的线性回归方程y^=b^x+a^.(2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照据,计算得∑4i=1x1y1=66.5,∑4i=1x21=32+42+52+62=86,x=4.5,y=3.5,b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y-b^x=3.5-0.7×4.5=0.35,所求的回归方程为y^=0.7x+0.35.(2)x=100,y^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为4 15 .(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考据:参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a+b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知据可求得K 2=210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表;②准确解K 2.提醒:准确计算K 2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男 女总计走天桥 40 20 60 走斑马线 20 3050总计60 50 110K 2=a +bc +d a +cb +d,n =a +b +c +d .附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:K 2=-260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】 (12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到据如下表:(1)有关?(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K 2=a +bc +d a +cb +d,其中n=a +b +c +d )[规范解答] (1)由公式K 2=-230×25×25×30≈11.978>7.879,(3分)所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m 个男生,则630=m20,得m =4,所以样本中有4个男生,2个女生,分别记作B 1,B 2,B 3,B 4,G 1,G 2.从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,G 1),(B 1,G 2),(B 2,B 3),(B 2,B 4),(B 2,G 1),(B 2,G 2),(B 3,B 4),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),(G 1,G 2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B 1,G 1),(B 1,G 2),(B 2,G 1),(B 2,G 2),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表据↓利用K 2公式计算K 2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计据见下表所示:(1)概率是多少?抽到不参加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明由.附:K 2=n ad -bc 2a +bc +d a +cb +d;其中n =a +b +c+d .解:(1)概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n ad -bc 2a +bc +d a +cb +d=-225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b >0B.a >0,b <0C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x与y正相关,且由观测据算得样本平均x=3,y =3.5,则由该观测据算得的线性回归方程可能为( )A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4解析:依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K2=,其中n=a+b+c+d.a+b c+d a+c b+d则下面的正确结论是( )A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a +b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k0=-255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本据:得到的回归方程为y=b x+a.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就( )A.增加1.4个单位B.减少1.4个单位C.增加7.9个单位D.减少7.9个单位解析:依题意得,a+b-25=0.9,故a^+b^=6.5①;又样本点的中心为(5,0.9),故0.9=5b^+a^②,联立①②,解得b^=-1.4,a^=7.9,则y^=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组据如下表:假设根据上表据所得线性回归直线方程为y =b ^x +a ^,若某同学根据上表中的前两组据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x 2=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y ^=1.46x +a ^,则实a ^的值为________.解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:性别有关(请用百分表示).解析:K 2=a +bc +d a +cb +d=-225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示据的回归直线方程为y ^=4x +242,则实a =________.解析:回归直线y =4x +242必过样本点的中心点(x ,y ),而x=2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a5=4×4+242,解得a =262. 答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指.(说明:图中饮食指低于70的人,饮食以蔬菜为主;饮食指高于70的人,饮食以肉类为主)(1)根据以上据完成下列2×2列联表:(2)出简要分析.解:(1)2×2列联表如下:(2)因为K 2=12×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关. 10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑n i =1t 2i -n t 2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2.又l tt =∑ni =1t 2i -n t 2=55-5×32=10,l ty =∑ni =1t i y i -n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:∵x =10.0,y =8.0,b ^=0.76,∴a ^=8-0.76×10=0.4,∴回归方程为y ^=0.76x +0.4,把x =15代入上式得,y ^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是学.答案:乙学。