18学年高中数学第三章统计案例章末小结知识整合与阶段检测教学案北师大版选修2_3
高中数学 第3章 统计案例章末归纳总结课件 北师大版选修23
数 r≈0.987.
第二十九页,共30页。
(3)由相关系数r≈0.987知,两个变量(biànliàng)有较强的线 性相关程度.
由公式计算可得b≈2.1214,a≈3.5361,故y对x的线性回归 方程为y=3.5361+2.1214x.
当x=9s时,位置y的估计值为 3.5361+2.1214×9=22.6287(cm).
第六页,共30页。
3.线性回归分析是在数学必修3的基础上,进一步认识线 性回归的方法及其可靠性,通过实例,从感性到理性逐层深入 地探求对线性相关程度进行检验的统计量(相关系数),从而建 立线性回归分析的基本(jīběn)算法步骤.
4.通过对典型案例的探究,了解独立性检验(只要求2×2 列联表)的基本(jīběn)思想、方法及初步应用.
第二十四页,共30页。
二、填空题 4.对于两个分类变量X与Y: (1)如果(rúguǒ)χ2>6.635,就约有____________的把握认 为“X与Y有关系”; (2)如果(rúguǒ)χ2>3.841,就约有____________的把握认 为“X与Y有关系”. [答案] (1)99% (2)95%
第十四页,共30页。
(2)设所求的回归直线方程为 y=bx+a.
10
xiyi-10 x y
i=1
由 b=
≈1.267,
10
xi2-10 x 2
i=1
a= y -b x =-30.467.所以所求的回归直线方程为 y= 1.267x-30.467.
(3)当 x=160 时,y=1.267×160-30.647≈172(min). 即大约冶炼 172min.
第十二页,共30页。
[解析] (1)由已知数据列成下列:
高中数学第三章统计案例章末小结知识整合与阶段检测教学案北师大版选修2_334
第三章统计事例知识整合与阶段检测[ 对应学生用书P42]一、回归剖析1.线性回归剖析对于一组拥有线性有关关系的数据( x1,y1) , ( x2,y2) ,, ( x n,y n) ,其线性回归直线方程为y= a+bx,n nx i- xy i- y x i y i- n x · yi = 1i =1此中 b==,n nx i- x222x i- n xi = 1i = 1a= y - b x .2.有关系数nx i- x y i- yi = 1r =n nx i- x2·y i- y2i = 1i =1nx i y i- n x · yi = 1=,n n222- n y2x i- n x ·y ii =1i = 1| r | 值越大,有关性越高,| r | 值越靠近0,线性有关程度越低.二、独立性查验独立性查验的一般步骤(1)列出 2×2列联表;(2) 代入公式计算2n ad- bc 2χ =a+c a+ b b+d c+d;(3)依据χ 2的值的大小作出判断.对应阶段质量检测三见 8开试卷(时间 90分钟,满分120 分)一、选择题 ( 本大题共10 小题,每题 5 分,共50 分.在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1. ( 全国新课标 ) 在一组样本数据 ( x1,y1) , ( x2,y2) ,, ( x n,y n)( n≥2,x1,x2,,x不全相等 ) 的散点图中,若全部样本点( x,y)( i=1,2 ,,n) 都在直线y=2x+ 1上,则n i i1这组样本数据的样真有关系数为()A.- 1B. 01C. 2D. 1分析:由于全部的点都在直线上,因此它就是确立的函数关系,因此有关系数为 1.答案: D2.已知x与y之间的一组数据:x0123y1357则 y 与 x 的线性回归方程y= a+ bx 必过点()A. (2,2)B. (1.5,0)C. (1,2)D. (1.5,4)分析:线性回归方程y=a+ bx 必过点--( x,y ) .答案: D3.以下现象的有关程度最高的是()A.某商铺的员工人数与商品销售额之间的有关系数为0.87 B.流通花费率与商业收益之间的有关系数为-0.94C.商品销售额与商业收益之间的有关系数为0.51D.商品销售额与流通花费率之间的有关系数为-0.81分析: | r | 越靠近 1,有关程度越高.答案: B4.已知某车间加工部件的个数x 与所花销时间 y(h)之间的线性回归方程为y=0.01 x +0.5 ,则加工 600 个部件大概需要 ()A. 6.5 h B. 5.5 hC. 3.5 h D. 0.5 h分析:当 x =600, y=600×0.01+0.5=6.5(h).答案: A5.设两个变量x和y之间拥有线性有关关系,它们的有关系数是r ,y 对于 x 的回归直线的斜率是 b,纵轴上的截距是 a,那么必有()A.b与r的符号同样 B .a与r的符号同样C.b与r的符号相反 D .a与r的符号相反分析:由于 >0 时,两变量正有关,此时,r >0;<0 时,两变量负有关,此时r<0.b b答案: A6.以下对于线性回归的判断,正确的个数是()①若散点图中的全部点都在一条直线邻近,则这条直线的方程为回归方程②散点图中的绝大部分点都线性有关,个别特别点不影响线性回归,如图中的,,C 点A B③已知线性回归方程为 y=-0.81+0.50 x,则 x=25时, y 的预计值为11.69④线性回归方程的意义是它反应了样本整体的变化趋向A. 0B. 1C. 2D. 3分析:由最小二乘法获取的方程才是线性回归方程,故①错,将x=25代入 y=-0.81+0.50 x,得y= 11.69 ,故③正确,②④也正确.答案: D7.某观察团对全国 10 大城市的员工人均薪资水平x( 千元 ) 与居民人均花费水平y( 千元 )进行统计检查, y 与 x 拥有有关关系,回归方程为 y=0.66 x+1.562.若某城市居民人均花费水平为 7.675千元,预计该城市人均花费额占人均薪资收入的百分比为() A. 83%B. 72%C. 67%D. 66%7.675 - 1.562分析:当 y = 7.675 时, x =≈9.262 ,0.667.6759.262 ×100%≈83%.应选A.答案: A8.两个有关变量知足以下关系:x 101520 25 30y1 003 1 005 1 0101 0111 014则两变量的回归方程为 ()A . y =0.56 x + 997.4B . y = 0.63 x - 231.2C . y =0.56 x + 501.4D . y = 60.4 x + 400.7分析:回归直线经过样本中心点 (20,1 008.6),经查验只有选项A 切合题意.应选 A.答案: A9.若线性回归方程中的回归系数 b = 0 时,则有关系数为 ()A . r =1B . r =- 1C . r =0D .没法确立n - -x i y i -n x yi =1n- -分析:当 b = 0 时,= 0,即= 0,nx i y i - n x y- 2i = 12x i - n xi =1n- -x i y i - n x yi =1∴ r ==0.n- n- 22 22x i - n xy i - n yi = 1i = 1答案: C10.某工厂为展望某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的有关8888关系,现取了 8 组察看值.计算知x i = 52, y i = 228, x 2x i y i =1 849 ,则 yi = 478,i = 1i =1i = 1i =1对 x 的线性回归方程是 ()A . y =11.47 + 2.62 xB . y =- 11.47 + 2.62 xC . y =2.62 + 11.47 xD . y = 11.47 - 2.62 x分析:由已知条件得--x =6.5, y =28.5.8--x i y i- n x yi = 1--由 b=, a= y- b x ,8-2- n 2x i xi = 1计算得 b≈2.62, a≈11.47,因此 y=11.47+2.62 x.答案: A二、填空题 ( 本大题共 4 小题,每题 5 分,共 20 分,请把正确的答案填在题中的横线上)11.为了判断高中三年级学生选修文科能否与性别有关,现随机抽取50 名学生,获取以下 2×2列联表:理科文科男1310女720-2依据表中数据,获取χ2=≈4.844. 则有 ________的掌握,则23×27×20×30以为选修文科与性别有关系.分析:∵χ2= 4.844>3.841 ,∴起码有 95%的掌握以为能否选修文科与性别有关.答案: 95%12.已知变量x,y拥有线性有关关系,测得( x,y) 的一组数据以下:(0,1), (1,2),(2,4) , (3,5),其回归方程为y=1.4 x+a,则 a 的值是________.分析:0+1+2+31+2+4+5x == 1.5 ,y=4= 3 ,∴这组数据的样本中心点是4(1.5,3) ,把样本中心点代入回归直线方程y = 1.4x+,∴ 3=1.4 ×1.5 +,∴= 0.9.a a a答案: 0.913.已知拥有有关关系的两个随机变量的一组观察数据的散点图散布在函数y=3e2x+1的图像邻近,则可经过变换获取的线性回归方程为________________ .分析:由 y=3e2x+1,得ln y=ln(3e2x+1),即 ln y= ln 3 + 2x+ 1.令 u=ln y, v= x,则线性回归方程为u=1+ln 3+2v.答案: y=1+ln 3+2x14.有甲、乙两个班级进行同一门课程的考试,依据学生考试成绩优异和不优异统计成绩后,获取以下的列联表.班级与成绩列联表优异不优异总计甲班103545乙班73845总计177390由上表供给的数据可知,学生的成绩与班级之间________.( 填“有关系”或“没有关系”)分析:由公式,得-2χ 2=≈0.653.17×73×45×45由于 0.653<2.706.因此我们没有原因说成绩与班级有关系.答案:没有关系三、解答题 ( 本大题共 4 小题,共 50 分.解答时应写出必需的文字说明、证明过程或演算步骤 )15. ( 本小题满分12 分) 在国家未实行西部开发战略前,一新闻单位在应届大学毕业生中随机抽取 1 000 人问卷,只有 80 人志愿加入西部建设.而国家实行西部开发战略后,随机抽取 1 200 名应届大学毕业生问卷,有 400 人志愿加入国家西部建设.依据以上数据成立一个2×2的列联表.解: 2×2的列联表以下:志愿者非志愿者总计开发战略宣布前80920 1 000开发战略宣布后400800 1 200总计480 1 720n=2 20016. ( 本小题满分12 分) 某农科所对冬天日夜温差大小与某反季节大豆新品种抽芽多少之间的关系进行剖析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每日日夜温差与实验室每日100 颗种子中的抽芽数,获取以下资料:日期12月1日12月2日12月3日12月4日12月5日温差 x(℃)101113128抽芽数 y(颗)2325302616该农科所确立的研究方案:先从这 5 组数据中选用 3 组数据求线性回归方程,剩下的2组数据用于回归方程查验.(1)若选用12月1日和12月5日这两日的数据进行查验,请依据12月 2日至 12月 4日的数据,求出y 对于 x 的线性回归方程 y= bx+a;(2)若由线性回归方程获取的预计数据与所选出的查验数据的偏差均不超出 2 颗,则认为获取的线性回归方程是靠谱的,试问 (1) 中所获取的线性回归方程能否靠谱?若靠谱,请展望温差为 14℃时的抽芽数.33解:(1) 由数据,求得x= 12,y= 27. 故x i y i=977,3x · y =972,2x i=434,3 xi = 1i = 12= 432,由公式,求得=5,=y -b x=- 3.b2a5因此 y 对于 x 的线性回归方程为y=2x-3.5(2)当 x=10时, y=×10-3=22,|22-23|<2;25当 x=8时, y=2×8-3=17,|17-16|<2.因此获取的线性回归方程是靠谱的.5当 x=14时,有 y=2x-3=35-3=32,因此展望温差为 14 ℃时的抽芽数约为 32 颗.17. ( 本小题满分12 分) 某些行为在运动员的竞赛之间常常被给予很强的神奇色彩,如有种说法以为,在进入某乒乓球场竞赛前先迈入左脚的球员就会博得竞赛的成功.某记者为此追踪了某有名乒乓球运动员在该球场中的308 场竞赛,获取数据以下表:输赢状况胜负总计先迈脚状况先迈入左脚17827205先迈入右脚8419103总计26246308据此资料,你能得出什么结论?解:依据公式可得,2n ad- bc 2χ =c+ d a+ c b+ da+ b-2=≈1.502.205×103×262×46由于 1.502<2.706,因此我们以为先迈入左脚与否跟竞赛的输赢是没关的.18.( 本小题满分14 分 ) 在某次试验中,有两个试验数据x, y,统计的结果以下边的表格 1.x12345y23445表格 1(1)在给出的坐标系中画出数据 ( x,y) 的散点图.(2)补全表格 2,而后依据表格 2 的内容和公式序号x y x2xy112122234633491244416165552525∑表格 2nx i y i- n x yi=1b=,a=y-b x.n22x i-n xi=1①求出 y 对 x 的回归直线方程y= a+ bx 中回归系数a,b;②预计当 x 为10时 y 的值是多少.解: (1) 数据 ( x,y) 的散点图以下图:(2)表格以下:序号x y x2xy112122234633491244416165552525∑15185561计算得 x =3, y = 3.6 ,5x i y i-5x yi =161-5×3×3.6b=5=55-5×32=0.7,2x2x i-5i=1a= y - b x =3.6-0.7×3=1.5,因此 y= a+ bx=1.5+0.7 x,当 x 为10时, y=8.5.。
2017-2018版高中数学 第三章 统计案例章末复习课课件 北师大版选修2-3
种子处理 32 61 93
种子未处理 101 213 314
总计 133 274 407
12345
根据以上数据可得出 A.种子是否经过处理与是否生病有关
√B.种子是否经过处理与是否生病无关
C.种子是否经过处理决定是否生病 D.有90%的把握认为种子经过处理与生病有关 解析 χ2=4079×3×323×142×131-336×1×2714012≈0.164<2.706,
2.相关系数
(1)相关系数 r 的计算公式 r=
n
∑xiyi-n x y
i=1
n
n
.
∑x2i -n x 2 ∑y2i -n y 2
i=1
i=1
(2)相关系数r的取值范围是 [-1,1] ,|r|值越大,变量之间的线性相关 程度越高. (3)当r>0时,b > 0,称两个变量正相关; 当r<0时,b < 0,称两个变量负相关; 当r=0时,称两个变量线性不相关.
跟踪训练2 某学生对其亲属30人 的饮食习惯进行了一次调查,并 用茎叶图表示30人的饮食指数, 如图所示.(说明:图中饮食指数低 于70的人,饮食以蔬菜为主;饮食 指数高于70的人,饮食以肉类为主). (1)根据茎叶图,帮助这位同学说明 其亲属30人的饮食习惯;
解 30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食 肉类为主.
2.统计量 nad-bc2
χ2= a+bc+da+cb+d .
3.独立性检验 当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变 量A,B是没有关联的. 当χ2>2.706时,有 90% 的把握判定变量A,B有关联. 当χ2>3.841时,有 95% 的把握判定变量A,B有关联. 当χ2>6.635时,有 99% 的把握判定变量A,B有关联.
高中数学 第三章 统计案例教案 北师大版选修23
第三章统计案例§1回归分析1.1 回归分析(教师用书独具)●三维目标1.知识与技能(1)了解回归分析的基本思想,会对两个变量进行回归分析.(2)明确建立回归模型的基本步骤,并对具体问题进行回归分析.(3)会解决实际问题.2.过程与方法(1)通过实际问题去理解回归分析的必要性,明确回归分析的基本思想.(2)从散点图中的点的分布上,发现直接求回归直线方程存在明显不足,从中引导学生去发现解决问题的新思路——进行回归分析.3.情感、态度与价值观(1)培养学生用整体的观点和互相联系的观点,来分析问题.(2)进一步加强数学的应用意识,培养学生学好数学、用好数学的信心.(3)加强与现实生活中的联系,以科学的态度评价两个变量的相关关系.●重点难点重点:掌握回归分析的步骤、相关系数、建立回归模型的步骤;体会有些非线性模型通过变换,可以转化为线性回归模型;在解决实际问题的过程中寻找更好的建型方法.难点:求线性回归方程的系数a,b;相关系数;选择不同的模型建模.回归分析主要是研究两个变量间的关系,是在必修三的基础上学习,教材的1.1回归分析是复习必修三的内容,为了使建立回归方程有意义,提出了相关系数,这与回归直线中b的系数有关联,教师可通过实例,让学生了解相关系数的大小与线性相关的关系;在现实中又有一种非线性的相关性,如何解决引导学生转化为线性关系,主要通过数形结合思想、函数思想,使问题化归为线性关系,教学中可通过提醒、猜想、练习等方法,使学生掌握本节的重点内容.(教师用书独具)●教学建议建议本节课用3课时讲解完成.教学中通过组织学生自己动手操作计算、观察、分析、交流、讨论、归纳让他们在探究学习中经历知识形成的全过程,从而形成“自主探究、合作交流”的数学学习方法.教师在课堂上可以用计算机软件进行参数的估计、相关系数的计数,让学生掌握利用计算器进行线性回归方程的求解和评价.●教学流程第1课时以实际问题作为课题引入.⇒回顾建立回归直线方程的基本步骤.⇒通过实例巩固、体验线性回归直线方程的求法及应用.⇒第2课时提出新问题,如何用其他方法刻画变量之间的线性相关.⇒师生共同探究,得出相关系的概念及相关系数的大小与线性相关之间的关系.⇒通过例题,巩固验证相关系数刻画变量之间的线性相关的特点.⇒第3课时引导学生探究如果不是线性回归模型,如何估计参数,能否利用线性回归模型.⇒对数据进行分析变换后,对新数据建立线性模型.⇒转化为原来变量模型,得出结论,总结建模思想,补充拓展.⇒课堂小结并完成当堂双基达标,巩固本节所学知识.课标解读 1.通过实例掌握回归分析的基本思想方法.2.利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行预报.变量之间的相关关系【问题导思】1.正方形的面积S 与其边长a 是什么关系?圆的周长l 与半径r 是什么关系? 【提示】 ∵S =a 2,l =2πr , ∴它们都是确定的函数关系.2.父亲的身高与儿子的身高之间有何关系?耕种深度与水稻产量之间有何关系? 【提示】 非确定关系.1.变量之间有一定的联系,但不能完全用函数来表达.如人的体重y 与身高x .一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的随机性.2.在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常把这种图叫作变量之间的散点图.线性回归方程【问题导思】1.确定线性回归方程,只需得出哪两个量?【提示】 确定线性回归直线方程,只需确定a ,b 两个量即可.2.在线性回归方程y =a +bx 中,当一次项系数b 为正数时,说明两个变量有何相关关系?在散点图上如何反映? 【提示】 说明两个变量正相关,在散点图上自左向右看这些点呈上升趋势.假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设线性回归方程为y =a +bx ,要使这n 个点与直线y =a +bx 的“距离”平方之和最小,即使得Q (a ,b )=(y 1-a -bx 1)2+(y 2-a -bx 2)2+…+(y n -a -bx n )2达到最小,a ,b 需满足b =∑nb =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x .由数据求线性回归方程已知x ,y 之间一组数据:x 0 1 2 3 y1357(1)分别计算:x 、y 、x 1y 1+…+x 4y 4,x 21+x 22+…+x 24; (2)求出线性回归方程y =bx +a .【思路探究】 可利用表格的数直接计算,然后把这些结果代入线性回归方程系数公式,分别求得a ,b ,再求出线性回归方程. 【自主解答】 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+…+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+…+x 24=02+12+22+32=14;(2)b =x 1y 1+x 2y 2+x 3y 3+x 4y 4-4x yx 21+x 22+x 23+x 24-4x 2=34-4×1.5×414-4×1.52=2;a =y -b x =4-2×1.5=1.故y =2x +1.答:(1)所求的值分别为:1.5,4,34,14; (2)所求的线性回归方程是:y =2x +1.求线性回归方程的步骤:(1)列表求出x ,y ,∑ni =1x 2i ,∑ni =1x i y i ;(2)利用公式b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x ,求出b ,a ;(3)写出线性回归方程.观察两相关量得如下数据:x -1 -2 -3 -4 -5 5 3 4 2 1 y-9-7-5-3-115379求两变量间的回归方程. 【解】 列表i 12345678910 x i-1-2-3-4-55342 1 y i-9-7-5-3-115379 x2i1491625259164 1 x i y i9141512551512149由此可得x=0,y=0,∑10i=1x2i=110,∑10i=1x i y i=110,b=∑10i=1x i y i-10x y∑10 i=1x2i-10x2=110-10×0110-10×0=1,a=y-b x=0,∴所求回归方程为y=x.求实际问题的回归方程某企业想通过做广告来提高自己的知名度,经预测可知本企业产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:x 24568y 3040605070(1)判断y与x是否具有线性相关关系;(2)求回归直线方程.【思路探究】先画出散点图,即可判断y与x是否具有相关关系,如果y与x具有相关关系可将有关数据代入公式求得回归直线方程.【自主解答】(1)散点图如图所示:根据散点图可知,所给的数据点都在一条直线的附近,所以y与x具有线性相关关系.(2)列出下表,并且科学地的进行有关计算.i 1234 5x i24568y i3040605070x i y i60160300300560x=5,y=50,∑5 i=1x2i=145,∑5i=1y2i=135 000,∑5i=1x i y i=1 380于是可得,b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=1 380-5×5×50145-5×52=6.5,a=y-b x=50-6.5×5=17.5,于是所求的回归直线方程是y=6.5x+17.5.对一级数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:汞含量x 2 4 6 8 10 消光系数y64138205285360(1)作散点图;(2)如果y 与x 之间具有线性相关关系,求线性回归方程. 【解】 (1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设线性回归方程为:y =bx +a .经计算:得x =6,y =210.4,∑5i =1x 2i =220,∑5i =1x i y i =7 790.∴b =7 790-5×6×210.4220-5×62=36.95, a =210.4-36.95×6=-11.3.∴线性回归方程为y =36.95x -11.3.利用回归直线方程进行统计某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:x 35 40 45 50 y 56 41 28 11(1)画出散点图,并判断y 与x 是否具有线性相关关系; (2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.【思路探究】 两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.【自主解答】 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)∵x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34,∑4i=1x i y i=35×56+40×41+45×28+50×11=5 410,∑4i=1x2i=352+402+452+502=7 350,∴b=∑4i=1x i y i-4x·y∑4 i=1x2i-4x2=5 410-4×42.5×347 350-4×42.52=-370125=-2.96.∴a=y-b x=34-(-2.96)×42.5=159.8.∴y=-2.96x+159.8.(3)依题意有P=(-2.96x+159.8)(x-30)=-2.96x2+248.6x-4 794,∴当x=248.62×2.96≈42时,P有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.1.b=-2.96是斜率的估计值,说明单价每增加一个单位,日销售量就减少2.96. 2.借助于回归方程对实际问题的估计值是个近似值,不是一个准确值.假设关于某设备的使用年限x 和所支出的维修费y (万元)有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系. (1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少万元? 【解】 (1)列表如下:ix iy ix 2ix i y i1 2 2.2 4 4.4 2 3 3.8 9 11.4 3 4 5.5 16 22.0 4 5 6.5 25 32.5 5 6 7.0 36 42.0 ∑202590112.3由此可得:x =4,y =5.进而可以求得b =∑5i =1x i y i -5x y∑5i =1x 2i -5x2=1.23,a =y -b x =0.08.∴线性回归方程为y =0.08+1.23x .(2)当x =10时,y =0.08+1.23×10=12.38(万元),即估计使用10年时维修费用是12.38万元.数形结合思想在回归分析中的应用(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨标准煤)与相应的生产能耗y(吨标准煤)的几组对照数据.x 345 6y 2.534 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【思路点拨】(1)可直接由表格提供的点,列出散点图;(2)可利用线性回归方程中a,b公式直接求解;(3)直接用方程来估计所求值.【规范解答】(1)图形如图所示.3分(2)x =3+4+5+64=4.5;y =2.5+3+4+4.54=3.5;∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5.∑4i =1x 2i =32+42+52+62=86. 6分∴b =∑4i =1x i y i -4x ·y ∑4i =1x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7, 8分 a =y -b x =3.5-0.7×4.5=0.35. 9分∴y =0.7x +0.35. 10分 (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65吨标准煤. 12分线性回归方程的应用(1)描述两变量间的依存关系;(2)利用回归方程可进行预测;(3)利用回归方程还可以进行统计控制.1.作回归分析要有实际意义.2.回归分析前,最好先做出散点图.3.应用回归分析预测时,最好先作出散点图.1.下列说法正确的是( )A.任何两个变量都具有相关关系B.球的体积与该球的半径具有相关关系C.农作物的产量与施化肥量之间是一种确定性的关系D.某商品的生产量与该商品的销售价格之间是一种非确定性的关系【解析】两个变量之间的关系有两种,即函数关系与相关关系,故A错误.B中球的体积与该球的半径是函数关系.C中农作物的产量与施化肥量之间不是严格的函数关系,但是具有相关关系,因而是非确定性的关系.D中商品的生产量还和市场需求有关,故商品的生产量与该商品的销售价格之间是非确定性的关系.故选D.【答案】 D2.一位母亲记录了儿子3岁~9岁的身高(数据略),由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为y=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是( )A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右【解析】x=10时,y=7.19×10+73.93=145.83,但这是预测值而不是精确值,所以只能选D.【答案】 D3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为________.【解析】通过检验A,B,C,D四点共线,都在直线y=x+1上.【答案】y=x+14.已知一个回归直线方程为y=1.5x+45,x∈{1,7,5,13,19},求y.【解】由已知可知:x=1+7+5+13+195=9.又∵回归直线过点(x,y),∴y =1.5x +45,即y =1.5×9+45=58.5.一、选择题1.对具有线性相关关系的两个变量建立的线性回归方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .只能大于0 C .可能等于0D .只能小于0【解析】 b 可能大于0,也可能小于0,但当b =0时,x ,y 不具有线性相关关系. 【答案】 A2.下列两个变量间的关系不是函数关系的是( ) A .正方体的棱长与体积 B .角的弧度数与它的正弦值C .单产为常数时,土地面积与粮食总产量D .日照时间与水稻亩产量【解析】 ∵A 、B 、C 都可以得出一个函数关系式,而D 不能写出确定的函数关系式,它只是一个不确定关系. 【答案】 D3.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.36万元 B .65.5万元 C .67.7万元D .72.0万元【解析】 x =4+2+3+54=3.5,y =49+26+39+544=42,∴a=y-b x=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.【答案】 B4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y)B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(x n,b n)中的一个点C.直线y=bx+a的斜率为∑ni=1x i y i-n x·y∑ni=1x2i-n x2D.直线y=bx+a的纵截距为y-b x【解析】回归直线可以不经过任何一个点.其中A:由a=y-b x代入回归直线方程y=bx+y-a x,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B5.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A二、填空题6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1x i y i=1 481.b =1 481-6×72×7179-6×722≈-1.818 2,a =71-(-1.818 2)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】 由上表可得,y =-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元. 【答案】 1.818 28.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 【答案】 0.254 三、解答题9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 推销金额y /万元23345(1)求年推销金额y 关于工作年限x 的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 【解】 (1)设所求的线性回归方程为y =bx +a ,则b =∑i =15x i -xy i -y∑i =15x i -x2=1020=0.5, a =y -b x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y =0.5x +0.4. (2)当x =11时,y =0.5x +0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个数.现观测得到(x ,y )的4组值为(8,5),(12,8),(14,9),(16,11).(1)假设y 与x 之间存在线性相关关系,求y 与x 之间的线性回归方程.(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】 (1)设回归方程为y =a +bx ,则x =8+12+14+164=12.5,y =5+8+9+114=8.25, ∑4i =1x 2i =660,∑4i =1x i y i =438,b =∑4i =1x i y i -4x y∑4i =1x 2i -4x2=438-4×12.5×8.25660-4×12.52≈0.73, a =y -b x =8.25-0.73×12.5=-0.875,所以所求回归方程为y =-0.875+0.73x .(2)由y ≤10,即-0.875+0.73x ≤10,得x ≤10.8750.73≈15,即机器速度不得超过15转/秒.11.高二(3)班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y92799789644783687159若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】 显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 x i 24 15 23 19 16 11 20 16 17 13 y i 927997896447 83687159 x i y i2 208 1 185 2 231 1 691 1 024 5171 660 1 088 1 207767∑10i =1x 2i=3 182,∑10i =1x i y i=13 578于是可得b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2=545.4154.4≈3.53,a=y-b x=74.9-3.53×17.4≈13.5.因此可求得回归直线方程为y=3.53x+13.5.当x=18时,y=3.53×18+13.5≈77.故该同学预计可得77分左右.(教师用书独具)在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据如下表所示:价格x 1.4 1.6 1.82 2.2需求量y 121075 3(1)画出散点图;(2)求出y对x的回归直线方程;(3)如价格定为1.9万元,预测需求量大约是多少.(精确到0.01 t)【思路探究】先根据所给数据画出散点图,判断y与x是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识预测需求量.【自主解答】(1)散点图如图所示.(2)采用列表的方法计算a与回归系数b.序号x i y i x2i x i y i1 1.412 1.9616.82 1.610 2.56163 1.87 3.2412.64 25 4 105 2.2 3 4.84 6.6Σ9 37 16.6 62x=15×9=1.8,y=15×37=7.4,b=62-5×1.8×7.416.6-5×1.82=-11.5,a=7.4+11.5×1.8=28.1.所以y对x的回归直线方程为y=a+bx=28.1-11.5x.(3)当x=1.9时,y=28.1-11.5×1.9=6.25,所以价格定为1.9万元时,需求量大约是6.25 t.解答本类题目的关键首先应先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行预测.已知10只狗的血球体积x(单位:mm3)及红血球数y(单位:百万)的测量值如下:x 45424648423558403950y 6.53 6.309.257.50 6.99 5.909.49 6.20 6.557.72(1)画出散点图;(2)求出y对x的回归线性方程;(3)若血球体积为49 mm3,预测红血球数大约是多少?【解】(1)散点图如图(2)设线性回归方程为y =bx +a ,由表中数据代入公式,得b =∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.16,a =y -b x ≈0.12.所以所求线性回归方程为y =0.16x +0.12. (3)把x =49代入线性回归方程得:y =0.16×49+0.12≈7.96(百万),计算结果表明,当血球体积为49 mm 3时,红血球数大约为7.96百万.拓展阅读GDDS 和SDDS随着世界经济一体化的加快,各国间的交流与合作越来越频繁,为加强国际组织对各国经济运行状况的监督,国际社会在各领域纷纷建立了国际通行标准,其中国际货币基金组织(简称IMF)制定的数据公布通用系统(简称GDDS)和数据公布特殊标准(简称SDDS).GDDS 的主要内容和要求:在统计范围内,它将国民经济活动划分为5大经济部门,对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据.系统提出了五大部门综合框架和相关的数据类别和指标编制、公布的目标.选定的数据类别和指标中规定为主要部分.SDDS 将国民经济活动划分为4大经济部门.选定的数据类别分为:必须的、受鼓励的和“视相关程度”三类.必须的数据类别包括:综合统计框架、跟踪性数据、与部门有关的其他数据.IMF 为什么制定GDDS 和SDDS 呢?进入20世纪90年代以来,世界一些地区金融危机频繁爆发.1994年墨西哥的金融危机、1997年东南亚金融危机都导致国际金融市场剧烈动荡.两次金融危机给IMF 一个深刻的教训,也对其职能提出了挑战,在总结经验教训的基础上,IMF 认为,在新的国际经济、金融形势下,必须制定统一的数据发布标准,使各成员国按照统一程序提供全面、准确的经济金融信息,从而可以有效及时地对各国的经济进行正确的分析预测,从宏观上来作出调控,减少金融危机的发生和影响.1.2 相关系数课标解读 1.了解两个随机变量间的线性相关系数r ,并能利用公式求出相关系数r ;了解正相关、负相关、不相关的概念. 2.能利用相关系数r 判断两个随机变量间线性相关程度的大小,从而判断回归直线拟合的效果.相关系数【问题导思】1.有什么办法判断两个变量是否具有线性相关关系?【提示】 作出散点图,看这些点是否在某一直线的附近,计算线性相关系数. 2.线性相关系数与最小误差有何关系? 【提示】 Q (误差)=l yy (1-r 2).3.相关系数r 的绝对值的大小对相关性有何影响?【提示】 |r |越大,变量之间的相关程度越高;|r |越小,变量间线性相关程度越低;当r =0时,两个变量线性不相关.4.r 的正负对相关性的影响. 【提示】 r >0,b =l xyl xx>0两变量正相关; r <0,b =l xyl xx<0,两变量负相关.1.判断两个变量之间的线性相关关系的方法有: (1)计算线性相关系数r . (2)画散点图.2.假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r =l xyl xx l yy=∑ni=1x i-x y i-y∑ni=1x i-x2i=1ny i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y2相关系数及其应用维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度18202224262830(克/升)缩醛化度26.8628.3528.7528.8729.7530.0030.36(克分子%)求相关系数r.【思路探究】可直接利用相关系数r的公式直接计算.【自主解答】列表如下:i x i y i x2i x i y i y2i11826.86324483.48721.459 622028.35400567803.722 532228.75484632.5826.562 542428.87576692.88833.476 952629.75676773.5885.062 562830.0078484090073030.36900910.80921.729 6∑168202.94 4 144 4 900.16 5 892.013 6 x=24,y=28.99,r=∑7i=1x i y i-7x y∑7i=1x2i-7x2∑7i=1y2i-7y2=4 900.16-7×24×28.994 144-7×242×5 892.013 6-7×28.992≈0.94.当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.下列是小麦产量与施化肥量的一组观测数据:施化肥量15202530354045小麦产量320330360410460470480 判断施化肥量与水稻产量是否有相关关系.【解】i x i y i x2i y2i x i y i115320225102 400 4 800220330400108 900 6 600325360625129 6009 000430410900168 10012 300535460 1 225211 60016 100640470 1 600220 90018 800745480 2 025230 40021 600∑210 2 8307 000 1 171 90089 200∴r=∑i=17x i y i-7x y∑i=17x2i-7x2∑i=17y2i-7y2=4 300700×27 771.43≈0.975.由于r=0.975>0,因此施化肥量和水稻产量近似成线性正相关关系.线性回归分析的综合应用“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到数据如下:店铺编号 区内大学生数(万人)季度销售额(万元)1 0.2 5.8 2 0.6 10.53 0.8 8.84 0.8 11.85 1.2 11.76 1.6 13.7 7 2 15.78 2 16.9 9 2.2 14.9 10 2.620.2(1)试对区内大学生人数与店铺的销售额的关系进行相关性检验;(2)试根据这些数据建立回归模型,然后再进一步根据回归方程预测一个区内大学生人数1万人店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求建店区内大学生人数至少约多少人?【思路探究】 先根据表中的数据作相关检验,然后判断是否具有相关关系,再根据所给的数据解出线性回归方程,最后进行预测. 【自主解答】 (1)根据数据我们对区内大学生人数x 与店铺季度销售额y 作相关检验.根据数据可知:x =110(0.2+0.6+…+2.6)=1.4;y =110(5.8+10.5+…+20.2)=13,∑10i =1x 2i -10x 2=5.68,∑10i =1x i y i -10x y =28.4,∑10i =1y 2i -10y 2=157.3,因此r =28.45.68×157.3≈0.95;|r |接近1,因此有把握认为区内大学生人数x 与店铺季度销售额y 具有线性相关关系,求y 对x 的回归直线方程有意义.(2)回归系数b =28.45.68=5,a =13-5×1.4=6.因此回归直线方程是y=bx+a=5x+6.当x=1时,y=5×1+6=11,即区内大学生人数1万元店铺的季度销售额约11万元.(3)由回归直线方程是y=5x+6.令y≥10,解得x≥0.8,所以当建店区内大学生人数至少8 000人时才适合建店.进行相关性检验主要有两种常用方法,一是作散点图,观察所给的数据点是否在一条直线的附近,作散点图的优点是既直观又方便,是解决相关性检验问题比较常用的方法;缺点是作图总是存在误差,有时很难判断这些点是不是分布在一条直线的附近.二是利用样本相关系数对其进行相关性检验,优点是判断准确,缺点是计算繁琐,但可以借助计算器进行处理.在我国某地的一个县城,近期发现了好几个癌症村.政府部门十分震惊,马上组成调查组调查病因,经调查发现致癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工厂,化工厂排出的废水中含有金属砷,废水污染了水源,人食用了这种水就会致癌.下面就是调查组对几个癌症村水源中的砷超标的倍数和患癌症的人数统计的数据:砷超标的倍数x 34 5.5 4.2 5.86 3.5患癌症人数y 15202824354434(1)画出表中数据的散点图; (2)求y 对x 的回归方程;(3)若一个村的水源中砷超标的倍数为7,试估计这个村的患癌症的人数. 【解】 (1)散点图如图所示:(2)观察散点图,可知x 、y 成线性相关关系. 计算得x =327,y =2007,根据求b 公式代入数据计算得b ≈6.065,a =2007-6.065×327≈0.846. 所以患癌症人数y 对水源中砷超标的倍数x 的回归直线方程为y =6.065x +0.846.(3)根据上面求得的回归直线方程,当水源中砷超标的倍数为7时,y =6.065×7+0.846=43.301. 即该村患癌症的人数约为43人.对误差的大小与变量相关关系的理解有误对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不正确的是( )A.由样本数据得到的回归方程y=bx+a必过样本点的中心(x,y)B.在回归分析中,误差Q越小,变量之间的线性相关程度越高C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,说明变量之间的相关性强【错解】 B【错因分析】对误差Q与变量间的相关关系理解错误.【防范措施】正确理解回归方程、相关系数r、误差Q、散点图等概念是解决概念题的基础.【正解】∵误差Q越小,|r|越大,变量之间的线性相关程度越高,而相关系数r的范围为-1≤r≤1,∴C错误.【答案】 C1.相关系数是用来刻画两个变量相关关系的强与弱的.2.相关系数的计算公式r=∑ni=1x i-x y i-y∑ni=1x i-x2∑ni=1y i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y21.在对变量y和x进行线性相关检验时,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.9950.则变量y和x具有较高线性相关程度的是( )A.①和②B.①和④C.②和④D.③和④【解析】相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.【答案】 B2.对相关系数r,下列说法正确的是( )A.|r|越大,相关程度越大B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小【解析】由两个变量相关系数公式。
2018年高中数学第3章统计案例章末小结与测评教学案选修2-3
第3章统计案例一、独立性检验1.独立性检验的思想及方法独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理.根据随机变量X的含义,可以通过概率来评价假设不合理程度.2.独立性检验的一般步骤(1)提出假设H0;(2)根据样本数据列2×2列联表,计算χ2=错误!;(3)比较χ2与临界值的大小并作出判断.二、回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.建立回归模型的基本步骤:(1)确定两个变量;(2)画出散点图;(3)进行相关系数检验;(4)确定线性回归方程类型,求出回归方程.建立回归模型的基本步骤,不仅适用于线性回归模型,也适用于非线性回归模型的建立.(考试时间:120分钟试卷总分:160分)一、填空题(本大题共14小题,每小题5分,共70分)1.下列有关线性回归的说法①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归直线得到具有代表意义的线性回归方程;④任何一组观测值都能得到具有代表意义的线性回归方程.其中错误的是________.解析:任何一组观测值并不都能得到具有代表意义的线性回归方程.答案:④2.下表是x与y之间的一组数据,则y关于x的线性回归直线必过点________.x0123y1357解析:∵x=错误!=y错误!= 1.5,4),而回归直线必过样本点的中心,故必过(1.5,4).答案:(1.5,4)3.对两个变量y和x进行线性相关性检验,已知n是观察值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0。
2017-2018版高中数学第三章统计案例章末复习课学案北师大版选修2_3
第三章统计案例学习目标 1.能通过相关系数判断两变量间的线性相关性.2.掌握建立线性回归模型的步骤.3.理解条件概率的定义及计算方法.4.能利用相互独立事件同时发生的概率公式解决一些简单的实际问题.5.掌握利用独立性检验解决一些实际问题.知识点一线性回归分析1.线性回归方程在线性回归方程y=a+bx中,b=____________=____________,a=____________.其中x =____________,y=____________.2.相关系数(1)相关系数r的计算公式r=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y2.(2)相关系数r的取值范围是________,|r|值越大,变量之间的线性相关程度越高.(3)当r>0时,b________0,称两个变量正相关;当r<0时,b________0,称两个变量负相关;当r=0时,称两个变量线性不相关.知识点二独立性检验1.2×2列联表设A、B为两个变量,每一变量都可以取两个值,得到表格其中,a表示变量A取 ________,且变量B取 ________时的数据,b表示变量A取 ______,且变量B取________时的数据;c表示变量A取 __________,且变量B取 ________时的数据;d表示变量A取________,且变量B取________时的数据.上表在统计中称为2×2列联表.2.统计量χ2=____________________.3.独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;当χ2>2.706时,有________的把握判定变量A,B有关联;当χ2>3.841时,有________的把握判定变量A,B有关联;当χ2>6.635时,有________的把握判定变量A,B有关联.类型一线性回归分析例1 某城市理论预测2010年到2014年人口总数与年份的关系如表所示:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程y=bx+a;(3)据此估计2018年该城市人口总数.反思与感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)实际应用.依据求得的回归方程解决实际问题.跟踪训练1 在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:且知x与y具有线性相关关系,求出y关于x的线性回归方程.类型二 独立性检验思想与应用例2 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整;(不用写计算过程)(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由.反思与感悟 独立性检验问题的求解策略 χ2统计量法:通过公式 χ2=n ad -bc 2a+bc +d a +cb +d先计算统计量,再用以下结果对变量的独立性进行判断.(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的.(2)当χ2>2.706时,有90%的把握判定变量A,B有关联.(3)当χ2>3.841时,有95%的把握判定变量A,B有关联.(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.跟踪训练2 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成如下2×2列联表;(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?1.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的线性回归方程y=bx+a中,b( )A.在(-1,0)内B.等于0C.在(0,1)内D.在[1,+∞)内2.已知线性回归方程中斜率的估计值为1.23,回归方程过点(4,5),则线性回归方程为( ) A.y=1.23x+0.08 B.y=0.08x+1.23C.y=1.23x+4 D.y=1.23x+53.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到χ2≈9.643,则以下说法正确的是( )A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有1%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99%的把握认为课外阅读量大与作文成绩优秀有关4.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:根据以上数据可得出( )A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关5.对于线性回归方程y=bx+a,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该线性回归方程是________,根据线性回归方程判断当x=________时,y的估计值是38.1.建立回归模型的基本步骤(1)确定研究对象,明确变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.答案精析知识梳理 知识点一1.∑ni =1x i -xy i -y∑n i =1x i -x 2∑ni =1x i y i -n x y∑n i =1x 2i -n x2y -b x 1n ∑ni =1x i 1n ∑ni =1y i2.(2)[-1,1] (3)> < 知识点二1.a +b c +d a +c b +d a +b +c +d A 1 B 1 A 1 B 2 A 2 B 1 A 2 B 2 2.n ad -bc 2a+bc +d a +cb +d3.90% 95% 99% 题型探究例1 解 (1)散点图如图.(2)因为x =0+1+2+3+45=2,y =5+7+8+11+195=10,∑5i =1x i y i =0×5+1×7+2×8+3×11+4×19=132,∑5i =1x 2i =02+12+22+32+42=30, 所以b =132-5×2×1030-5×22=3.2, a =y -b x =3.6.所以线性回归方程为y =3.2x +3.6. (3)令x =8,则y =3.2×8+3.6=29.2, 故估计2018年该城市人口总数为292万人.跟踪训练1 解 x =15×(14+16+18+20+22)=18,y =15×(12+10+7+5+3)=7.4,∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15y 2i =122+102+72+52+32=327, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15,所以a =7.4+1.15×18=28.1,所以y 对x 的线性回归方程为y =-1.15x +28.1. 例2 解 (1)列联表补充如下:(2)由χ2=-228×20×32×16≈4.286.因为4.286>3.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关. 跟踪训练2 解 (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主.(2)2×2列联表如下:(3)χ2=-212×18×20×10=10>6.635,故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”.当堂训练1.C 2.A 3.D 4.B5.y=x+14 24。
高中数学第3章统计案例章末高效整合课件北师大版选修2_3
10
10
10
x =55,y =91.7,x2i =38 500,y2i =87 777,xiyi=55 950
i=1
i=1
i=1
10
xiyi-10 x y
i=1
r=
10
10
x2i -10 x 2y2i -10 y 2
i=1
i=1
= 38 5005-5 1905×0-55120×87557×779-1.170×91.72≈0.999 8, 0.999 8>0.75,故 y 与 x 具有线性相关关系.
解析: (1)列出下表,并用科学计算器进行计算. i 1 2 3 4 5 6 7 8 9 10 xi 10 20 30 40 50 60 70 80 90 100 yi 62 68 75 81 89 95 102 108 115 122
1 2 3 4 5 7 8 10 12 xiyi 620 360 250 240 450 700 140 640 350 200
∧
附:若(x1,y1),(x2,y2),…,(xn,yn)为样本点,y=bx+a
为回归直线,则 x =
1 n
n
xi,
y
=
1 n
n
yi,
i=1
i=1
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
b=
=
,a= y -b x .
n
xi- x 2
n
x2i -n x 2
④可以利用线性回归方程 y=a+bx 预报在 x 取某一个值时 y 的估计值.
(3)先判定相关性,再求线性回归方程 利用样本相关系数 r 来判断两个变量之间是否有线性相关 关系时,可以依据若|r|>0.75,我们认为有很强的线性相关关系, 可以求线性回归方程,并可用求得的线性回归方程来预报变量 的取值;若|r|<0.75,则认为两个变量之间的线性相关关系并不 强,这时求线性回归方程没有太大的实际价值.
【统计】高中数学第三章统计案例整合学案北师大版选修23
【关键字】统计高中数学第三章统计案例整合学案北师大版选修2-3知识建构综合应用专题一确定返回直线方程的策略准确确定返回直线方程,有利于进一步加强数学应用意识,培养运用所学知识解决实际问题的能力,正确地求出返回直线方程是本节的重点,现介绍求返回直线方程的三种方法.一、利用返回直线过定点确定返回直线方程返回直线方程y=a+bx经过样本的中心(x,y)点,(x,y)称为样本点的中心,返回直线一定过此点.A.y=0.5x-1B.y=xC.y=2x+0.3D.y=x+1 答案:B二、利用公式求a,b,确定返回直线方程利用公式求返回直线方程时应注意以下几点:①求b时利用公式b=,先求出=(x1+x2+x3+…+xn),=(y1+y2+y3+…+yn).再由a=-b求a的值,并写出返回直线方程.②线性返回方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预报结果的偏差.③返回直线方程y=a+bx中的b表示x每增加1个单位时y的变化量,而a表示y不随x的变化而变化的量.④可以利用返回直线方程y=a+bx预报在x取某一个值时y的估计值.【例2】某5名学生的数学和化学成绩如下表:(2)求化学成绩y对数学成绩x的返回直线方程.解:(1)散点图略.(2) =×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8.所以b=≈0.625.a=-b=67.8-0.625×73.2=22.05.所以y对x的返回直线方程为y=0.625x+22.05.三、先判定相关性,再求返回直线方程利用样本相关系数r来判断两个变量之间是否有线性相关关系时,可以依据若|r|>0.75,我们认为有很强的线性相关关系,可以求返回直线方程,并可用求得的返回直线方程来预报变量的取值;若|r|<0.75,则认为两个变量之间的线性相关关系并不强,这时求返回直线方程没有太大的实际价值.(1)y与x是否具有相关关系;(2)如果y与x具有线性相关关系,求返回直线方程.解:(1)由已知表格中的数据,求得=71,=72.3,r=≈0.78.由于0.78>0.75,所以y与x之间具有很强的线性相关关系.(2)y与x具有线性相关关系,设返回直线方程为:y=a+bx,则有b==1.22,a=-b=72.3-1.22×71=-14.32.所以y关于x的返回直线方程为y=1.22x-14.32.专题二可线性化的返回分析一、曲线线性化的意义曲线的线性化是曲线拟合的重要手段之一,对于某些非线性的资料可以通过简单的变量替换使之线性化,这样就可以按最小二乘法原理求出变换后变量的线性返回方程,在实际工作中常利用该线性返回方程绘制资料的标准工作曲线,同时根据需要可将此线性返回方程还原成曲线返回方程,实现对曲线的拟合.二、常用的非线性函数(一)指数函数y=aebx (1)对(1)式的两边取对数,得lny=lna+bx当b>0时,y随着x的增大而增大;当b<0时,y随着x的增大而减小.当以lny和x绘制的散点图呈直线趋势时,可考虑采用指数函数来描述y与x间的非线性关系,lna和b分别为截距与斜率.更一般的指数函数是y=aebx+k,式中的k为一常量,往往未知,应用时可试用不同的值. (二)对数函数y=a+blnx(x>0)当b>0时,y随着x的增大而增大,先快后慢;当b<0时,y随着x的增大而减小,先快后慢,当以y和lnx绘制的散点图呈直线趋势时,可考虑采用对数函数描述y与x间的非线性关系,式中a和b分别为截距与斜率.更一般的对数函数是y=a+bln(x+k),式中的k为一常量,往往未知.(三)幂函数y=ax b(a>0,x>0)(2)当b>0时,y随着x的增大而增大;b<0时,y随着x的增大而减小.对(2)式的两边取对数,得lny=lna+blnx,当以lny和lnx绘制的散点图呈直线趋势时,可考虑采用对数函数描述y与x间的非线性关系,式中lna和b分别为截距与斜率.更一般的幂函数是y=ax b+k,式中的k为一常量,往往未知.以上三种模型是我们在日常生活中常遇到的曲线模型,掌握这三种模型,有利于我们研究更多的曲线拟合与回归分析的问题.三、利用线性回归拟合曲线的一般步骤(一)绘制散点图一般根据资料性质结合专业知识便可确定资料的曲线类型,不能确定时,可在方格坐标纸上绘制散点图,根据散点的分布,选择接近的、合适的曲线类型.(二)进行变量替换y′=f(y),x′=g(x)使变换后的两个变量呈线性相关关系.(三)按最小二乘法原理求线性回归方程及进行方差分析.(四)将线性化方程转换为关于原始变量x,y的回归方程.【例1】经过调查得到8个厂家同种类型的产品年新增加投资额和年利润额的数据资料,如表(1)所示.表(1) 八个厂家年新增投资额与年利润额数据资料x的增大Y也有明显的增加的趋势,因此两者之间存在着相关关系,但是这种相关关系与其用一条直线来描述倒不如用曲线描述更加合适,因此Y与x之间更加倾向于被认为是一种非线性关系.回归方程也需要用一些非线性函数来刻画,比如图(2)年新增加投资额与年利润额数据的散点图图3 经过对数变换后的散点图Y=β0·eβ1·x; ①或者Y=β0+β1·x2②等等.图(3)给出的是变量lnY与变量x的散点图,从中可以看出这些点基本上是围绕一条直线波动,说明变量lnY与x之间近似是一种线性关系,从而也印证了回归方程取①形式的合理性.同时,图(3)也提示我们一种求解回归方程①的思路,即通过求解变量lnY对x的线性回归方程即可得到相应的①式所表示的Y和x的回归方程,即在图(3)中的回归直线同图(2)中的曲线(Ⅱ)是一致的.具体来说,首先对样本数据(x i,Y i),i=1,2,…,n作对数变换Z i=lnY i,i=1,2,…,n;③然后利用最小二乘法求出变量Z对x的回归方程Z=a0+a1·x;④即图(3)中的直线方程,则相应的形如①式的Y对x的回归方程是Y=e z=e a0·e a1x;⑤即β0=e a0,β1=a1.利用表(1)中给出的数据,可以得到lnY对x的线性回归方程是Z=1.314+0.100x由此可得Y对x的回归方程是Y=3.720 5·e0.100x; ⑥如果采用形如②式的抛物线型回归方程,容易看出,令ω=x2,②式就是表示了变量Y对ω的线性回归方程:Y=β0+β1·ω;⑦所以,对样本数据做变换ωi=x i2(i=1,2,…,n),利用(ωi,Y i)(i=1,2,…,n)求解出⑦中的系数估计值β0、β1代入②式即得到Y对x的回归方程.对表(1)中的数据计算结果为Y=4.413+0.057x2;⑧专题三独立性检验的基本方法判断结论成立的可能性的一般步骤:(1)假设两个分类变量X 和Y 没有关系; (2)给定一个显著水平,查表给出临界值;(3)计算χ2=;))()()(()(2d b d c b a c a bc ad n ++++- 2【例1】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,对于人力资源部的研究项目,根据上述数据能得出什么结论?分析:首先由已知条件确定a ,b ,c ,d ,n 的数值,再利用公式求出χ2的观测值,最后与临界值比较再下结论. 解:由题目中表的数据可知:a=54,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189.代入公式得χ2=103869594)32406354(1892⨯⨯⨯⨯-+⨯≈10.759.因为10.759>6.635,所以有99%的把握认为员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革态度和工作积极性是有关的.【例2】在一次恶劣气候的飞行航程中调查男女乘客晕机的情况如下表所示,根据此资料您解:这是一个2×2列联表的独立性检验问题,根据列联表中的数据,得到χ2=57323455)8312624(892⨯⨯⨯⨯-⨯⨯≈3.689.因为3.689>2.706,所以有90%的把握认为此次飞行中晕机与否跟男女性别有关. 几点注意:(1)在列联表中注意各项的对应及有关值的确定,避免混乱. (2)若要判断X 与Y 有关时,先假设X 与Y 无关.(3)把计算出的χ2的值与相关的临界值作比较,确定出“X 与Y 有关系”的把握.科海观潮 相关与相关系数一、什么是相关事物总是相互联系的,它们之间的关系多种多样,分析起来,大概有以下几种情况:(1)一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果.例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等.(2)第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系.例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系.(3)第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系.具有相关关系的两种现象之间,关系是复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内.例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系.统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度.相关的情况有以下三种:一是两列变量变动方向相同,即一列变量变动时,另一列变量亦同时发生或大或小与前一列变量同方向的变动,这称为正相关.如身高与体重的关系,一般讲身长越长体重就越重.第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小,但与前一列变量指向相反的变动.例如初学打字时练习次数越多,出现错误的量就越少等.第三处相关情况是零相关,即两列变量之间无关系.这种情况下,一列变量变动时,另一列变量作无规律的变动.如学习成绩优劣与身高之间的关系,就属零相关,即无相关关系,二者都是独立的随机变量.二、相关系数相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标,作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用ρ表示,并且是指线性相关而言.相关系数的取值介于-1.00至+1.00之间,常用小数形式表示.它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量.相关系数的正负号,表示相关方向,正值表示正相关,负值表示负相关.相关系数取值的大小表示相关的程度.相关系数为0时,称零相关即毫无相关,为1.00时,表示完全正相关,相关系数为-1.00时,为完全负相关.这二者都是完全相关.如果相关系数的绝对值在1.00与0之间不同时,则表示关系程度不同.接近1.00端一般为相关程度密切,接近0端一般为关系不够密切.(注意:若是非线性相关关系,而且直线相关计算r值可能很小,但不能说两变量关系不密切)关于这一点如何判定,尚需考虑计算相关系数时样本数目的多少.如果样本数目较少,受取样偶然因素的影响较大,很有可能本来无关的两类事物,却计算出较大的相关系数来.例如欲研究身高与学习有无关系,如果只选3、5个人,很可能遇到身材愈高学习愈好这一类偶然现象,这时虽然计算出的相关系数可能接近 1.00,但实际上这两类现象之间并无关系.究竟如何综合考虑样本数目大小,相关系数取值大小而判定相关是否密切这一问题,一般要经过统计检验后方能确定.相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍.也不能说相关系数从0.25到0.50与从0.50到0.75所提高的程度一样多.存在相关关系,即相关系数取值较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析,绝不可简单化.计算相关系数一般要求成对的数据,即若干个体中每个个体要有两种不同的观测值.例如每个学生(智力相同者)的算术和语文成绩;每个人的视反应和听反应时;每个学生的智力分数与学习成绩等等.任意两个个体之间的观测值不能求相关.计算相关的成对数据的数目,一般以30以上为宜.此文档是由网络收集并进行重新排版整理.word可编辑版本!。
高中数学第三章统计案例小结与复习教案北师大版选修2_320170927317
第三章 统计案例一、教学目标:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
二、教学重难点:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
三、教学方法:探析归纳,讲练结合 四、教学过程(一)、知识归纳与梳理 1、线性回归:(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。
注:与函数关系不同,相关关系是一种非确定性关系。
(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。
(3)散点图:表示具有相关关系的两个变量的一组数据的图形。
(4)回归直线方程:a bx y +=,其中⎪⎪⎩⎪⎪⎨⎧-=--=∑∑==x b y a x n x y x n y x b n i i ni i i 2121, ∑==n i i x n x 11。
相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。
相关系数的性质:(1)|r|≤1。
(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小。
2、独立性检验①22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表1构造随机变量2χ()()()()()2n ad bc a b c d a c b d -=++++(其中n a b c d =+++)得到2χ常与以下几个临界值加以比较: 如果2 2.706χ>,就有0090的把握因为两分类变量X 和Y 是有关系;如果 23.841χ> 就有0095的把握因为两分类变量X 和Y 是有关系; 如果2 6.635χ> 就有0099的把握因为两分类变量X 和Y 是有关系;如果22.706χ≤,就认为没有充分的证据说明变量X 和Y 是有关系. (二)、典例探析例1、一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一1)画出散点图;2)检验相关系数r 的显著性水平;3)求月总成本y 与月产量x 之间的回归直线方程.1)画出散点图:2)r=∑∑∑===---1211212222121)12)(12(12i i i i i ii y y x x yx yx=0.997891=在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.3)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y例2、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
高中数学北师大版选修2-2同步配套教学案第三章 章末小结 知识整合与阶段检测
[对应学生用书]一、导数与函数的单调性.若′()>,则()是增加的;若′()<,则()是减少的;若′()=恒成立,则()为常数函数;若′()的符号不确定,则()不是单调函数..若函数=()在区间(,)上是增加的,则′()≥;若函数=()在区间(,)上是减少的,则′()≤..利用导数求函数单调区间的步骤:()求导数′();()解不等式′()>或′()<;()写出单调增区间或减区间.特别注意写单调区间时,区间之间用“和”或“,”隔开,绝对不能用“∪”连接.二、导数与函数的极值和最值.极值当函数()在处连续可导时,如果附近的左侧′()>,右侧′()<,那么()是极大值;若左侧′()<,右侧′()>,那么()是极小值..利用导数求函数极值的一般步骤()确定函数()的定义域;()解方程′()=的根;()检验′()=的根的两侧′()的符号.若左正右负,则()在此根处取得极大值;若左负右正,则()在此根处取得极小值;否则,此根不是()的极值点..最值对于函数=(),给定区间[,],若对任意∈[,],存在∈[,],使得()≥()(()≤()),则()为函数在区间[,]上的最大(小)值..利用导数求函数最值的一般步骤()求()在(,)内的极值;()将()的各极值与(),()比较,其中最大的一个是最大值,最小的一个是最小值..函数最值与极值的区别与联系()函数的极值是在局部范围内讨论问题,是一个局部概念,而函数的最值是对整个区间而言,是在整体范围内讨论问题,是一个整体性的概念.()闭区间上的连续函数一定有最值,开区间内的可导函数不一定有最值,若有唯一的极值,则此极值必是函数的最值.()函数在其定义区间上的最大值、最小值最多各有一个,而函数的极值则可能不止一个,也可能没有极值.见开试卷)))(时间分钟,满分分)一、选择题(本大题共小题,每小题分,共分.在每小题给出的四个选项中,只有一项是符合题目要求的).曲线=-在点处的切线的倾斜角为( ).°.-°.-°°解析:∵′=-,∴处的切线斜率为-,倾斜角为°.答案:.下列求导运算正确的是( ).( )′=.( )′=.()′=.()′=解析:( )′=-,()′=,()′=+.答案:.已知函数=(),其导函数=′()的图像如图所示,则=()( ).在(-∞,)上为减少的.在=处取极小值.在(,+∞)上为减少的.在=处取极大值解析:在(-∞,)上,′()>,故()在(-∞,)上为增函数,错;在=处,导数由正变负,()由增变减,故在=处取极大值,错;在(,+∞)上,′()<,()为减函数,对;在=处取极小值,错.答案:.设函数()的导函数为′(),且()=+′(),则′()=( ).-..-。
高中数学第三章统计案例章末小结知识整合与阶段检测北师大选修(共5张PPT)
= , 高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章n末小结知识整合与阶段检测课n件北师大选修
x -n x · y -n y 高中数学第三章统计案例章末小2结知识整合2与阶段检测课件北2师大选修 2
i
i
i=1
i=1
|r|值越大,相关性越高,|r|值越接近 0,线性相关程度越低.
第4页,共5页。
二、独立性检验 独立性检验的一般步骤 (1)列出 2×2 列联表; (2)代入公式计算 χ2=a+can+adb-bb+cd2c+d; (3)根据 χ2 的值的大小作出判断.
第5页,共5页。
高中数学第三章统计案例章末n 小结知识整合与阶段检测课件北n 师大选修
x - x · y - y 高中数学第三章统计案例章末小结知识整合与阶2段检测课件北师大选修
2
高中数学第三章统计案例章末小结知i识整合与阶段检测课件北师大选i修
高中数学第三章统计案例章i=末1小结知识整合与阶段检测课件i=北1师大选修
高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章末小结n知识整合与阶段检测课件北师大选修
x y -n x ·y 高中数学第三章统计案例章末小结知识整合与阶段检测课件北师大选修
高中数学第三章统计案例章末小结知识整合与阶段检测课件 北师大选修
高中数学第3章统计案例章末复习课学案北师大版选修2_3
第3章 统计案例【例1】 下表是一位母亲给儿子作的成长记录:(2)如果年龄(3周岁~16周岁之间)相差5岁,其身高有多大差异? (3)如果身高相差20 cm ,其年龄相差多少?[解] (1)设年龄为x ,身高为y ,则x =114(3+4+…+15+16)=9.5,y =114(90.8+97.6+…+167.5+173.0)≈131.985 7,∑14i =1x 2i =1 491,∑14i =1y 2i =252 958.2,∑14i =1x i y i =18 990.6,14x y ≈17 554.1, ∴∑14i =1x 2i -14(x )2=227.5,∑14i =1y 2i -14(y )2≈9 075.05, ∑14i =1x i y i -14x y =1 436.5,∴r =∑14i =1x i y i -14x y∑14i =1x 2i -14(x )2∑14i =1y 2i -14(y )2=1 436.5227.5×9 075.05≈0.999 7.因此,年龄和身高之间具有较强的线性相关关系.(2)由(1)得b =∑14i =1x i y i -14x y∑14i =1x 2i -14(x )2=1 436.5227.5≈6.314, a =y -b x =131.985 7-6.314×9.5≈72,∴x 与y 的线性回归方程为y =6.314x +72.因此,如果年龄相差5岁,那么身高相差6.314×5=31.57(cm). (3)如果身高相差20 cm ,年龄相差206.314≈3.168≈3(岁).解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)实际应用.依据求得的回归方程解决实际问题.1.某运动员训练次数与运动成绩之间的数据关系如下:(2)求出回归直线方程;(3)计算相关系数并进行相关性检验; (4)试预测该运动员训练47次及55次的成绩.[解] (1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:由上表可求得x =39.25,y =40.875,∑i =18x 2i =12 656, ∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b =∑i =18x i y i -8x y∑i =18x 2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴回归直线方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用回归直线方程y =1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57.故预测该运动员训练47次和55次的成绩分别为49和57.黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病.试推断经过药物处理跟发生青花病是否有关系.[解] 由已知得到下表:根据2×2列联表中的数据,可以求得χ2=470×(25×200-185×60)2210×260×85×385≈9.788.因为χ2>6.6.35,所以我们有99%的把握认为经过药物处理跟发生青花病是有关系的.独立性检验问题的基本步骤 (1)找相关数据,作列联表. (2)求统计量χ2.(3)判断可能性,注意与临界值做比较,得出事件有关的可信度.2.某学校高三年级有学生1 000名,经调查研究,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学).现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:体育锻炼与身高达标2×2列联表(2)请问体育锻炼与身高达标是否有关系(χ2值精确到0.01)?参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解] (1)χ2=100×(40×15-35×10)275×25×50×50≈1.33<2.706,所以没有充分的理由说明体育锻炼与身高达标有关系.。
2017_2018学年高中数学第三章统计案例2独立性查验教学案北师大版选修2_3
女
6
514
[一点通] 分清类别是作列联表的关键步骤,对所给数据要明确属于那一类.
1.下面是一个2×2列联表:那么表中a,b处的值别离为( )
y1
y2
总计
x1
a
21
53
x2
8
25
33
总计
b
46
A.32,40B.42,50
C.74,82D.64,72
解析:a=53-21=32,b=a+8=40.
答案:A
2.某学校对高三学生作一项调查后发觉:在平常的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性额外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表.
解:列联表如下:
性格情况
考前心情
是否紧张
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
解析:a=73-21=52,b=100-46=54,应选C.
答案:C
3.高二第二学期期中考试,对甲、乙两个班级学生的数学考试成绩依照优秀和不优秀统计人数后,取得2×2列联表,那么随机变量χ2的值为( )
班级与成绩统计表
优秀
不优秀
总计
甲班
11
34
45
乙班
8
37
45
总计
19
71
90
A.0.600B.0.828
非统计专业
统计专业
男
13
10
女
7
20
则χ2≈________,有________的把握判定主修统计专业与性别有关.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 统计案例知识整合与阶段检测[对应学生用书P42]一、回归分析 1.线性回归分析对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =a +bx ,其中b =∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x·y∑i =1nx 2i -n x 2,a =y -b x .2.相关系数r=∑i =1nx i -xy i -y∑i =1nx i -x2·∑i =1ny i -y2=∑i =1nx i y i -n x·y∑i =1nx 2i -n x2·∑i =1ny 2i -n y 2,|r |值越大,相关性越高,|r |值越接近0,线性相关程度越低. 二、独立性检验独立性检验的一般步骤 (1)列出2×2列联表; (2)代入公式计算χ2=n ad -bc 2a +ca +b b +dc +d;(3)根据χ2的值的大小作出判断.⎣⎢⎡⎦⎥⎤对应阶段质量检测三 见8开试卷(时间90分钟,满分120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(全国新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解析:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1. 答案:D2.已知x 与y 之间的一组数据:则y 与x 的线性回归方程A .(2,2) B .(1.5,0) C .(1,2)D .(1.5,4)解析:线性回归方程y =a +bx 必过点(x -,y -). 答案:D3.下列现象的相关程度最高的是( )A .某商店的职工人数与商品销售额之间的相关系数为0.87B .流通费用率与商业利润之间的相关系数为-0.94C .商品销售额与商业利润之间的相关系数为0.51D .商品销售额与流通费用率之间的相关系数为-0.81解析:|r|越接近1,相关程度越高.答案:B4.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x +0.5,则加工600个零件大约需要( )A.6.5 h B.5.5 hC.3.5 h D.0.5 h解析:当x=600,y=600×0.01+0.5=6.5(h).答案:A5.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )A.b与r的符号相同 B.a与r的符号相同C.b与r的符号相反 D.a与r的符号相反解析:因为b>0时,两变量正相关,此时,r>0;b<0时,两变量负相关,此时r<0.答案:A6.以下关于线性回归的判断,正确的个数是( )①若散点图中的所有点都在一条直线附近,则这条直线的方程为回归方程②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点③已知线性回归方程为y=-0.81+0.50x,则x=25时,y的估计值为11.69④线性回归方程的意义是它反映了样本整体的变化趋势A.0 B.1C.2 D.3解析:由最小二乘法得到的方程才是线性回归方程,故①错,将x=25代入y=-0.81+0.50x,得y=11.69,故③正确,②④也正确.答案:D7.某考察团对全国10大城市的职工人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,y与x具有相关关系,回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比为( ) A.83% B.72%C.67% D.66%解析:当y =7.675时,x =7.675-1.5620.66≈9.262,7.6759.262×100%≈83%.故选A. 答案:A8.两个相关变量满足如下关系:A .y =0.56x +997.4B .y =0.63x -231.2C .y =0.56x +501.4D .y =60.4x +400.7解析:回归直线经过样本中心点(20,1 008.6),经检验只有选项A 符合题意.故选A. 答案:A9.若线性回归方程中的回归系数b =0时,则相关系数为( ) A .r =1 B .r =-1 C .r =0D .无法确定解析:当b =0时,∑i =1nx i y i -n x - y-∑i =1nx 2i -n x-2=0,即∑i =1nx i y i -n x - y -=0,∴r =∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2∑i =1ny 2i -n y -2=0.答案:C10.某工厂为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观察值.计算知∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y对x 的线性回归方程是( )A .y =11.47+2.62xB .y =-11.47+2.62xC .y =2.62+11.47xD .y =11.47-2.62x解析:由已知条件得x -=6.5,y -=28.5.由b =∑i =18x i y i -n x - y-∑i =18x 2i -n x -2,a =y --b x -,计算得b ≈2.62,a ≈11.47, 所以y =11.47+2.62x . 答案:A二、填空题(本大题共4小题,每小题5分,共20分,请把正确的答案填在题中的横线上)11.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:根据表中数据,得到χ2=23×27×20×30≈4.844.则有________的把握,则认为选修文科与性别有关系.解析:∵χ2=4.844>3.841,∴至少有95%的把握认为是否选修文科与性别有关. 答案:95%12.已知变量x ,y 具有线性相关关系,测得(x ,y )的一组数据如下:(0,1),(1,2),(2,4),(3,5),其回归方程为y =1.4x +a ,则a 的值是________.解析:x =0+1+2+34=1.5,y =1+2+4+54=3,∴这组数据的样本中心点是(1.5,3),把样本中心点代入回归直线方程y =1.4x +a ,∴3=1.4×1.5+a ,∴a =0.9.答案:0.913.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y =3e 2x +1的图像附近,则可通过转换得到的线性回归方程为________________.解析:由y =3e2x +1,得ln y =ln(3e2x +1),即ln y =ln 3+2x +1.令u =ln y ,v =x ,则线性回归方程为u =1+ln 3+2v .答案:y=1+ln 3+2x14.有甲、乙两个班级进行同一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表.班级与成绩列联表由上表提供的数据可知,学生的成绩与班级之间________.(填“有关系”或“没有关系”)解析:由公式,得χ2=-217×73×45×45≈0.653.因为0.653<2.706.所以我们没有理由说成绩与班级有关系.答案:没有关系三、解答题(本大题共4小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)15.(本小题满分12分)在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.根据以上数据建立一个2×2的列联表.解:2×2的列联表如下:16.(本小题满分12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验.(1)若选取12月1日和12月5日这两日的数据进行检验,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y =bx +a ;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得到的线性回归方程是否可靠?若可靠,请预测温差为14℃时的发芽数.解:(1)由数据,求得x =12,y =27.故∑i =13x i y i =977,3x ·y =972,∑i =13x 2i =434,3x2=432,由公式,求得b =52,a =y -b x =-3.所以y 关于x 的线性回归方程为y =52x -3.(2)当x =10时,y =52×10-3=22,|22-23|<2;当x =8时,y =52×8-3=17,|17-16|<2.所以得到的线性回归方程是可靠的. 当x =14时,有y =52x -3=35-3=32,所以预测温差为14 ℃时的发芽数约为32颗.17.(本小题满分12分)某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有种说法认为,在进入某乒乓球场比赛前先迈入左脚的球员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛,获得数据如下表:解:根据公式可得, χ2=n ad -bc 2a +bc +d a +cb +d=-2205×103×262×46≈1.502.因为1.502<2.706,所以我们认为先迈入左脚与否跟比赛的胜负是无关的.18.(本小题满分14分)在某次试验中,有两个试验数据x ,y ,统计的结果如下面的表格1.(1)在给出的坐标系中画出数据(x ,y )的散点图.(2)补全表格2,然后根据表格2的内容和公式b =∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .①求出y 对x 的回归直线方程y =a +bx 中回归系数a ,b ; ②估计当x 为10时y 的值是多少. 解:(1)数据(x ,y )的散点图如图所示:(2)表格如下:计算得x =3,y =3.6,b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=61-5×3×3.655-5×32=0.7, a =y -b x =3.6-0.7×3=1.5,所以y =a +bx =1.5+0.7x , 当x 为10时,y =8.5.。