【创新设计】2016-2017学年高中数学 第一章 统计案例练习 北师大版选修1-2
高中数学第一章统计案例1.1.1回归分析同步测控北师大选修1-2创新
高中数学 第一章 统计案例 1.1.1 回归分析同步测控 北师大版选修1-2我夯基 我达标1.下列两变量中具有相关关系的是( )A.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积解析:两个变量之间的关系出现不确定性为相关关系,A 、C 、D 为确定的关系. 答案:B2.设有一个回归方程为y=5+3x,变量x 增加1个单位时( )A.y 平均增加5个单位B.y 平均减少5个单位C.y 平均增加3个单位D.y 平均减少3个单位 解析:x 增加1个单位,y 平均增加3个单位. 答案:C3.由一组数据(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )得到的回归直线方程为y=a+bx,则下列说法正确的是… ( )A.直线y=a+bx 必过点(x ,y )B.直线y=a+bx 至少经过点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的一点C.直线y=a+bx 是由(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的两点确定的D.(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )这n 个点到直线y=a+bx 的距离之和最小 解析:∵a=y -b x ,即y =a+b x , ∴直线y=a+bx 过点(x ,y ).答案:A4.某工厂为预测某产品的回收率y,需要研究它和原料有效成份含量x 之间的相关关系,现取8对观察值.计算得∑=81i ix=52,∑=81i i y =228,∑=812i ix=478,∑=81i ii yx =1849,则y 对x 的回归方程为( )A.y=11.47+2.62xB.y=-11.47+2.62xC.y=2.62+11.47xD.y=11.47-2.62x 解析:设y=a+bx,由已知x =213852==6.5,y =2578228==28.5, b=281281)(88x xyx yx i ii ii--∑∑===25.684785.285.681849⨯-⨯⨯-=2.62,a=y -b x =28.5-2.62×6.5=11.47,∴y=11.47+2.62x. 答案:A5.下列有关回归方程的说法,正确的个数为( )①回归方程适用于任何样本 ②回归方程一般具有时间性③样本取值的范围不影响回归方程的范围 ④回归方程的预报值就是预报变量的精确值 ⑤预报值是预报变量可能取值的平均值A.0B.1C.2D.3 解析:关于回归方程的说法,正确的是②⑤. 答案:C6.两个变量满足下列关系:两变量回归直线方程为( )A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7 解析:∑=51i ix=100,∑=51i iy =5 043,∑=51i iiyx =101 000,∑=512i ix=2 250,x =20,y =1 008.6,b=∑∑==--512251)(55i ii iix xyx yx =220522506.1008205101000⨯-⨯⨯-=0.56, a=y -b x =1 008.6-0.56×20=997.4.答案:A7.用身高x(cm)预报体重y(kg)满足y=0.849x-85.712,若要找到41.638 kg 的人,则身高为______________cm.解析:令y=41.638,得x=150 cm. 答案:1508.对20艘轮船的研究中,船的吨位区间从192 t 到3 246 t,船员的数目从5人到32人,船员人数关于船的吨位的回归分析得到如下结果: 船员人数=9.5+0.006 2×吨位.(1)假定两艘船吨位相差1 000 t,船员平均人数相差______________;(2)对于最小的船估计的船员数是____________,对于最大的船估计的船员数是____________.解析:吨位每增加1,船员人数增加0.006 2,吨位增加1 000, 船员人数增加6.2,当x=192时,y=10.69,当x=3 246时,y=29.6. 答案:(1)6.2人 (2)10.7 29.6解析:设线性回归方程为y=a+bx,∑=51i ix=35,∑=51i i y =208,x =7,y =41.6,∑=512i ix=349,∑=51i ii yx =1 697,则b=2251251753496.41751697)(55⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈2.32.a=y -b x =41.6-2.32×7=25.36.∴y=25.36+2.32x. 令y=60,得x=15. 答案:1.5万元10.在两个变量的回归分析中,作散点图的目的是____________________________. 答案:(1)判断两变量是否线性相关; (2)判断两变量更近似于什么函数关系我综合 我发展求回归方程.解析:可作散点图,观察x 、y 的关系满足线性关系,代入公式求方程. 解:作散点图,可知y 与x 有线性关系,设为y=a+bx, 则x =530=6,y =51052=210.4, ∑=512I ix=220,∑=51I ixy i =7 790,b=2512251652204.210657790)(55⨯-⨯⨯-=--∑∑==i i i iix x yx yx =36.95,a=y -b x =210.4-36.95×6=-11.3,∴回归方程为y=-11.3+36.95x.12.为研究重量x(单位:g)对弹簧长度y(单位:cm)的影响,对承载不同重量的6根弹簧进行测量,数据如下表:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的回归直线方程. 解析:作出散点图,可看出各点在一直线附近,x 、y 满足线性关系,代入公式求回归方程. 解:(1)如下图所示.(2)从散点图看,这是一个属于线性回归模型的问题.x =61(5+10+…+30)=17.5, y =61(7.25+8.12+…+11.8)≈9.487,∑=612i ix =52+…+302=2 275, ∑=61i ii yx =5×7.25+…+30×11.8=1 076.2,计算得b≈0.183,a≈6.283.所求回归方程为y=6.283+0.183x.13.假设授课天数和分数是线性相关的,10个不同地方的初中生分数如下表:试求分数y 与授课天数x 之间的回归直线方程.解析:观察,可知x 、y 之间满足线性关系,代入计算. 解:x =203,∑=10121i x=416 824,y =64.5,∑=101i ii yx =132 418,∴b=210122101203104168245.6420310132418)(1010⨯-⨯⨯-=--∑∑==i i i iix x yx yx =0.313 3,a=y -b x =64.5-0.313 3×203=0.900 1,∴回归直线方程为y=0.313 3x+0.900 1.我创新 我超越14.一项调查表明对9个不同的x 值,测得y 的9个对应值如下表所示:解析:作出散点图观察满足线性关系,列表代入求值. 解:散点图如下图所示.由图知所有数据点接近直线排列,因此认为y 对x 有线性回归关系是成立的.根据已知数据列∴x =3.366,y =10.122 2.b=∑∑==--912291)(99i ii iix xyx yx =2366.3911.1151222.10366.3909.345⨯-⨯⨯-≈2.93, a=y -b x =0.260 4,∴所求的回归直线方程为y=0.260 4+2.93x.15.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:r/s),用y 表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y 与x 之间存在线性相关关系,求y 与x 之间的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少?(精确到1)解析:利用公式求出回归方程,并解不等式. 解:(1)设回归方程为y=a+bx,则x =41614128+++=12.5,y =411985+++=8.25,∑=412i ix=660,∑=41i ii yx =438,b=70515.12466025.85.124438)(442241241=⨯-⨯⨯-=--∑∑==x xyx yx i ii ii, a=y -b x =8.257051-×12.5=76-, ∴所求回归方程为y=76-+7051x.(2)由y≤10,即76-+7051x≤10,得x≤51760≈15,即机器速度不得超过15 r/s.。
2016-2017学年高二数学北师大版选修1-2练习:第一章 统计案例 1.3 Word版含解析
1.3 可线性化的回归分析明目标、知重点 1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.1.常见的非线性回归模型幂函数曲线y =ax b ,指数曲线y =a e bx .倒指数曲线y =a e ,对数曲线y =a +b ln_x .b x 2.非线性函数可以通过变换转化成线性函数,得到线性回归方程,再通过相应变换得到非线性回归方程.探究点一 非线性回归模型思考1 有些变量间的关系并不是线性相关,怎样确定回归模型?答 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?答 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.例1 某地区不同身高的未成年男性的体重平均值如下表:身高x /cm 60708090100110体重y /kg6.137.909.9912.1515.0217.50身高x /cm 120130140150160170体重y /kg20.9226.8631.1138.8547.2555.05试建立y 与x 之间的回归方程.解 根据表中数据画出散点图如图所示.由图看出,样本点分布在某条指数函数曲线y =c 1e c 2x 的周围,于是令z =ln y .x 60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01画出散点图如图所示.由表中数据可得=115,=2.962 5,i y i =4 370.5,=173 000,x y 12∑i =1x 12∑i =1x2i ∴b =≈0.020,12∑i =1xiyi -12 x y12∑i =1x 2i -12(x )2∴a =-b ≈0.663,y x ∴z 与x 之间的线性回归方程为z =0.663+0.020x ,则有y =e 0.663+0.020x .反思与感悟 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c 1e c 2x 的周围,其中c 1和c 2是待定参数;可以通过对x 进行对数变换,转化为线性相关关系.跟踪训练1 在彩色显影中,由经验知:形成染料光学密度y 与析出银的光学密度x 由公式y =A e (b <0)表示.现测得试验数据如下:b x x i 0.050.060.250.310.070.10y i0.100.141.001.120.230.37x i 0.380.430.140.200.47y i1.191.250.590.791.29试求y 对x 的回归方程.解 由题给的公式y =A e ,两边取自然对数,便得ln y =ln A +,与线性回归方程相对照,bx bx 只要取u =,v =ln y ,a =ln A .1x 就有v =a +bu .题给数据经变量置换u =,v =ln y 变成如下表所示的数据:1x u i 20.00016.667 4.000 3.22614.28610.000v i -2.303-1.96600.113-1.470-0.994u i 2.632 2.3267.143 5.000 2.128v i0.1740.223-0.528-0.2360.255可得ln y =0.548-,0.146x 即y =e0.548-=e 0.548·e -≈1.73e -,0.146x 0.146x 0.146x 这就是y 对x 的回归方程.探究点二 非线性回归分析思考 对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们之间的相关关系?答 不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图像进行比较,挑选一种拟合比较好的函数,作为回归模型.例2 对两个变量x ,y 取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲 y =0.1x +1,乙 y =-0.05x 2+0.35x +0.7,丙 y =-0.8·0.5x +1.4,试判断三人谁的数学模型更接近于客观实际.解 甲模型,当x =1时,y =1.1;当x =2时,y =1.2;当x =3时,y =1.3;当x =4时,y =1.4.乙模型,当x =1时,y =1;当x =2时,y =1.2;当x =3时,y =1.3;当x =4时,y =1.3.丙模型,当x =1时,y =1;当x =2时,y =1.2;当x=3时,y=1.3;当x=4时,y=1.35.观察4组数据并对照知,丙的数学模型更接近于客观实际.跟踪训练2 根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:年份1986199119962001产量8.610.412.916.1根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种( )A.y=bx+a(b≠0)B.y=ax2+bx+c(a≠0)C.y=a x(a>0且a≠1)D.y=log a x(a>0且a≠1)答案 A1.散点图在回归分析中的作用是( )A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否相关答案 D2.变量x与y之间的回归方程表示( )A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合答案 D3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )A .1B .-0.5C .0D .0.5答案 C4.某种产品的广告费支出x 与销售额y 之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是____________.x /万元24568y /万元3040605070答案 (6,50)[呈重点、现规律]1.对于确定具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决.建立回归模型的步骤①确定研究对象,明确变量关系;②画出散点图,观察变量之间的关系;③由经验确定回归方程的类型;④按一定规则估计回归方程中的参数2.常见曲线方程的变换公式曲线方程变换公式变换后的线性方程=a +1y b x y ′=,x ′=1y 1x y ′=a +bx ′y =ax b y ′=ln y ,x ′=ln x y ′=A +bx ′(A =ln a )y =a +b ln x y ′=y ,x ′=ln x y ′=a +bx ′y =a e bxy ′=ln y ,x ′=xy ′=A +bx ′(A =ln a )一、基础过关1.下列说法正确的是( )①线性回归方程适用于一切样本和总体;②线性回归方程一般都有时间性;③样本的取值范围会影响线性回归方程的适用范围;④根据线性回归方程得到的预测值是预测变量的精确值.A .①③④ B .②③ C .①② D .③④答案 B2.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A .y =-10x +200 B .y =10x +200C .y =-10x -200 D .y =10x -200答案 A3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =x +1上,则这组样本数据的样本12相关系数为( )A .-1B .0 C. D .112答案 D4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x 1.9934 5.1 6.12y1.54.047.51218.01对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )A .y =2x -2B .y =()x12C .y =log 2x D .y =(x 2-1)12答案 D解析 可以代入检验,当x 取相应的值时,所求y 与已知y 相差最小的便是拟合程度最高的.5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx 答案 A解析 对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .6.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx +a 的周围,令z =ln y ,求得线性回归方程为z =0.25x -2.58,则该模型的回归方程为________.答案 y =e 0.25x -2.58解析 ∵z =0.25x -2.58,z =ln y ,∴y =e 0.25x -2.58.7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x /年35679推销金额y /万元23345(1)求年推销金额y 关于工作年限x 的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.解 (1)设所求的线性回归方程为y =bx +a ,则b ===0.5,a =-b =0.4.5∑i =1xiyi -5x y5∑i =1x 2i -5x 21020y x ∴年推销金额y 关于工作年限x 的线性回归方程为y =0.5x +0.4.(2)当x =11时,y =0.5x +0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年推销金额为5.9万元.二、能力提升8.研究人员对10个家庭的儿童问题行为程度(X )及其母亲的不耐心程度(Y )进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合( )A .y =0.771 1x +26.528B .y =36.958ln x -74.604C .y =1.177 8x 1.014 5D .y =20.924e 0.019 3x答案 B解析 可以通过画散点图观察知两个变量x 、y 之间大致呈现对数函数关系.9.已知x ,y 之间的一组数据如下表:x 1.08 1.12 1.19 1.25y2.252.372.432.55则y 与x 之间的线性回归方程y =bx +a 必过点________________________________________________________________________.答案 (1.16,2.4)解析 回归方程y =bx +a 必过样本点的中心(,),x y ∵==1.16,x 1.08+1.12+1.19+1.254==2.4,y 2.25+2.37+2.43+2.554∴样本点的中心为(1.16,2.4).10.已知线性回归方程为y =0.50x -0.81,则x =25时,y 的估计值为________.答案 11.69解析 当x =25时,y =0.50×25-0.81=11.69.11.在一次抽样调查中测得样本的5个样本点,数值如下表:x 0.250.5124y1612521如何建立y 与x 之间的回归方程.解 画出散点图如图(1)所示,观察可知y 与x 近似是反比例函数关系.设y = (k ≠0),令t =,则y =kt .k x 1x 可得到y 关于t 的数据如下表:t 4210.50.25y1612521画出散点图如图(2)所示,观察可知t 和y 有较强的线性相关性,因此可利用线性回归模型进行拟合,易得:=1.55,=7.2,i y i =94.25,=21.312 5,t y 5∑i =1t 5∑i =1t2i b =≈4.134 4,a =-b ≈0.791 7,∑5i =1tiyi -5t y ∑5 i =1t 2i -5t 2y t 所以y =4.134 4t +0.791 7,所以y 与x 的回归方程是y =+0.791 7.4.134 4x12.某地区六年来轻工业产品利润总额y 与年次x 的试验数据如下表所示:年次x 123456利润总额y11.3511.8512.4413.0713.5914.41由经验知,年次x 与利润总额y (单位:亿元)有如下关系:y =ab x e 0.其中a 、b 均为正数,求y 关于x 的回归方程.(保留三位有效数字)解 对y =ab x e 0两边取对数,得ln y =ln a e 0+x ln b ,令z =ln y ,则z 与x 的数据如下表:x 123456z2.432.472.522.572.612.67由z =ln a e 0+x ln b 及最小二乘法公式,得ln b ≈0.047 7,ln a e 0≈2.38,即z =2.38+0.047 7x ,所以y =10.8×1.05x .三、探究与拓展13.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:x 9.511.513.515.517.5y64.643.22.8x 19.521.523.525.527.5y2.52.42.32.22.1散点图显示出x 与y 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +.试根据b x 上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.解 设u =,则y ≈a +bu ,得下表数据:1x u 0.105 30.087 00.074 10.064 50.057 1y64.643.22.8u 0.051 30.046 50.042 60.039 20.036 4y2.52.42.32.22.1进而可得n =10,≈0.060 4,=3.21,u y -102≈0.004 557 3,10∑i =1u2i u i y i -10 ≈0.256 35,10∑i =1uu y b ≈≈56.25,0.256 350.004 557 3a =-b ·≈-0.187 5,y u 所求的回归方程为y =-0.187 5+.56.25x 当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。
(常考题)北师大版高中数学选修1-2第一章《统计案例》测试(答案解析)(1)
一、选择题1.甲、乙两人进行乒乓球比赛,比赛规则为“3局2胜”,即以先赢2局者为胜,根据经验,每局比赛中甲获胜的概率为0.4,则本次比赛甲获胜的概率是( ) A .0.216B .0.36C .0.352D .0.6482.甲、乙两人进行乒乓球比赛,假设每局比赛甲胜的概率是0.6,乙胜的概率是0.4.那么采用5局3胜制还是7局4胜制对乙更有利?( ) A .5局3胜制B .7局4胜制C .都一样D .说不清楚3.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表经计算2K 的值,则有( )的把握认为玩手机对学习有影响. A .95% B .99%C .99.5%D .99.9%4.已知变量,X Y ,由它们的样本数据计算得到2K 的观测值 4.328k ≈,2K 的部分临界值表如下:以下判断正确的是( )A .在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系B .在犯错误的概率不超过0.05的前提下认为变量,X Y 没有关系C .有97.5%的把握说变量,X Y 有关系D .有97.5%的把握说变量,X Y 没有关系5.某光学仪器厂生产的透镜,第一次落地打破的概率为0.3;第一次落地没有打破,第二次落地打破的概率为0.4;前两次落地均没打破,第三次落地打破的概率为0.9.则透镜落地3次以内(含3次)被打破的概率是( ). A .0.378 B .0.3C .0.58D .0.9586.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( ) A .35B .14C .12D .137.以下四个命题,其中正确的个数有( )①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程^0.212y x =+中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大. A .1B .2C .3D .48.先后抛掷骰子两次,落在水平桌面后,记正面朝上的点数分别为,x y ,设事件A 为x y +为偶数,事件B 为x y ≠ ,则概率(|)P B A =( )A .14B .13C .12D .239.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.7567.3ˆ25yx =-+. ②y 与x 负相关且 3.47654ˆ.68y x =+ ③y 与x 正相关且 1.226 6.5ˆ78yx =-- ④y 与x 正相关且8.96786ˆ.13y x =+ 其中一定不正确的结论的序号是( ) A .①②B .②③C .③④D .①④10.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:其中()()()()()22,.n ad bc K n a b c d a b c d a c b d -==+++++++则下列结论正确的是A .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别无关”C .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别有关”D .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别无关” 11.对具有线性相关关系的变量x ,y 有一组观测数据(),i i x y (1,2,,8i =),其回归直线方程是1ˆ8ˆybx =+,且1238x x x x ++++=()123826y y y y ++++=,则实数ˆb的值是( )A .116B .14C .13D .1212.把一枚硬币任意掷两次,事件A=“第一次出现正面”,事件B=“第二次出现正面”,则P (B/A )=( ) A .14B .13C .12D .23二、填空题13.在一次三人象棋对抗赛中,甲胜乙的概率为0.4,乙胜丙的概率为0.5,丙胜甲的概率为0.6,比赛顺序如下:第一局,甲对乙;第二局,第一局胜者对丙;第三局,第二局胜者对第一局败者;第四局,第三局胜者对第二局败者.则乙连胜四局的概率为____. 14.某人抛掷一枚均匀骰子,构造数列{}n a ,使1,()1,()n n a n ⎧=⎨-⎩当第次掷出偶数当第次掷出奇数,记12n n S a a a =+++,则20S ≠且82S =的概率为_____.15.甲、乙两位同学进行篮球三分球投篮比赛,甲每次投中的概率为13,乙每次投中的概率为12,每人分别进行三次投篮.乙恰好比甲多投进2次的概率是______. 16.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)17.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表18.已知某种高炮在它控制的区域内击中敌机的概率为0.2,要使敌机一旦进入这个区域后有0.9以上的概率被击中,需要至少布置___________门高炮?(用数字作答,已知lg20.3010=,lg30.4771=)19.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是3.240y x=-+,且20m n+=,则其中的n=______.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求:(i)三个球中有两个红球一个黑球的概率;(ii)第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:22⨯关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()2n ad bc K a b c d a c b d -=++++. 23.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA 疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X ,求X 的分布列和数学期望.运算公式:()()()()()22n ad bc K a b c d a c b d -=++++,对照表:24.消费者信心指数是反映消费者信心强弱的指标;它是预测经济走势和消费趋向的一个先行指标,是监测经济周期变化的重要依据.消费者信心指数值介于0和200之间.指数超过100时,表明消费者信心处于强信心区;指数等于100时,表示消费者信心处于强弱临界点;指数小于100时,表示消费者信心处于弱信心区.我国某城市从2016年到2019年各季度的消费者信心指数如下表1:记2016年至2019年年份序号为,该城市各年消费者信心指数的年均值(四舍五入取整)为y ,x 与y 的关系如下表2:的消费者信心指数不小于2017年的消费者信心指数的概率;(2)根据表2得到线性回归方程为:ˆˆ4.4yx a =+,求ˆa 的值,并预报该城市2020年消费者信心指数的年平均值.(3)根据表2计算(,)x y 的相关系数r (保留两位小数),并判断是否正相关很强.参考数据和公式:ˆˆay bx =-;12342.54x +++==;105112114119112.54y +++==23.45≈22.47≈;()()niix x y y r --=∑0.751r ≤≤时,y 与x 正相关很强.25.近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:表:根据以上数据,绘制了散点图.x1234567 y611213466101196(1)根据散点图判断,在推广期内y a bx=+与xy c d=⋅(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断,不必说明理由);(2)根据(1)的判断结果及表中的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:支付方式现金乘车卡扫码比例10%60%30%车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠,预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要()*n n N∈年才能开始盈利,求n的值.参考数据:其中lgi iv y=,7117iiv v==∑参考公式:对于一组数据(),i iu v,()22,u v,…,(),n nu v,其回归直线v a uβ=+的斜率和截距的最小二乘估计公式分别为:1221ni iiniiu v nuvu nuβ==-=-∑∑,a v uβ=-.26.在一定范围内,植物的生长受到空气、水、温度、光照和养分等因素的影响,某试验小组为了研究光照时长对某种植物增长高度的影响,在保证其他因素相同的条件下,对该植物进行不同时长的光照试验,经过试验,得到6组该植物每日的光照时间x (单位:h )和每日平均增长高度y (单位:mm )的数据.(1)该小组分别用模型①ˆˆˆybx a =+和模型②ˆˆˆmx n y e +=对以上数据进行拟合,得到回归模型,并计算出模型的残差如下表:(模型①和模型②的残差分别为1ˆe 和2ˆe ,残差ˆˆi i i ey y =-)根据上表的残差数据,应选择哪个模型来刻画该植物每日的光照时间与每日平均增长高度的关系较为合适,简要说明理由;(2)为了优化模型,将(1)中选择的模型残差绝对值最大所对应的一组数据(),x y 剔除,根据剩余的5组数据,求该模型的回归方程,并预测光照时间为11h 时,该植物的平均增长高度.(剔除数据前的参考数据:7.5x =, 5.9y =,61299.8i ii x y==∑,621355i i x ==∑,ln z y =,141z ≈.,6173.10i i i x z =≈∑,n10.7l 2.37≈, 4.03456.49e ≈.)参考公式:()()()1122211ˆn niii ii i nni ii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】 【分析】先列举出甲获胜的情况,再利用独立事件的概率乘法公式可计算出所求事件的概率。
高中数学第一章统计案例1.1.2相关系数同步测控北师大版选修1-2资料
4.4
2
3
3.8
9
14.44
11.4
3
4
5.5
16
30.25
22.0
4
5
6.5
25
42.25
32.5
5
6
7.0
364942.0来自∑2025
90
140.78
112.3
∴=4,=5, (1)b==1.23, a=-b=5-1.23×4=0.08. ∴回归直线方程为y=1.23x+0.08. (2)当x=10时,y=1.23×10+0.08=12.38(万元),估计使用10年时,维修费用是 12.38万元. (3)r===0.979, x、y有很强的线性关系. 14.某工厂前10个月份的产量与生产费用如下表:
a=
-b=54.5-0.848×165.25=-85.632, ∴回归方程为y=-85.632+0.848x, r== =0.803. 答案:y=-85.632+0.848x 0.803 10.一家工厂对职工进行技能检查,收集数据如下:
零件数x/ 10 20 30 40 50 60 70 80 个
我综合 我发展
9.设8名女大学生的身高和体重数据如下:
身高 x/cm
165 165 157 170 175 165 155 170
体重 y/kg
48
57
50
54
64
61
43
59
则回归方程为______________,相关系数为______________. 解析:=1 322,=436,=218 774,=24 116, yi=72 315,=165.25,=54.5, b===0.848,
2016-2017学年高二数学北师大版选修1-2练习:第一章 统计案例 Word版含解析
1回归分析题目击破一、基本概念函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.例1下列变量之间的关系是相关关系的是________.(1)正方形的边长与面积之间的关系;(2)水稻产量与施肥量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率之间的关系.分析两变量之间的关系有两种:函数关系和带有随机性的相关关系.解析(1)是函数关系;(2)不是严格的函数关系,但是具有相关性,因而是相关关系;(3)既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;(4)降雪量与交通事故发生率之间具有相关关系.答案(2)(4)点评该例主要考查对变量相关关系概念的掌握.二、线性回归方程设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫作回归直线.例2若由资料知y对x呈线性相关关系,试求:(1)回归方程y=a+bx;(2)估计使用年限10年时,维修费用是多少?分析因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.解(1)制表于是有b=112.3-5×4×5=1.23,90-5×42a=y-b x=5-1.23×4=0.08.∴回归方程为y=1.23x+0.08.(2)当x=10时,y=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用约是12.38万元.点评已知y对x呈线性相关关系,无须进行相关性检验,否则,应首先进行相关性检验.三、非线性回归问题分析非线性回归问题的具体做法是:(1)若问题中已给出经验公式,这时可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决.下面举例说明非线性回归分析问题的解法.例3某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均资本x(单位:万元)与人均产值y(单位:万元)的数据:(1)设y 与x 之间具有近似关系y ≈ax b (a ,b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产值(精确到0.01).解 (1)在y ≈ax b 的两边取常用对数,可得lg y ≈lg a +b lg x ,设lg y =z ,lg a =A ,lg x =X ,则z ≈A +bX .由公式(1)可得⎩⎪⎨⎪⎧A =-0.215 5,b =1.567 7,由lg a =-0.215 5, 得a ≈0.608 8,即a,b的估计值分别为0.608 8和1.567 7.(2)由(1)知y=0.608 8x1.567 7.样本数据及回归曲线的图形如图所示.当x=16时,y=0.608 8×161.567 7≈47.01(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.2巧解非线性回归问题如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想.一、案例分析温度x/℃2345678某项指标y 5.790 6.8108.19910.00112.19014.79017.801试建立某项指标y关于温度x的回归模型,并判断你所建立的回归模型的拟合效果.分析根据表中的数据画出散点图,再由图设出相应的回归模型.解画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y=Bx2+A的周围.令X =x 2,则变换后的样本点应该分布在y =bX +a (b =B ,a =A )的周围.计算得到线性回归方程为y =0.199 94X +4.999 03.用x 2替换X ,得某项指标y 关于温度x 的回归方程y =0.199 94x 2+4.999 03. 计算得r ≈0.999 997,几乎为1,说明回归模型的拟合效果非常好.点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图像相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 二、知识拓展常见的非线性函数转换方法:(1)幂型函数y =ax m (a 为正数,x ,y 取正值)解决方案:对y =ax m 两边取常用对数,有lg y =lg a +m lg x ,令u =lg y ,v =lg x ,则原式可变为u =m v +lg a ,其中m ,lg a 为常数,该式表示u ,v 的线性函数. (2)指数型函数y =c ·a x (a ,c >0,且a ≠1)解决方案:对y =ca x 两边取常用对数,则有lg y =lg c +x lg a ,令u =lg y ,则原式可变为u =x lg a +lg c ,其中lg a 和lg c 为常数,该式表示u ,x 的线性函数.与幂函数不同的是x 保持不变,用y 的对数lg y 代替了y .(3)反比例函数y =kx (k >0)解决方案:令u =1x ,则y =ku ,该式表示y ,u 的线性函数.(4)二次函数y =ax 2+c解决方案:令u =x 2,则原函数可变为y =au +c ,该式表示y ,u 的线性函数. (5)对数型函数y =c log a x解决方案:令x =a u ,则原函数可变为y =cu ,该式表示y ,u 的线性函数.3 判断两个分类变量的关系本章的重点是用独立性检验的基本思想对两个分类变量作出明确的判断,下面通过典例剖析如何判断两个分类变量的关系.例 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189对于人力资源部的研究项目,根据上述数据能得出什么结论?分析 首先由已知条件确定a 、b 、c 、d、n 的数值,再利用公式求出χ2的值,最后根据χ2值分析结果.解 由题目中表的数据可知: χ2=n (ad -bc )2(a +c )(a +b )(c +d )(b +d )=189×(54×63-40×32)294×95×86×103≈10.759.因为10.759>6.635,所以有99%的把握说员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.点评 在列联表中注意事件的对应及有关值的确定,避免混乱;在判断两个分类变量的关系的可靠性时一般利用随机变量来确定;把计算出的χ2的值与临界值作比较,确定出“A 与B 有关系”的把握.4 独立性检验思想的应用在日常生活中,经常会面临一些需要推断的问题.在对这些问题作出推断时,我们不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验思想做出合理的推断. 所谓独立性检验,就是根据采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关系来判定事件A 与B 是否有关的问题.其基本步骤如下:(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量; (2)根据样本数据制作列联表;(3)计算统计量χ2,并查表分析.当χ2很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系.下面举例说明独立性检验思想在解决实际问题中的应用.例 为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,统计结果为:患慢性气管炎共有56人,患慢性气管炎且吸烟的有43人,未患慢性气管炎但吸烟的有162人.根据调查统计结果,分析患慢性气管炎与吸烟在多大程度上有关系? 解 根据所给样本数据得到如下2×2列联表:由列联表可以粗略估计出:有吸烟者中,有20.98%的患慢性气管炎;在不吸烟者中,有9.70%的患慢性气管炎.两个比例的值相差较大,所以结论“患慢性气管炎与吸烟有关”成立的可能性较大.根据列联表中的数据,得到χ2=339×(43×121-13×162)256×283×205×134≈7.469>6.635.所以有99%的把握认为“患慢性气管炎与吸烟有关”.点评 通过计算检验随机变量χ2,可以比较精确地给出这种判断的可靠程度.先收集数据,然后通过一些统计方法对数据进行科学的分析,这是我们用统计方法解决实际问题的基本策略.。
2016-2017学年高中数学第一章统计案例2独立性检验2.1条件概率与独立事件课后演练提升北师大版选修1-2资料
2016-2017学年高中数学 第一章 统计案例 2 独立性检验 2.1 条件概率与独立事件课后演练提升 北师大版选修1-2一、选择题1.下面几种概率是条件概率的是( )A .甲、乙二人投篮命中率分别为0.6、0.7,各投篮一次都命中的概率B .甲、乙二人投篮命中率分别为0.6、0.7,在甲投中的条件下,乙投篮一次命中的概率C .10件产品中有3件次品,抽2件产品进行检验,恰好抽到一件次品的概率D .小明上学路上要过四个路口,每个路口遇到红灯的概率都是25,小明在一次上学途中遇到红灯的概率解析: 由条件概率定义知选B. 答案: B2.有甲、乙两批种子,发芽率分别为0.8和0.9,在两批种子中各取一粒,则恰有一粒种子能发芽的概率是( )A .0.26B .0.08C .0.18D .0.72解析: P =0.8×0.1+0.2×0.9=0.26. 答案: A3.打靶时,甲每打10次可中靶8次,乙每打10次可中靶7次,若两人同时射击一个目标,则它们都中靶的概率是( )A.35 B .34 C.1225D .1425解析: 设甲射击一次中靶为事件A ,乙射击一次中靶为事件B ,则P (A )=810=45,P (B )=710,P (AB )=P (A )·P (B )=45×710=1425. 答案: D4.一袋中有3个红球,2个白球,另一袋中有2个红球,1个白球,从每袋中任取一球,则至少取到1个白球的概率是( )A.38 B .35 C.25D .15解析: 分两大类:1白球1红球或全是白球.P =25×23(一白一红)+35×13(一红一白)+25×13(两白)=35或1-35×23=35. 答案: B 二、填空题5.已知A 、B 是相互独立事件,且P (A )=12,P (B )=23,则P (A B )=________;P (A B )=________.解析: A 、B 是相互独立事件, ∴A 与B ,A 与B 也是相互独立事件. 又∵P (A )=12,P (B )=23,故P (A )=12,P (B )=1-23=13,∴P (A B )=P (A )·P (B )=12×13=16;P (A B )=P (A )·P (B )=12×13=16.答案: 16 166.一射手对同一目标独立地射击4次,若至少命中一次的概率为8081,则该射手一次射击的命中率为________.解析: 设命中率为p ,则1-(1-p )4=8081,(1-p )4=181,p =23.答案: 23三、解答题7.一个盒子中有6个白球、4个黑球,每次从中不放回地任取1个,连取两次,求在第一次取到白球的条件下,第二次取到黑球的概率.解析: 记“第一次取到白球”为事件A ,“第二次取到黑球”为事件B .注意,这里的问题与“求第一次取到白球,第二次取到黑球的概率”不一样.方法一:显然,事件“第一次取到白球,第二次取到黑球”的概率P (AB )=n ABn Ω=6×410×9=415. 由条件概率的计算公式,得P (B |A )=P AB P A =415610=49.方法二:因为n (A )=C 16C 19,n (AB )=C 16C 14,所以P (B |A )=n AB n A =C 16C 14C 16C 19=49.8.甲、乙、丙三人分别对一目标射击,甲射击命中目标的概率是12,乙命中目标的概率是13,丙命中目标的概率是14,现在三人同时射击目标. (1)求目标被击中的概率;(2)求三人中至多有1人击中目标的概率.解析: 甲、乙、丙分别射中目标是相互独立的,利用独立事件来求概率,目标被击中是指甲、乙、丙三人至少有一人射中目标.常从反面解答,即求出目标未被击中的概率.设甲击中目标为事件A ,乙击中目标为事件B ,丙击中目标为事件C ,目标未被击中为事件AB C ,(1)目标被击中的概率P =1-P (A B C )=1-P (A )P (B )P (C ) =1-[1-P (A )][1-P (B )][1-P (C )]=1-⎝ ⎛⎭⎪⎫1-12⎝ ⎛⎭⎪⎫1-13⎝ ⎛⎭⎪⎫1-14=34,即目标被击中的概率为34.(2)三人中至多有1人击中目标为事件A B C +A B C +A B C +A B C 概率为P (A B C +A B C +A B C +A B C ) =P (A B C )+P (A B C )+P (A B C )+P (A B C )=⎝ ⎛⎭⎪⎫1-12⎝ ⎛⎭⎪⎫1-13⎝ ⎛⎭⎪⎫1-14+12×⎝ ⎛⎭⎪⎫1-13⎝ ⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12×13×⎝ ⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12⎝ ⎛⎭⎪⎫1-13×14=14+14+18+112=17249.某种有奖销售的饮料,瓶盖内印有“奖励一瓶”或“谢谢购买”字样,购买一瓶若其瓶盖内印有“奖励一瓶”字样即为中奖,中奖概率为16.甲、乙、丙三位同学每人购买了一瓶该饮料.(1)求甲中奖且乙、丙都没有中奖的概率;(2)“恰有两人中奖”与“恰有一人中奖”的概率哪个大?说明理由. 解析: 设甲、乙、丙中奖的事件分别为A 、B 、C ,那么P (A )=P (B )=P (C )=16(1)甲中奖且乙、丙都没有中奖的事件为A ·B ·C ,P (A B C )=P (A )P (B )P (C )=16×⎝ ⎛⎭⎪⎫1-16×⎝ ⎛⎭⎪⎫1-16 =25216(2)恰有两人中奖的事件为AB C +A B C +A BCP (AB C +A B C +A BC )=P (AB C )+P (A B C )+P (A BC )=P (A )P (B )P (C )+P (A )P (B )P (C )+P (A )P (B )P (C ) =16×16×⎝ ⎛⎭⎪⎫1-16+16×⎝ ⎛⎭⎪⎫1-16×16+⎝ ⎛⎭⎪⎫1-16×16×16=572 恰有一人中奖的事件为A B C +A B C +A B CP (A B C +A B C +A B C )=P (A )P (B )P (C )+P (A )P (B )P (C )+P (A )P (B )P (C )=16×⎝ ⎛⎭⎪⎫1-16×⎝ ⎛⎭⎪⎫1-16+⎝ ⎛⎭⎪⎫1-16×16×⎝ ⎛⎭⎪⎫1-16+⎝ ⎛⎭⎪⎫1-16×⎝ ⎛⎭⎪⎫1-16×16=2572∵572<2572∴“恰有一人中奖”的概率大于“恰有两人中奖”的概率.。
2016-2017学年北师大版高中数学选修1-2检测:第一章
第一章§1 1.2、1.2、1.3(本栏目内容,在学生用书中以独立形式分册装订!)一、选择题1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归方程为y=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高在145.83 cm左右B.身高在145.83 cm以上C.身高在145.83 cm以下D.身高一定是145.83 cm解析:回归方程得到的预报值是预报变量的估计值,它是预报变量可能取值的平均值.答案: A2.已知线性回归方程y=1+bx,若x=2,y=9,则b等于()A.4 B.-4C.18 D.0解析:样本点的中心为(2,9),因回归直线过样本点的中心,所以9=1+b×2,b=4.故选A.答案: A3.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫()A.函数关系B.线性关系C.相关关系D.回归关系解析:由相关关系的概念可知,C正确.答案: C4.工人月工资y(元)关于劳动生产率x(千元)的回归方程为y=650+80x,下列说法中正确的个数是()①劳动生产率为1 000元时,工资为730元;②劳动生产率提高1 000元,则工资提高80元;③劳动生产率提高1 000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2 000元.A.1B.2C.3D.4解析:代入方程计算可判断①②④正确.答案: C二、填空题5.已知回归直线方程为y =-3.0x +0.55,y 的估计值为-5.45时,x 的值为________. 解析: 将y 的值代入回归方程即可. 答案: 2.06.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是________.解析: 本题考查相关关系的概念,相关关系是一种不确定性关系.曲线上的点与该点的坐标之间具有确定性关系.答案: ①③④ 三、解答题7.高三一班学生每周用于数学学习的时间x (单位:h)与数学平均成绩y (单位:分)之间有如下数据:解析: 由表中数据可得x =17.4,y =75.9,所以相关系数r =∑i =110x i yi -10x y(∑i =110x 2i -10x 2)(∑i =110y 2i -10y 2)≈0.892.所以x 与y 具有线性相关关系.8.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下表:由资料看y 解析: 由表中数据得,x =30, y =66.7+76.0+85.0+112.3+128.05=93.6,∑i =15x i y i =0×66.7+10×76.0+20×85.0+50×112.3+70×128.0=17 035,∑i =15x 2i =02+102+202+502+702=7 900,所以b =∑i =15x i y i -5x y∑i =15x 2i -5x2≈0.880 9,a =y -b x =93.6-0.880 9×30=67.173. 所以回归方程为y =0.880 9x +67.173.9.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)(2)求线性回归方程,并在散点图中加上回归直线; (3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解析: (1)散点图如图所示:(2)x =15∑i =15x i =109,∑i =15 (x i -x )2=1 570,y =23.2,∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y =bx +a , 则b =3081 570≈0.196 2,a =y -b x =23.2-109×3081 570≈1.816 6.故所求回归直线方程为y =0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为 y =0.196 2×150+1.816 6=31.246 6(万元).。
(常考题)北师大版高中数学选修1-2第一章《统计案例》测试题(有答案解析)
一、选择题1.甲、乙两队进行排球比赛,采取五局三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩可知在每一局比赛中,甲队获胜的概率为23,乙队获胜的概率为13.若前两局中乙队以20:领先,则下列说法中错误的是( ) A .甲队获胜的概率为827B .乙队以30:获胜的概率为13 C .乙队以三比一获胜的概率为29D .乙队以32:获胜的概率为492.在一个质地均匀的小正方体的六个面中,三个面标0,两个面标1,一个面标2,将这个小正方体连续抛掷两次,若向上的数字的乘积为偶数,则该乘积为非零偶数的概率为( ) A .14 B .89 C .116D .5323.“人机大战,柯洁哭了,机器赢了”,2017年5月27日,岁的世界围棋第一人柯洁不敌人工智能系统AlphaGo ,落泪离席.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查.在参与调查的男性中,有人持反对意见,名女性中,有人持反对意见.再运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是( )A .分层抽样B .回归分析C .独立性检验D .频率分布直方图4.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下: 20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .185.从345678910,1112,,,,,,,,中不放回地依次取2个数,事件A = “第一次取到的数可以被3整除”,B = “第二次取到的数可以被3整除”,则()P B|?A =( )A .59B .23C .13D .296.在“新零售”模式的背景下,自由职业越来越流行,诸如:淘宝网店主、微商等等,现调研某自由职业者的工资收入情况,记x 表示该自由职业者的平均水平每天工作的小时数,y 表示平均每天工作x 个小时的月收入.假设y 与x 具有线性相关关系,则y 关与x 的线性回归方程ˆˆˆybx a =+必经过点( ) A .()33, B .()34, C .()44, D .()45,7.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为 A .720B .12 20C .120D .2208.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样9.在5道题中有3道理科题和2道文科题,如果一次性抽取 2道题,已知有一道是理科题的条件下,则另一道也是理科题的概率为 A .13B .14C .12D .3510.通过随机询问72名不同性别的学生在购买食物时是否看营养说明,得到如下列联表:参考公式:22()()()()()n ad bc K a b c d a c b d -=++++20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828则根据以上数据:A .能够以99.5%的把握认为性别与读营养说明之间无关系;B .能够以99.9%的把握认为性别与读营养说明之间无关系;C .能够以99.5%的把握认为性别与读营养说明之间有关系;D .能够以99.9%的把握认为性别与读营养说明之间有关系;11.学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过 A .B .C .D .12.为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表:及格 不及格 合计 很少使用手机 20 5 25 经常使用手机 10 15 25 合计302050则有( )的把握认为经常使用手机对数学学习成绩有影响.参考公式:()()()()()22=n ad bc K a b c d a c b d -++++,其中n a b c d =+++A .97.5%B .99%C .99.5%D .99.9%二、填空题13.在一次三人象棋对抗赛中,甲胜乙的概率为0.4,乙胜丙的概率为0.5,丙胜甲的概率为0.6,比赛顺序如下:第一局,甲对乙;第二局,第一局胜者对丙;第三局,第二局胜者对第一局败者;第四局,第三局胜者对第二局败者.则乙连胜四局的概率为____. 14.两个实习生加工一个零件,产品为一等品的概率分别为23和34,则这两个零件中恰有一个一等品的概率为__________. 15.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数0.83r =-,表明两个变量的相关性较弱.③若由一个2⨯2列联表中的数据计算得2K 的观测值 4.103k ≈,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(,),(1,,)i i x y i n =的回归直线方程ˆˆˆy bx a =+后要进行残差分析,相应于数据(,),(1,,)i i x y i n =的残差是指()ˆˆˆi i ie y bx a =-+. 以上命题“错误”的序号是_________________16.甲、乙两队进行排球比赛,已知在一局比赛中甲队获胜的概率是23,没有平局,若采用三局两胜制比赛,即先胜两局者获胜且比赛结束,则甲队获胜的概率等于__________. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bc a b c d a c b d -++++.) 19.已知一组数据的回归直线方程为 1.51y x =-+,且4y =,发现有两组数据( 1.7,2.9)-,( 2.3,5.1)-的误差较大,去掉这两组数据后,重新求得回归直线方程为y x a '''=-+,则当3x '=-时,y '=_____.20.某质检员检验一件产品时,把正品误判为次品的概率是0.1,把次品误判为正品的概率是0.05.如果一箱产品中含有8件正品,2件次品,现从中任取1件让该质检员检验,那么出现误判的概率为___________.三、解答题21.某校将进行篮球定点投篮测试,规则为:每人至多投3次,先在M 处投一次三分球,投进得3分,未投进不得分,以后均在N 处投两分球,每投进一次得2分,未投进不得分.测试者累计得分高于3分即通过测试,并终止投篮.甲、乙两位同学为了通过测试,进行了五轮投篮训练,每人每轮在M 处和N 处各投10次,根据他们每轮两分球和三分球的命中次数情况分别得到如图表:若以每人五轮投篮训练命中频率的平均值作为其测试时每次投篮命中的概率. (1)求甲同学通过测试的概率;(2)在甲、乙两位同学均通过测试的条件下,求甲得分比乙得分高的概率.22.消费者信心指数是反映消费者信心强弱的指标;它是预测经济走势和消费趋向的一个先行指标,是监测经济周期变化的重要依据.消费者信心指数值介于0和200之间.指数超过100时,表明消费者信心处于强信心区;指数等于100时,表示消费者信心处于强弱临界点;指数小于100时,表示消费者信心处于弱信心区.我国某城市从2016年到2019年各季度的消费者信心指数如下表1:2016年 2017年 2018年 2019年 第一季度 104.50 111.70 118.50 119.30 第二季度 104.00 110.20 114.60 118.20 第三季度 105.50 114.20 110.20 118.10 第四季度106.80113.20113.20119.30记2016年至2019年年份序号为,该城市各年消费者信心指数的年均值(四舍五入取整)为y ,x 与y 的关系如下表2: 年份序号x1 2 3 4 消费者信心指数年均值y105112114119的消费者信心指数不小于2017年的消费者信心指数的概率;(2)根据表2得到线性回归方程为:ˆˆ4.4yx a =+,求ˆa 的值,并预报该城市2020年消费者信心指数的年平均值.(3)根据表2计算(,)x y 的相关系数r (保留两位小数),并判断是否正相关很强.参考数据和公式:ˆˆay bx =-;12342.54x +++==;105112114119112.54y +++==;55023.45≈;50522.47≈;()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑;当0.751r ≤≤时,y 与x 正相关很强.23.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.(1)用样本估计总体,以频率作为概率,若在A ,B 两块实验地随机抽取3株花苗,求所抽取的花苗中优质花苗数的分布列和数学期望;(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:下面的临界值表仅供参考.20()P K k ≥0.050 0.010 0.001 0k3.8416.63510.828(参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)24.甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.优秀非优秀总计甲班10乙班30合计105已知在全部105人中抽到随机抽取1人为优秀的概率为2 7(Ⅰ)请完成上面的列联表;(Ⅱ)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系” .(Ⅲ)若按下面的方法从甲班优秀的学生抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6或10号的概率.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++25.在疫情这一特殊时期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后进行了摸底考试,某校数学教师为了调查高三学生这次摸底考试的数学成绩与在线学习数学时长之间的相关关系,对在校高三学生随机抽取45名进行调查.知道其中有25人每天在线学习数学的时长是不超过1小时的,得到了如下的等高条形图:(Ⅰ)是否有99%的把握认为“高三学生的这次摸底考试数学成绩与其在线学习时长有关”;(Ⅱ)将频率视为概率,从全校高三学生这次数学成绩超过120分的学生中随机抽取10人,求抽取的10人中每天在线学习时长超过1小时的人数的数学期望和方差.()20P K k ≥ 0.050 0.010 0.001 0k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++26.某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X (小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量y (百斤)与使用某种液体肥料x (千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,是否可用线性回归模型拟合y 与x 的关系?请计算相关系数r 并加以说明(精确到0.01).(若||0.75r >,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X 限制,并有如下关系: 周光照量X (单位:小时)3050X << 5070X ≤≤ 70X >若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪,求商家在过去50周周总利润的平均值.附:相关系数公式()()niix x y y r --=∑0.55≈,0.95≈.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】A ,在乙队以2:0领先的前提下,若甲队获胜则第三、四、五局均为甲队取胜;B ,乙队以3:0获胜,即第4局乙获胜;C ,乙队以三比一获胜,即第三局甲获胜,第四局乙获胜;D ,若乙队以3:2获胜,则第五局为乙队取胜,第三、四局乙队输. 【详解】解:对于A ,在乙队以2:0领先的前提下,若甲队获胜则第三、四、五局均为甲队取胜,所以甲队获胜的概率为3128()327P ==,故正确; 对于B ,乙队以3:0获胜,即第4局乙获胜,概率为13,故正确;对于C ,乙队以三比一获胜,即第三局甲获胜,第四局乙获胜,概率为212339⨯=,故正确;对于D ,若乙队以3:2获胜,则第五局为乙队取胜,第三、四局乙队输,所以乙队以3:2获胜的概率为221433327⨯⨯=,故错.故选:D . 【点睛】本题主要考查相互独立事件的概率乘法公式,所求的事件与它的对立事件概率间的关系,属于中档题.2.D解析:D【分析】首先确定是条件概率,在出现数字乘积为偶数的前提下,乘积为非零偶数的概率,首先求两次数字乘积为偶数的概率,然后两次为非零偶数的概率,再按照条件概率的公式求解.【详解】两次数字乘积为偶数,可先考虑其反面——只需两次均出现1向上,概率是221 69⎛⎫=⎪⎝⎭,所以两次数字乘积为偶数的概率P=228169⎛⎫-=⎪⎝⎭;若乘积非零且为偶数,需连续两次抛掷小正方体的情况为(1,2)或(2,1)或(2,2),P=111152366636⨯⨯+⨯=,.故所求条件概率为55368329P==.故选:D【点睛】本题主要考查了条件概率的计算和独立事件,考查了学生的计算能力,属于基础题. 3.C解析:C【解析】【分析】根据“性别”以及“反对与支持”这两种要素,符合,从而可得出统计方法。
2016-2017学年高二数学北师大版选修1-2练习:第一章 统计案例 1.1-1.2 Word版含解析
1.1 回归分析1.2 相关系数明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.掌握建立线性回归模型的步骤.1.线性回归方程在线性回归方程y =a +bx 中,b ==,a =-b .其中=∑ni =1(xi -x )(yi -y )∑ni =1(xi -x )2∑ni =1xiyi -nx y ∑ni =1x 2i -nx 2y x x 1nx i ,=y i .∑n i =1y 1n ∑ni =1(,)称为样本点的中心,线性回归直线过样本点的中心.x y 2.相关系数(1)相关系数r 的计算公式r =.∑ni =1xiyi -nx y ∑n i =1x 2i -nx 2∑n i =1y 2i -ny 2(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.(3)当r >0时,b >0,称两个变量正相关;当r <0时,b <0,称两个变量负相关;当r =0时,b =0,称两个变量线性不相关.[情境导学]“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?探究点一 线性回归方程思考1 两个变量之间的关系分几类?答 分两类:①函数关系,②相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2 什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.思考3 对具有线性相关关系的两个变量进行回归分析有哪几个步骤?答 基本步骤为画散点图,求线性回归方程,用线性回归方程进行预测.例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归方程,并预测一名身高为172 cm的女大学生的体重.解 (1)画散点图选取身高为变量x,体重为变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y=bx+a来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b =0.849,a =-85.712.于是得到回归方程为y =0.849x -85.712.(3)预测和决策当x =172时,y =0.849×172-85.712=60.316(kg).即预测一名身高为172 cm 的女大学生的体重约为60.316 kg.反思与感悟 在使用回归方程进行预测时要注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预测值就是预测变量的精确值.跟踪训练1 某班5名学生的数学和物理成绩如表:学生学科A B C D E 数学成绩(x )8876736663物理成绩(y )7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.解 (1)散点图如图.(2)=×(88+76+73+66+63)=73.2.x 15=×(78+65+71+64+61)=67.8.y 15x i y i =88×78+76×65+73×71+66×64+63×61∑5 i =1=25 054.x =882+762+732+662+632=27 174.∑5 i =12i∴b =≈0.625.∑5i =1xiyi -5x ·y ∑5 i =1x 2i -5x 2∴a =-b =67.8-0.625×73.2=22.05.y x ∴y 对x 的线性回归方程是y =0.625x +22.05.(3)当x =96时,y =0.625×96+22.05≈82.所以,可以预测他的物理成绩是82.探究点二 相关系数思考1 给出n 对数据,按照公式求出的线性回归方程,是否一定能反映这n 对数据的变化规律?答 如果数据散点图中的点都大致分布在一条直线附近,这条直线就能反映这n 对数据的变化规律,否则求出的方程没有实际意义.思考2 怎样通过相关系数刻画变量之间的线性相关关系?答 |r |值越接近1,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低;当r =0时,两个变量线性不相关.例2 下面的数据是从年龄在40岁到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y (满分100),以及每天花在看电视上的平均时间x (小时).看电视的平均时间x 4.4 4.6 2.7 5.80.2 4.6心脏功能水平y525369578965(1)求心脏功能水平y 与每天花在看电视上的平均时间x 之间的样本相关系数r ;(2)求心脏功能水平y 与每天花在看电视上的平均时间x 的线性回归方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏功能水平.解 n =6,=(4.4+4.6+…+4.6)≈3.716 7,x 16=(52+53+…+65)≈64.166 7,y 16-62≈(4.42+4.62+…+4.62)-6×3.716 726∑i =1x2i x ≈19.766 8,-62≈(522+532+…+652)-6×64.166 726∑i =1y2i y≈964.807 7,i y i -6 ≈(4.4×52+4.6×53+…+4.6×65)-6×3.7167×64.166 7≈-124.630 2.6∑i =1xx y (1)心脏功能水平y 与每天花在看电视上的平均时间x 之间的相关系数:r ≈≈-0.902 5.-124.630 219.766 8×964.807 7(2)b ≈≈-6.305 0,a =-b ≈87.600 5,心脏功能水平y 与每天花在看电视上-124.630 219.766 8y x 的平均时间x 的线性回归方程为y =87.600 5-6.305 0x .由(1)知y 与x 之间有较强的线性关系,这个方程是有意义的.(3)将x =3代入线性回归方程y =87.600 5-6.305 0x ,可得y ≈68.7,即平均每天看电视3小时,心脏功能水平约为68.7.反思与感悟 求解两个变量的相关系数及它们的线性回归方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到i ,i ,,,n∑i =1x n∑i =1y n∑i =1x 2i n∑i =1y2i i y i 这些量,也就无需制表这一步,直接算出结果就行了.另外,利用计算机中有关应n∑i =1x用程序也可以对这些数据进行处理.跟踪训练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度x (g/L)18202224262830缩醛化度y (克分子%)26.8628.3528.7528.8729.7530.0030.36(1)画散点图;(2)求线性回归方程;(3)求相关系数r .解 (1)(2)列表:i x i y i x 2i x i y i 11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80∑168202.944 1444 900.16==24,=,b =x 1687y 202.947∑7i =1xiyi -7x y ∑7 i =1x 2i -7x 2==0.264 3,4 900.16-7×24×202.9474 144-7×242a =-b =-0.264 3×24≈22.648,y x 202.947∴线性回归方程为y =22.648+0.264 3x .(3)y ≈5 892,r =∑7 i =12i ∑7i =1xiyi -7x y ∑7 i =1x 2i -7x 2∑7 i =1y 2i -7y 2==0.96.4 900.16-7×24×202.9474 144-7×242×5 892-7×(202.947)2由此可以看出甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系.1.下列变量之间:①人的身高与年龄;②产品的成本与生产数量;③商品的销售额与广告费;④家庭的支出与收入.其中不是函数关系的有( )A .1个B .2个C .3个D .4个答案 D2.已知线性回归方程为y =bx +a ,其中a =3且样本点中心为(1,2),则线性回归方程为( )A .y =x +3 B .y =-2x +3C .y =-x +3 D .y =x -3答案 C解析 ∵y =bx +3过(1,2),可计算得b =-1.3.已知一个线性回归方程为y =1.5x +45,x i ∈{1,7,5,13,19},则=________.y 答案 58.54.一唱片公司欲知打歌费用x (十万元)与唱片销售量y (千张)之间的关系,从其所发行的唱片中随机抽取了10张,得如下的资料:i =28,=303.4,i =75,=598.5,i y i =237,则y 与x 的相关系数r10∑i =1x10∑i =1x2i 10∑i =1y 10∑i =1y 2i 10∑i =1x的绝对值为________.答案 0.3解析 由公式r =得|r |=0.3.n∑i=1xiyi -nx yn∑i =1x 2i -nx 2n∑i =1y 2i -ny 2[呈重点、现规律]1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求线性回归方程并进行预报.2.通过计算相关系数可以判定两个变量的线性相关程度.一、基础过关1.在下列各量之间,存在相关关系的是( )①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③某户家庭用电量与电价之间的关系.A .②③ B .①③ C .① D .②答案 D2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y =0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(,)x y C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由线性回归方程为y =0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系;由最小二乘法建立回归方程的过程知y =bx +a =bx +-b (a =-b ),所以y x y x 回归直线过样本点的中心(,);利用回归方程可以估计总体,所以D 不正确.x y 3.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元)4235销售额y (万元)49263954根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预测广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案 B解析 ∵==,==42,x 4+2+3+5472y 49+26+39+544又y =bx +a 必过(,),x y ∴42=×9.4+a ,∴a =9.1.72∴线性回归方程为y =9.4x +9.1.∴当x =6(万元)时,y =9.4×6+9.1=65.5(万元).4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求x y得b=0.51,=61.75,=38.14,则线性回归方程为( )A.y=0.51x+6.65 B.y=6.65x+0.51C.y=0.51x+42.30 D.y=42.30x+0.51答案 A5.对于回归分析,下列说法错误的是( )A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r2=1,说明x与y之间完全相关D.样本相关系数r∈(-1,1)答案 D解析 相关系数r的范围是[-1,1].6.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条线性回归方程为________.答案 y=-10+6.5xx y y x解析 由题意知=2,=3,b=6.5,所以a=-b=3-6.5×2=-10,即线性回归方程为y=-10+6.5x.7.某个服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x3456789y66697381899091(1)求样本点的中心;(2)画出散点图;(3)求纯获利y与每天销售件数x之间的回归方程.x y解 (1)=6,≈79.86,样本点的中心为(6,79.86).(2)散点图如下:(3)因为i y i =3 487,=280,7∑i =1x7∑i =1x2i 所以b =7∑i =1xiyi -7x y7∑i =1x 2i -7(x )2=≈4.75.3 487-7×6×79.86280-7×62a =-b ≈51.36,y x 所以y =4.75x +51.36.二、能力提升8.已知x 与y 之间的几组数据如下表:x 123456y21334假设根据上表数据所得线性回归方程y =bx +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′ B .b >b ′,a <a ′C .b <b ′,a >a ′ D .b <b ′,a <a ′答案 C解析 b ′=2,a ′=-2,由公式b =求得.6∑i =1(xi -x )(yi -y )6∑i =1(xi -x )2b =,a =-b =-×=-,57y x 136577213∴b <b ′,a >a ′.选C.9.下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )x 1234y1357A.点(2,3) B .点(1.5,4)C .点(2.5,4)D .点(2.5,5)答案 C解析 回归方程必过样本点的中心(,),即(2.5,4).x y 10.若线性回归方程中的回归系数b =0,则相关系数r =________.答案 0解析 b =,n∑i =1(xi -x )(yi -y )n∑i =1(xi -x )2r =,n∑i =1(xi -x )(yi -y )n∑i =1(xi -x )2·n∑i =1(yi -y )2若b =0,则r =0.11.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:零件的个数x /个2345加工的时间y /小时2.5344.5若加工时间y 与零件个数x 之间有较好的相关关系.(1)求加工时间与零件个数的回归方程;(2)试预测加工10个零件需要的时间.解 (1)由表中数据得=,=,x =54,x 72y 72∑4i =12i x i y i =52.5,∑4 i =1从而得b =0.7,a =-b =1.05,y x 因此,所求的线性回归方程为y =0.7x +1.05.(2)将x =10代入回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件的预测时间为8.05小时.12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元)88.28.48.68.89销量y (件)908483807568(1)求线性回归方程y =bx +a ,其中b =-20,a =-b ;y x (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)==8.5,x 8+8.2+8.4+8.6+8.8+96=(90+84+83+80+75+68)=80.y 16∵b =-20,a =-b ,y x ∴a =80+20×8.5=250,∴线性回归方程y =-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20(x -)2+361.25,334∴该产品的单价应定为元,工厂获得的利润最大.334三、探究与拓展13.某运动员训练次数与运动成绩之间的数据关系如下:次数x 3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:次数x i 成绩y i x 2i y 2i x i y i 30309009009003334 1 089 1 156 1 1223537 1 225 1 369 1 2953739 1 369 1 521 1 4433942 1 521 1 764 1 6384446 1 936 2 116 2 0244648 2 116 2 304 2 20850512 5002 6012 550由上表可求得=39.25,=40.875,x =12 656,x y ∑8i =12i y =13 731,x i y i =13 180,∑8 i =12i ∑8 i =1∴b =≈1.041 5,∑8i =1xiyi -8x y ∑8 i =1x 2i -8x 2a =-b =-0.003 88,y x ∴线性回归方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系.(4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预测值.将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57.。
2016-2017学年高中数学第一章统计案例章末分层突破学案北师大版选修
【课堂新坐标】2016-2017学年高中数学第一章统计案例章末分层突破学案北师大版选修1-2[自我校对]①回归分析②独立性检验③相关系数④相互独立事件,回归分析分析两个变量线性相关的常用方法:(1)散点图法,该法主要是用来直观地分析两变量间是否存在相关关系.(2)相关系数法,该法主要是从量上分析两个变量间相互联系的密切程度,|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.下表是一位母亲给儿子作的成长记录:年龄/周岁3456789身高/cm90.897.6104.2110.9115.6122.0128.5年龄/周岁10111213141516身高/cm134.2140.8147.6154.2160.9167.5173.0(2)如果年龄(3周岁~16周岁之间)相差5岁,其身高有多大差异? (3)如果身高相差20 cm ,其年龄相差多少?【精彩点拨】 本例考查对两个变量进行回归分析.首先求出相关系数,根据相关系数的大小判断其是否线性相关,由此展开运算.【规范解答】 (1)设年龄为x ,身高为y ,则x =114(3+4+…+15+16)=9.5,y =114(90.8+97.6+…+167.5+173.0)≈131.985 7,∑14i =1x 2i =1 491,∑14i =1y 2i =252 958.2,∑14i =1x i y i =18 990.6,14x y ≈17 554.1, ∴∑14i =1x 2i -14(x )2=227.5,∑14i =1y 2i -14(y )2≈9 075.05, ∑14i =1x i y i -14x y =1 436.5,∴r =∑14i =1x i y i -14x y∑14i =1x 2i -14x2∑14i =1y 2i -14y2=1 436.5227.5×9 075.05≈0.999 7.因此,年龄和身高之间具有较强的线性相关关系.(2)由(1)得b =∑14i =1x i y i -14x y∑14i =1x 2i -14x2=1 436.5227.5≈6.314, a =y -b x =131.985 7-6.314×9.5≈72,∴x 与y 的线性回归方程为y =6.314x +72.因此,如果年龄相差5岁,那么身高相差6.314×5=31.57(cm). (3)如果身高相差20 cm ,年龄相差206.314≈3.168≈3(岁). [再练一题]1.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,提到如下数据:单价x (元)88.28.48.68.89销量y (件)90 84 83 80 75 68(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y =-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,l 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.,条件概率1.条件概率公式揭示了条件概率P (A |B )与事件概率P (B )、 P (AB )三者之间的关系.下列两种情况可利用条件概率公式:一种情况是已知P (B )和P (AB )时去求出P (A |B );另一种情况是已知P (B )和P (A |B )时去求出P (AB ).对于后一种情况,为了方便也常将条件概率公式改写为如下的乘法公式:若P (A )>0,有P (AB )=P (A )P (B |A ).2.乘法公式与条件概率公式实际上是一个公式,要求 P (AB )时,必须知道P (A |B )或P (B |A );反之,要求P (A |B )时,必须知道积事件AB 的概率P (AB ),在解决实际问题时,不要把求P (AB )的问题误认为是求P (A |B )的问题.盒子里装有16个球,其中6个是玻璃球,10个是木质球,玻璃球中有2个是红球,4个是蓝球;木质球中有3个是红球,7个是蓝球.现从中任取一个(假设每个球被取到是等可能的)是蓝球,问该球是玻璃球的概率是多少?【精彩点拨】 要注意B 发生时A 发生的概率与A ,B 同时发生的概率的区别. 【规范解答】 设事件A :“任取一球,是玻璃球”;事件B :“任取一球,是蓝球”.由题中数据可列表如下:红球 蓝球 总计 玻璃球 2 4 6 木质球 3 7 10 总计51116由表知,P (B )=1116,P (AB )=416,故所求事件的概率为P (A |B )=P ABP B =4161116=411.[再练一题]2.有外形相同的球分装三个盒子,每盒10个.其中,第一个盒子中有7个球标有字母A,3个球标有字母B ;第二个盒子中有红球和白球各5个;第三个盒子中则有红球8个,白球2个.试验按如下规则进行:先在第一个盒子中任取一个球,若取得标有字母A 的球,则在第二个盒子中任取一个球;若第一次取得标有字母B 的球,则在第三个盒子中任取一个球.如果第二次取出的是红球,则称试验为成功.求试验成功的概率.【解】 设A ={从第一个盒子中取得标有字母A 的球}.B ={从第一个盒子中取得标有字母B 的球},C ={从第二个盒子中取一个红球},D ={从第三个盒子中取一个红球},则容易求得P (A )=710,P (B )=310,则P (C )=12,P (D )=810=45.显然,事件A ∩C 与事件B ∩D 互斥,且事件A 与C 是相互独立的, 所以试验成功的概率为P =P (A ∩C )+P (B ∩D ) =P (A )·P (C )+P (B )·P (D )=59100,所以本次试验成功的概率为59100.独立性检验独立性检验问题的基本步骤为: (1)找相关数据,作列联表. (2)求统计量χ2.(3)判断可能性,注意与临界值做比较,得出事件有关的可信度.考察黄烟经过药物处理跟发生青花病的关系,得到如下数据:在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病.试推断经过药物处理跟发生青花病是否有关系.【精彩点拨】 提出假设,根据2×2列联表求出χ2,从而进行判断.【规范解答】 由已知得到下表:药物处理 未经过药物处理总计 青花病 25 185 210 无青花病 60 200 260 总计85385470假设经过药物处理跟发生青花病无关.根据2×2列联表中的数据,可以求得χ2=470×25×200-185×602210×260×85×385≈9.788.因为χ2>7.879,所以我们有99.5%的把握认为经过药物处理跟发生青花病是有关系的. [再练一题]3.某学校高三年级有学生1 000名,经调查研究,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学).现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:体育锻炼与身高达标2×2列联表:身高达标 身高不达标总计 积极参加 体育锻炼 40不积极参加 体育锻炼 15 总计100(2)请问体育锻炼与身高达标是否有关系?(χ2值精确到0.01) 参考公式:χ2=n ad -bc 2a +bc +d a +cb +d.【解】 (1)身高达标 身高不达标总计 积极参加 体育锻炼 403575不积极参加 体育锻炼 10 15 25 总计5050100χ2=100×40×15-35×10275×25×50×50≈1.33<2.706,所以没有充分的理由说明体育锻炼与身高达标有关系.1.(2015·湖北高考)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关【解析】 根据正相关和负相关的定义进行判断.若线性回归方程的斜率为正,则两个变量正相关,若斜率为负,则负相关.因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =by +a ,b >0,则z =by +a =-0.1bx +b +a ,故x 与z 负相关.【答案】 C2.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y =bx +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【解析】 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a =8-0.76×10=0.4,∴当x =15时,y =0.76×15+0.4=11.8(万元). 【答案】 B3.(2014·湖北高考)根据如下样本数据x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0A .a >0,b >0B .a >0,b <0C .a <0,b >0D .a <0,b <0【解析】 作出散点图如下:观察图像可知,回归直线y =bx +a 的斜率b <0,当x =0时,y =a >0.故a >0,b <0. 【答案】 B4.(2016·全国卷Ⅱ)图11是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.图11注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 t i -ty i -y∑ni =1 t i -t2∑n i =1y i -y2,回归方程y =a +bt中斜率和截距的最小二乘估计公式分别为b =∑ni =1t i -t y i -y ∑ni =1t i -t 2,a =y --b t .【解】 (1)由折线图中的数据和附注中的参考数据得t =4,∑7i =1(t i -t )2=28,∑7i =1y i -y2=0.55,∑7i =1 (t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89, ∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b =∑7i =1 t i -t y i -y ∑7i =1t i -t 2=2.8928≈0.103. a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y =0.92+0.10t . 将2016年对应的t =9代入回归方程得y =0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.单元综合测评(一) 统计案例 (时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.在下列各量与量的关系中是相关关系的为( )①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电费之间的关系.A .①②③B .③④C .④⑤D .②③④【解析】 ①⑤是一种确定性关系,属于函数关系.②③④为相关关系. 【答案】 D2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y =2.347x -6.423; ② y 与x 负相关且y =-3.476x +5.648; ③y 与x 正相关且y =5.437x +8.493;④y 与x 正相关且y =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④【解析】 y 与x 正(或负)相关时,线性回归直线方程y =bx +a 中,x 的系数b >0(或b <0),故①④错.【答案】 D3.电视机的使用寿命与显像管开关的次数有关.某品牌的电视机的显像管开关了10 000次后还能继续使用的概率是0.80,开关了15 000次后还能继续使用的概率是0.60,则已经开关了10 000次的电视机显像管还能继续使用到15 000次的概率是( )A .0.75B .0.60C .0.48D .0.20【解析】 记“开关了10 000次后还能继续使用”为事件A ,记“开关了15 000次后还能继续使用 ”为事件B ,根据题意,易得P (A )=0.80,P (B )=0.60,则P (AB )=0.60,由条件概率的计算方法,可得P (B |A )=P AB P A =0.600.80=0.75.【答案】 A4.一位母亲记录了她儿子3岁到9岁的身高,建立了她儿子身高与年龄的回归模型y =73.93+7.19x ,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是( )A .她儿子10岁时的身高一定是145.83 cmB .她儿子10岁时的身高一定是145.83 cm 以上C .她儿子10岁时的身高在145.83 cm 左右D .她儿子10岁时的身高一定是145.83 cm 以下【解析】 由回归模型得到的预测值是可能取值的平均值,而不是精确值,故选C . 【答案】 C5.(2016·咸阳高二检测)已知一个线性回归方程为y =1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( )A .58.5B .46.5C .60D .75【解析】 ∵x =15(1+7+5+13+19)=9,回归直线过样本点的中心(x -,y -),∴y -=1.5×9+45=58.5. 【答案】 A6.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则P (B |A )=( )A .13B .518C .16D .14【解析】 出现点数互不相同的共有6×5=30种, 出现一个5点共有5×2=10种, ∴P (B |A )=P AB P A =13.【答案】 A7.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度,如果k >5.024,那么就有把握认为“X 和Y 有关系”的百分比为( )p (χ2>k )0.50 0.40 0.25 0.15 0.10 k 0.455 0.708 1.323 2.072 2.706 p (χ2>k )0.05 0.025 0.010 0.005 0.001 k3.845.0246.6357.87910.83A C .2.5%D .97.5%【解析】 查表可得χ2>5.024.因此有97.5%的把握认为“X 和Y 有关系”. 【答案】 D8.甲、乙两队进行排球决赛,现在的情形是甲队只要再赢一局就获得冠军,乙队需要再赢两局才能获得冠军.若两队每局胜的概率相同,则甲队获得冠军的概率为( )A .12 B .35 C .23D .34【解析】 由题意知,乙队获得冠军的概率为12×12=14,由对立事件概率公式得,甲队获得冠军的概率为P =1-14=34.【答案】 D9.种植两株不同的花卉,若它们的成活率分别为p 和q ,则恰有一株成活的概率为( ) A .p +q -2pq B .p +q -pq C .p +qD .pq【解析】 甲花卉成活而乙花卉不成活的概率为p (1-q ),乙花卉成活而甲花卉不成活的概率为q (1-p ),故恰有一株成活的概率为p (1-q )+q (1-p )=p +q -2qp .【答案】 A10.同时抛掷三颗骰子一次,设A :“三个点数都不相同”,B :“至少有一个6点”,则P (B |A )为( )A .12B .6091C .518D .91216【解析】 P (A )=6×5×46×6×6=120216,P (AB )=3×4×56×6×6=60216,∴P (B |A )=P AB P A =60216×216120=12.【答案】 A11.以下关于线性回归分析的判断,正确的个数是( ) ①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图1中的A ,B ,C 点;③已知直线方程为y =0.50x -0.81,则x =25时,y 的估计值为11.69; ④回归直线方程的意义是它反映了样本整体的变化趋势.图1A .0B .1C .2D .3【解析】 能使所有数据点都在它附近的直线不只一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ,b 得到的直线y =bx +a 才是回归直线,∴①不对;②正确;将x =25代入y =0.50x -0.81,得y =11.69, ∴③正确;④正确,故选D . 【答案】 D12.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关” .嗜酒 不嗜酒 总计 患肝病 700 60 760 未患肝病 200 32 232 总计90092992其中正确命题的个数为( ) A .0 B .1 C .2D .3【解析】 由列联表中数据可求得随机变量χ2=992×700×32-60×2002760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”,因此②③正确.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中的横线上) 13.已知x ,y 的取值如下表:x 2 3 5 6 y2.74.36.16.9则a =________. 【解析】 由题意得x =4,y =5,又(x ,y )在直线y =1.02x +a 上,所以a =5-4×1.02=0.92.【答案】 0.9214.已知P (B |A )=12,P (A )=35,则P (AB )=________.【解析】 由P (B |A )=P ABP A得P (AB )=P (B |A )·P (A )=12×35=310.【答案】31015.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (χ22χ2=50×13×20-10×7223×27×20×30≈4.844,则认为“选修文科与性别有关系”出错的可能性为________.【解析】 χ2≈4.844>3.841,故判断出错的可能性为0.05. 【答案】 0.0516.某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温(℃) 18 13 10 -1 杯数24343864售量为________杯.⎝ ⎛⎭⎪⎪⎫已知回归系数b =∑i =1nx i y i -n x y ∑i =1nx 2i-n x 2,a =y -b x 【解析】 根据表格中的数据可求得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40.∴a =y -b x =40-(-2)×10=60,∴y =-2x +60,当x =-5时,y =-2×(-5)+60=70. 【答案】 70三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)甲袋中有8个白球,4个红球,乙袋中有6个白球,6个红球.从每袋中任取1个球,试问:取得同色球的概率是多少?【解】 设从甲袋中任取1个球,事件A :“取得白球”,由此事件A :“取得红球”,从乙袋中任取1个球,事件B :“取得白球”,由此事件B :“取得红球”,则P (A )=23,P (A )=13,P (B )=12,P (B )=12.因为A 与B 相互独立,A 与B 相互独立, 所以从每袋中任取1个球,取得同色球的概率为P (AB +A B )=P (AB )+P (A B )=P (A )P (B )+P (A )P (B )=23×12+13×12=12.18.(本小题满分12分)吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:男 女 总计 喜欢吃零食 5 12 17 不喜欢吃零食40 28 68 总计454085请问喜欢吃零食与性别是否有关? 【解】 χ2=n ad -bc 2a +bc +d a +cb +d,把相关数据代入公式,得 χ2=85×5×28-40×12217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 19.(本小题满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图2:图2将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷 总计 男 女总计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,P (χ2≥k )0.05 0.01 k3.8416.635【解】 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下:非体育迷 体育迷 总计 男 30 15 45 女 45 10 55 合计7525100将2×2列联表中的数据代入公式计算,得χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=100×30×10-45×15275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2 人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P (A )=710.20.(本小题满分12分)1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放入2号箱,然后从2号箱随机取出一球,问:(1)从1号箱中取出的是红球的条件下,从2号箱取出红球的概率是多少? (2)从2号箱取出红球的概率是多少?【解】 记事件A :最后从2号箱中取出的是红球; 事件B :从1号箱中取出的是红球.P (B )=42+4=23.P (B )=1-P (B )=13.(1)P (A |B )=3+18+1=49.(2)∵ P (A |B )=38+1=13,∴P (A )=P (A ∩B )+P (A ∩B ) =P (A |B )P (B )+P (A |B )P (B ) =49×23+13×13=1127. 21.(本小题满分12分)在一个文娱网络中,点击观看某个节目的累计人次和播放天数如下数据:播放 天数 12345678910点击观看的累计人次51 134 213 235 262 294 330 378 457 533(2)判断两变量之间是否有线性相关关系,求线性回归方程是否有意义? (3)求线性回归方程;(4)当播放天数为11天时,估计累计人次为多少? 【解】 (1)散点图如下图所示:(2)由散点图知:两变量线性相关,求线性回归方程有意义.借助科学计算器,完成下表:i 1 2 3 4 5 6 7 8 9 10 x i 1 2 3 4 5 6 7 8 9 10 y i 51 134 213 235 262294330378457533x i y i512686399401 310 1 7642 3103 024 4 1135 330x =5.5,y =288.7,r =∑i =110x i y i -10x y∑i =110x 2i -10x2∑i =110y 2i -10y 2=19 749-10×5.5×288.7385-10×5.52× 1 020 953-10×288.72≈0.984.这说明累计人次与播放天数之间存在着较强的线性相关关系,所以求线性回归方程有实际意义.(3)b =∑i =110x i y i -10x y∑i =110x 2i -10x 2=19 749-10×5.5×288.7385-10×5.52≈46.9, a =y -b x ≈288.7-46.9×5.5≈30.8,因此所求的线性回归方程是y =30.8+46.9x .(4)当x =11时,y 的估计值是46.9×11+30.8≈547. 因此,当播放天数为11天时,估计累计人次为547.22.(本小题满分12分)(2016·济南模拟)为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入(单位:百元)的频数分布及对楼市限购令的赞成人数如下表:族”.(1)根据已知条件完成下面的2×2列联表,有多大的把握认为赞不赞成楼市限购令与收入高低有关?已知:χ2=n ad-bc2a+b c+d a+c b+d,当χ2<2.706时,没有充分的证据判定赞不赞成楼市限购令与收入高低有关;当χ2>2.706时,有90%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>3.841时,有95%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>6.635时,有99%的把握判定赞不赞成楼市限购令与收入高低有关.非高收入族高收入族总计赞成不赞成总计(2)限购令的概率.【解】(1)非高收入族高收入族总计赞成25328不赞成15722总计401050χ2=40×10×22×28≈3.43,故有90%的把握认为楼市限购令与收入高低有关.(2)设月收入在[55,65)的5人的编号为a,b,c,d,e,其中a,b为赞成楼市限购令的人,从5人中抽取两人的方法数有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10种,其中ab,ac,ad,ae,bc,bd,be为所求事件数,因此所求概率P=710.。
2016-2017学年高二数学北师大版选修1-2练习:第一章 统计案例 2 Word版含解析
答案 0.01 解析 因为 χ2>6.635,我们有 99%的把握认为两个研究对象Ⅰ和Ⅱ有关,所以我们为“两 个研究对象Ⅰ和Ⅱ无关”的可信程度是 0.01.
9.下列说法正确的是________.(填序号)
①对事件 A 与 B 的检验无关,即两个事件互不影响; ②事件 A 与 B 关系越密切,χ2 就越大;
③χ2 的大小是判断事件 A 与 B 是否相关的唯一数据; ④若判定两事件 A 与 B 有关,则 A 发生 B 一定发生.
答案 ② 解析 对于①,事件 A 与 B 的检验无关,只是说两事件的相关性较小,并不一定两事件互 不影响,故①错.②是正确的.对于③,判断 A 与 B 是否相关的方式很多,可以用列联表, 也可以借助于概率运算,故③错.对于④,两事件 A 与 B 有关,说明两者同时发生的可能 性相对来说较大,但并不是 A 发生 B 一定发生,故④错.
χ2= 86 × 103 × 95 × 94 ≈38.459. ∵38.459>6.635,∴有 99%的把握说,学生学习数学的兴趣与数学成绩是有关的.
[呈重点、现规律] 1.独立性检验的思想:先假设两个事件无关,计算统计量 χ2 的值.若 χ2 值较大,则拒绝 假设,认为两个事件有关. 2.独立性检验的步骤: ①画列联表; ②计算 χ2; ③将得到的 χ2 值和临界值比较,下结论.
其中,a 表示变量 A 取 A1,且变量 B 取 B1 时的数据,b 表示变量 A 取 A1,且变量 B 取 B2 时的数据;c 表示变量 A 取 A2,且变量 B 取 B1 时的数据;d 表示变量 A 取 A2,且变量 B 取 B2 时的数据.上表在统计中称为 2×2 列联表. 2.统计量 χ2
nad-bc2 χ2=a+bc+da+cb+d. 3.独立性检验 当 χ2≤2.706 时,没有充分的证据判定变量 A,B 有关联; 当 χ2>2.706 时,有 90%的把握判定变量 A,B 有关联; 当 χ2>3.841 时,有 95%的把握判定变量 A,B 有关联; 当 χ2>6.635 时,有 99%的把握判定变量 A,B 有关联.
2016-2017学年高中数学 第一章 统计案例单元测试(含解析)北师大版选修1-2
(一) 统计案例章末综合测评(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.在下列各量与量的关系中是相关关系的为( )①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电费之间的关系.A .①②③B .③④C .④⑤D .②③④【解析】 ①⑤是一种确定性关系,属于函数关系.②③④为相关关系. 【答案】 D2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y =2.347x -6.423; ② y 与x 负相关且y =-3.476x +5.648; ③y 与x 正相关且y =5.437x +8.493; ④y 与x 正相关且y =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④【解析】 y 与x 正(或负)相关时,线性回归直线方程y =bx +a 中,x 的系数b >0(或b <0),故①④错.【答案】 D3.电视机的使用寿命与显像管开关的次数有关.某品牌的电视机的显像管开关了10 000次后还能继续使用的概率是0.80,开关了15 000次后还能继续使用的概率是0.60,则已经开关了10 000次的电视机显像管还能继续使用到15 000次的概率是( )A .0.75B .0.60C .0.48D .0.20【解析】 记“开关了10 000次后还能继续使用”为事件A ,记“开关了15 000次后还能继续使用 ”为事件B ,根据题意,易得P (A )=0.80,P (B )=0.60,则P (AB )=0.60,由条件概率的计算方法,可得P (B |A )=P AB P A =0.600.80=0.75.【答案】 A4.一位母亲记录了她儿子3岁到9岁的身高,建立了她儿子身高与年龄的回归模型y =73.93+7.19x ,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是( )A .她儿子10岁时的身高一定是145.83 cmB .她儿子10岁时的身高一定是145.83 cm 以上C .她儿子10岁时的身高在145.83 cm 左右D .她儿子10岁时的身高一定是145.83 cm 以下【解析】 由回归模型得到的预测值是可能取值的平均值,而不是精确值,故选C . 【答案】 C5.(2016·咸阳高二检测)已知一个线性回归方程为y =1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( )A .58.5B .46.5C .60D .75【解析】 ∵x =15(1+7+5+13+19)=9,回归直线过样本点的中心(x -,y -),∴y -=1.5×9+45=58.5. 【答案】 A6.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则P (B |A )=( )A .13B .518C .16D .14【解析】 出现点数互不相同的共有6×5=30种, 出现一个5点共有5×2=10种, ∴P (B |A )=P AB P A =13.【答案】 A7.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度,如果k >5.024,那么就有把握认为“X 和Y 有关系”的百分比为( )A .C .2.5%D .97.5%【解析】 查表可得χ2>5.024.因此有97.5%的把握认为“X 和Y 有关系”. 【答案】 D8.甲、乙两队进行排球决赛,现在的情形是甲队只要再赢一局就获得冠军,乙队需要再赢两局才能获得冠军.若两队每局胜的概率相同,则甲队获得冠军的概率为( )A .12B .35C .23D .34【解析】 由题意知,乙队获得冠军的概率为12×12=14,由对立事件概率公式得,甲队获得冠军的概率为P =1-14=34.【答案】 D9.种植两株不同的花卉,若它们的成活率分别为p 和q ,则恰有一株成活的概率为( ) A .p +q -2pq B .p +q -pq C .p +qD .pq【解析】 甲花卉成活而乙花卉不成活的概率为p (1-q ),乙花卉成活而甲花卉不成活的概率为q (1-p ),故恰有一株成活的概率为p (1-q )+q (1-p )=p +q -2qp .【答案】 A10.同时抛掷三颗骰子一次,设A :“三个点数都不相同”,B :“至少有一个6点”,则P (B |A )为( )A .12B .6091C .518D .91216【解析】 P (A )=6×5×46×6×6=120216,P (AB )=3×4×56×6×6=60216,∴P (B |A )=P AB P A =60216×216120=12.【答案】 A11.以下关于线性回归分析的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图1中的A,B,C 点;③已知直线方程为y=0.50x-0.81,则x=25时,y的估计值为11.69;④回归直线方程的意义是它反映了样本整体的变化趋势.图1A.0 B.1C.2 D.3【解析】能使所有数据点都在它附近的直线不只一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线y=bx+a才是回归直线,∴①不对;②正确;将x=25代入y=0.50x-0.81,得y=11.69,∴③正确;④正确,故选D.【答案】 D12.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关” .A.0 B.1C.2 D.3【解析】由列联表中数据可求得随机变量χ2=-2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”,因此②③正确.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中的横线上) 13.已知x ,y 的取值如下表:则a =________. 【解析】 由题意得x =4,y =5,又(x ,y )在直线y =1.02x +a 上,所以a =5-4×1.02=0.92.【答案】 0.9214.已知P (B |A )=12,P (A )=35,则P (AB )=________.【解析】 由P (B |A )=P ABP A得P (AB )=P (B |A )·P (A )=12×35=310.【答案】31015.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (χ2χ2=-223×27×20×30≈4.844,则认为“选修文科与性别有关系”出错的可能性为________.【解析】 χ2≈4.844>3.841,故判断出错的可能性为0.05. 【答案】 0.0516.某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:售量为________杯.⎝ ⎛⎭⎪⎪⎫已知回归系数b =∑i =1nx i y i -n x y ∑i =1nx 2i-n x 2,a =y -b x 【解析】 根据表格中的数据可求得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40.∴a =y -b x =40-(-2)×10=60,∴y =-2x +60,当x =-5时,y =-2×(-5)+60=70. 【答案】 70三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)甲袋中有8个白球,4个红球,乙袋中有6个白球,6个红球.从每袋中任取1个球,试问:取得同色球的概率是多少?【解】 设从甲袋中任取1个球,事件A :“取得白球”,由此事件A :“取得红球”,从乙袋中任取1个球,事件B :“取得白球”,由此事件B :“取得红球”,则P (A )=23,P (A )=13,P (B )=12,P (B )=12.因为A 与B 相互独立,A 与B 相互独立, 所以从每袋中任取1个球,取得同色球的概率为P (AB +A B )=P (AB )+P (A B )=P (A )P (B )+P (A )P (B )=23×12+13×12=12.18.(本小题满分12分)吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:【解】 χ2=n ad -bc 2a +bc +d a +cb +d,把相关数据代入公式,得 χ2=-217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 19.(本小题满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图2:图2将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,【解】 (1)25人,从而完成2×2列联表如下:将2×2χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=-275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2 人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P (A )=710.20.(本小题满分12分)1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放入2号箱,然后从2号箱随机取出一球,问:(1)从1号箱中取出的是红球的条件下,从2号箱取出红球的概率是多少? (2)从2号箱取出红球的概率是多少?【解】 记事件A :最后从2号箱中取出的是红球; 事件B :从1号箱中取出的是红球.P (B )=42+4=23. P (B )=1-P (B )=13.(1)P (A |B )=3+18+1=49.(2)∵ P (A |B )=38+1=13,∴P (A )=P (A ∩B )+P (A ∩B ) =P (A |B )P (B )+P (A |B )P (B ) =49×23+13×13=1127. 21.(本小题满分12分)在一个文娱网络中,点击观看某个节目的累计人次和播放天数如下数据:(2)判断两变量之间是否有线性相关关系,求线性回归方程是否有意义?(3)求线性回归方程;(4)当播放天数为11天时,估计累计人次为多少? 【解】 (1)散点图如下图所示:(2)由散点图知:两变量线性相关,求线性回归方程有意义.借助科学计算器,完成下表:r =∑i =110x i y i -10x y∑i =110x 2i -10x2∑i =110y 2i -10y 2=19 749-10×5.5×288.7385-10×5.52× 1 020 953-10×288.72≈0.984.这说明累计人次与播放天数之间存在着较强的线性相关关系,所以求线性回归方程有实际意义.(3)b =∑i =110x i y i -10x y∑i =110x 2i -10x 2=19 749-10×5.5×288.7385-10×5.52≈46.9, a =y -b x ≈288.7-46.9×5.5≈30.8,因此所求的线性回归方程是y =30.8+46.9x .(4)当x=11时,y的估计值是46.9×11+30.8≈547.因此,当播放天数为11天时,估计累计人次为547.22.(本小题满分12分)(2016·济南模拟)为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入(单位:百元)的频数分布及对楼市限购令的赞成人数如下表:(1)根据已知条件完成下面的2×2列联表,有多大的把握认为赞不赞成楼市限购令与收入高低有关?已知:χ2=n ad-bc2a +b c+d a+c b+d,当χ2<2.706时,没有充分的证据判定赞不赞成楼市限购令与收入高低有关;当χ2>2.706时,有90%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>3.841时,有95%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>6.635时,有99%的把握判定赞不赞成楼市限购令与收入高低有关.(2)限购令的概率.【解】(1)χ2=40×10×22×28≈3.43,故有90%的把握认为楼市限购令与收入高低有关.(2)设月收入在[55,65)的5人的编号为a,b,c,d,e,其中a,b为赞成楼市限购令的人,从5人中抽取两人的方法数有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10种,其中ab,ac,ad,ae,bc,bd,be为所求事件数,因此所求概率P=710.。
创新设计高考数学北师大理科一轮复习练习:第章 统计与统计案例 第讲 含答案
基础巩固题组(建议用时:40分钟)一、选择题1.(2016·湖北七市(州)联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直y=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为3.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系太弱,无研究价值解析依题意,注意到题中的相关的点均集中在某条直线的附近,且该直线的斜率小于1,结合各选项知选B.答案 B2.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A.直线l过点(,x y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析由样本的中心(,x y)落在回归直线上可知A正确;x和y的相关系数表示x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,故D错.答案 A3.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是() A.y=-10x+200B.y=10x+200C.y=-10x-200D.y=10x-200解析由题意知回归方程斜率应为负,故排除B,D,又销售量应为正值,故C不正确,故选A.答案 A4.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:由表中数据,72 km 处气温的度数为()A.-10B.-8C.-4D.-6解析由表中数据可得x=18+13+10-14=10,y=24+34+38+644=40,所以中心点(10,40)在线性回归直线y=-2x+a上,所以40=-20+a,解得a=60,所以线性回归方程为y=-2x+60,当y=72时,x=-6,故选D.答案 D5.(2016·郑州质量预测)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:若由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得χ2=110×(40×30-20×20)260×50×60×50≈7.8.参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 解析 依题意,因为χ2=7.8>6.635,因此有99%以上的把握认为“爱好该项运动与性别有关”,故选A. 答案 A 二、填空题6.已知回归方程y =4.4x +838.19,则可估计x 与y 的增长速度之比约为________. 解析 x 每增长1个单位,y 增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.事实上所求的比值为回归直线方程斜率的倒数. 答案 5∶227.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是________(填序号).①列联表中c 的值为30,b 的值为35; ②列联表中c 的值为15,b 的值为50;③根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”;④根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”.解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,①、②错误. 根据列联表中的数据,得到χ2=105×(10×30-20×45)255×50×30×75≈6.6>3.841,因此有95%的把握认为“成绩与班级有关系”. 答案 ③8.已知x ,y 之间的一组数据如下表:对于表中数据,现给出如下拟合直线:①y =x +1;②y =2x -1;③y =85x -25;④y =32x .则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).解析 由题意知x =4,y =6,∴b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=85,∴a =y -b x =-25,∴y =85x -25,∴填③. 答案 ③ 三、解答题9.某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:b =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t -)2,a =y --b t -.解 (1)由所给数据计算得t -=17(1+2+3+4+5+6+7)=4, y -=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b =∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5,a =y -b t =4.3-0.5×4=2.3, 所求回归方程为y =0.5t +2.3.(2)由(1)知,b =0.5>0,故2007至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y =0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.10.(2016·深圳调研)某企业通过调查问卷(满分50分)的形式对本企业900名员工的工作满意度进行调查,并随机抽取了其中30名员工(16名女员工,14名男员工)的得分,如下表:(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满意”,否则为“不满意”,请完成下列表格:(3)的把握,认为该企业员工“性别”与“工作是否满意”有关? 解 (1)从表中可知,30名员工中有8名得分大于45分,所以任选一名员工,他(她)的得分大于45分的概率是830=415,所以估计此次调查中,该单位约有900×415=240名员工的得分大于45分. (2)由题意可得下列表格:(3)假设H 0根据表中数据,求得χ2=30×(12×11-3×4)215×15×16×14≈8.571>6.635,∴能有99%的把握认为“性别”与“工作是否满意”有关.能力提升题组 (建议用时:20分钟)11.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y =3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③回归方程y =bx +a 必过(x ,y );④有一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系. 其中错误的个数是( ) A .0 B .1 C .2D .3解析 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y =3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y =bx +a 必过点(x ,y ),③正确;因为χ2=13.079>6.635,故有99%的把握确认这两个变量有关系,④正确.故选B. 答案 B12.已知x 与y 之间的几组数据如下表:前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b>b′,a>a′B.b>b′,a<a′C.b<b′,a>a′D.b<b′,a<a′解析由题意,可知b′=2,a′=-2,b=∑i=16x i y i-6x y∑i=16x2i-6x2=57.a=y-b x=136-57×72=-13,∴b<b′,a>a′,选C.答案 C13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918.对此,四名同学得出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,真命题的序号是________.①p且綈q;②綈p且q;③(綈p且綈q)且(r或s);④(p或綈r)且(綈q或s).解析∵χ2≈3.918>3.841,∴有95%的把握认为“这种血清能起到预防感冒的作用”,即命题p正确,命题q,r,s均不正确.对①②③④依次进行判断,可知①④正确.答案①④14.某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.解(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075 每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得χ2=75×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.。
新北师大版高中数学选修1-2第一章《统计案例》测试题(包含答案解析)(3)
一、选择题1.从一口袋中有放回地每次摸出1个球,摸出一个白球的概率为0.4,摸出一个黑球的概率为0.5,若摸球3次,则恰好有2次摸出白球的概率为 A .0.24B .0.26C .0.288D .0.2922.从1,2,3,4,5中不放回地依次选取2个数,记事件A =“第一次取到的是奇数”,事件B =“第二次取到的是奇数”,则(|)P B A =( ) A .12B .25C .310D .153.从345678910,1112,,,,,,,,中不放回地依次取2个数,事件A = “第一次取到的数可以被3整除”,B = “第二次取到的数可以被3整除”,则()P B|?A =( ) A .59B .23C .13D .294.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( ) A .35B .14C .12D .135.下面是22⨯列联表:则表中a b ,的值分别为( ) A .84,60 B .42,64C .42, 74D .74, 426.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .407.已知()112P A =,()136P AB =,()512P B =,则()P B A 为( ) A .12 B .13C .115D .158.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.7567.3ˆ25yx =-+. ②y 与x 负相关且 3.47654ˆ.68y x =+ ③y 与x 正相关且 1.226 6.5ˆ78yx =-- ④y 与x 正相关且8.96786ˆ.13y x =+ 其中一定不正确的结论的序号是( ) A .①②B .②③C .③④D .①④9.两个变量y 与x 的回归模型中,分别选择了4个不同模型,对于样本点()11,x y ,()22,x y ,…,(),n n x y ,可以用()()22121ˆ1ni i i n ii y yR y y ==-=--∑∑来刻画回归的效果,已知模型1中20.96R =,模型2中23{5x yy x -==-,模型3中20.55R =,模型4中20.41R =,其中拟合效果最好的模型是( ) A .模型1B .模型2C .模型3D .模型410.袋中有6个黄色、4个白色的乒乓球,做不放回抽样,每次任取1个球,取2次,则关于事件“直到第二次才取到黄色球”与事件“第一次取到白球的情况下,第二次恰好取得黄球”的概率说法正确的是( )A .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于23 B .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于415C .事件“直到第二次才取到黄色球”的概率等于23,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于415D .事件“直到第二次才取到黄色球”的概率等于415,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于2311.通过随机询问72名不同性别的学生在购买食物时是否看营养说明,得到如下列联表:参考公式:22()()()()()n ad bc K a b c d a c b d -=++++则根据以上数据:A .能够以99.5%的把握认为性别与读营养说明之间无关系;B .能够以99.9%的把握认为性别与读营养说明之间无关系;C .能够以99.5%的把握认为性别与读营养说明之间有关系;D .能够以99.9%的把握认为性别与读营养说明之间有关系; 12.下面给出四种说法:①用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好; ②命题P :“∃x 0∈R ,x 02﹣x 0﹣1>0”的否定是¬P :“∀x ∈R ,x 2﹣x ﹣1≤0”; ③设随机变量X 服从正态分布N (0,1),若P (x >1)=p 则P (﹣1<X <0)=12﹣p ④回归直线一定过样本点的中心(,x y ). 其中正确的说法有( ) A .①②③B .①②④C .②③④D .①②③④二、填空题13.机动车驾驶的考核过程中,科目三又称道路安全驾驶考试,是机动车驾驶人考试中道路驾驶技能和安全文明驾驶常识考试科目的简称假设某人每次通过科目三的概率均为45,且每次考试相互独立,则至多考两次就通过科目三的概率为__________. 14.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.15.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是13,那么该生在上学路上到第3个路口首次遇到红灯的概率为__________.16.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cossinxyθθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y+=;③极坐标系中,22,3Aπ⎛⎫⎪⎝⎭与()3,0B的距离是19;④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.17.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bca b c d a c b d-++++.)18.已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.19.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++20.若10件产品包含2件次品,今在其中任取两件,已知两件中有一件不是废品的条件下,另一件是废品的概率为__________.三、解答题21.在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:(1)依据表中给出的数据,是否可用线性回归模型拟合y 与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r >,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()nnii i itt y y t yntyr ---=∑∑,7.547≈,5185.2i i i t y ==∑,()52122.78ii yy =-=∑.22.某医院治疗白血病有甲、乙两套方案,现就70名患者治疗后复发的情况进行了统计,得到其等高条形图如图所示(其中采用甲、乙两种治疗方案的患者人数之比为5:2).(1)补充完整22⨯列联表中的数据,并判断是否有99%把握认为甲乙两套治疗方案对患者白血病复发有影响;复发 未复发 总计甲方案乙方案 2总计70(2)为改进“甲方案”,按分层抽样组成了由5名患者构成的样本,求随机抽取2名患者恰好是复发患者和未复发患者各1名的概率. 附:20()P K k 0.05 0.01 0.005 0.001 0k 3.8416.6357.87910.828n a b c d =+++,22()()()()()n ad bc K a b c d a c b d -=++++.23.在疫情这一特殊时期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后进行了摸底考试,某校数学教师为了调查高三学生这次摸底考试的数学成绩与在线学习数学时长之间的相关关系,对在校高三学生随机抽取45名进行调查.知道其中有25人每天在线学习数学的时长是不超过1小时的,得到了如下的等高条形图:(Ⅰ)是否有99%的把握认为“高三学生的这次摸底考试数学成绩与其在线学习时长有关”;(Ⅱ)将频率视为概率,从全校高三学生这次数学成绩超过120分的学生中随机抽取10人,求抽取的10人中每天在线学习时长超过1小时的人数的数学期望和方差.()20P K k ≥0.050 0.010 0.001 0k 3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++24.某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【创新设计】2016-2017学年高中数学第一章统计案例练习北师
大版选修1-2
1 回归分析题目击破
一、基本概念
函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
例1 下列变量之间的关系是相关关系的是________.
(1)正方形的边长与面积之间的关系;
(2)水稻产量与施肥量之间的关系;
(3)人的身高与年龄之间的关系;
(4)降雪量与交通事故发生率之间的关系.
分析两变量之间的关系有两种:函数关系和带有随机性的相关关系.
解析(1)是函数关系;(2)不是严格的函数关系,但是具有相关性,因而是相关关系;(3)既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;(4)降雪量与交通事故发生率之间具有相关关系.
答案(2)(4)
点评该例主要考查对变量相关关系概念的掌握.
二、线性回归方程
设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫作回归直线.
例2
使用年限x 2345 6
维修费用y 2.2 3.8 5.5 6.57.0
若由资料知y对x呈线性相关关系,试求:
(1)回归方程y=a+bx;
(2)估计使用年限10年时,维修费用是多少?
分析 因为y 对x 呈线性相关关系,所以可以用线性相关的方法解决问题.
于是有b =90-5×4
2
=1.23, a =y -b x =5-1.23×4=0.08.
∴回归方程为y =1.23x +0.08.
(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用约是12.38万元.
点评 已知y 对x 呈线性相关关系,无须进行相关性检验,否则,应首先进行相关性检验. 三、非线性回归问题
分析非线性回归问题的具体做法是:
(1)若问题中已给出经验公式,这时可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.
(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法.
例3 某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均
(1)设y 与x 之间具有近似关系y ≈ax b
(a ,b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产值(精确到0.01).
解 (1)在y ≈ax b
的两边取常用对数,可得lg y ≈lg a +b lg x ,设lg y =z ,lg a =A ,lg
x =X ,则z ≈A +bX .
由公式(1)可得⎩
⎪⎨
⎪⎧A =-0.215 5,
b =1.567 7,
由lg a =-0.215 5, 得a ≈0.608 8,
即a ,b 的估计值分别为0.608 8和1.567 7. (2)由(1)知y =0.608 8x
1.567 7
.
样本数据及回归曲线的图形如图所示.
当x=16时,y=0.608 8×161.567 7≈47.01(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.
2 巧解非线性回归问题
如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想.
一、案例分析
温度x/℃2345678
某项指标y 5.790 6.8108.19910.00112.19014.79017.801 试建立某项指标y关于温度x的回归模型,并判断你所建立的回归模型的拟合效果.
分析根据表中的数据画出散点图,再由图设出相应的回归模型.
解
画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y=Bx2+A的周围.
令X=x2,则变换后的样本点应该分布在y=bX+a(b=B,a=A)的周围.
X 491625364964
计算得到线性回归方程为y =0.199 94X +4.999 03.
用x 2
替换X ,得某项指标y 关于温度x 的回归方程y =0.199 94x 2
+4.999 03. 计算得r ≈0.999 997,几乎为1,说明回归模型的拟合效果非常好.
点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图像相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 二、知识拓展
常见的非线性函数转换方法:
(1)幂型函数y =ax m
(a 为正数,x ,y 取正值)
解决方案:对y =ax m 两边取常用对数,有lg y =lg a +m lg x ,令u =lg y ,v =lg x ,则原式可变为u =mv +lg a ,其中m ,lg a 为常数,该式表示u ,v 的线性函数. (2)指数型函数y =c ·a x (a ,c >0,且a ≠1)
解决方案:对y =ca x
两边取常用对数,则有lg y =lg c +x lg a ,令u =lg y ,则原式可变为u =x lg a +lg c ,其中lg a 和lg c 为常数,该式表示u ,x 的线性函数.与幂函数不同的是x 保持不变,用y 的对数lg y 代替了y . (3)反比例函数y =k x
(k >0)
解决方案:令u =1
x
,则y =ku ,该式表示y ,u 的线性函数.
(4)二次函数y =ax 2
+c
解决方案:令u =x 2
,则原函数可变为y =au +c ,该式表示y ,u 的线性函数. (5)对数型函数y =c log a x
解决方案:令x =a u ,则原函数可变为y =cu ,该式表示y ,u 的线性函数.
3 判断两个分类变量的关系
本章的重点是用独立性检验的基本思想对两个分类变量作出明确的判断,下面通过典例剖析如何判断两个分类变量的关系.
例 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
分析 首先由已知条件确定a 、b 、c 、d 、n 的数值,再利用公式求出χ2
的值,最后根据χ2
值分析结果.
解 由题目中表的数据可知:
χ2
=n ad -bc 2a +c a +b c +d b +d
=-40×
2
94×95×86×103
≈10.759.
因为10.759>6.635,所以有99%的把握说员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
点评 在列联表中注意事件的对应及有关值的确定,避免混乱;在判断两个分类变量的关系的可靠性时一般利用随机变量来确定;把计算出的χ2
的值与临界值作比较,确定出“A 与
B 有关系”的把握.
4 独立性检验思想的应用
在日常生活中,经常会面临一些需要推断的问题.在对这些问题作出推断时,我们不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验思想做出合理的推断. 所谓独立性检验,就是根据采集样本的数据,利用公式计算χ2
的值,比较与临界值的大小关系来判定事件A 与B 是否有关的问题.其基本步骤如下:
(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量; (2)根据样本数据制作列联表;
(3)计算统计量χ2
,并查表分析.当χ2
很大时,就认为两个变量有关系;否则就认为没有
充分的证据显示两个变量有关系.
下面举例说明独立性检验思想在解决实际问题中的应用.
例为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,统计结果为:患慢性气管炎共有56人,患慢性气管炎且吸烟的有43人,未患慢性气管炎但吸烟的有162人.根据调查统计结果,分析患慢性气管炎与吸烟在多大程度上有关系?
解
由列联表可以粗略估计出:有吸烟者中,有20.98%的患慢性气管炎;在不吸烟者中,有9.70%的患慢性气管炎.两个比例的值相差较大,所以结论“患慢性气管炎与吸烟有关”成立的可能性较大.
根据列联表中的数据,得到
χ2=
-2
56×283×205×134
≈7.469>6.635.
所以有99%的把握认为“患慢性气管炎与吸烟有关”.
点评通过计算检验随机变量χ2,可以比较精确地给出这种判断的可靠程度.先收集数据,然后通过一些统计方法对数据进行科学的分析,这是我们用统计方法解决实际问题的基本策略.。