2014-2015学年高中数学 第3章 相关系数同步练习 北师大版选修2-3
高中数学北师大版选修2-3同步训练:(12)回归分析
(12)回归分析1、已知某产品的销售额y 与广告费用x 之间的关系如表所示:若求得其线性回归方程为 6.5y x a =+,则预计广告费用为6万元时,销售额为( ) A.42万元B.45万元C.48万元D.51万元2、若实数,x y 的取值如表,从散点图分析,y 与x 线性相关,且回归方程为 3.5 1.3y x =-,则m =( )A.15B.16C.16.2D.173、已知下表所示数据的回归直线方程为44y x =-,则实数a 的值为( ) x 2 3 4 5 6 y 3711a 21A. 16B. 18C. 20D. 224、若回归直线的方程为 1.52ˆyx =-+,则变量x 增加一个单位时 ( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位D.y 平均减少2个单位5、已知x 与y 之间的一组数据如下表:则y 与x 的线性回归方程为y bx a =+必过点( )A.(2,2)B.(1,2)C.(1.5,0)D.(1.5,4)6、已知回归直线斜率的估计值为2.1,样本点的中心为()3,4,则回归直线方程为( ) A. 2.1 5.4y x =-B. 2.1 2.3y x =-C. 2.1 2.3y x =+D. 2.3 2.1y x =-7、对具有线性相关关系的变量,x y ,测得一组数据如下表: x24568x 0 1 2 3 y1357根据上表,利用最小二乘法得它们的回归方程为10.5y x a =+,据此模型来预测当20x =时,y 的估计值为( ) A.210B.210.5C.211D.211.58、设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(,)(1,2,,),i i x y i n =⋅⋅⋅,用最小二乘法建立的回归方程为0.8585.71,y x =-,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(,)x yC.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 9、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )A. 63.6万元B. 65.5万元C. 67.7万元D. 72.0万元10、某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:4℃时,用电量的千瓦时数约为( )A .72B .70C .68D .6611、某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm ,170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm .12、若回归直线方程的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是_____________.x (厘米)和体重y (公斤)数据如下表:8,则表格中空白处的值为__________ 14、某工厂对新研发的一种产品进行试销,得到如下数据表: 已知销量y 与单价x 具有线性相关关系,该工厂每件产品的成本为5.5元,请你利用所求的线性相关关系预测:要使得利润最大,单价应该定为_____________元. 附:线性回归方程ybx a =+中斜率和截距的最小二乘估计计算公式:121()()()niii nii x x yy b x x ==--=-∑∑,a y bx =-15、某城市理论预测2017年到2021年人口总数(单位:十万)与年份的关系如下表所示:(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程ˆˆˆybx a =+; (2)据此估计2022年该城市人口总数.附: 1221ˆni i i n ii x y nx y bx nx==-=-∑∑, ˆˆay bx =-. 参考数据: 051728311419132⨯+⨯+⨯+⨯+⨯=,222220123430++++=.答案以及解析1答案及解析: 答案:C解析: 由题意得,0123425x ++++==,1015203035225y ++++==,将(),x y 代入线性回归方程 6.5y x a =+中,得9a =,即线性回归方程为 6.59y x =+.当6x =时,48y =.故选C.2答案及解析: 答案:D解析:由表格中的数据可得1234535x ++++==,278122555m m y +++++==, 由于回归直线过点(),x y ,所以,353.53 1.35m +⨯-=,解得17m =,故选:D.3答案及解析: 答案:B 解析:4答案及解析: 答案:C解析:由回归方程2 1.5ˆyx =-知,x 与y 负相关,即x 增加一个单位,y 平均减少1.5个单位.5答案及解析: 答案:D 解析:6答案及解析: 答案:B 解析:7答案及解析: 答案:D 解析:8答案及解析: 答案:D解析:由线性回归方程0.8585.71y x =-知,0.850,k =>所以y 与x 具有正的线性相关关系的,故选项A 正确;由回归直线方程恒过样本点的中心(,)x y 知,选项B 正确;若该大学某女生身高增加1cm ,则由0.8585.71y x =-知其体重约增加0.85kg ,因此C 选项正确;若该大学某女生身高为170cm ,则可预测或估计其体重为58.79kg ,并不一定为58.79kg ,因此选项D 不正确.故答案为D.9答案及解析: 答案:B解析:由表可计算4235742x +++==, 49263954424y +++==,∵点7,422⎛⎫ ⎪⎝⎭在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4, 所以7429.4ˆ2a =⨯+, 解得ˆ9.1a=, 故回归方程为9.4.1ˆ9y x =+, 令6x =,得ˆ65.5y=。
《相关系数》(北师大版 选修2-3)
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
当堂检测
3.在回归分析中,相关系数|r|越大,则误差Q(a,b)应( A ) A.越小 B.越大 C.可能大也可能小 D.以上都不对 4.两个变量满足如下表的关系:
由表可知:
2 2 x 1 00 , y i i 75 , xi yi 0 ,
n
n
n
i 1
i 1
i ቤተ መጻሕፍቲ ባይዱ1
x 0 ,y 2.71,则可得
r 0 7 0 2.71 100 7 0 2 75 7 2.712 0
你发现什么了?? r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没有意义的。
=1 i=1
6
6
6
=1
2 =79,
∑
6
=1
2 =30
268, ∑ x iyi =1
=1
6
∴r=
=1
∑
6
-6
2 2 ∑ 2-6 6
=1 6
∑ 2- 6
6
=
1 481 -6×3.5×71 79-6×3 .52×
30 268 -6×71 2
≈-0. 91,
=1
∴y 与 x 具有较高的相关程度. ∴
b= =1 6
自主学习
活动:请阅读课本P76-P77“思考交流”之前的内容, 思考下列问题: 1、相关系数r的计算公式是什么? 2、说出相关系数r的取值范围。 3、相关系数与线性相关的程度有怎样的关系? 4、根据相关系数r的范围,线性相关可以分为几类?
点拨精讲
北师大版高中数学选修2-3二项式系数的性质同步练习.docx
二项式系数的性质 同步练习【选择题】1、已知C 71+n - C 7n = C 8n ,那么n 等于 ( )A 、14B 、12C 、13D 、152、C 0n +3C 1n + 9C 2n …+3n C nn 的值等于 ( )A 、4nB 、3·4nC 、34n -1D 、314-n3、C 111+ C 311+…+C 911的值为 ( )A 、2048B 、1024C 、1023D 、512 4、(X+1)(2X+1)(3X+1)……(nX+1)展开式中X 的一次项系数为 ( )A 、C 1-n nB 、C 2n C 、C 21+nD 、不能用组合数表示5、设(1+X+X 2)n = a 0+ a 1X+ a 2X 2+…a n 2X 2n ,则a 0+ a 1+ a 2+…a n 2等于 ( ) A 、2n2 B 、3nC 、213-nD 、213+n6、若n 是正奇数,则7n + C 1n 71-n + C 2n 72-n +…C 1-n n 7被9除的余数为 ( )A 、2B 、5C 、7D 、8 7、(1+X )2+(1+X )3+…+(1+X )10展开式中X 4 的系数为 ( )A 、C 511B 、C 411 C 、C 510D 、C 410【填空题】 8、(a+b )n 展开式中第r 项为 。
9、0.955 精确到0.01的近似值为 。
10、11100-1的末位连续零的个数为 。
11、(2X+3Y )28展开式中系数最大的项是第 项。
【解答题】 12、已知(X X +31X)n 展开式中前三项的二项式系数和为37,求X 的整数次幕的项.13、利用二项式定理证明:)2(231+>-n n n (n ∈N +,n >2)14、在二项式(aX m +bX n )12 (a >0,b >0,m 、n ≠0) 中2m +n =0,如果它的展开式中系数最大的项恰为常数项。
北师大版高中数学选修2-3相关系数同步练习.docx
高中数学学习材料唐玲出品相关系数同步练习【选择题】1、对于回归分析,下列说法错误的是()A、变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B、线性相关系数可以是正的或负的C、回归分析中,如果2r=1或r=±1,说明x与y之间完全线性相关D、样本相关系数r∈(-1,+1)2、下列说法中正确的是()A、任何两个变量都具有相关关系B、人的知识与其年龄具有相关关系C、散点图中的各点是分散的,没有规律D、根据散点图求得的回归直线方程都是有意义的3、下列两变量具有相关关系的是()A、正方体的体积与边长B、人的身高与体重C、匀速行驶车辆的行驶距离与时间D、球的半径与体积4、对于线性相关系数r,下列说法正确的是()A、)r,||r越大,相关程度越大;反之,相关程度越小∈|+∞|,0(B 、),(+∞-∞∈r ,r 越大,相关程度越大;反之,相关程度越小C 、||r ≤1,且||r 越接近于1,相关程度越大;||r 越接近于0,相关程度越小D 、以上说法都不正确5、线性回归方程ˆy=b x +a 必过( ) A 、(0,0)点 B 、(x ,0)点 C 、(0,y )点 D 、(x ,y )点 【填空题】6、 ________________ 叫做变量y 与x 之间的相关系数。
7、对于回归方程25775.4ˆ+=x y,当x=28时,y 的估计值是________________。
【解答题】8、随机选取15家销售公司,由营业报告中查出其上年度的广告费x(占总费用的百分比)及盈利额y(占销售总额的百分比)列表如下: x 1.5 0.8 2.6 1.0 0.6 2.8 1.2 0.9 y 3.1 1.9 4.2 2.3 1.6 4.9 2.8 2.1 x 0.4 1.3 1.2 2.0 1.6 1.8 2.2 y1.42.42.43.83.03.44.0试根据上述资料: 画出散点图;计算出这两组变量的相关系数;在显著水平0.01的条件下,对变量x 与y 进行相关性检验; 如果变量x 与y 之间具有线性相关关系,求出回归直线方程;已知某销售公司的广告费占其总费用的1.7%,试估计其盈利净额占销售总额的百分比。
最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)
一、选择题1.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.下列说法错误..的是( ) A .10xy ≠是5x ≠或2y ≠的充分不必要条件B .若命题p :x R ∀∈,210x x ++≠,则p ⌝:x R ∃∈,210x x ++=C .已知随机变量()2~2,X N σ,且()40.84P X ≤=,则()00.16P X ≤=D .相关系数r 越接近1,表示线性相关程度越弱. 3.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值4.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 5.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .16.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④7.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个8.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )附:参考公式及数据:(1)统计量:()()()()()22n ad bcKa b c d a c b d-=++++,(n a b c d=+++).(2)独立性检验的临界值表:则下列说法正确的是A.有95%的把握认为环保知识测试成绩与专业有关B.有95%的把握认为环保知识测试成绩与专业无关C.有99%的把握认为环保知识测试成绩与专业有关D.有99%的把握认为环保知识测试成绩与专业无关9.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为()附:()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关10.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .1011.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关 12.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .二、填空题13.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________.14. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 16.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)19.给出下列四个结论:(1)相关系数r的取值范围是1r<;(2)用相关系数r来刻画回归效果,r的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a,得2分的概率为b,不得分的概率为c,且(),,0,1a b c∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:礼让斑马线行人不礼让斑马线行人男性司机人数4015女性司机人数2025若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg合计旧养殖法新养殖法合计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg和不少于50kg的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg的网箱数为X,求X的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++ ()2P K k ≥ 0.1000.050 0.010 0.005 0.001 k 2.706 3.8416.6357.87910.82823.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A 表示事件“微信支付人数低于50千人”,估计A 的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;()()()()()2n ad bc K a b c d a c b d -=++++.24.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .25.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.050.01k 3.841 6.63526.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(Ⅰ)求a 的值;(Ⅱ)记A 表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A 的概率;(Ⅲ)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请在答题卡上将22⨯列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.D解析:D 【分析】A 选项,由“若10xy ≠,则5x ≠或2y ≠”的逆否命题判断充分性,由其否命题判断必要性;由全称命题的否定的概念判断选项B ;由正态分布的性质判断选项C ;由相关系数的概念判断选项D. 【详解】对于选项A,命题“若10xy ≠,则5x ≠或2y ≠”的逆否命题为“若5x =且2x =,则10xy =”,为真命题,而命题“若10xy =,则5x =且2x =”为假命题,所以10xy ≠是5x ≠或2y ≠的充分不必要条件,故A 正确;对于选项B,由全称命题的否定可得p ⌝:x R ∃∈,210x x ++=,故B 正确;对于选项C,由随机变量()2~2,X N σ,且()40.84P X ≤=,则()()()041410.840.16P X P X P X ≤=≥=-≤=-=,故C 正确;对于选项D,相关系数r 越接近1,表示线性相关程度越强,故D 错误, 故选:D 【点睛】本题考查充分不必要条件的判断,考查全称命题的否定,考查正态分布的概率,考查相关系数的概念,熟练掌握各知识点是解题关键.3.B解析:B 【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案. 【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验, 回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析, 综上可知①是独立性检验,②是回归分析,故选B . 【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.4.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.5.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4). 【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.7.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.8.A【解析】分析:首先计算观测值k 0的值,然后给出结论即可. 详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k ⨯⨯-⨯==≈>⨯⨯⨯, 则有95%的把握认为环保知识测试成绩与专业有关. 本题选择A 选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)10.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .11.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .12.A【解析】当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,可知A模拟效果最好.故选A.考点:非线性回归方程的选择.二、填空题13.④【解析】两个变量之间的相关系数r的绝对值越接近于1表示两个变量的线性相关性越强r的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④【解析】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.14.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲. 15.【解析】试题分析:由题意得即样本中心点代入回归直线方程得考点:回归直线方程的应用解析:60【解析】试题分析:由题意得18131011542x++-==,24343864404y+++==,即样本中心点15(,40)2,代入回归直线方程,得15402602ˆˆa a=-⨯+⇒=.考点:回归直线方程的应用.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:%【解析】试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4) 【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r 的取值范围是1r ≤,故(1)错误;(2)用相关指数r 来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210, 白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确; (4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1), ∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203+24b aa b ⋅) =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)直方图见解析,3360元;(2)列联表见解析,没有95%的把握认为网购金额与网购人年龄有关. 【分析】(1)由频数分布表计算出各组数据的纵坐标(频率除以组距),再做出频率分布直方图, 由频率分布直方图估计平均值的定义可得本市居民此期间网络购物的消费平均值; (2) 根据频数分布表中的数据可知网购金额不超过4000元的有700人,超过4000元的有300人,根据分层抽样可得网购金额不超过4000元需要抽取140人,超过4000元的需要抽取60人,再根据列联表的性质即可完成表格,再根据列联表的数据计算出2K 并与给定的参考表对照得到结论. 【详解】(1)由题可知随机对1000人做问卷调查,消费数据的组距为2000, 可求得频率分布直方图纵轴上每组的数据(频率除以组距), 即3000.0001510002000=⨯,4000.000210002000=⨯,1800.0000910002000=⨯,600.0000310002000=⨯,则[]0,2000,(]2000,4000,(]4000,6000,(]6000,8000,(]8000,10000, 对应的的数据(频率除以组距)分别是0.00015,0.0002,0.00009,0.00003,0.00003, 从而得出频率分布直方图,由频率分布直方图估计平均值的定义,可得10000.330000.450000.1870000.0690000.0630012009004205403360x =⨯+⨯+⨯+⨯+⨯=++++=(元),故本市居民此期间网络购物的消费平均值为3360元; (2)由数据可知以网购金额不超过4000元的有2007001401000⨯=(人), 超过4000元的有200300601000⨯=(人),可得列联表.由()()()()220075356525502.3813.8411406010010021n ad bc K a b c d a c b d -⨯⨯-⨯===≈<++++⨯⨯⨯. 故在此期间没有95%的把握认为网购金额与网购人年龄有关. 【点睛】本题第一问考查了平均数的计算、画出频率分布直方图,其中主要是计算出纵坐标的值(频率除以组距)属于常见题型,第二问主要考查完善列联表,2K 的计算,属于中档题目,解题中对计算能力要求较高.22.(1)列联表见解析,有把握;(2)分布列见解析,1.8. 【分析】(1)完成列联表求出2K ,从而有99%的把握认为箱产量与养殖方法有关.(2)推导出X 的可能取值为1,2,3,分别求出相应的概率,由此能求出X 的分布列和数学期望. 【详解】解:(1)依题意,得下表:2200(62603840)9.68 6.63510298100100K ⨯-⨯∴=≈>⨯⨯⨯,即2( 6.635)0.010P K ∴>=所以,有99%的把握认为箱产量与养殖方法有关;(2)按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,分别为2箱和3箱,从中再抽3箱,则1,2,3X =则2123353(1)10C C P X C ===,1223356(2)10C C P X C ===,0323351(3)10C C P X C ===,X 的分布列为所以,1123 1.8101010EX=⨯+⨯+⨯=【点睛】本题考查独立检验的应用,考查离散型随机变量的分布列、数学期望的求法,考查运算求解能力,属于中档题.23.(1)0.62;(2)列联表见解析,有99%的把握认为支付人数与支付方式有关.【分析】(1)由频率分布直方图可得微信支付人数低于50千人的频率;(2)根据频率分布直方图得出<50千人和≥50千人的人数,得列联表,计算出2K,比较后可得结论.【详解】(1)根据题意,由微信支付人数的频率分布直方图可得:()()0.0120.0140.0240.0340.04050.62P A=++++⨯=(2)根据题意,补全列联表可得:则有()22006266383415.705 6.63510010096104K⋅⨯-⨯=≈>⨯⨯⨯,故有99%的把握认为支付人数与支付方式有关.【点睛】本题考查频率分布直方图,考查列联表,独立性检验,计算出2K即得,本题属于基础题.24.(1)见解析;(2)分布列见解析,期望是10 3.【分析】(1)先根据题中数据完成列联表,再进行计算,判断;(2)根据题意得X服从二项分布,进而求解.【详解】(1)由题意得,。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师大版选修2-3我夯基,我达标1.下列结论正确的是( ) ①函数关系是一种确定性关系 ②相关关系是一种非确定性关系③回归分析是具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④ 答案:C2.已知回归直线的斜率的估计值是 1.23,样本的平均值为x =4,y =5,则回归直线的方程是( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23 解析:回归直线都过点(y ,x ),即(4,5)点,斜率为1.23.答案:B3.回归分析中,相关系数|r|值越大,则误差Q (a ,b )应( ) A.越小 B.越大C.可能大也可能小D.以上都不对解析:Q=l yy (1-r 2)>0,∴|r|越大,Q (a ,b )越小. 答案:A4.对于相关系数r ,下列说法正确的是( ) A.|r|越大,相关程度越小 B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小 答案:DA.很强B.很弱C.无相关D.不确定 解析:∑∑∑=====5125151,543,75i i i i i ix y x=1 375,∑=51i i x y i=8 285,∑=512i iy=59 051,x =15,y =108.6.r=∑∑∑===---512251225155i i i i i iiyy xx yx yx =226.10855905115513756.1081558285⨯-∙⨯-⨯⨯-=0.982 6.相关程度很强. 答案:A我综合,我发展(2)指出产量每增加1 000件时,单位成本下降多少;(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少? 解:∑=61i ix=21,∑=61i iy=426,∑=61i ix2=79,∑=61i iy2=30 268,∑=61i ixy i =1 481,x =3.5,y =71,b=5.5105.3679715.361481662261261-=⨯-⨯⨯-=--∑∑==xx yx yx i i i ii=-1.818, a=y -6x =71+1.818×3.5=77.363, ∴回归方程为y=77.363-1.818x.r==---∑∑∑===2612261261666i ii i i iiyyxx yx yx1110225.510716302685.3679715.36148122-=⨯-=⨯-⨯-⨯⨯-=-0.91.(2)产量每增加1 000件时单位成本下降1.818元. (3)当x=6时,y=66.455元; 当y=70时,x=4.05(千件)=4 050件.若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y=bx+a 的回归系数a 、b ; (2)估计使用年限为10年时,维修费用是多少? (3)求线性相关系数r.∴x =4,y =5, b=103.1245905453.1122=⨯-⨯⨯-=1.23, a=y -b x =5-1.23×4=0.08.(2)回归直线方程为y=1.23x+0.08.当x=10时,y =1.23×10+0.08=12.38(万元).估计使用10年时维修费用是12.38万元. (3)r=78.15103.125578.14045905453.11222⨯=⨯-⨯-⨯⨯-=0.979.x 、y 有很强的线性相关性.我创新,我超越8.为了研究三月下旬的平均气温x (单位:℃)与四月二十号前棉花害虫化蛹高峰日y 的关日为哪一天;(2)对变量x 、y 进行相关性检验. 解:(1)x =61(24.4+29.5+…+28.9)≈29.12, y =61(19+6+…+8)=7.5, ∑=61i ix2=24.42+…+28.92=5 125.01,∑=61i iy2=192+…+82=563,∑=61i ixy i =24.4×19+…+28.9×8=1 222,∴b=212.29601.512512.295.761222⨯-⨯⨯-≈-2.379, a=y -b x =7.5+2.379×29.12=76.77.回归直线方程为y=-2.379x+76.77.当x=27时,y=-2.379×27+76.77=12.537.据此估计该地区2008年4月12日或13日为化蛹高峰日.(2)r=∑∑∑===---6161222261)6)(6(6i i i i i iiy y x x yx yx =-0.966,由于|r|接近于1,∴y 与x 存在很强的线性相关关系.求y 与x 的线性回归方程,并检验回归方程中的显著性. 分析:x 、y 有明显的线性关系,可根据公式求方程. 解:由已知数据得x=71,∑=71i i x ≈0.543,y =71×145.2≈20.74,∑=712i i x =2.595,∑=712i i y =3094.72,i i i y x ∑=71=85.45. ∴b≈2)543.0(7595.274.20543.0745.85⨯-⨯⨯-≈12.45,a=20.74-12.45×0.543≈13.98.回归直线方程为y=13.98+12.45x,利用相关系数检验是否显著,∑=71i ixy i -7x y =85.45-7×0.543×20.74≈6.62,∑=71i ix2-72x =2.595-7×(0.543)2≈0.531,∑=712i i y -72y =3 094.72-7×(20.74)2=83.687.∴r=687.63531.062.6⨯≈0.993.由于r接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 3.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据A .0B .1C .2D .35.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -7.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计 男生 18 9 27 女生 8 15 23 合计262450( )附:()()()()()22n ad bc K a b c d a c b d -=++++ P(K 2>k 0) 0.15 0.10 0.05 0.025 0.01 0.001 k 02.0722.7063.8415.0246.63510.828A .0.01B .0.025C .0.10D .0.059.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==10.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下35143178附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.在吸烟与患肺病是否相关的判断中,有下面的说法:(1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.(2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;(3)若2 6.635K >,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是________.14.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:不生二胎 40 40则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30农村170 30根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++.(其中n a b c d =+++为样本容量)23.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?24.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表: x 2 5 8 9 11 y1210887(1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下: i i xi y2i xi i x y1 2 12 4 24 2510255038864644988172511712177∑354529528725.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .喜欢数学不喜欢数学合计男生5女生10(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.4.B解析:B 【解析】 【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.D解析:D由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B9.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .10.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.D解析:D23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Y σ=-=-⨯-= 二、填空题13.(1)【分析】根据题意利用独立性检验的定义与基本思想对题目中的命题进行逐个分析判断即可求解出答案【详解】根据独立性检验的基本思想在犯错误的概率不超过005的前提下认为吸烟与患肺病有关系的意思为有的把解析:(1) 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有95%的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有99%的把握认为这个推理是正确的,而不是说某个人吸烟就有99%的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,2K 是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率.14.-6【解析】由题意可得=10=40所以+2=40+2×10=60所以=-2x+60当=72时-2x+60=72解得x=-6解析:-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.15.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:% 【解析】 试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。
(新)高中数学第三章统计案例1_2相关系数同步测控北师大版选修2-3
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师大版选修2-3我夯基,我达标1.下列结论正确的是( ) ①函数关系是一种确定性关系 ②相关关系是一种非确定性关系③回归分析是具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④ 答案:C2.已知回归直线的斜率的估计值是 1.23,样本的平均值为x =4,y =5,则回归直线的方程是( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23 解析:回归直线都过点(y ,x ),即(4,5)点,斜率为1.23.答案:B3.回归分析中,相关系数|r|值越大,则误差Q (a ,b )应( ) A.越小 B.越大C.可能大也可能小D.以上都不对解析:Q=l yy (1-r 2)>0,∴|r|越大,Q (a ,b )越小. 答案:A4.对于相关系数r ,下列说法正确的是( ) A.|r|越大,相关程度越小 B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小 答案:DA.很强B.很弱C.无相关D.不确定 解析:∑∑∑=====5125151,543,75i i i i i i x y x =1 375,∑=51i i x y i=8 285,∑=512i iy=59 051,x =15,y =108.6.r=∑∑∑===---512251225155i i i i i iiyy xx yx yx =226.10855905115513756.1081558285⨯-•⨯-⨯⨯-=0.982 6.相关程度很强. 答案:A我综合,我发展(2)指出产量每增加1 000件时,单位成本下降多少;(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少? 解:∑=61i ix=21,∑=61i iy=426,∑=61i ix2=79,∑=61i iy2=30 268,∑=61i ixy i =1 481,x =3.5,y =71,b=5.5105.3679715.361481662261261-=⨯-⨯⨯-=--∑∑==xx yx yx i i i ii=-1.818, a=y -6x =71+1.818×3.5=77.363, ∴回归方程为y=77.363-1.818x.r==---∑∑∑===2612261261666i ii i i iiyyxx yx yx1110225.510716302685.3679715.36148122-=⨯-=⨯-⨯-⨯⨯-=-0.91.(2)产量每增加1 000件时单位成本下降1.818元. (3)当x=6时,y=66.455元; 当y=70时,x=4.05(千件)=4 050件.若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y=bx+a 的回归系数a 、b ; (2)估计使用年限为10年时,维修费用是多少? (3)求线性相关系数r.∴x =4,y =5, b=103.1245905453.1122=⨯-⨯⨯-=1.23, a=y -b x =5-1.23×4=0.08.(2)回归直线方程为y=1.23x+0.08.当x=10时,y=1.23×10+0.08=12.38(万元).估计使用10年时维修费用是12.38万元. (3)r=78.15103.125578.14045905453.11222⨯=⨯-⨯-⨯⨯-=0.979.x 、y 有很强的线性相关性.我创新,我超越8.为了研究三月下旬的平均气温x (单位:℃)与四月二十号前棉花害虫化蛹高峰日y 的关日为哪一天;(2)对变量x 、y 进行相关性检验. 解:(1)x =61(24.4+29.5+…+28.9)≈29.12, y =61(19+6+…+8)=7.5, ∑=61i ix2=24.42+…+28.92=5 125.01,∑=61i iy2=192+…+82=563,∑=61i ixy i =24.4×19+…+28.9×8=1 222,∴b=212.29601.512512.295.761222⨯-⨯⨯-≈-2.379, a=y -b x =7.5+2.379×29.12=76.77.回归直线方程为y=-2.379x+76.77.当x=27时,y=-2.379×27+76.77=12.537.据此估计该地区2008年4月12日或13日为化蛹高峰日.(2)r=∑∑∑===---6161222261)6)(6(6i i i i i iiy y x x yx yx =-0.966,由于|r|接近于1,∴y 与x 存在很强的线性相关关系.求y 与x 的线性回归方程,并检验回归方程中的显著性. 分析:x 、y 有明显的线性关系,可根据公式求方程. 解:由已知数据得x=71,∑=71i i x ≈0.543,y =71×145.2≈20.74,∑=712i i x =2.595,∑=712i i y =3094.72,i i i y x ∑=71=85.45. ∴b≈2)543.0(7595.274.20543.0745.85⨯-⨯⨯-≈12.45,a=20.74-12.45×0.543≈13.98.回归直线方程为y=13.98+12.45x,利用相关系数检验是否显著,∑=71i ixy i -7x y =85.45-7×0.543×20.74≈6.62,∑=71i ix2-72x =2.595-7×(0.543)2≈0.531,∑=712i i y -72y =3 094.72-7×(20.74)2=83.687.∴r=687.63531.062.6⨯≈0.993.由于r接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
高中数学第三章统计案例1.2相关系数导学案北师大版选修2_3
高手笔记
1. 假设两个随机变量的数据分别为( x1, y 1),( x 2, y 2) ,, , ( xn, yn ),则变量间线性相关
系数 r 的计算公式为
r= l xy l xxl yy
n
( xi x)( yi y)
i1
n
n
2
(xi x)2
( yi y)
i1
i1
n
xi yi
i1
n
xi 2
i1
2
nx
x(克 /
升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据
.
甲醛浓度 ( 克/ 升 )18
20
22
24
26
28
30
缩醛化度 ( 克分子 %)26.86 28.35
28.75
28.87
29.75
30.00
30.36
求相关系数 r.
解: 列表如下
i
xi
1
18
2
20
3
22
4
24
(3) r=
5
xi yi
i1
5
xi 2
i1
2
5x
5x y
5
yi2
i1
5y2
12952 5 109 23.2 60975 5 109 2 2756.8 5 23.22
308
=0.96 ,
1570 65.6
拟合程度较高 .
【例题 2】为了了解某地母亲身高 x 与女儿身高 y 的相关关系 , 现随机测得 10 对母女的身高 ,
25 599
6
154
1.2 相关系数
自主整理
相关系数 北师大版 选修2-3
例2. 5个学生的数学和物理成绩如下表: 学生
学科 数学 物理
A 80 70
B 75 66
C 70 68
D 65 64
E 60 62
画出散点图,并判断它们是否有相关关系. 物理
具有相关关系.
数学
例3. 下表给出了某校12名高一学生的身高(单位:cm) 和体重(单位:kg):
画出散点图,并观察它们是否有相关关系. 体 重 具有相关关系. 身 高
相关系数
相关关系的测度
(相关系数取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
小结
* 线性相关系数r:
r
x y
i 1 i
n
i
nx y
2 2 y n y i i 1 n
,其中 1 r 1 。
x nx
检验:
(1)作统计假设H0:x与y不具有线性相关关系; (2)由0.05与n-2=9,在附录1中查的r0.05=0.602; (3)根据公式求的线性相关系数r=0.998; (4)因为|r|=0.998>0.602,即|r|>r0.05,所以 有95%的把握认为x与y之间具有线性相关关系,线 性相关回归方程y=527.591+14.453x是有意义的.
r
x y
i 1 i 2 2 x n x i i 1 n
n
i
nx y
2 2 y n y i i 1
n
n 2 i n
n
2 x y 要求r,只需求出相关的量: xi y i , , i ,
最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)
一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3003.为研究某两个分类变量是否有关系,根据调查数据计算得到k≈15.968,因为P(K 2≥10.828)=0.001,则断定这两个分类变量有关系,那么这种判断犯错误的概率不超过( ). A .0.1B .0.05C .0.01D .0.0014.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成95 75 80 94 92 65 67 84 98 7167 93 64 787790 57 83 72 83若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%5.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%6.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ) A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合7.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:不秃发 5 450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0018.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为( ) 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%10.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .11.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( ) x 2 4 5 6 8 y2535605575A .5B .15C .10D .2012.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下 35 143 178 合计722283002()P K k ≥ 0.050 0.010 0.001 k 3.8416.63510.828附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%二、填空题13.若两个分类变量X 与Y 的列联表为:y 1 y 2 x 1 10 15 x 24016则“X 与Y 之间有关系”这个结论出错的可能性为________.14.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.参考公式:K 2=2()()()()()n ad bc a b c d a c b d -++++15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是3;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N Pσξ≤=则.其中正确结论的序号为________________17.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)18.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cossinxyθθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y+=;③极坐标系中,22,3Aπ⎛⎫⎪⎝⎭与()3,0B19④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.19.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太积极参加班级工作合计学习积极性高18725学习积极性一般61925合计242650则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表()2P K k≥0.0250.0100.0050.001k 5.024 6.6357.87910.82820.下列说法中,正确的有_______.①回归直线ˆˆˆy bx a =+恒过点(),x y ,且至少过一个样本点;②根据22⨯列列联表中的数据计算得出2 6.635K ≥,而()26.6350.01P K ≥≈,则有99%的把握认为两个分类变量有关系;③2k 是用来判断两个分类变量是否相关的随机变量,当2k 的值很小时可以推断两个变量不相关;三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:(1)若把年龄在2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?附:()()()()()2n ad bc K a b c d a c b d -=++++.两人年龄都小于20岁的概率.22.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差); 年广告投入x (万元) 2 3 4 5 6 年利润y (十万元)346811模型甲估计值(1)iy^ 残差(1)i e ^模型乙估计值(2)iy^ 残差(2)ie^②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 合 计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg 的网箱数为X ,求X 的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++24.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bc K n a b c d a b c d a c b d -==+++++++临界值表k 3.841 5.024 6.63510.82825.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L(单位:M)的数据,其频率分布直方图如图所示.求a的值,并估计这200名员工月使用流量的平均值x(同一组中的数据用中点值代表);(2)若将月使用流量在800M以上(含800M)的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工女员工合计手机营销达人5非手机营销达人合计200(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X,求X的分布列和数学期望.参考公式及数据:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.()2P K k≥0.150.100.050.0250.0100.005k 2.072 2.706 3.841 5.024 6.6357.87926.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A、B两品种茶叶的产量,某季采摘时,随机选取种植A、B两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?A品种茶叶(亩数)B品种茶叶(亩数)合计高产茶园非高产茶园合计(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++ ()2P K k≥0.0500.0100.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.A【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
北师大版高中数学选修2-3第三章统计案例同步练习(一).docx
高中数学学习材料马鸣风萧萧*整理制作第三章 统计案例 同步练习(一)说明:本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案填入题后括号内,第Ⅱ卷可在各题后直接作答.共100分,考试时间90分钟.第Ⅰ卷(选择题 共30分)一、选择题(本大题共10小题,每小题3分,共30分)1.设有一个回归方程为,32ˆx y+=变量x 增加一个单位时,则 ( ) A.y 平均增加2个单位 B. y 平均减少3个单位 C.y 平均减少2个单位D. y 平均增加3个单位2.线性回归方程,ˆbx a y+=必经过的点是 ( ) A.),0(a B. ),(b x C. ),(y x D. ),(b a3.温州市正在全面普及数字电视,某住宅小区有2万住户,从中随机抽取200户,调查是否安装数字电视,调查结果如右表,则该住宅小区已经安装数字电视的用户数为( )A.8 000B.5 000C. 5 500D. 9 500 数字电视 老住户 新住户 已安装 30 50 未安装 65 554.医学上用光电比色计检验尿汞时,得尿汞含量(mg/L )与消光系数计数的结果如下表: 尿汞含量x 2 4 6 8 10消光系数y64 133 205 285 360如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,汞含量( ) A.约为13.27mg/L B. 高于13.27mg/L C.低于13.27mg/L D. 一定是13.27mg/L5.下表是性别与喜欢数学与否的统计列联表,依据表中的数据,得到 ( )喜欢数学 不喜欢数学 总计 男生 40 28 68 女生 5 12 17 总计 45 40 85 A.879.72≈χB. 564.32≈χC. 706.22<χD. 722.42≈χ6.在画两个变量的散点图时,下面叙述正确的是 ( )A.两个变量中的任意一个变量在x 轴上B.解释变量在x 轴上,预报变量在y 轴上C.预报变量在x 轴上,解释变量在y 轴上D.两个变量中的任意一个变量在y 轴上7.收集一只棉铃虫的产卵数y 与温度x 的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y 与x 之间的回归方程,并算出了对应相关指数2R 如下表: 拟合曲线直 线指数曲线 抛物线 二次曲线y 与x 的回归方程 7.4638.19ˆ-=x y84.327.0ˆ-=x e y202367.0ˆ2-=x y 1)78.0(ˆ2--=x y 相关指数2R0.746 0.996 0.902 0.002则这组数据模型的回归方程的最好选择应是 ( )A. 7.4638.19ˆ-=x yB. 84.327.0ˆ-=x e yC. 202367.0ˆ2-=x yD. 1)78.0(ˆ2--=x y8.如果根据性别与是否爱好物理的列表,得到841.3843.3>≈k ,所以判断性别与物理有关,那么这种判断出错的可能性为 ( ) A.5% B.15% C.20% D.25% 9.下列各组变量的关系中是相关关系的是 ( )A.电压U 与电流IB.圆面积S 与半径RC.粮食产量与施肥量D.天上出现的彗星流与自然界的灾害 10.在硝酸纳(NaNO 3)的溶解试验中,测得在不同温度)(C t ︒下,溶解于100mg 水中硝酸纳y (mg)的数据如下表: )(C t ︒ 0 4 10 15 21 29 36 51 68 y (mg) 66.7 71.0 76.3 80.685.792.999.4113.6 125.1则溶解于100mg 水中硝酸纳y (mg)关于温度)(C t ︒的回归方程是 ( )A.t y8634.0818.67ˆ+= B. t y8706.0508.67ˆ+= C. t y9143.0803.66ˆ+=D. t y7823.0812.68ˆ+= 第Ⅱ卷(非选择题 共70分) 二、填空题(本大题共4小题,每小题4分,共16分)11.在镁合金X 射线探伤中,透视电压μ与透视厚度l 有非常显著的线性关系,一组数据如下表,则它们的回归方程为__________. l (mm) 8 16 243454 μ(V) 45 52.5 5562.5 7012.在0H 成立时,若,40.0)(2=≥k P χ则=k __________.13.随机抽样340人,性别与喜欢韩剧列联表如下表,则性别与喜欢韩剧有关的频率约为__________.不喜欢韩剧 不喜欢韩剧 总计 男生 42 93 135 女生 52 153 205总计94 246 34014.某个学生做力学胡克定律实验得到了一组数据如下:序号 1 2 3 4 5F 1.01 2.02 3.01 4.03 5.02+ 1.210 1.391 1.640 1.708 2.340 l∆l则去掉第__________(填序号)个数据后,剩下数据的线性相关系数最大.三、解答题(本大题共5小题,共54分.解答应写出文字说明、证明过程或演算步骤)15.(本小题满分8分)在500名患者身上试验某种血清治疗SARS的作用,与另外500名未用血清的患者进行比较研究.结果如下表:治愈未治愈总计用血清治疗254 246 500未用血清治疗223 277 500 总计477 523 1000问该种血清能否起到治疗SARS的作用?16.(本小题满分10分)恋上网吧是中学生中普遍存在的一种现象.恋上网吧对学生的学业、身体健康都有不良的影响.下表是性别与恋上网吧的列联表.男生女生总计恋上网吧120 50 170不恋上网吧280 400 680 总计400 450 850试画出列联表的三维柱形图、二维条形图与等高条形图,并结合图形判断性别与恋上网吧是否有关.17.(本小题满分12分)在某班级随机地抽取7名学生,得到一组数学成绩与物理成绩的数据如下表:58 98 113 125 135 143 150 数学成绩物理成24 53 71 69 78 77 98绩试用计算器求出数学成绩x与物理成绩y的线性回归方程,并计算相关系数r的值,并说明两者相关性的强弱.当这个班里的同学甲的数学成绩为87分,预测该名同学的物理成绩.18.(本小题满分12分)电压的稳定程度与机床加工的零件的合格率有相关的关系,下表是一台滚齿机的电压数μ与合格率y的数据表:220 210 200 196 190 电压μ(V)99.9 97.8 94.6 90.4 89.2合格率y(%)若在生产管理中要求齿轮加工的合格率达到95%以上,电压应稳定在什么范围?19.(本小题满分12分) 一只蝗虫的产卵数y 与温度)(C x ︒有关,现收集到5组数据如下:温度)(C x ︒ 20 23 25 27 29 产卵数y512213068对上述数据分别用b ax y +=2与dx ce y =来拟合y 与x 之间的关系,并用残差分析两者的拟合效果.参考答案第Ⅰ卷(选择题 共30分)1-10 DCAAD BBACB第Ⅱ卷(非选择题 共70分)11、l 530.0573.42ˆ+=μ12、0.708 13、0.75 14、515、解:由列联表给出的数据,计算8522.3523477500500)223246277254(100022≈⨯⨯⨯⨯-⨯⨯≈χ因为,841.38522.3>所以我们有95%的把握认为这种血清能起到治疗SARS 的作用.16、由图形知性别与恋上网吧有关.17、线性回归方程是:,5572.167128.0ˆ-=x y相关系数,9697.0=r ∴由此可知数学与物理的相关性很强;当解释变量87=x 时,预报变量物理成绩456.45≈y 分.18、因为,2.203)190196200210220(51=++++=u∑==-⋅-51,32.212)()(j jj y y u u %,38.94)2.894.906.948.979.99(51=++++=y .8.564)(51=-∑=j ju u,888.84)(51=-∑=j j y y 那么,75.09697.0888.848.56432.212>≈⨯=r因此y 与u 有很强的线性相关关系,由公式:u y376.0993.17ˆ+=,依题意: )(806.20495376.0993.17ˆV u u y≥⇒≥+=,电压应稳定在[204.806,220]范围内.(注意:用计算器统计模式直接计算时,当预报量y 为95%时,解释变量u 为204.849V).19、令2x t =,y 与t 的数据表为:t400529 625 729 841 产卵数y5 12 21 30 68则y 与t 之间的线性回归方程为: ,6619.551326.0ˆ)1(-=t y 即,6619.551326.0ˆ2)1(-=x y……① 令,ln ,ln c c y z ='=则,dx c z +'=z 与x 的数据表是:温度)(C x ︒20 23 25 27 29 y z ln =1.60942.48493.04453.40124.2195z 与x 的线性回归方程为,9675.32790.0ˆ-=x z即...ˆ9675.32790.0)(-=x z e y …②, 现列出①、②残差表;温度)(C x ︒2023 25 27 29 产卵数y5 12 21 30 68 1e7.6133 -2.4946 -6.2265 -11.0192 12.1272 2e-0.01630.41510.7531-17.73766.2126①式的残差的平方和为,4464.371)ˆ(ˆ2)1(511=-=∑=y y Q j j ②式的残差的平方和为9586.353)ˆ(ˆ2)2(512=-=∑=y y Q j j ∴用dx ce y =来拟合y 与x 之间的关系效果要好。
高中数学 第3章 §1回归分析同步测试 北师大版选修23
【成才之路】2014-2015学年高中数学 第3章 §1回归分析同步测试 北师大版选修2-3一、选择题1.相关系数r 的取值范围是( ) A .[-1,1] B .[-1,0] C .[0,1] D .(-1,1)[答案] A2.(2014·重庆理,3)已知变量x 与y 正相关,且由观测数据算得样本平均数x -=3,y -=3.5,则由该观测数据算得线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4 [答案] A[解析] 本题考查了线性回归方程,将点(3,3.5)代入个方程中可知,选项A 成立,所以选A ,线性回归方程一定经过点(x ,y ).3.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0 B. 0<r 2<r 1 C. r 2<0<r 1 D .r 2=r 1 [答案] C[解析] 对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,而r 2<0,所以有r 2<0<r 1,故选C.二、填空题4.对于回归方程y =4.75x +257,当x =28时,y 的估计值是____________. [答案] 390[解析] ∵y =4.75x +257,当x =28时,y =4.75×28+257=390.5.(2010·广东)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:年份20052006200720082009收入x 11.5 12.1 13 13.3 15 支出Y6.88.89.81012支出有__________线性相关关系.[答案] 13 较强的[解析] 由表中所组的数据知所求的中位数为13,画出x 与Y 的散点图知它们有较强的线性相关关系.三、解答题6.(2012·福建文,18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解析] (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y =-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1000 =-20(x -334)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定价为8.25元时,工厂可获得最大利润.一、选择题1.(2014·湖北理,4)根据如下样本数据x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y =bx +a ,则( )A .a >0,b >0B .a >0,b <0C .a <0,b >0D .a <0,b <0[答案] B[解析] 作出散点图如下:由图象不难得出:回归直线y ^=bx +a 的斜率b <0,截距a >0.所以a >0,b <0.解答本题的关键是画出散点图,然后根据散点图中回归直线的斜率、截距来判断系数b ,a 与0的大小.2.对四对变量y 和x 进行相关性检验,已知n 是观测值的组数,r 是相关系数,且知①n =3,r =0.9950;②n =7,r =0.9533;③n =15,r =0.3012;④n =17,r =0.4991.(已知n =3时,r 0.05=0.997;n =7时,r 0.05=0.754;n =15时,r 0.05=0.514;n =17时,r 0.05=0.482)(r 0.05为r 的临界值)则变量y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④ D .③和④[答案] C[解析] 若y 与x 具有线性相关关系,则需r >r 0.05,对②和④都满足r >r 0.05. 3.(2011·山东)某产品的广告费用x 与销售额y 的统计数据如下表6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元[答案] B[解析] ∵a =y -b x =49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y =9.4x +9.1.令x =6,得y =9.4×6+9.1=65.5(万元).4.(2012·新课标文,3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1[答案] D[解析] 本题考查了相关系数及相关性的判定.样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x +1上,样本的相关系数应为1.要注意理清相关系数的大小与相关性强弱的关系.5.(2013·湖北文,4)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ [答案] D[解析] 若y 与x 负相关,则y ^=bx +a 中b <0,故①不正确,②正确; 若y 与x 正相关,则y ^=bx +a 中b >0,故③正确,④不正确;故选D. 二、填空题6.下列说法中错误的命题序号是________.(1)如果变量η与ξ之间存在着线性相关关系,则我们根据实验数据得到的点(x i ,y i )(i =1、2、…,n )将散布在某一条直线的附近(2)如果两个变量ξ与η之间不存在线性关系,那么根据它们的一组数据(x i ,y i )(i =1,2,…,n )不能写出一个线性方程(3)设x ,y 是具有相关关系的两个变量,且x 关于y 的线性回归方程为y =bx +a ,b 叫作回归系数(4)为使求出的线性回归方程有意义,可用统计假设检验的方法来判断变量η与ξ之间是否存在线性相关关系[答案] (2)[解析] 两个变量不具有相关关系,但据公式,我们也能求得其回归方程,只是无意义,因此要进行相关性检验.然后再求回归直线的方程.故(2)不正确,∴填(2).7.某化工厂为预测某产品的回收率y ,研究得知它和原料有效成分含量x 之间具有线性相关关系,现取8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 与x 的线性回归方程是____________.(精确到小数点后两位数)[答案] y =11.47+2.62x[解析] 根据给出的数据可先求x =18∑i =18x i =132,y =18∑i =18y i =572,然后代入公式b =∑i =18x i y i -8x y∑i =18x 2i -8x 2=1849-8×132×572478-8×1694≈2.62,a =y -b x =11.47,进而求得回归方程y=11.47+2.62x .三、解答题8.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元)求线性回归方程.[解析] 求回归直线的方程,关键在于正确的求出a 和b ,由于在求a ,b 时计算量较大,计算时要仔细谨慎、分层进行,避免计算错误.作出散点图由散点图可判断出,变量间存在线性相关关系.列表:于是可得b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=1380-5×5×50145-5×52=6.5, a =y -b x =50-6.5×5=17.5.于是所求的回归直线方程是y =17.5+6.5x .9.(2013·重庆文,17)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x2i=720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a =y --b x -, 其中x -,y -为样本平均值.线性回归方程也可写为y ^=b ^x +a ^.[解析] (1)由题意知n =10,x =-1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2.又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i =n x y =184-10×8×2=24.由此得b =l xy l xx =2480=0.3,a =y -b x =2-0.3×8=-0.4, 故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值B 随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).10.如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地震次数为N ,试建立N 对x 的回归方程,并表述二者之间的关系.级的地震次数N 之间呈现出一种非线性的相关性,随着x 的减少,所考察的地震数N 近似地以指数形式增长.于是令y =lg N .得到的数据如下表所示.图1图2从散点图(2)中可以看出x和y之间有很强的线性相关性,因此由最小二乘法得a≈6.704,b≈-0.741,故线性回归方程为y=-0.741x+6.704.因此,所求的回归方程为:lg N=-0.741x+6.704,故N=10-0.741x+6.704.[点评] 在解回归分析问题时,一般先作出原始数据的散点图.依据散点图中点的分布,选择合适的函数模型进行拟合.。
2014-2015学年高中数学 第3章 回归分析同步练习 北师大版选修2-3
回归分析同步练习【选择题】1、下列两个变量之间的关系哪个不是函数关系?()A、角度和它的余弦值B、正方形边长和面积C、正n边形的边数和顶点角度之和D、人的年龄和身高2、变量y与x之间的回归直线方程()A.表示y与x之间的函数关系B.表示y和x之间的不确定关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合3、若用水量x(吨)与某种产品的产量y的回归直线方程是ˆy=2x+1250,若用水量为50kg 时,预计的某种产品的产量是()A.1350 kg B.大于 1350 kg C.小于1350kg D.以上都不对【填空题】4、对具有______________的两个变量进行统计分析的方法叫回归分析。
5、现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高-130磅.其中体重与身高分别以磅和英寸为单位.如果换算为公制(1英寸≈2.5cm,1磅≈0.45kg),回归方程应该为_____________________6、回归直线方式:abxy+=ˆ中b=_____________________,a=____________________(其中:∑==niixnx11)【解答题】7、为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:(1)在同一张图上画散点图,直线ˆy(1)=24+2.5x,曲线ˆy(2)=602xx+;(2)比较所画直线与曲线,哪一条更能表现这组数据之间的关系?(3)分别计算用直线方程与曲线方程得到在5个x 点处的销售额预测值与实际值之间的误差,最后比较两个误差绝对值之和的大小。
8、下面是两个变量的一组数据: x 1 2 3 4 5 6 7 8 y1491625364964请用最小二乘法求出这两个变量之间的线性回归方程。
参考答案1、D2、D3、A4、相关关系5、体重预测值=0.72(kg/cm)×身高-58.5kg6、其中b = , a =x b y -7、解:(1)所求图形如右图.∑∑==--ni i ni ii x n x yx n yx 1221(2)从图形上看,曲线ˆy (2)=602x x +比直线ˆy (1)=24+2.5x 更能表现出这组数据之间的关系.(3)列表略:用直线ˆy (1)=24+2.5x 近似数据时,误差绝对值的和为27.5.用曲线ˆy (2)=602xx +近似数据时,误差绝对值的和为12.5,比前者小得多.8、159-=x y.。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(1)
一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.假设有两个分类变量X 和Y 的22⨯列联表为:X Y1y2y 总计1x5b5b + 2x15d15d + 总计20 4060对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==3.下列命题是假命题...的是( ) A .某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,若用分层抽样的方法抽出一个容量为30的样本,则一般职员应抽出18人; B .用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大;C .已知向量,,则是的必要条件; D .若,则点的轨迹为抛物线.4.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个5.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%6.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C.样本数据的中位数约为1750元D.在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关7.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a=+,计算得7b=,则当投入10万元广告费时,销售额的预报值为A.75万元B.85万元C.99万元D.105万元8.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ()A.99%的可能性B.99.75%的可能性C.99.5%的可能性D.97.5%的可能性9.某班主任对全班50名学生进行了作业量的调查,数据如下表:()附:()()()()()22n ad bcKa b c d a c b d-=++++A .0.01B .0.025C .0.10D .0.0510.已知,x y 的取值如下表:( )若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆy x =-+B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:P(K2≥k0)0.0500.0100.001 k0 3.841 6.63510.828(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)14.设样本数据x1,x2,…,x2 017的方差是4,若y i=x i-1(i=1,2,…,2 017),则y1,y2,…,y2 017的方差为______.15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.已知与之间的一组数据如图所示,当m变化时,与的回归直线方程ˆy bx a=+必过定点.0123135m-7m+17.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于.23454618.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是_____________.①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.19.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表20.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数0.83r =-,表明两个变量的相关性较弱.③若由一个2⨯2列联表中的数据计算得2K 的观测值 4.103k ≈,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(,),(1,,)i i x y i n =的回归直线方程ˆˆˆy bx a =+后要进行残差分析,相应于数据(,),(1,,)i i x y i n =的残差是指()ˆˆˆi i ie y bx a =-+. 以上命题“错误”的序号是_________________三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30农村170 30(附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付支付宝支付总计20.0500.0100.001()P K kk 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++. 23.受新冠肺炎疫情影响,本学期同学们在家上网课时间达三个多月,电脑屏幕代替了黑板,对同学们的视力造成了很大的损伤.某学校为了了解同学们现阶段的视力情况,对全校高三1000名学生的视力情况进行了调查,从中随机抽取了100名学生的体检表,绘制了频率分布直方图如图:(1)求a 的值,并估计这1000名学生视力的中位数(精确到0.01);(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前50名与后50名的学生进行了调查,得到如下数据:前50名 后50名 近视4232 不近视 818根据表中数据,能否有95%把握认为视力与学习成绩有关?(3)若报考某高校某专业的资格为:视力不低于5.0,以该样本数据来估计全市高三学生的视力,现从全市视力在4.8以上的同学中随机抽取4名同学,这4名同学中有资格报该校该专业的人数为X ,求X 的分布列及数学期望.()2P K k ≥ 0.100.05 0.025 0.010 0.005k 2.706 3.841 5.024 6.635 7.87924.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等.(1)根据题意,完成下列2×2列联表;出生时间婴儿性别白天晚上合计男女总计200(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82825.共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有5 6是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列22⨯列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量X,求X 的分布列与期望. 参考数据:独立性检验界值表其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++26.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表: (1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(1)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关” 5.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .46.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;7.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K 2=10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响C .在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D .在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响8.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015由此表得到的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关” 9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1B .2C .3D .411.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .412.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%二、填空题13.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.14.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”.(K2≥k0) k03.8415.0246.6357.87915.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 16.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有_______%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 合计 偏高 4 1 5 不偏高 3 12 15 合计71320独立性检验临界值表()20P K k ≥0.025 0.010 0.005 0.001 0k 5.0246.6357.87910.828独立性检验随机变量2K 值的计算公式:22()()()()()n ad bc K a b c d a c b d -=++++17.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.18.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是_____________. ①若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.三、解答题21.某高校在A 省自主招生,对初审通过的1000人进行复试(20道客观题,每题10分,满分200分),按分数从高到低录取100人认定复试通过,不低于140分的各分数对应人数如下表:(Ⅰ)已知y 关于t 的回归方程为814.311.6y t =-,求y 关于x 的回归方程y bx a =+; (Ⅱ)已知y 关于x 的相关系数为0.95-,试求出y 关于t 的相关系数r (小数点后保留两位小数),通过比较,判断哪个回归方程拟合效果更好;(注:r 越大,拟合性越好) (Ⅲ)根据(Ⅱ)中拟合性更好的回归方程,预报得分为130的考生能否全部通过复试? 相关公式和数据:()()()1122211n niii ii i nniii i x x y yx y nx yb x x xnx ====---==--∑∑∑∑,a y bx =-,()()nniii ix x y y x y nx yr ---==∑∑,518960i ii x y==∑,521129000i i x ==∑,512.31i i i t y =≈∑,5210.0049ii t =≈∑,0.029t =,20.000841t =,160x=,12y =,31.6≈0.027≈21.4≈.22.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n adbc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.23.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过,且2浓度不超过”的概率; (2)根据所给数据,完成下面的22⨯列联表:PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,24.“海水稻”就是耐盐碱水稻,是一种介于野生稻和栽培稻之间的普遍生长在海边滩涂地区,具有耐盐碱的水稻,它比其它普通的水稻均有更强的生存竞争能力,具有抗涝,抗病虫害,抗倒伏等特点,还具有预防和治疗多种疾病的功效,防癌效果尤为显著.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x (‰)对亩产量y (吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y 与海水浓度x 之间的相关关系,用最小二乘法计算得y 与x 之间的线性回归方程为.88ˆ0ˆy bx=+.(2)①完成上述残差表:②统计学中,常用相关指数2R 来刻画回归效果,2R 越大,模型拟合效果越好,并用它来说明预报变量与解释变量的相关性.你能否利用以上表格中的数据,利用统计学的相关知识,说明浇灌海水浓度对亩产量的贡献率?(计算中数据精确到0.01)(附:残差公式ˆˆi i i ey y =-,相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑)25.2020年寒假是特殊的寒假,因为疫情全体学生只能在家进行网上在线学习,为研究学生网上学习的情况,某校社团对男女各10名学生进行了网上在线学习的问卷调查,每名学生给出评分(满分100分),得到如图所示的茎叶图.(1)根据茎叶图判断男生组和女生组哪个组对网课的评价更高?并说明理由;(2)如图是按该20名学生的评分绘制的频率分布直方图,求a 的值并估计这20名学生评分的平均值(同一组中的数据用该组区间中点值作为代表);(3)求该20名学生评分的中位数m,并将评分超过m和不超过m的学生数填入下面的列联表:超过m不超过m男生女生根据列联表,能否有85%的把握认为男生和女生的评分有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.500.400.250.150.100.050.025k0.4550.708 1.323 2.072 2.706 3.841 5.02426.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A、B两品种茶叶的产量,某季采摘时,随机选取种植A、B两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?A品种茶叶(亩数)B品种茶叶(亩数)合计高产茶园非高产茶园合计(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++ ()2P K k≥0.0500.0100.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55ii x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215i i x x=-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.C解析:C 【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③; 根据不等式的性质可判断④.详解:①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c xy c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确; ④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.7.A解析:A 【解析】因为7.879<K 2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响. 故选A.8.C解析:C 【解析】由2×2列联表得到a =45,b =10,c =30,d =15.则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100.所以K 2的观测值k =2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C. 点睛:根据卡方公式求K 2,再与参考数据比较,最后作出判断.9.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.B解析:B 【解析】逐一考查所给的说法:①将一组数据中的每个数据都乘以同一个非零常数a 倍,原说法错误;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位,原说法正确;③线性相关系数r 的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱,原说法错误;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.5,原说法错误;⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大,原说法正确. 本题选择B 选项.12.D解析:D 【解析】23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.二、填空题13.5【解析】【分析】根据题目中的数据利用的公式求得的值即可作出判断得到答案【详解】根据题目中所给的数据可得到2×2列联表再由公式得k =≈1076因为1076>7879所以约有995的把握认为学生的数学解析:5% 【解析】 【分析】根据题目中的数据,利用2K 的公式,求得2K 的值,即可作出判断,得到答案. 【详解】根据题目中所给的数据可得到2×2列联表,再由公式得k =≈10.76.因为10.76>7.879,所以约有99.5%的把握认为“学生的数学成绩和物理成绩有关系”. 【点睛】本题主要考查了独立性检验的应用,其中解答中认真审题,准确计算2K 的值是解答本题的关键,着重考查了推理与运算能力,属于基础题.14.5【解析】∵K2的观测值k=6132>5024且k=6132<6635对照临界值表得有1–0025=975的把握认为X 与Y 有关系故答案为975解析:5% 【解析】∵K 2的观测值k =6.132>5.024,且k =6.132<6.635,对照临界值表得,有1–0.025=97.5%的把握认为“X 与Y 有关系”.故答案为97.5%.15.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 16.5【分析】计算并与临界值表中数据比较即可得出答案【详解】故有的把握认为该学校至周岁的男生的身高和体重之间有关系故答案为:975【点睛】本题主要考查了独立性检验的实际应用属于中档题解析:5 【分析】计算2K ,并与临界值表中数据比较,即可得出答案. 【详解】2220(41213) 5.934 5.024713515K ⨯-⨯=≈>⨯⨯⨯故有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系. 故答案为:97.5 【点睛】本题主要考查了独立性检验的实际应用,属于中档题.17.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】 由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.18.③【解析】推断在100个吸烟的人中必有99人患有肺病说法错误排除①有99的把握认为吸烟与患病有关系时与99的可能患有肺病是两个不同概念排除②故填③解析:③ 【解析】推断在100个吸烟的人中必有99人患有肺病,说法错误,排除①,有99%的把握认为吸烟与患病有关系时,与99%的可能患有肺病是两个不同概念,排除②,故填③.19.①②【解析】①分类变量与的随机变量越大说明与有关系的可信度越大正确;②所以两边取对数可得令可得即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为中则③错故答案为①②解析:①② 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②kx y ce =,所以两边取对数,可得()ln ln ln ln ln kxkxy cec ec kx ==+=+,令ln z y =,可得4ln ,0.34,ln 4,0.3,z c kx z x c k c e =+=+∴==∴=,即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+ 中,1,1,3b x === ,则2a =,③错,故答案为①②.20.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.三、解答题21.(Ⅰ)0.64114.4y x =-+;(Ⅱ)0.99,y 关于t 的方程拟合效果更好;(Ⅲ)不能. 【分析】(Ⅰ)求出ˆa、ˆb ,进而求出y 关于x 的回归方程y bx a =+; (Ⅱ)根据求相关系数r 的方程,代入相关数值即可求解;然后比较,判断出哪个回归方程拟合效果更好;(Ⅲ)先根据(Ⅱ)中拟合性更好的回归方程求出预报得分为130的考生的人数;再根据总录取人数为100人、140分以上有60人的条件来判断预报得分为130的考生能否全部通过复试. 【详解】解:(Ⅰ)5152215896096000.6412900128005i ii i i x y x yb x nx==--===---∑∑,()120.64160114.4a y bx =-=--⨯=,所以,y 关于x 的回归方程是:0.64114.4y x =-+.(Ⅱ) 55 2.31 1.740.990.02721.4i it y x yr --=≈≈⨯∑,比较相关系数:0.950.99-<,故y 关于t 的方程拟合效果更好. (Ⅲ)当130x =时,110t =,代入回归方程814.311.6y t =-, 得预报值:1814.311.669.8310y =⨯-=, 因为140分以上有60人,所以只需在130分的人中录取40人, 故不能全部通过复试. 【点睛】本题主要考查求解回归方程、求相关系数及根据回归方程求函数值等知识,考查运算求解能力,属于中等题型.22.(1)有99%的把握认为该球员射门成功与射门距离是否超过30米有关;(2)3π.【分析】(1)利用22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++求得2K 的值,再与临界表对照下结论.(2)由2+3()cos sin 4f θθθθθ=+⋅-,求导得到1()sin sin cos (cos )22f θθθθθθθθ=-++=-'-, 利用导数得到函数单调性,求得最大值点即可. 【详解】(1)由题知:22602616144)=10.8 6.63540203030k ⨯-⨯=>⨯⨯⨯(所以有99%的把握认为该球员射门成功与射门距离是否超过30米有关(2)由题知:1()sin sin cos (cos )22f θθθθθθθθ=-++=-'-因为()0f θ'=,得3πθ=所以当(0,)3πθ∈时,()0f θ'>;当(,)32ππθ∈时,()0f θ'< 所以()f θ在(0,)3π上单调递增;在(,)32ππ上单调递减所以()()3f f πθ≤,即球员射门成功率最高时射门角3πθ=【点睛】本题主要考查独立性检验和导数与函数的最值,还考查了运算求解的能力,属于中档题. 23.(1)0.64;(2)答案见解析;(3)有. 【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果; (2)根据表格中数据可得22⨯列联表; (3)计算出2K ,结合临界值表可得结论. 【详解】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>,因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 【点睛】本题考查了古典概型的概率公式,考查了完善22⨯列联表,考查了独立性检验,属于中档题.24.(1)当海水浓度为8‰时,该品种的亩产量为0.24吨(2)①填表见解析;②所以浇灌海水浓度对亩产量的贡献率是98%,详解见解析. 【分析】(1)根据题意,算出,x y ,将样本中心点(),x y 代入线性回归方程为.88ˆ0ˆy bx =+,求出ˆb,从而可估计当浇灌海水浓度为8‰时,该品种的亩产量. (2)根据线性回归方程0.080.8ˆ8yx =-+和残差公式ˆˆi i i e y y =-,即可求出个海水浓度时对应的残差,即可完成残差表;根据相关指数2R 的公式,求出2R ,根据2R 的意义,即可得出浇灌海水浓度对亩产量的贡献率. 【详解】(1)根据题意,可得3456755x ++++==,0.620.580.490.40.310.485y ++++==,而y 与x 之间的线性回归方程为.88ˆ0ˆy bx=+, 则ˆ0.4850.88b=+,解得:ˆ0.08b =-, 当8x =时,0.0880..24ˆ880y=-⨯+=, 所以当海水浓度为8‰时,该品种的亩产量为0.24吨.(2)①由(1)知0.080.8ˆ8yx =-+, 根据残差公式ˆˆi i i ey y =-,得残差表如下:()2222220.00040.00040.000100.000110.140.10.010.080.17R ++++=-+++-+0.0016410.980.06565=-=≈, 所以浇灌海水浓度对亩产量的贡献率是98%. 【点睛】本题考查线性回归方程和残差的计算,以及相关指数2R 的求法和根据2R 的意义对实际问题进行分析,考查运算能力.25.(1)男生对网课的评价更高,详见解析(2)0.045a =;平均值为74(3)中位数为74.5,填表见解析;没有【分析】(1)男生对网课的评价更高,可以根据中位数,平均值,不低于70分的人数得到答案. (2)根据比例关系得到0.045a =,再计算平均值得到答案.。
北师大版高中数学选修2-3可线性化的回归分析同步练习.docx
高中数学学习材料马鸣风萧萧*整理制作可线性化的回归分析 同步练习【选择题】1、给定y 与x 的一组样本数据,求得相关系数r=-0.690,则( ) A.y 与x 的线性相关性很强 B. y 与x 的相关性很强 C. y 与x 正线性相关 D. y 与x 负线性相关2、下列关系中是相关关系的是 ( )A 、位移与速度、时间的关系B 、烧香的次数与成绩的关系C 、广告费支出与销售额的关系D 、物体的加速度与力的关系 【填空题】3、为考虑广告费用x 与销售额y 之间的关系,随机地抽取5家超市,得到如下表所示的数据;广告费用x(千克) 1.0 4.0 6.0 10.0 14.0 销售额y (千元) 19.0 42.0 46.0 52.0 53.0 现要使销售额达到10万元,则广告费用约为______________千克. 4、独立性检验常作的图形是______________和_________________. 【解答题】5、在彩色显影中,由经验可知,形成染料光学密度y 与析出银的光学密度x 由公式)0(<=b Ae y xb 表示,现测得试验数据如下:i x0.05 0.06 0.25 0.31 0.07 0.10 i y 0.10 0.14 1.00 1.12 0.23 0.37 i x0.380.430.140.200.47i y1.19 1.25 0.59 0.79 1.29试求y 对x 的回归方程.6、某种书每册的成本费Y 元与印刷册数x (千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 Y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检验每册书的成本费Y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出Y 对x 的回归方程.参考答案1、D2、C3、31.856 44、三维柱形图,二维条形图5、解:由题意知,对于给定的公式)0(<=b Ae y xb 两边取自然对数,得.ln ln xbA y +=与线性回归方程相对照可以看出,只要取,ln ,ln ,1A a y v xu ===就有v =a +bu . 这是V 对u 的线性回归直线方程,对此我们再套用相关性检验,求回归系数b 和a ,题目中所给的数据由变量置换,ln ,1y v xu ==变为如下所示的数据.i u20.00 16.667 4.000 3.226 14.286 10.000i v -2.303 -1.966 0 0.113 -1.470 -0.994 i u 2.632 2.326 7.143 5.000 2.128 i v0.1740.223-0.528-0.2360.255可以求得:r =0.998,由于,75.0998.0||>=r 可知,v u 与具有很强的线性相关关系.再求出b =-0.14,a =0.548, u v146.0548.0ˆ-=∴ 把v u 与置换回来可得.146.0548.0ˆln xy -=∴xxxeee e y146.0146.0548.0146.0548.073.1ˆ---=⋅==∴所以回归曲线方程为xe y146.073.1ˆ-=∴6、Y 对x 的回归方程为.120.1976.8ˆ+=xy。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关系数 同步练习
【选择题】
1、对于回归分析,下列说法错误的是( )
A 、变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
B 、线性相关系数可以是正的或负的
C 、回归分析中,如果2
r =1或r =±1,说明x 与y 之间完全线性相关 D 、样本相关系数r ∈(-1,+1)
2、下列说法中正确的是( ) A 、任何两个变量都具有相关关系 B 、人的知识与其年龄具有相关关系 C 、散点图中的各点是分散的,没有规律 D 、根据散点图求得的回归直线方程都是有意义的
3、下列两变量具有相关关系的是( )
A 、正方体的体积与边长
B 、人的身高与体重
C 、匀速行驶车辆的行驶距离与时间
D 、球的半径与体积
4、对于线性相关系数r,下列说法正确的是( )
A 、),0(||+∞∈r ,||r 越大,相关程度越大;反之,相关程度越小
B 、),(+∞-∞∈r ,r 越大,相关程度越大;反之,相关程度越小
C 、||r ≤1,且||r 越接近于1,相关程度越大;||r 越接近于0,相关程度越小
D 、以上说法都不正确
5、线性回归方程ˆy
=b x +a 必过( ) A 、(0,0)点 B 、(x ,0)点 C 、(0,y )点 D 、(x ,y )点 【填空题】
6、 ________________ 叫做变量y 与x 之间的相关系数。
7、对于回归方程25775.4ˆ+=x y ,当x=28时,y 的估计值是________________。
【解答题】
8、随机选取15家销售公司,由营业报告中查出其上年度的广告费x(占总费用的百分比)及盈
利额y(占销售总额的百分比)列表如下:
试根据上述资料: 画出散点图;
计算出这两组变量的相关系数;
在显著水平0.01的条件下,对变量x 与y 进行相关性检验; 如果变量x 与y 之间具有线性相关关系,求出回归直线方程;
已知某销售公司的广告费占其总费用的1.7%,试估计其盈利净额占销售总额的百分比。
9、商品零售商要了解每周的广告费及销售额(单位:万元)之间的关系,记录如下:
利用上述资料: 画出散点图;
求销售额y 对广告费x 的一元线性回归方程; 求出两个变量的相关系数。
参考答案
1、D
2、B
3、B
4、C
5、D
6、
7、390
8、解:(1)散点图(略)
(2)这两组变量的相关系数是r=0.98831;
(3)在显著水平0.01的条件下进行相关系数的统计检验:查表求得在显著水平0.01和自由度15-2=13的相关系数临界值
01.0r =0.641,因r=0.98831〉01.0r ,这说明两变量之间存在显著
))((1221221
∑
∑∑
===---=
n
i i n i i n i i i y n y x n x y
x n y x r
的线性关系;
(4)线性回归方程是:y=1.41468x+0.82123
(5)当x=1.7时,由回归方程得y=3.23,捷克估算其盈利净额占销售总额的3.23%。
9、解:画出散点图(略)
销售额y对广告费x的一元线性回归方程是:y=7.28601x+200.39416
两个变量的相关系数r=0.98353。