金版高三数学 第十四章第四节 统计案例优化训练(理) 北师大版必修3 选修2-3.doc

合集下载

高中数学第3章统计案例章末复习课学案北师大版选修2_3

高中数学第3章统计案例章末复习课学案北师大版选修2_3

第3章 统计案例【例1】 下表是一位母亲给儿子作的成长记录:(2)如果年龄(3周岁~16周岁之间)相差5岁,其身高有多大差异? (3)如果身高相差20 cm ,其年龄相差多少?[解] (1)设年龄为x ,身高为y ,则x =114(3+4+…+15+16)=9.5,y =114(90.8+97.6+…+167.5+173.0)≈131.985 7,∑14i =1x 2i =1 491,∑14i =1y 2i =252 958.2,∑14i =1x i y i =18 990.6,14x y ≈17 554.1, ∴∑14i =1x 2i -14(x )2=227.5,∑14i =1y 2i -14(y )2≈9 075.05, ∑14i =1x i y i -14x y =1 436.5,∴r =∑14i =1x i y i -14x y∑14i =1x 2i -14(x )2∑14i =1y 2i -14(y )2=1 436.5227.5×9 075.05≈0.999 7.因此,年龄和身高之间具有较强的线性相关关系.(2)由(1)得b =∑14i =1x i y i -14x y∑14i =1x 2i -14(x )2=1 436.5227.5≈6.314, a =y -b x =131.985 7-6.314×9.5≈72,∴x 与y 的线性回归方程为y =6.314x +72.因此,如果年龄相差5岁,那么身高相差6.314×5=31.57(cm). (3)如果身高相差20 cm ,年龄相差206.314≈3.168≈3(岁).解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)实际应用.依据求得的回归方程解决实际问题.1.某运动员训练次数与运动成绩之间的数据关系如下:(2)求出回归直线方程;(3)计算相关系数并进行相关性检验; (4)试预测该运动员训练47次及55次的成绩.[解] (1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:由上表可求得x =39.25,y =40.875,∑i =18x 2i =12 656, ∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b =∑i =18x i y i -8x y∑i =18x 2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴回归直线方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用回归直线方程y =1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57.故预测该运动员训练47次和55次的成绩分别为49和57.黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病.试推断经过药物处理跟发生青花病是否有关系.[解] 由已知得到下表:根据2×2列联表中的数据,可以求得χ2=470×(25×200-185×60)2210×260×85×385≈9.788.因为χ2>6.6.35,所以我们有99%的把握认为经过药物处理跟发生青花病是有关系的.独立性检验问题的基本步骤 (1)找相关数据,作列联表. (2)求统计量χ2.(3)判断可能性,注意与临界值做比较,得出事件有关的可信度.2.某学校高三年级有学生1 000名,经调查研究,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学).现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:体育锻炼与身高达标2×2列联表(2)请问体育锻炼与身高达标是否有关系(χ2值精确到0.01)?参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解] (1)χ2=100×(40×15-35×10)275×25×50×50≈1.33<2.706,所以没有充分的理由说明体育锻炼与身高达标有关系.。

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(包含答案解析)(1)

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(包含答案解析)(1)

一、选择题1.下列说法错误的是( )A .在回归直线方程0.2 0.8y x =+中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位.B .对分类变量X 与Y ,随机变量2K 的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小.C .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1.D .回归直线过样本点的中心(),x y .2.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3003.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:20()P K k ≥0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 4.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;5.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )附:参考公式及数据:(1)统计量:()()()()()22n ad bc K a b c d a c b d -=++++,(n a b c d =+++).(2)独立性检验的临界值表:则下列说法正确的是A .有95%的把握认为环保知识测试成绩与专业有关B .有95%的把握认为环保知识测试成绩与专业无关C .有99%的把握认为环保知识测试成绩与专业有关D .有99%的把握认为环保知识测试成绩与专业无关6.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .107.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( )A .90%B .95%C .97.5%D .99.5%8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( )A .5B .15C .10D .2010.已知样本789x y 、、、、的平均数是8xy 值为 A .8B .32C .60D .8011.已知,x y 的取值如下表:( )y1 1.3 3.2 5.6 8.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-12.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%二、填空题13.给出以下四个命题:①设,,a b c 是空间中的三条直线,若a b ⊥,b c ⊥,则//a c .②在面积为S 的ABC 的边AB 上任取一点P ,则PBC 的面积大于S4的概率为34.③已知一个回归直线方程为 1.545y x =+{}()1,5,7,13,19,1,2,...,5i x i ∈=,则58.5=y . ④数列{}n a 为等差数列的充要条件是其通项公式为n 的一次函数. 其中正确命题的序号为________.(把所有正确命题的序号都填上)14.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?15.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15. 16.给出下列命题:①线性相关系数越大,两个变量的线性相关越强;反之,线性相关性越弱; ②由变量和的数据得到其回归直线方程:,则一定经过;③从越苏传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好; ⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位,其中真命题的序号是___________.17.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.18.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.19.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.20.下列说法中,正确的有_______.①回归直线ˆˆˆy bx a =+恒过点(),x y ,且至少过一个样本点;②根据22⨯列列联表中的数据计算得出2 6.635K ≥,而()26.6350.01P K ≥≈,则有99%的把握认为两个分类变量有关系;③2k 是用来判断两个分类变量是否相关的随机变量,当2k 的值很小时可以推断两个变量不相关;三、解答题21.有治疗某种疾病的A B 、两种药物,为了分析药物的康复效果进行了如下随机抽样调查:AB 、两种药物各有100位病人服用,他们服用药物后的康复时间(单位:天数)及人数记录如下: 服用A 药物:(1)若康复时间低于15天(不含15天),记该种药物对某病人为“速效药物”.当17a >时,请完成下列22⨯列联表,并判断是否有99%的把握认为病人服用药物A 比服用药物B 更速效?A 药物的7人为Ⅰ组,服用B 药物的7人为Ⅱ组.现从Ⅰ、Ⅱ两组中随机各选一人,分别记为甲、乙.①a 为何值时,Ⅰ、Ⅱ两组人康复时间的方差相等(不用说明理由); ②在①成立且12a >的条件下,求甲的康复时间比乙的康复时间长的概率. 参考数据:参考公式:2()()()()()n ad bc K a b c b a c b d -=++++,其中n =a +b +c +d.22.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,从上述500名患者中抽取300人,得到如下列联表,根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:短潜伏者 长潜伏者 合计60岁及以上 90 70 160 60岁以下 60 80 140 合计 150150300附表及公式:20P K k ≥()0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++23.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)24.2020年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了研究学生在线学习情况,市教研院数学学科随机从市区各高中学校抽取120名学生对线上教学情况进行调查(其中,男生与女生的人数之比为3:1),结果发现:男生中有40名对于线上教学满意,女生中有10名表示对于线上教学不满意.(1)请完成如表2×2列联表,并回答能否有95%的把握认为对“线上教学是否满意与性别有关”;态度性别满意不满意合计男生女生合计120(2)采用分层抽样的方法,从被调查的对线上教学满意的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的经验介绍,求所选取的2名学生性别不同的概率.附:参考公式及临界值表()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++P (K 2>k 0)0.150.100.050.0250.0100.0050.001 k 02.0722.7063.8415.0246.6357.87910.82825.某地为响应国家“脱贫攻坚战”的号召,帮助贫困户脱贫,安排贫困人员参与工厂生产.现用A ,B 两条生产线生产某产品.为了检测该产品的某项质量指标值(记为Z ),现随机抽取这两种这两条生产线的产品各100件,由检测结果得到如下频率分布直方图.(Ⅰ)分别估计A ,B 两条生产线的产品质量指标值的平均数(同一组数据中的数据用该组区间的中点值作代表),从平均数结果看,哪条生产线的质量指标值更好?(Ⅱ)计算A 生产线的产品质量指标值的众数和中位数(中位数计算结果精确到小数点后两位).(Ⅲ)该公司规定当92Z ≥时,产品为超优品.根据所检测的结果填写22⨯列联表,并判断是否有95%的把握认为“生产超优品是否与生产线有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++()20P K k ≥0.050 0.010 0.005 0.001 0k 3.8416.6357.87910.82822⨯列联表A 生产线B 生产线 总计超优品非超优品 总计26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:y()()51=--∑iii t t y y()521ii y y =-∑17.14 74 555.792①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据线性回归方程,相关系数,独立性检验的相关知识即可判断选项的正误. 【详解】对于选项A :在回归直线方程0.2.8ˆ0yx =+中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位,正确.对于选项B :对分类变量X 与Y ,随机变量2K 的观测值k 越大,则判断“X 与Y 有关系"的把握程度越大,错误.对于选项C :两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1,正确. 对于选项D :回归直线过样本点的中心(),x y ,正确. 故选: B 【点睛】本题主要考查了线性回归的有关知识,考查了随机变量的相关性,考查了推理能力,属于中档题.2.C解析:C 【分析】写出四个区间中点的横纵坐标,从而可求出 2.5x =,250y =,进而可选出正确答案. 【详解】解:由频率分布直方图可知, 第一个区间中点坐标,111.0,0.101000100x y ==⨯=, 第二个区间中点坐标,222.0,0.211000210x y ==⨯=, 第三个区间中点坐标,333.0,0.301000300x y ==⨯=, 第四个区间中点坐标,444.0,0.391000390x y ==⨯=, 则()12341 2.54x x x x x =+++=,()123412504y y y y y =+++=, 则一定在其线性回归直线上的点为(),x y ()2.5,250=. 故选:C. 【点睛】本题考查了频率分布直方图,考查了线性回归直线方程的性质.本题的关键是利用线性回归直线方程的性质,即点(),x y 一定在方程上.3.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)4.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.5.A解析:A 【解析】分析:首先计算观测值k 0的值,然后给出结论即可.详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k ⨯⨯-⨯==≈>⨯⨯⨯, 则有95%的把握认为环保知识测试成绩与专业有关. 本题选择A 选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.6.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .7.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.C解析:C由题意可得:2456855x ++++==,2535605575505y ++++==,回归方程过样本中心点,则:5285,1ˆˆ0bb =⨯+∴=. 本题选择C 选项.10.C解析:C 【解析】由78982x y++++⎧=⎪⎪=得=60xy ,故选C. 11.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 12.D解析:D 【解析】 试题由题根据二列联表得出;2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。

高中数学北师大版选修2-3 统计案例 本章整合 课件(28张)

高中数学北师大版选修2-3    统计案例 本章整合 课件(28张)

专题一
专题二
专题三
应用 2 10 名同学在高一和高二的数学成绩如下表 :
x y 74 76 71 75 72 71 68 70 76 76 73 79 67 65 70 77 65 62 74 72
其中 x 为高一数学成绩,y 为高二数学成绩. (1)y 与 x 是否具有线性相关关系 ; (2)如果 y 与 x 具有线性相关关系,求线性回归方程. 提示:利用相关系数公式判断其相关性,进一步求其线性回归方程.
专题一
专题二
专题三
应用 3 一个车间为了规定工时定额,需要确定加工零件所花费的时间, 为此进行了 10 次试验,测得的数据如下 :
零件数 x/个 加工时间 y/分 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122
(1)y 与 x 是否具有线性相关关系 ? (2)如果 y 与 x 具有线性相关关系,求线性回归方程. 提示:先求出 r 的值,|r|的值越接近于 1,表明两个变量的线性相关关系 越强,在线性相关关系较强,即|r|>0.75 时,求线性回归方程.
专题一
专题二
专题三
3.先判定相关性,再求线性回归方程 利用相关系数 r 来判断两个变量之间是否有线性相关关系时,可以依 据若|r|→1,我们认为两个变量间有很强的线性相关关系,可以求线性回归 方程,并可用求得的线性回归方程来预报变量的取值; 若|r|→0,则认为两个 变量之间的线性相关关系并不强,这时求线性回归方程没有太大的实际价 值.
∑ ������i ������i -10������ ������
10
8 80 108 8 640 6 400 11 664

金版高三数学 第十四章第四节 统计案例优化训练(理) 北师大版必修3 选修23

金版高三数学 第十四章第四节 统计案例优化训练(理) 北师大版必修3 选修23

金版高三数学第十四章第四节统计案例优化训练(理)北师大版必修3 选修23(本栏目内容,学生用书中以活页形式单独装订成册!)一、选择题(每小题6分,共36分)1.对分类变量X与Y的随机变量2的观测值,说法正确的是( )A.越大,“X与Y有关系”可信程度越小B.越小,“X与Y有关系”可信程度越小C.越接近于0,“X与Y无关”程度越小D.越大,“X与Y无关”程度越大【解析】越大,说明“X与Y有关系”成立的可信程度越大,反之越小.【答案】 B2.对于独立性检验,下列说法中错误的是( )A.2的值越大,说明两事件相关程度越大B.2的值越小,说明两事件相关程度越小C.2≤3.841时,有95%的把握说事件A 与B有关D.2>6.635时,有99%的把握说事件A 与B有关【解析】在独立性检验中,随机变量2的取值大小可说明两个变量相关的程度.一般地随机变量2的值越大,两变量的相关程度越大;反之就越小.临界值2>6.635说明有99%的把握认为二者有关系;2≤2.706则说明二者几乎无关.因此可知C中的说法是不正确的.【答案】 C3.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( )A.b与r符号相同 B.a与r符号相同C.b与r符号相反 D.a与r符号相反【解析】 由于b =∑i =1nx i y i-n x y ∑i =1n (x i-x )2r =∑i =1n x i y i-n x y ∑i =1n (x i -x )2∑i =1n(y i -y )2分母均为正,而分子相同,故b 与r 同号.【答案】 A4.已知x 、y 的取值如下表所示:若从散点图分析,y 与x 线性相关,且y =0.95x +a ,则a 的值等于( )A .2.6B .6.3C.2 D.4.5【解析】方法一:直接对照法由表中数据得x =2,y=4.5,在回归直线方程y=bx+a 中,a=y-b x=4.5-0.95×2=2.6,故选A.方法二:逆向思维法由于线性回归方程一定经过样本中心点(x,y),即(2,4.5),将四个选项中的a值代入方程,然后检验哪一条直线经过点(2,4.5),经检验只有A正确.【答案】 A5.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( )P(2≥k) …0.250.150.100.020.0100.005…k … 1. 2. 2. 5. 6.7.…323 072 706 024 635 879A.90% B.95%C.97.5% D.99.5%【解析】∵2=6.023>5.024,∴可断言市民收入增减与旅游愿望有关系的可信程度为97.5%,故选C.【答案】 C6.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.杂质高杂质低旧设备37 121新设备22 202根据以上数据,则( )A.含杂质的高低与设备改造有关B.含杂质的高低与设备改造无关C.设备是否改造决定含杂质的高低D.以上答案都不对【解析】由已知数据得到如下2×2列联表杂质高杂质低合计旧设备37 121158新设备22 202224合计59 323382由公式2=382×(37×202-121×22)2 158×224×59×323≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备是否改造是有关的.【答案】 A二、填空题(每小题6分,共18分)7.在独立性检验中,选用2统计量,用其取值大小来推断独立性是否成立,当2满足条件________时,我们有99%的把握说事件A与B 有关.【解析】由独立性检验判断表得K2>6.635.【答案】2>6.6358.若两个分类变量x和y的列联表为:y 1y 2x 1515x 241则x与y之间有关系的概率约为________.【解析】2=(5+15+40+10)(5×10-40×15)2≈18.822,(5+15)(40+10)(5+40)(15+10)查表知P(2≥10.828)≈0.001,∴x与y之间有关系的概率约为1-0.001=0.999.【答案】0.9999.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y^=3-5x,变量x增加一个单位时,y平均增加5个单位;③回归方程y^=bx+a必过点(x,y);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得2=13.079,则其两个变量间有关系的可能性是90%.其中错误的是________.【解析】①正确.由回归方程的定义及最小二乘法思想,知③正确.②④⑤不正确.【答案】②④⑤三、解答题(共46分)10.(15分)下表是某地区的一种传染病与饮用水的调查表.试作统计分析推断.(注:若K2>10.828,则认为得传染病与饮用水无关)【解析】根据列联表中数据可计算K2观测值为=830×(52×218-94×466)2518×312×146×684≈54.21. 由于54.21>10.828,说明该地区的传染病与饮用不干净水是有关的.11.(15分)某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件,根据所给数据:(1)写出2×2列联表;(2)判断产品是否合格与设备改造是否有关.【解析】 (1)由已知数据得合格品 不合格品 合计 设备改造后65 30 95设备改造前 36 49 85合计 101 79 18(2)根据列联表中数据,的观测值为=180×(65×49-36×30)2101×79×85×95≈12.38. 由于12.38>10.828,有99.9%的把握认为产品是否合格与设备改造有关.12.(16分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据. x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【解析】设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图.由图知y与x 间呈线性相关关系,设线性回归方程为y^=bx+a.由公式可求得b=-1.818,a=77.363,∴线性回归方程为y=-1.818x+77.363.(2)由线性回归方程知,每增加1 000件产量,单位成本下降1.818元.(3)产量为6 000件时,单位成本是66.45元/件,单位成本是70元/件时,产量为4 050件.。

金版高考数学 第四章第四节 统计案例课件(文) 北师大版必修3、选修

金版高考数学 第四章第四节 统计案例课件(文) 北师大版必修3、选修

是否独立.
当 ≤3.841时,认为X与Y无关; 当 >3.841时,有95%的把握说X与Y有关; 当 >6.635时,有99%的把握说X与Y有关; 当 >10.828时,有99.9%的把握说X与Y有关.
1.相关系数度量( ) A.两个变量之间线性相关关系的强度 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间是否存在关系 【解析】 相关系数来衡量两个变量之间线性相关关系的强弱. 【答案】 A
第四节 统计案例
1.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)相关系数 对于变量 y 与 x 的一
n
xiyi-n x y
i=1
i=1
r=

n
n
(xi- x )2 (yi- y )2
n
n
( xi2-n x 2)( yi2-n y 2)
2.常见的可线性化的回归分析 (1)幂函数型曲线 y=axb 作变换 u=ln y,v=ln x,c=ln a 得线性函数 u=c+bv. (2)指数型曲线 y=aebx 作变换 u=ln_y,c=ln_a,得线性函数 u=c+bx.
(3)倒指数型曲线 y=aexb 作变换 u=ln_y,v=x1,c=ln_a 得线性函数 u=c+bv. (4)对数型曲线 y=a+bln x 作变换 v=ln_x,得线性函数 y=a+bv.
i=1
i=1

44 842.4-10×4 476.268
(44 794-44 622.4)(44 941.93-44 903.4)
= 79.72 ≈0.980 4. 6 611.576 4
所以 y 与 x 之间具有很强的线性相关关系.

高中数学 第三章 统计案例教案 北师大版选修23

高中数学 第三章 统计案例教案 北师大版选修23

第三章统计案例§1回归分析1.1 回归分析(教师用书独具)●三维目标1.知识与技能(1)了解回归分析的基本思想,会对两个变量进行回归分析.(2)明确建立回归模型的基本步骤,并对具体问题进行回归分析.(3)会解决实际问题.2.过程与方法(1)通过实际问题去理解回归分析的必要性,明确回归分析的基本思想.(2)从散点图中的点的分布上,发现直接求回归直线方程存在明显不足,从中引导学生去发现解决问题的新思路——进行回归分析.3.情感、态度与价值观(1)培养学生用整体的观点和互相联系的观点,来分析问题.(2)进一步加强数学的应用意识,培养学生学好数学、用好数学的信心.(3)加强与现实生活中的联系,以科学的态度评价两个变量的相关关系.●重点难点重点:掌握回归分析的步骤、相关系数、建立回归模型的步骤;体会有些非线性模型通过变换,可以转化为线性回归模型;在解决实际问题的过程中寻找更好的建型方法.难点:求线性回归方程的系数a,b;相关系数;选择不同的模型建模.回归分析主要是研究两个变量间的关系,是在必修三的基础上学习,教材的1.1回归分析是复习必修三的内容,为了使建立回归方程有意义,提出了相关系数,这与回归直线中b的系数有关联,教师可通过实例,让学生了解相关系数的大小与线性相关的关系;在现实中又有一种非线性的相关性,如何解决引导学生转化为线性关系,主要通过数形结合思想、函数思想,使问题化归为线性关系,教学中可通过提醒、猜想、练习等方法,使学生掌握本节的重点内容.(教师用书独具)●教学建议建议本节课用3课时讲解完成.教学中通过组织学生自己动手操作计算、观察、分析、交流、讨论、归纳让他们在探究学习中经历知识形成的全过程,从而形成“自主探究、合作交流”的数学学习方法.教师在课堂上可以用计算机软件进行参数的估计、相关系数的计数,让学生掌握利用计算器进行线性回归方程的求解和评价.●教学流程第1课时以实际问题作为课题引入.⇒回顾建立回归直线方程的基本步骤.⇒通过实例巩固、体验线性回归直线方程的求法及应用.⇒第2课时提出新问题,如何用其他方法刻画变量之间的线性相关.⇒师生共同探究,得出相关系的概念及相关系数的大小与线性相关之间的关系.⇒通过例题,巩固验证相关系数刻画变量之间的线性相关的特点.⇒第3课时引导学生探究如果不是线性回归模型,如何估计参数,能否利用线性回归模型.⇒对数据进行分析变换后,对新数据建立线性模型.⇒转化为原来变量模型,得出结论,总结建模思想,补充拓展.⇒课堂小结并完成当堂双基达标,巩固本节所学知识.课标解读 1.通过实例掌握回归分析的基本思想方法.2.利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行预报.变量之间的相关关系【问题导思】1.正方形的面积S 与其边长a 是什么关系?圆的周长l 与半径r 是什么关系? 【提示】 ∵S =a 2,l =2πr , ∴它们都是确定的函数关系.2.父亲的身高与儿子的身高之间有何关系?耕种深度与水稻产量之间有何关系? 【提示】 非确定关系.1.变量之间有一定的联系,但不能完全用函数来表达.如人的体重y 与身高x .一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的随机性.2.在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常把这种图叫作变量之间的散点图.线性回归方程【问题导思】1.确定线性回归方程,只需得出哪两个量?【提示】 确定线性回归直线方程,只需确定a ,b 两个量即可.2.在线性回归方程y =a +bx 中,当一次项系数b 为正数时,说明两个变量有何相关关系?在散点图上如何反映? 【提示】 说明两个变量正相关,在散点图上自左向右看这些点呈上升趋势.假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设线性回归方程为y =a +bx ,要使这n 个点与直线y =a +bx 的“距离”平方之和最小,即使得Q (a ,b )=(y 1-a -bx 1)2+(y 2-a -bx 2)2+…+(y n -a -bx n )2达到最小,a ,b 需满足b =∑nb =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x .由数据求线性回归方程已知x ,y 之间一组数据:x 0 1 2 3 y1357(1)分别计算:x 、y 、x 1y 1+…+x 4y 4,x 21+x 22+…+x 24; (2)求出线性回归方程y =bx +a .【思路探究】 可利用表格的数直接计算,然后把这些结果代入线性回归方程系数公式,分别求得a ,b ,再求出线性回归方程. 【自主解答】 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+…+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+…+x 24=02+12+22+32=14;(2)b =x 1y 1+x 2y 2+x 3y 3+x 4y 4-4x yx 21+x 22+x 23+x 24-4x 2=34-4×1.5×414-4×1.52=2;a =y -b x =4-2×1.5=1.故y =2x +1.答:(1)所求的值分别为:1.5,4,34,14; (2)所求的线性回归方程是:y =2x +1.求线性回归方程的步骤:(1)列表求出x ,y ,∑ni =1x 2i ,∑ni =1x i y i ;(2)利用公式b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x ,求出b ,a ;(3)写出线性回归方程.观察两相关量得如下数据:x -1 -2 -3 -4 -5 5 3 4 2 1 y-9-7-5-3-115379求两变量间的回归方程. 【解】 列表i 12345678910 x i-1-2-3-4-55342 1 y i-9-7-5-3-115379 x2i1491625259164 1 x i y i9141512551512149由此可得x=0,y=0,∑10i=1x2i=110,∑10i=1x i y i=110,b=∑10i=1x i y i-10x y∑10 i=1x2i-10x2=110-10×0110-10×0=1,a=y-b x=0,∴所求回归方程为y=x.求实际问题的回归方程某企业想通过做广告来提高自己的知名度,经预测可知本企业产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:x 24568y 3040605070(1)判断y与x是否具有线性相关关系;(2)求回归直线方程.【思路探究】先画出散点图,即可判断y与x是否具有相关关系,如果y与x具有相关关系可将有关数据代入公式求得回归直线方程.【自主解答】(1)散点图如图所示:根据散点图可知,所给的数据点都在一条直线的附近,所以y与x具有线性相关关系.(2)列出下表,并且科学地的进行有关计算.i 1234 5x i24568y i3040605070x i y i60160300300560x=5,y=50,∑5 i=1x2i=145,∑5i=1y2i=135 000,∑5i=1x i y i=1 380于是可得,b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=1 380-5×5×50145-5×52=6.5,a=y-b x=50-6.5×5=17.5,于是所求的回归直线方程是y=6.5x+17.5.对一级数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:汞含量x 2 4 6 8 10 消光系数y64138205285360(1)作散点图;(2)如果y 与x 之间具有线性相关关系,求线性回归方程. 【解】 (1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设线性回归方程为:y =bx +a .经计算:得x =6,y =210.4,∑5i =1x 2i =220,∑5i =1x i y i =7 790.∴b =7 790-5×6×210.4220-5×62=36.95, a =210.4-36.95×6=-11.3.∴线性回归方程为y =36.95x -11.3.利用回归直线方程进行统计某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:x 35 40 45 50 y 56 41 28 11(1)画出散点图,并判断y 与x 是否具有线性相关关系; (2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.【思路探究】 两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.【自主解答】 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)∵x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34,∑4i=1x i y i=35×56+40×41+45×28+50×11=5 410,∑4i=1x2i=352+402+452+502=7 350,∴b=∑4i=1x i y i-4x·y∑4 i=1x2i-4x2=5 410-4×42.5×347 350-4×42.52=-370125=-2.96.∴a=y-b x=34-(-2.96)×42.5=159.8.∴y=-2.96x+159.8.(3)依题意有P=(-2.96x+159.8)(x-30)=-2.96x2+248.6x-4 794,∴当x=248.62×2.96≈42时,P有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.1.b=-2.96是斜率的估计值,说明单价每增加一个单位,日销售量就减少2.96. 2.借助于回归方程对实际问题的估计值是个近似值,不是一个准确值.假设关于某设备的使用年限x 和所支出的维修费y (万元)有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系. (1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少万元? 【解】 (1)列表如下:ix iy ix 2ix i y i1 2 2.2 4 4.4 2 3 3.8 9 11.4 3 4 5.5 16 22.0 4 5 6.5 25 32.5 5 6 7.0 36 42.0 ∑202590112.3由此可得:x =4,y =5.进而可以求得b =∑5i =1x i y i -5x y∑5i =1x 2i -5x2=1.23,a =y -b x =0.08.∴线性回归方程为y =0.08+1.23x .(2)当x =10时,y =0.08+1.23×10=12.38(万元),即估计使用10年时维修费用是12.38万元.数形结合思想在回归分析中的应用(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨标准煤)与相应的生产能耗y(吨标准煤)的几组对照数据.x 345 6y 2.534 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【思路点拨】(1)可直接由表格提供的点,列出散点图;(2)可利用线性回归方程中a,b公式直接求解;(3)直接用方程来估计所求值.【规范解答】(1)图形如图所示.3分(2)x =3+4+5+64=4.5;y =2.5+3+4+4.54=3.5;∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5.∑4i =1x 2i =32+42+52+62=86. 6分∴b =∑4i =1x i y i -4x ·y ∑4i =1x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7, 8分 a =y -b x =3.5-0.7×4.5=0.35. 9分∴y =0.7x +0.35. 10分 (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65吨标准煤. 12分线性回归方程的应用(1)描述两变量间的依存关系;(2)利用回归方程可进行预测;(3)利用回归方程还可以进行统计控制.1.作回归分析要有实际意义.2.回归分析前,最好先做出散点图.3.应用回归分析预测时,最好先作出散点图.1.下列说法正确的是( )A.任何两个变量都具有相关关系B.球的体积与该球的半径具有相关关系C.农作物的产量与施化肥量之间是一种确定性的关系D.某商品的生产量与该商品的销售价格之间是一种非确定性的关系【解析】两个变量之间的关系有两种,即函数关系与相关关系,故A错误.B中球的体积与该球的半径是函数关系.C中农作物的产量与施化肥量之间不是严格的函数关系,但是具有相关关系,因而是非确定性的关系.D中商品的生产量还和市场需求有关,故商品的生产量与该商品的销售价格之间是非确定性的关系.故选D.【答案】 D2.一位母亲记录了儿子3岁~9岁的身高(数据略),由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为y=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是( )A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右【解析】x=10时,y=7.19×10+73.93=145.83,但这是预测值而不是精确值,所以只能选D.【答案】 D3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为________.【解析】通过检验A,B,C,D四点共线,都在直线y=x+1上.【答案】y=x+14.已知一个回归直线方程为y=1.5x+45,x∈{1,7,5,13,19},求y.【解】由已知可知:x=1+7+5+13+195=9.又∵回归直线过点(x,y),∴y =1.5x +45,即y =1.5×9+45=58.5.一、选择题1.对具有线性相关关系的两个变量建立的线性回归方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .只能大于0 C .可能等于0D .只能小于0【解析】 b 可能大于0,也可能小于0,但当b =0时,x ,y 不具有线性相关关系. 【答案】 A2.下列两个变量间的关系不是函数关系的是( ) A .正方体的棱长与体积 B .角的弧度数与它的正弦值C .单产为常数时,土地面积与粮食总产量D .日照时间与水稻亩产量【解析】 ∵A 、B 、C 都可以得出一个函数关系式,而D 不能写出确定的函数关系式,它只是一个不确定关系. 【答案】 D3.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.36万元 B .65.5万元 C .67.7万元D .72.0万元【解析】 x =4+2+3+54=3.5,y =49+26+39+544=42,∴a=y-b x=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.【答案】 B4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y)B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(x n,b n)中的一个点C.直线y=bx+a的斜率为∑ni=1x i y i-n x·y∑ni=1x2i-n x2D.直线y=bx+a的纵截距为y-b x【解析】回归直线可以不经过任何一个点.其中A:由a=y-b x代入回归直线方程y=bx+y-a x,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B5.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A二、填空题6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1x i y i=1 481.b =1 481-6×72×7179-6×722≈-1.818 2,a =71-(-1.818 2)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】 由上表可得,y =-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元. 【答案】 1.818 28.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 【答案】 0.254 三、解答题9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 推销金额y /万元23345(1)求年推销金额y 关于工作年限x 的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 【解】 (1)设所求的线性回归方程为y =bx +a ,则b =∑i =15x i -xy i -y∑i =15x i -x2=1020=0.5, a =y -b x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y =0.5x +0.4. (2)当x =11时,y =0.5x +0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个数.现观测得到(x ,y )的4组值为(8,5),(12,8),(14,9),(16,11).(1)假设y 与x 之间存在线性相关关系,求y 与x 之间的线性回归方程.(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】 (1)设回归方程为y =a +bx ,则x =8+12+14+164=12.5,y =5+8+9+114=8.25, ∑4i =1x 2i =660,∑4i =1x i y i =438,b =∑4i =1x i y i -4x y∑4i =1x 2i -4x2=438-4×12.5×8.25660-4×12.52≈0.73, a =y -b x =8.25-0.73×12.5=-0.875,所以所求回归方程为y =-0.875+0.73x .(2)由y ≤10,即-0.875+0.73x ≤10,得x ≤10.8750.73≈15,即机器速度不得超过15转/秒.11.高二(3)班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y92799789644783687159若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】 显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 x i 24 15 23 19 16 11 20 16 17 13 y i 927997896447 83687159 x i y i2 208 1 185 2 231 1 691 1 024 5171 660 1 088 1 207767∑10i =1x 2i=3 182,∑10i =1x i y i=13 578于是可得b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2=545.4154.4≈3.53,a=y-b x=74.9-3.53×17.4≈13.5.因此可求得回归直线方程为y=3.53x+13.5.当x=18时,y=3.53×18+13.5≈77.故该同学预计可得77分左右.(教师用书独具)在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据如下表所示:价格x 1.4 1.6 1.82 2.2需求量y 121075 3(1)画出散点图;(2)求出y对x的回归直线方程;(3)如价格定为1.9万元,预测需求量大约是多少.(精确到0.01 t)【思路探究】先根据所给数据画出散点图,判断y与x是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识预测需求量.【自主解答】(1)散点图如图所示.(2)采用列表的方法计算a与回归系数b.序号x i y i x2i x i y i1 1.412 1.9616.82 1.610 2.56163 1.87 3.2412.64 25 4 105 2.2 3 4.84 6.6Σ9 37 16.6 62x=15×9=1.8,y=15×37=7.4,b=62-5×1.8×7.416.6-5×1.82=-11.5,a=7.4+11.5×1.8=28.1.所以y对x的回归直线方程为y=a+bx=28.1-11.5x.(3)当x=1.9时,y=28.1-11.5×1.9=6.25,所以价格定为1.9万元时,需求量大约是6.25 t.解答本类题目的关键首先应先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行预测.已知10只狗的血球体积x(单位:mm3)及红血球数y(单位:百万)的测量值如下:x 45424648423558403950y 6.53 6.309.257.50 6.99 5.909.49 6.20 6.557.72(1)画出散点图;(2)求出y对x的回归线性方程;(3)若血球体积为49 mm3,预测红血球数大约是多少?【解】(1)散点图如图(2)设线性回归方程为y =bx +a ,由表中数据代入公式,得b =∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.16,a =y -b x ≈0.12.所以所求线性回归方程为y =0.16x +0.12. (3)把x =49代入线性回归方程得:y =0.16×49+0.12≈7.96(百万),计算结果表明,当血球体积为49 mm 3时,红血球数大约为7.96百万.拓展阅读GDDS 和SDDS随着世界经济一体化的加快,各国间的交流与合作越来越频繁,为加强国际组织对各国经济运行状况的监督,国际社会在各领域纷纷建立了国际通行标准,其中国际货币基金组织(简称IMF)制定的数据公布通用系统(简称GDDS)和数据公布特殊标准(简称SDDS).GDDS 的主要内容和要求:在统计范围内,它将国民经济活动划分为5大经济部门,对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据.系统提出了五大部门综合框架和相关的数据类别和指标编制、公布的目标.选定的数据类别和指标中规定为主要部分.SDDS 将国民经济活动划分为4大经济部门.选定的数据类别分为:必须的、受鼓励的和“视相关程度”三类.必须的数据类别包括:综合统计框架、跟踪性数据、与部门有关的其他数据.IMF 为什么制定GDDS 和SDDS 呢?进入20世纪90年代以来,世界一些地区金融危机频繁爆发.1994年墨西哥的金融危机、1997年东南亚金融危机都导致国际金融市场剧烈动荡.两次金融危机给IMF 一个深刻的教训,也对其职能提出了挑战,在总结经验教训的基础上,IMF 认为,在新的国际经济、金融形势下,必须制定统一的数据发布标准,使各成员国按照统一程序提供全面、准确的经济金融信息,从而可以有效及时地对各国的经济进行正确的分析预测,从宏观上来作出调控,减少金融危机的发生和影响.1.2 相关系数课标解读 1.了解两个随机变量间的线性相关系数r ,并能利用公式求出相关系数r ;了解正相关、负相关、不相关的概念. 2.能利用相关系数r 判断两个随机变量间线性相关程度的大小,从而判断回归直线拟合的效果.相关系数【问题导思】1.有什么办法判断两个变量是否具有线性相关关系?【提示】 作出散点图,看这些点是否在某一直线的附近,计算线性相关系数. 2.线性相关系数与最小误差有何关系? 【提示】 Q (误差)=l yy (1-r 2).3.相关系数r 的绝对值的大小对相关性有何影响?【提示】 |r |越大,变量之间的相关程度越高;|r |越小,变量间线性相关程度越低;当r =0时,两个变量线性不相关.4.r 的正负对相关性的影响. 【提示】 r >0,b =l xyl xx>0两变量正相关; r <0,b =l xyl xx<0,两变量负相关.1.判断两个变量之间的线性相关关系的方法有: (1)计算线性相关系数r . (2)画散点图.2.假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r =l xyl xx l yy=∑ni=1x i-x y i-y∑ni=1x i-x2i=1ny i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y2相关系数及其应用维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度18202224262830(克/升)缩醛化度26.8628.3528.7528.8729.7530.0030.36(克分子%)求相关系数r.【思路探究】可直接利用相关系数r的公式直接计算.【自主解答】列表如下:i x i y i x2i x i y i y2i11826.86324483.48721.459 622028.35400567803.722 532228.75484632.5826.562 542428.87576692.88833.476 952629.75676773.5885.062 562830.0078484090073030.36900910.80921.729 6∑168202.94 4 144 4 900.16 5 892.013 6 x=24,y=28.99,r=∑7i=1x i y i-7x y∑7i=1x2i-7x2∑7i=1y2i-7y2=4 900.16-7×24×28.994 144-7×242×5 892.013 6-7×28.992≈0.94.当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.下列是小麦产量与施化肥量的一组观测数据:施化肥量15202530354045小麦产量320330360410460470480 判断施化肥量与水稻产量是否有相关关系.【解】i x i y i x2i y2i x i y i115320225102 400 4 800220330400108 900 6 600325360625129 6009 000430410900168 10012 300535460 1 225211 60016 100640470 1 600220 90018 800745480 2 025230 40021 600∑210 2 8307 000 1 171 90089 200∴r=∑i=17x i y i-7x y∑i=17x2i-7x2∑i=17y2i-7y2=4 300700×27 771.43≈0.975.由于r=0.975>0,因此施化肥量和水稻产量近似成线性正相关关系.线性回归分析的综合应用“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到数据如下:店铺编号 区内大学生数(万人)季度销售额(万元)1 0.2 5.8 2 0.6 10.53 0.8 8.84 0.8 11.85 1.2 11.76 1.6 13.7 7 2 15.78 2 16.9 9 2.2 14.9 10 2.620.2(1)试对区内大学生人数与店铺的销售额的关系进行相关性检验;(2)试根据这些数据建立回归模型,然后再进一步根据回归方程预测一个区内大学生人数1万人店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求建店区内大学生人数至少约多少人?【思路探究】 先根据表中的数据作相关检验,然后判断是否具有相关关系,再根据所给的数据解出线性回归方程,最后进行预测. 【自主解答】 (1)根据数据我们对区内大学生人数x 与店铺季度销售额y 作相关检验.根据数据可知:x =110(0.2+0.6+…+2.6)=1.4;y =110(5.8+10.5+…+20.2)=13,∑10i =1x 2i -10x 2=5.68,∑10i =1x i y i -10x y =28.4,∑10i =1y 2i -10y 2=157.3,因此r =28.45.68×157.3≈0.95;|r |接近1,因此有把握认为区内大学生人数x 与店铺季度销售额y 具有线性相关关系,求y 对x 的回归直线方程有意义.(2)回归系数b =28.45.68=5,a =13-5×1.4=6.因此回归直线方程是y=bx+a=5x+6.当x=1时,y=5×1+6=11,即区内大学生人数1万元店铺的季度销售额约11万元.(3)由回归直线方程是y=5x+6.令y≥10,解得x≥0.8,所以当建店区内大学生人数至少8 000人时才适合建店.进行相关性检验主要有两种常用方法,一是作散点图,观察所给的数据点是否在一条直线的附近,作散点图的优点是既直观又方便,是解决相关性检验问题比较常用的方法;缺点是作图总是存在误差,有时很难判断这些点是不是分布在一条直线的附近.二是利用样本相关系数对其进行相关性检验,优点是判断准确,缺点是计算繁琐,但可以借助计算器进行处理.在我国某地的一个县城,近期发现了好几个癌症村.政府部门十分震惊,马上组成调查组调查病因,经调查发现致癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工厂,化工厂排出的废水中含有金属砷,废水污染了水源,人食用了这种水就会致癌.下面就是调查组对几个癌症村水源中的砷超标的倍数和患癌症的人数统计的数据:砷超标的倍数x 34 5.5 4.2 5.86 3.5患癌症人数y 15202824354434(1)画出表中数据的散点图; (2)求y 对x 的回归方程;(3)若一个村的水源中砷超标的倍数为7,试估计这个村的患癌症的人数. 【解】 (1)散点图如图所示:(2)观察散点图,可知x 、y 成线性相关关系. 计算得x =327,y =2007,根据求b 公式代入数据计算得b ≈6.065,a =2007-6.065×327≈0.846. 所以患癌症人数y 对水源中砷超标的倍数x 的回归直线方程为y =6.065x +0.846.(3)根据上面求得的回归直线方程,当水源中砷超标的倍数为7时,y =6.065×7+0.846=43.301. 即该村患癌症的人数约为43人.对误差的大小与变量相关关系的理解有误对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不正确的是( )A.由样本数据得到的回归方程y=bx+a必过样本点的中心(x,y)B.在回归分析中,误差Q越小,变量之间的线性相关程度越高C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,说明变量之间的相关性强【错解】 B【错因分析】对误差Q与变量间的相关关系理解错误.【防范措施】正确理解回归方程、相关系数r、误差Q、散点图等概念是解决概念题的基础.【正解】∵误差Q越小,|r|越大,变量之间的线性相关程度越高,而相关系数r的范围为-1≤r≤1,∴C错误.【答案】 C1.相关系数是用来刻画两个变量相关关系的强与弱的.2.相关系数的计算公式r=∑ni=1x i-x y i-y∑ni=1x i-x2∑ni=1y i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y21.在对变量y和x进行线性相关检验时,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.9950.则变量y和x具有较高线性相关程度的是( )A.①和②B.①和④C.②和④D.③和④【解析】相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.【答案】 B2.对相关系数r,下列说法正确的是( )A.|r|越大,相关程度越大B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小【解析】由两个变量相关系数公式。

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》测试(有答案解析)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》测试(有答案解析)

一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”5.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成90 63 72 87 917158 82 93 81 7782 48 85 69 91 61 84 78 86绩若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系()A.95% B.97.5% C.99.5% D.99.9%6.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bc K a b c d a c b d -=++++A .0.01B .0.025C .0.10D .0.058.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K 2=10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响C .在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D .在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响 9.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==10.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bc k a b c d a c b d -=++++并参照附表,得到的正确结论是A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关” 11.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________.14.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82815.某汽车销售公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:百辆)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,...,8)i =数据作了初步处理,得到年销售量y 与年宣传费具有近似关系:ˆyb x a =+以及一些统计量的值如下:81i i x ==∑372.8,81i i y ==∑450.4,81i i x ==∑54.4,81i i y ==∑76.2 .已经求得近似关系中的系数68b =,请你根据相关回归分析方法预测当年宣传费100x =(千元)时,年销售量y =__________(百辆). 16.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.17.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温. 气温(℃)14 12 86用电量(度) 22 26 34 38由表中数据得线性方程x b a yˆˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .18.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+ ⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象;④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)19.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________. 20.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.三、解答题21.为了解某班学生喜爱玩游戏是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱玩游戏的学生的概率为35.(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜爱玩游戏与性别有关?说明你的理由;(3)以该班学生的情况来估计全校女生喜爱玩游戏的情况,用频率代替概率.现从全校女生中抽取3人进一步调查,设抽到喜爱玩游戏的女生人数为ξ,求ξ的期望. 下面的临界值表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)22.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)如果从全部受过教育的农民中随机地抽取3名,求抽到脱贫攻坚效果不明显的人数X 的分布列和数学期望(将频率当作概率计算).参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.23.2020年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了研究学生在线学习情况,市教研院数学学科随机从市区各高中学校抽取120名学生对线上教学情况进行调查(其中,男生与女生的人数之比为3:1),结果发现:男生中有40名对于线上教学满意,女生中有10名表示对于线上教学不满意.(1)请完成如表2×2列联表,并回答能否有95%的把握认为对“线上教学是否满意与性别有关”;(2)采用分层抽样的方法,从被调查的对线上教学满意的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的经验介绍,求所选取的2名学生性别不同的概率.附:参考公式及临界值表()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++24.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.25.为提高全民身体素质,加强体育运动意识,某校体育部从全校随机抽取了男生、女生各100人进行问卷调查,以了解学生参加体育运动的积极性是否与性别有关,得到如下列联表(单位:人):男生 70 30 100 女生 60 40 100 合计13070200(1)根据以上数据,判断能否在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)用频率估计概率,现从该校所有女生中随机抽取3人.记被抽取的3人中“偶尔运动或不运动”的人数为X ,求X 的分布列、期望()E X 和方差()D X .附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k 0.150.10 0.05 0.025 0k 2.0722.7063.8415.02426.为了研究某学科成绩是否与学生性别有关,采用分层抽样的方法,从高二年级抽取了30名男生和20名女生的该学科成绩,得到如图所示男生成绩的频率分布直方图和女生成绩的茎叶图,规定80分以上为优分(含80分).(1)(i )请根据图示,将2×2列联表补充完整;优分 非优分 总计男生 女生总计50(ii )据列联表判断,能否在犯错误概率不超过10o o 的前提下认为“学科成绩与性别有关”?(2)将频率视作概率,从高二年级该学科成绩中任意抽取3名学生的成绩,求成绩为优分人数X 的分布列与数学期望.参考公式:()()()()()22()n ad bc K n a b c d a b c d a c b d -==+++++++. 参考数据:()20P K k ≥ 0.1000.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > ,2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.6.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.B解析:B【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bcKa b c d a c b d-=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果.详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.8.A解析:A 【解析】因为7.879<K 2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响. 故选A.9.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .10.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”11.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Yσ=-=-⨯-= 二、填空题13.④【解析】两个变量之间的相关系数r 的绝对值越接近于1表示两个变量的线性相关性越强r 的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④ 【解析】两个变量之间的相关系数,r 的绝对值越接近于1,表示两个变量的线性相关性越强,r 的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.14.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.15.6【解析】试题分析:由得当时所以年销售量7806考点:回归方程解析:6 【解析】试题分析:由ˆˆa y bx =-得ˆ100.6a =6ˆ8100.6y x ∴=+,当100x =时ˆ780.6y=,所以年销售量y =780.6 考点:回归方程16.2【解析】试题分析:从匀速传递的产品生产流水线上质检员每10分钟从中抽取一件产品进行某项指标检测这样的抽样是系统抽样①错;两个随机变量的线性相关性越强相关系数的绝对值越接近于1②正确;某项测量结果服解析:2 【解析】试题分析:从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,①错;两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,②正确;某项测量结果服从正太态布,则,③正确;对于两个分类变量和的随机变量的观测值来说,越大,判断“与有关系”的把握程度越大,④错.故只有2个正确.考点:抽样方法(系统抽样),线性相关关系,正态分布,独立性检验.17.【解析】试题分析:由回归方程过样本平均数点则:由代入可得:由当气温为5℃时用电量的度数约为:40考点:回归方程的性质及应用解析:【解析】试题分析:由回归方程过样本平均数点(,)x y ,则:10,30x y ==,由2ˆ-=b 代入x b a yˆˆˆ+=可得: ˆ50a=,由ˆ502y x =-当气温为5℃时,用电量的度数约为:40 考点:回归方程的性质及应用.18.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2. 因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+, ∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.19.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.20.①②【解析】①分类变量与的随机变量越大说明与有关系的可信度越大正确;②所以两边取对数可得令可得即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为中则③错故答案为①②解析:①② 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②kx y ce =,所以两边取对数,可得()ln ln ln ln ln kxkxy cec ec kx ==+=+,令ln z y =,可得4ln ,0.34,ln 4,0.3,z c kx z x c k c e =+=+∴==∴=,即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+ 中,1,1,3b x === ,则2a =,③错,故答案为①②. 三、解答题21.(1)列联表见解析;(2)在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关,理由见解析;(3)65. 【分析】(1)由喜爱游戏学生的概率计算后可填充列联表; (2)根据列联表计算2K 后可得;(3)由题意ξ的可能取值为0,1,2,3,且23,5B ξ⎛⎫⎪⎝⎭,计算出概率得概率分布列,然后由期望公式计算出期望. 【详解】(1)列联表补充如下:(2)∵()25020151058.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯∴在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关. (3)从全校女生中随机抽取1人,抽到喜爱游戏的女生的概率为25.抽到喜爱游戏的女生人数ξ的可能取值为0,1,2,3,23,5B ξ⎛⎫ ⎪⎝⎭其概率为332355kkk P C -⎛⎫⎛⎫=⋅ ⎪ ⎪⎝⎭⎝⎭,0k =,1,2,3故ξ的分布列ξ的期望值()355E ξ=⨯=.【点睛】本题考查独立性检验,考查列联表及卡方的计算,考查随机变量的分布列和数学期望,考查学生的数据处理能力,运算求解能力,属于中档题. 22.(1)能有;(2)分布列见详解,138115【分析】(1)根据2K 的公式计算出观测值,并与附表中的参考值进行比较可以作出判断. (2)随机变量X 的可能的取值为0 ,1 ,2 ,3 ,然后分别求概率,即可列出分布列,求出期望. 【详解】(1)由题意知:2K 的观测值()2501519610 6.650 6.63521292525k ⨯-⨯=≈>⨯⨯⨯, 所以有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”(2)X 的可能的取值为0 ,1 ,2 ,331532545591(0)2300460C P X C ==== ,121015325105021(1)230046C C P X C ⋅====, 21101532567513527(2)230046092C C P XC ⋅=====, 3103251206(3)2300115C P X C ====,X 的分布列为所以()01234604692115115E x =⨯+⨯+⨯+⨯= . 【点睛】本题主要考查了独立性检验以及离散型随机变量的分布列和期望,属于基础题. 23.(1)见解析(2)815【分析】(1)根据分层抽样的性质填写列联表,再计算2K ,即可得出结论; (2)利用列举法结合古典概型的概率公式求解即可. 【详解】(1)由题意可知抽取120名学生中男生有90人,女生有30人,则列联表如下表2120(40105020)40 4.4 3.841606090309K ⨯-⨯==≈>⨯⨯⨯则有95%的把握认为对“线上教学是否满意与性别有关”(2)由分层抽样的性质可知,抽取的6名学生中,男生4人,女生2人 记4名男生分别为a b c d ,,,,2名女生分别为,A B从这6名学生中抽取2名学生的所有情况为:{}{}{}{}{},,,,,,,,,a b a c a d a A a B ,{}{}{}{},,,,,,,b c b d b A b B ,{,},{,},{,}c d c A c B ,{,},{,},{,}d A d B A B 共15种其中所选取的2名学生性别不同的共有8种 则所选取的2名学生性别不同的概率815P = 【点睛】本题主要考查了独立性检验的实际应用以及古典概型概率公式的应用,属于中档题. 24.(1)有99%的把握认为“脱贫攻坚效果与农民的受教育的发展状况有关”;(2)910【分析】(1)根据列联表计算2K ,与附表数据6.635比较即得结论;(2)先分层抽样确定5位农民代表中有3位农民效果明显,2位农民效果不明显,再用列举法,计算从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率即可.【详解】解:(1)根据题中列联表得:()2250151910613506.65021292525203K ⨯⨯-⨯==≈⨯⨯⨯由于6.650 6.635>,故有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”; (2)受教育的农民中,效果明显与效果不明显的比例为15:103:2=,所以用分层抽样的方法抽取的5位农民代表中,3位效果明显,2位效果不明显.设这5位农民代表为,,,,A B C d e ,其中,,A B C 效果明显,,d e 效果不明显,从中任选2位调查,结果为:(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e ,(),d e ,共10种情况,其中(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e 满足至少有1位脱贫攻坚效果明显,共9种情况,所以从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率910P =. 【点睛】本题考查了独立性检验、分层抽样和古典概型的概率计算问题,属于中档题.25.(1)不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)分布列答案见解析,6()5E X =,18()25D X =. 【分析】(1)代入2K 即可得出结论;(2)X 服从二项分布,分别求出概率,即可得出X 的分布列,然后代入数据求出期望和方差即可. 【详解】(1)由列联表可知2200(70406030)2002.1981307010010091k ⨯⨯-⨯==≈⨯⨯⨯,因为2.198 2.706<,所以不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关. (2)由题意可知2(3,)5XB ,X 的所有可能取值为0,1,2,3,033327(0)()5125P X C ===,1232354(1)()()55125P X C ==⨯=,2232336(2)()55125P X C ==⨯=,33328(3)()5125P X C ===. 所以X 的分布列为()355E X =⨯=,()3(1)5525D X =⨯⨯-=.【点睛】本题主要考查独立性检验原理以及利用二项分布求期望和方差.属于中档题.26.(1)(i )列联表见解析;(ii )能在犯错误概率不超过10o o 的前提下认为该学科成绩与性别有关;(2)分布列见解析;65【分析】(1)(i )本题可通过题意得出男生与女生得优分与非优分的人数,然后填表即可; (ii )可先通过22⨯列联表计算出2K 的观测值,然后与表中数据对比即可得出结果; (2)可通过题意得出优分人数X 服从二项分布23,5B ⎛⎫ ⎪⎝⎭,根据()3323()()55kkkP X k C -==即可绘出成绩为优分人数X 的分布列,然后根据二项分布23,5B ⎛⎫ ⎪⎝⎭即可求出()E X . 【详解】(1)(i )根据图示,将22⨯列联表补充完整如下:(ii )K 的观测值:()()()()()()22250991121 3.125 2.70620302030n ad bc K a b c d a c b d -⨯⨯-⨯===>++++⨯⨯⨯,所以能在犯错误概率不超过10%的前提下认为该学科成绩与性别有关; (2)由于有较大的把握认为该学科成绩与性别有关, 因此可将男女生成绩的优分频率202505f ==视作概率; 从高二年级中任意抽取3名学生的该学科成绩中,优分人数X 服从二项分布235B ,⎛⎫ ⎪⎝⎭, ()3323()()55k k k P X k C -==,0123k =,,,,当X 0=,()003323270()()55125P X C ===; 当1X =,()113223541()()55125P X C ===; 当2X =,()223123362()()55125P X C ===; 当3X =,()33032383()()55125P X C ===; 故X 的分布列为:数学期望()355E X =⨯=. 【点睛】本题考查22⨯列联表的填写、独立性检验、分布列以及二项分布的数学期望,考查基础知识的灵活应用,考查推理能力与计算能力,体现了基础性与综合性,是中档题.。

北师大版高中数学选修2-3第三章统计案例同步练习(一).docx

北师大版高中数学选修2-3第三章统计案例同步练习(一).docx

高中数学学习材料马鸣风萧萧*整理制作第三章 统计案例 同步练习(一)说明:本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案填入题后括号内,第Ⅱ卷可在各题后直接作答.共100分,考试时间90分钟.第Ⅰ卷(选择题 共30分)一、选择题(本大题共10小题,每小题3分,共30分)1.设有一个回归方程为,32ˆx y+=变量x 增加一个单位时,则 ( ) A.y 平均增加2个单位 B. y 平均减少3个单位 C.y 平均减少2个单位D. y 平均增加3个单位2.线性回归方程,ˆbx a y+=必经过的点是 ( ) A.),0(a B. ),(b x C. ),(y x D. ),(b a3.温州市正在全面普及数字电视,某住宅小区有2万住户,从中随机抽取200户,调查是否安装数字电视,调查结果如右表,则该住宅小区已经安装数字电视的用户数为( )A.8 000B.5 000C. 5 500D. 9 500 数字电视 老住户 新住户 已安装 30 50 未安装 65 554.医学上用光电比色计检验尿汞时,得尿汞含量(mg/L )与消光系数计数的结果如下表: 尿汞含量x 2 4 6 8 10消光系数y64 133 205 285 360如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,汞含量( ) A.约为13.27mg/L B. 高于13.27mg/L C.低于13.27mg/L D. 一定是13.27mg/L5.下表是性别与喜欢数学与否的统计列联表,依据表中的数据,得到 ( )喜欢数学 不喜欢数学 总计 男生 40 28 68 女生 5 12 17 总计 45 40 85 A.879.72≈χB. 564.32≈χC. 706.22<χD. 722.42≈χ6.在画两个变量的散点图时,下面叙述正确的是 ( )A.两个变量中的任意一个变量在x 轴上B.解释变量在x 轴上,预报变量在y 轴上C.预报变量在x 轴上,解释变量在y 轴上D.两个变量中的任意一个变量在y 轴上7.收集一只棉铃虫的产卵数y 与温度x 的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y 与x 之间的回归方程,并算出了对应相关指数2R 如下表: 拟合曲线直 线指数曲线 抛物线 二次曲线y 与x 的回归方程 7.4638.19ˆ-=x y84.327.0ˆ-=x e y202367.0ˆ2-=x y 1)78.0(ˆ2--=x y 相关指数2R0.746 0.996 0.902 0.002则这组数据模型的回归方程的最好选择应是 ( )A. 7.4638.19ˆ-=x yB. 84.327.0ˆ-=x e yC. 202367.0ˆ2-=x yD. 1)78.0(ˆ2--=x y8.如果根据性别与是否爱好物理的列表,得到841.3843.3>≈k ,所以判断性别与物理有关,那么这种判断出错的可能性为 ( ) A.5% B.15% C.20% D.25% 9.下列各组变量的关系中是相关关系的是 ( )A.电压U 与电流IB.圆面积S 与半径RC.粮食产量与施肥量D.天上出现的彗星流与自然界的灾害 10.在硝酸纳(NaNO 3)的溶解试验中,测得在不同温度)(C t ︒下,溶解于100mg 水中硝酸纳y (mg)的数据如下表: )(C t ︒ 0 4 10 15 21 29 36 51 68 y (mg) 66.7 71.0 76.3 80.685.792.999.4113.6 125.1则溶解于100mg 水中硝酸纳y (mg)关于温度)(C t ︒的回归方程是 ( )A.t y8634.0818.67ˆ+= B. t y8706.0508.67ˆ+= C. t y9143.0803.66ˆ+=D. t y7823.0812.68ˆ+= 第Ⅱ卷(非选择题 共70分) 二、填空题(本大题共4小题,每小题4分,共16分)11.在镁合金X 射线探伤中,透视电压μ与透视厚度l 有非常显著的线性关系,一组数据如下表,则它们的回归方程为__________. l (mm) 8 16 243454 μ(V) 45 52.5 5562.5 7012.在0H 成立时,若,40.0)(2=≥k P χ则=k __________.13.随机抽样340人,性别与喜欢韩剧列联表如下表,则性别与喜欢韩剧有关的频率约为__________.不喜欢韩剧 不喜欢韩剧 总计 男生 42 93 135 女生 52 153 205总计94 246 34014.某个学生做力学胡克定律实验得到了一组数据如下:序号 1 2 3 4 5F 1.01 2.02 3.01 4.03 5.02+ 1.210 1.391 1.640 1.708 2.340 l∆l则去掉第__________(填序号)个数据后,剩下数据的线性相关系数最大.三、解答题(本大题共5小题,共54分.解答应写出文字说明、证明过程或演算步骤)15.(本小题满分8分)在500名患者身上试验某种血清治疗SARS的作用,与另外500名未用血清的患者进行比较研究.结果如下表:治愈未治愈总计用血清治疗254 246 500未用血清治疗223 277 500 总计477 523 1000问该种血清能否起到治疗SARS的作用?16.(本小题满分10分)恋上网吧是中学生中普遍存在的一种现象.恋上网吧对学生的学业、身体健康都有不良的影响.下表是性别与恋上网吧的列联表.男生女生总计恋上网吧120 50 170不恋上网吧280 400 680 总计400 450 850试画出列联表的三维柱形图、二维条形图与等高条形图,并结合图形判断性别与恋上网吧是否有关.17.(本小题满分12分)在某班级随机地抽取7名学生,得到一组数学成绩与物理成绩的数据如下表:58 98 113 125 135 143 150 数学成绩物理成24 53 71 69 78 77 98绩试用计算器求出数学成绩x与物理成绩y的线性回归方程,并计算相关系数r的值,并说明两者相关性的强弱.当这个班里的同学甲的数学成绩为87分,预测该名同学的物理成绩.18.(本小题满分12分)电压的稳定程度与机床加工的零件的合格率有相关的关系,下表是一台滚齿机的电压数μ与合格率y的数据表:220 210 200 196 190 电压μ(V)99.9 97.8 94.6 90.4 89.2合格率y(%)若在生产管理中要求齿轮加工的合格率达到95%以上,电压应稳定在什么范围?19.(本小题满分12分) 一只蝗虫的产卵数y 与温度)(C x ︒有关,现收集到5组数据如下:温度)(C x ︒ 20 23 25 27 29 产卵数y512213068对上述数据分别用b ax y +=2与dx ce y =来拟合y 与x 之间的关系,并用残差分析两者的拟合效果.参考答案第Ⅰ卷(选择题 共30分)1-10 DCAAD BBACB第Ⅱ卷(非选择题 共70分)11、l 530.0573.42ˆ+=μ12、0.708 13、0.75 14、515、解:由列联表给出的数据,计算8522.3523477500500)223246277254(100022≈⨯⨯⨯⨯-⨯⨯≈χ因为,841.38522.3>所以我们有95%的把握认为这种血清能起到治疗SARS 的作用.16、由图形知性别与恋上网吧有关.17、线性回归方程是:,5572.167128.0ˆ-=x y相关系数,9697.0=r ∴由此可知数学与物理的相关性很强;当解释变量87=x 时,预报变量物理成绩456.45≈y 分.18、因为,2.203)190196200210220(51=++++=u∑==-⋅-51,32.212)()(j jj y y u u %,38.94)2.894.906.948.979.99(51=++++=y .8.564)(51=-∑=j ju u,888.84)(51=-∑=j j y y 那么,75.09697.0888.848.56432.212>≈⨯=r因此y 与u 有很强的线性相关关系,由公式:u y376.0993.17ˆ+=,依题意: )(806.20495376.0993.17ˆV u u y≥⇒≥+=,电压应稳定在[204.806,220]范围内.(注意:用计算器统计模式直接计算时,当预报量y 为95%时,解释变量u 为204.849V).19、令2x t =,y 与t 的数据表为:t400529 625 729 841 产卵数y5 12 21 30 68则y 与t 之间的线性回归方程为: ,6619.551326.0ˆ)1(-=t y 即,6619.551326.0ˆ2)1(-=x y……① 令,ln ,ln c c y z ='=则,dx c z +'=z 与x 的数据表是:温度)(C x ︒20 23 25 27 29 y z ln =1.60942.48493.04453.40124.2195z 与x 的线性回归方程为,9675.32790.0ˆ-=x z即...ˆ9675.32790.0)(-=x z e y …②, 现列出①、②残差表;温度)(C x ︒2023 25 27 29 产卵数y5 12 21 30 68 1e7.6133 -2.4946 -6.2265 -11.0192 12.1272 2e-0.01630.41510.7531-17.73766.2126①式的残差的平方和为,4464.371)ˆ(ˆ2)1(511=-=∑=y y Q j j ②式的残差的平方和为9586.353)ˆ(ˆ2)2(512=-=∑=y y Q j j ∴用dx ce y =来拟合y 与x 之间的关系效果要好。

高中数学必修3北师大版 统计图表 学案(Word版含答案)

高中数学必修3北师大版 统计图表 学案(Word版含答案)

§3统计图表知识梳理1.统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以直观、准确地理解相应的结果.2.常用的统计图表有条形统计图、扇形统计图、折线统计图和茎叶图.3.用茎叶图表示数据有两个突出的优点:一是所有数据信息不丢失,二是记录方便.知识导学学习本节,首先要明白在收集了样本数据后,下一步要做的工作是什么?应该是分析和处理数据,为此较理想的方法是将所得数据进行适当的整理、分析,并转化为直观的形式表现出来,以便从中获取相应的信息,帮助我们制定恰当的决策.所以学习本节时,可先回忆初中阶段所学的直观表达一组数据的方法,即用条形统计图、扇形统计图和折线统计图来表达一组数据的特征.条形统计图、扇形统计图和折线统计图各自有哪些特点和用途?1.条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少.2.扇形统计图中,用圆面代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分占总体的百分比的大小.扇形统计图可以很清楚地表示各部分数量同总数之间的关系.3.折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连结起来.折线统计图不但可以表示出数量的多少,而且能够清楚地表示数量增减变化的情况.另外有时还可以用茎叶图表示样本数据,它有两个突出优点:(1)从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;(2)茎叶图可以随时记录,方便表示与比较.当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.在对一些数据进行统计时,要根据数据的特点和统计结果的精确度进行选择合适的统计图表.如果只需大致判断一些数据的分布规律,了解数据中各元素所占比例的大小情况可以使用扇形统计图.例如统计一个农村种植的各种作物的比例.如果需要根据图表了解各数据的频率可以使用条形统计图.例如统计一批产品中优等品的频率.如果要了解数据的增减情况可以采用折线图.例如统计一个人成绩变化情况.要了解数据的全部信息可以使用茎叶图.例如篮球比赛的计分.只有合理选择图表才能使统计的数据更加直观.疑难突破1.统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果.如何根据不同的需要选择适当的统计图进行表示?剖析:(1)条形统计图能清楚地表示出每个项目的具体数目,当数据量很大时,条形统计图能更直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目.(2)折线统计图是把条形统计图各个长方形上边的中点用线段连结起来得到的,它能够清晰地反映数据的变化情况.(3)扇形统计图能清楚地表示出各部分在总体中所占的百分比.(4)茎叶统计图没有信息的损失,所有的原始数据都可以从这个茎叶图中得到.但茎叶图只适合于表示两位有效数字的数据,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.(5)当在问题中收集到的数据量较多时,在用统计图表示之前,一般需要先将数据按一定的方式进行整理.在此基础上,再根据不同的需要选择适当的统计图表示.2.普查或抽样的方法收集到的数据一般乱而多,如何进行数据的处理?剖析:(1)我们无法将其包含的信息统统理解并加以表达,这就需要对数据进行整理和分析,将其转化成可以直接利用的形式,并从中获取相应的信息,统计图表正是表达和分析数据的重要工具,并且还可以直观地、准确地理解相应结果.(2)注意理解掌握常用统计图的特点,根据题目和需要,去选择合适的统计图,并从不同的统计图中获得各种所需要的信息.典题精讲例1某赛季甲、乙两名篮球运动员每场得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙的得分:8,13,14,16,23,26,28,33,38,39,51.(1)你能用适当的统计图表示上面的数据吗?(2)根据你所画的统计图,分析甲、乙运动员的得分情况.思路分析:由于所收集数据量不是太大,而且所给的数据均为一位数或两位数,不仅符合茎叶统计图的特征,而且第(2)问需要对这两组数据进行相互的比较,所以选用茎叶统计图来表示.解:(1)如图1-3-1所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数.图1-3-1(2)根据上图可以对两名运动员的成绩进行比较.从茎叶图上可以看出,甲运动员的得分情况大致对称,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.黑色陷阱:大多数同学会选用条形统计图或折线统计图,主要原因是该数据确实符合实际问题情境,但对于第(2)问甲、乙运动员的得分情况分析则图示得不到那么明显的结果.例2下表给出了2001年A、B两地的降水量.(单位:mm)1月2月3月4月5月6月7月8月9月10月11月12月A9.2 4.9 5.418.638.0106.354.4128.962.973.626.210.6 B41.453.3178.8273.5384.9432.467.5228.5201.4147.328.019.1请用适当的统计图表示上面的数据.思路分析:题意要求能将所给的两组数据的值进行相互比较,且能观察各月份的差异及趋势,可利用条形统计图和折线统计图来表示.解:用条形图1-3-2和折线图1-3-3表示上面的数据.图1-3-2浅色为A地降水量,深色为B地降水量.图1-3-3其中浅色为B地降水量,深色为A地降水量.绿色通道:当两组数据具有可比性时,要想得出两组数据的差异比较,且能够直观观察出各组数据的分布趋势,而条形统计图与折线统计图同时具备这两种要求.变式训练某地农村某户农民年收入如下(单位:元):土地收入打工收入养殖收入其他收入4 320 3 600 2 350850请用不同的统计图来表示上面数据.思路分析:题意的要求是将此四个数据用统计图展示出来,在所有的统计图中,可利用条形统计图、折线统计图、扇形统计图来表示.解:我们分别用条形图1-3-4、折线图1-3-5和扇形图1-3-6来表示.图1-3-4图1-3-5图1-3-6问题探究问题新浪科技讯2006年4月13日,中国互联网络信息中心(简称为:C NN IC)在京发布了北京市互联网络发展状况统计报告,数据显示,北京上网用户数为398万,占全国上网用户总人数的比例为5%,占北京市人口的28%,上网普及率居于全国首位.北京市上网用户的职业分布如下表:图1-3-7利用该图表,你能得到什么信息?你还有其他表示这些数据的方法吗?结合上述图表中的数据信息,你对各类上网人员情况有怎样的看法?导思:由条形图可以直观、形象地看出不同职业人员上网的情况,职业分得越细,反映的总体信息越多.表达样本数据可使用不同的图表形式.从北京上网用户数和图表中的数据不难得到以下信息:各类人员上网人数及多少,上网用户的职业分配情况,各类人员上网的作用的估计等.探究:问题中给出了北京市各职业人员上网情况的条形图,从图中可直观、形象地看出各类上网人员所占的比例大小,学生上网的最多,占到约30%,其次是专业技术人员,约占23%,这两类人员约占总上网人数的53%;工人和军人上网的人数较少,仅占3%.上述统计的数据,还可以用扇形统计图或折线图或茎叶图表示.下图是该问题中数据的扇形图(百分比)和折线图.图1-3-8图1-3-9通过上述图表的信息,发现学生上网的最多,其次是专业技术人员,这两类人员约占总上网人数的一半多,工人和军人上网的人数较少,这说明近几年随着我国宽带网的普及,各类学生开始喜欢从互联网上获取信息,如学习知识、了解国家大事、相互交流等,而专业技术人员更加注意利用互联网进行资料查阅、文件下载、资源共享、不断学习;同时由于职业的特点或文化程度的限制,大部分工人、军人等特殊职业还不具备上网的条件或没有时间上网.所以从上述统计的图表中我们可以看出,目前北京市互联网在不同职业中的普及情况.进而也可知道全国各城市普及互联网的大致情况.。

数学北师大版必修3优化训练:1.3统计图表 含解析 精品

数学北师大版必修3优化训练:1.3统计图表 含解析 精品

§3 统计图表5分钟训练 (预习类训练,可用于课前)1.在因特网上搜索相关的数据的方法属于收集数据中的( ) A.做试验 B.查阅资料 C.设计调查问卷 D.以上都不是 答案:B 解析:有些数据不容易直接找到或者直接得到数据比较麻烦,可以在因特网上进行查阅,收集,这是利用现代信息技术查阅资料的一种方法.所以,在因特网上搜索相关的数据属于查阅资料的一种方式.2.下面能使所有的原始数据都可以从该图中得到而没有信息的损失的统计图是( ) A.扇形统计图 B.折线统计图 C.条形统计图 D.茎叶统计图 答案:D解析:在统计图中,只有茎叶统计图完好无损地保存着所有的数据信息.A.条形统计图B.扇形统计图C.折线统计图D.茎叶统计图 答案:B解析:扇形统计图、条形统计图和折线统计图,均可以将统计中的所有数据所占整体百分比直观显示出来,但最佳的统计图表应当是扇形统计图,其显示得更为直观一点. 4.(2007浙江杭州模拟,文2)某校为了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )A.0.6小时B.0.9小时C.1.0小时D.1.5小时 答案:B解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生人数的比,即5052105.1101205.050⨯+⨯+⨯+⨯+⨯=0.9(小时).10分钟训练 (强化类训练,可用于课中)1.当收集到的数据量很大或有多组数据时,用哪种统计图表示较合适( ) A.茎叶统计图 B.条形统计图 C.折线统计图 D.扇形统计图 答案:B解析:条形统计图能直观地反映数据的分布状况,但却无法看到原始数据,出现了信息丢失,条形统计图虽然损失了数据的部分信息,但当数据量很大时,却能更直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目. 2.对于茎叶图的叙述,错误的是( )A.统计中用来表示数据的图B.能够保持原始信息不丢失C.方便记录和表示D.数据越多用茎叶图表示越方便 答案:D解析:茎叶图也是统计中表示数据的一种图,且茎叶图表示数据的突出特点是:没有原始信息的损失并且方便记录,但是大量的数据使用茎叶图不太方便. 3.甲、乙两小组各10名同学的英语口试成绩如下(单位:分): 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶统计图表示两个小组的成绩. 解:如下图:4.某班有60名同学,一次数学测验成绩为:优9人,良12人,中等18人,差21人.请用扇形统计图来表示数学测验情况.解:先算出各层次学生所占的比例: 优:609×100%=15%,良:6012×100%=20%;中:6018×100%=30%,差:6021×100%=35%. 用扇形统计图表示为:30分钟训练 (巩固类训练,可用于课后)用下列哪种统计图表示上面的数据较合适( )A.条形统计图B.扇形统计图C.折线统计图D.茎叶统计图 答案:C 解析:通过折线统计图,我们比较直观地看出此股票在这10天中,其价格总体是一个上升的趋势,也可以看出每天的变化.所以用折线统计图表示不断变化的数据,是有其优越性的.2.某市对上、下班时间机动车行驶时速情况作抽样调查,如下图(这是茎叶图表示机动车行驶时速的情况,单位:km/h),其中左边的数字5的意义是()A.表示机动车行驶时速为53B.表示机动车行驶时速为35C.表示机动车行驶时速为5D.表示机动车行驶时速为5 230答案:B解析:由茎叶统计图可知中间的数字表示上、下班时间车速的十位数,两边数字分别表示上、下班时间车速的个位数.该组统计中共有24个2位数数据,其中十位为1的有4个,十位为2的有11个,十位为3的有8个,十位为4的有1个,其中左边的数字5为数据35.即表示上班时间机动车行驶时速为35 km/h.3.下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况.134 112 117 126 128 124 122 116 113 107116 132 127 128 126 121 120 118 108 110133 130 124 116 117 123 122 120 112 112解:茎叶图如下图所示.该生产车间的工人加工零件数大多都在110到130之间,且分布较对称、集中,说明日生产情况稳定.4.下面两幅统计图〔如图(1)、图(2)〕,反映了某市甲、乙两所中学学生参加课外活动的情况.请你通过图中信息完成下面的问题.甲、乙两校参加课外活动的学生人数统计图(2000—2006年)图(1)2006年甲、乙两校学生参加课外活动情况统计图图(2)(1)通过对图(1)的分析,写出一条你认为正确的结论;(2)通过对图(2)的分析,写出一条你认为正确的结论;(3)2006年甲、乙两所中学参加科技活动的学生人数共有多少?解:(1)2000年至2006年甲校学生参加课外话动的人数比乙校增长的快;(2)甲校学生参加文体活动的人数比乙校参加科技活动的人数多;(3)2 000×12%+1 105×10%=351,2006年两所中学的学生参加科技活动的总人数是351人.。

金版高考数学 第四章第四节 统计案例课件(文) 北师大版必修3、选修1-2

金版高考数学 第四章第四节 统计案例课件(文) 北师大版必修3、选修1-2

2.常见的可线性化的回归分析 (1)幂函数型曲线 y=axb 作变换 u=ln y,v=ln x,c=ln a 得线性函数 u=c+bv. (2)指数型曲线 y=aebx 作变换 u=ln_y,c=ln_a,得线性函数 u=c+bx. b (3)倒指数型曲线 y=aex 1 作变换 u=ln_y,v=x,c=ln_a 得线性函数 u=c+bv. (4)对数型曲线 y=a+bln x 作变换 v=ln_x,得线性函数 y=a+bv.
3.下列说法正确的个数为(
)
①对事件A与B的检验无关时,即两个事件互不影响
②事件A与B
2就越大;
2的大小是判定事件A与B是否有关的唯一根据;
④若判定两事件A与B有关,则A发生,B一定发生.
A.1
C.3 D.4
B.2
【解析】 由概念知②正确,其他均不正确.
【答案】 A
4.下面是一个2×2列联表
x1 x2 总计
2 2 i=1 10
yi2=44 i=1

10
941.93, xiyi=44 842.4,
i=1
10
i=1
xiyi-10 x
10
10
y
r= ( xi2-10 x 2)( yi2-10 y 2)
i=1 i=1 10

44 842.4-10×4 476.268
(44 794-44 622.4)(44 941.93-44 903.4) 79.72 = ≈0.980 4. 6 611.576 4 所以 y 与 x 之间具有很强的线性相关关系.
2.以下对线性相关系数r的叙述中,正确的是(
)
A.|r|∈(0,+∞),|r|越大,相关程度越大;反之,相关程度越 小 B.|r|∈(-∞,+∞),r越大,相关程度越大;反之,相关程度 越小 C.|r|≤1,|r|越接近于1,相关程度越大;|r|越接近于0,相关程 度越小 D.以上说法都不对 【解析】 根据相关系数的定义和计算公式可知,|r|≤1,且|r| 越接近于1,相关程度越大;|r|越接近于0,相关程度越小,所以C 正确. 【答案】 C

【北师大版】数学《优化方案》必修3课件第3章§2.2

【北师大版】数学《优化方案》必修3课件第3章§2.2

古典概型的判定
判断一个事件是否为古典概型,关键看它是否具 备古典概型的两个特征:(1)在一次试验中,可能 出现的结果只有有限个,即有限性;(2)试验中每 个基本事件发生的可能性是均等的,即等可能性.
例2 袋中有大小相同的5个白球,3个黑球和3个 红球,每球有一个区别于其他球的编号,从中摸出 一个球. (1)有多少种不同的摸法?如果把每个球的编号看 作一个基本事件建立概率模型,该模型是不是古典 概型? (2)若以球的颜色为基本事件,有多少个基本事件? 以这些基本事件建立概率模型,该模型是不是古典 概型?
【解】 (1)法一:采用列举法 分别记白球为1、2、3号,黑球为4、5号,有以下 基本事件:(1,2)(1,3)(1,4)(1,5)(2,3)(2,4)(2,5)(3,4) (3,5)(4,5)共10个. 法二:采用列表法 设5只球的编号为:a、b、c、d、e,其中a,b,c 为白球,d,e为黑球.
古典概型概率的求法
应用古典概型的概率公式求P(A)时的步骤: (1)判断该试验是否为古典概型;(2)算出基本事件 的总数n;(3)算出事件A包含的基本事件的个数m; (4)代入古典概型概率公式求P(A).
例3 (2010年高考湖南卷)为了对某课题进行研究,
用分层抽样方法从三所高校A,B,C的相关人员中,
列表如下:
a
b
c
d
e
a
(a,b) (a,c) (a,d) (a,e)
b (b,a)
(b,c) (b,d) (b,e)
c (c,a) (c,b)
(c,d) (c,e)
d (d,a) (d,b) (d,c)
(d,e)
e (e,a) (e,b) (e,c) (e,d)
由于每次取两个球,每次所取两个球不相同,而摸 (b,a)与(a,b)是相同的事件,故共有10个基本事件. (2)法一中“两只都是白球”包括(1,2)(1,3)(2,3)三种. 法二中,包括(a,b),(b,c),(c,a)三种. 【名师点评】 求基本事件个数常用列举法、列表 法、树图法来解决,并且注意以下几个方面:①用 列举法时要注意不重不漏;②用列表法时注意顺序 问题;③树图法若是有顺序问题时,只做一个树图 然后乘以元素个数.

高中数学 统计案例同步训练题 北师大版选修23精品.doc

高中数学 统计案例同步训练题 北师大版选修23精品.doc

统计案例1•下列抽样试验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3 : 2 : 8 : 2,从中抽取200人入样B.从某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样2.某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查,经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为()A. 180B. 400C. 450D. 2 0003.1,在等腰直角三角形ABC中,在斜边AB上任取一点M,则AM>AC的概率是__________答案:耳124.甲、乙两人玩猜数字游戏,先由甲心中想一个数字,记为a,再由乙猜甲刚才所想的数字,把乙猜的数字记为b,其中a,施{1,2,3,4,5,6},若|«-^|<1,就称甲乙"心有灵犀” •4 现任意找两人玩这个游戏,则他们“心有灵犀”的概率为•答案:一9 5.每次抛掷一枚骰子(六个面上分别标以1, 2, 3, 4, 5, 6).连续抛掷2次,则2次向上的数之和不小于10的概率为__________ •答案:丄66.若从集合{1,2,3,4,5}的所有子集中任取一个子集,则取出的集合含有至少两个元素的13概率是______________ •答案:—167. _________________________________________________________________ 设aw {1,3,5},施{2,4,6},则函数y = log h丄是增函数的概率为______________________ 答案:丄方x 3 &设有一个回归方程为y = 2-1.5x则变量x每增加一个单位时,y平均减少_____________1. 5个单位9.若变量y与x之间的相关系数r =-0.9362,则变量y与x之间()A、不具有线性相关关系B、具有线性相关关系C、它们的线性关系还要进一步确定D、不确定10.下列说法:①将一组数据中的每个数据都加上或减去一个常数后,方差恒不变;②设A有一个回归方程y = 3-5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方A程y = bx + a必过点(x, y);④曲线上的点与改点的坐标之间具有相关关系;⑤在一个2x2列联表中,由计算得力2=13. 079,则其两个变量间有关系的可能性是90%,其中错误的序号是________________ ②④⑤11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟试根据上述数据计算力2= __________________比较这两种手术对病人又发作心脏病的影响有没有差别. ______________________________________________1. 78;不能作出这两种手术对病人又发作心脏病的影响有差别的结论12.(09天津)为了了解某工厂开展群众体育活动的情况,拟采用分层抽样的方法从A, B,C三个区中抽取7个工厂进行调查,已知A,B, C区中分别有18, 27, 18个工厂(I )求从A.B.C区中分别抽取的工厂个数;(II)若从抽取的7个工厂中随机抽取2个进行调查结果的对比,用列举法计算这2个工厂中至少有1个来自A区的概率。

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(含答案解析)(2)

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(含答案解析)(2)

一、选择题1.以下四个命题:①从匀速传递的产品生产流水线上,每30分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,那么该市身高高于180cm 的高中男生人数大约为3000;③随机交量X 服从二项分布(100,0.4)B ,若随机变量21Y X =+,则Y 的数学期望为()81E Y =,方差为()48D Y =;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系的把握程度越大其中正确的个数是( ) A .1B .2C .3D .42.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验 D .①独立性检验,②取平均值3.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”5.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 98 71 67 93 64 78 77 90 57 83 72 83 物理成绩90 63 72 87 91 71 58 82 93 81 77 82 48 85 69 91 61 84 78 86 若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%6.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个7.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%8.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关9.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005B .0.01C .0.02D .0.0510.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==11.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③12.已知,x y 的取值如下表:( )若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?15.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.16.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 17.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 18.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.19.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()1122122121212n n n n n n n n n χ++++-=20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:k 2.706 3.841 6.637.879参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.22.共享单车进驻城市,绿色出行引领时尚.某市2017年对共享单车的使用情况进行了调查,数据显示,该市共享单车用户年龄分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用共享单车用户”,使用次数为5次或不足5次的称为“不常使用共享单车用户”.已知在“经常使用共享单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的分析,采用随机抽样的方法,抽取了一个容量为200的样本.请你根据题目中的数据,补全下列2×2列联表:年轻人非年轻人合计经常使用共享单车用户120不常使用共享单车用户80合计 160 40 200根据列联表独立性检验,判断有多大把握认为经常使用共享单车与年龄有关? 参考数据:20()P K k ≥ 0.150 0.100 0.050 0.025 0.0100k2.072 2.7063.841 5.024 6.635其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.(2)以频率为概率,用分层抽样的方法在(1)的200户用户中抽取一个容量为5的样本,从中任选3户,记经常使用共享单车的用户数为随机变量X ,求X 的分布列和数学期望.23.为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[]0,60的范围内,规定分数在50以上(含50)的作文获奖,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图如图所示,其中a ,b ,c 构成以2为公比的等比数列.(1)求a ,b ,c 的值;(2)填写下面22⨯列联表,能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关?文科生 理科生 合计 获奖6不获奖合计400.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.24.新型冠状病毒属于β属的冠状病毒,人群普遍易感,病毒感染者一般有发热咳嗽等临床表现.基于目前的流行病学调查和研究结果,病毒潜伏期一般为1-14天,大多数为3-7天.为及时有效遏制病毒扩散和蔓延,减少新型冠状病毒感染对公众健康造成的危害,需要对与确诊新冠肺炎病人接触过的人员进行检查.某地区对与确诊患者有接触史的1000名人员进行检查,结果统计如下表:(Ⅰ)填写下面列联表,并通过计算判断能否在犯错误的概率不超过0.001的前提下,以为新冠肺炎密切接触者有发热症状与最终确诊患病有关?(Ⅱ)在全国人民的共同努力下,尤其是全体医护人员的辛勤付出下,我国的疫情得到较好控制,现阶段防控重难点主要在境外输入病例和无症状感染者(即无相关临床表现但核酸检测或血清特异性免疫球蛋白M 抗体检测阳性者).根据防控要求,无症状感染者虽然还没有最终确诊患新冠肺炎,但与其密切接触者仍然应当采取居家隔离医学观察14天.已知某人曾与无症状感染者密切接触,而且在家已经居家隔离11天未有临床症状,若该人员居家隔离第k 天出现临床症状的概率为()11112,13,142k k -⎛⎫= ⎪⎝⎭,两天之间是否出现临床症状互不影响,而且一旦出现临床症状立刻送往医院核酸检查并采取必要治疗,若14天内未出现临床症状则可以解除居家隔离,求该人员在家隔离的天数(含有临床症状表现的当天)ξ的分布列以及数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.25.某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人.(1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99.9%的把握认为该大学的大学生的阅读方式与性别有关,说明你的理由.附:22(-)()()()()n ad bcKa b c d a c b d=++++(n=a+b+c+d).26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据抽样方式的特征,可判断①;根据正态分布的性质,可判断②;根据二项分布的期望与方差特点,可判断③;根据独立性检验的方法和步骤,可判断④. 【详解】解:①根据抽样是间隔相同,且样本间无明显差异,故①应是系统抽样,即①为假命题;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,所以()1(180)1721800.12P P ξξ>=-<≤=,所以该市身高高于180cm 的高中男生人数大约为300000.13000⨯=人,故②为真命题;③随机交量X 服从二项分布(100,0.4)B ,则()1000.440E X =⨯=,()()1000.410.424D X =⨯⨯-=,若随机变量21Y X =+,则Y 的数学期望为()()2181E Y E X =+=,方差为()()2296D Y D X ==;故③为假命题;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故④为假命题. 故选:A . 【点睛】本题以命题的真假判断为载体考查了抽样方法,正态分布,二项分布及独立性检验等知识点,属于中档题.2.B解析:B 【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案. 【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验, 回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析, 综上可知①是独立性检验,②是回归分析,故选B . 【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.4.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.6.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.7.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)8.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .9.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.10.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .11.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .12.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k >,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.05【解析】【分析】根据表中的数据求出然后对照临界值表可得答案【详解】由题意得列联表为男女合计正常73 117 190 色弱7 3 10 合计80 120 200 由列联表中的解析:05【解析】【分析】根据表中的数据求出2K,然后对照临界值表可得答案.【详解】由题意得列联表为由列联表中的数据可得2200(7331177)3.947 3.841 8012010190K⨯⨯-⨯=≈>⨯⨯⨯,所以在犯错误的概率不超过0.05的前提下可认为“是否色弱与性别有关”.故答案为0.05.【点睛】在独立性检验中,再求出2K后查临界值表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的2K相比较.另外,临界值表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1p-.15.【解析】由茎叶图知乙=90甲=89+污损处可取数字012…9共10种而甲>乙时污损处对应的数字有6789共4种故甲>乙的概率为答案:解析:2 5【解析】由茎叶图知x 乙=90,x 甲=89+5x.污损处可取数字0,1,2,…,9,共10种,而x 甲>x 乙时,污损处对应的数字有6,7,8,9,共4种,故x 甲>x 乙的概率为25. 答案:25. 16.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能 【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 考点:独立性检验.17.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦18.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4) 【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r 的取值范围是1r ≤,故(1)错误;(2)用相关指数r 来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210, 白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确; (4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1), ∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203+24b aa b ⋅) =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.19.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)20.3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果【详解】(1)已知变量x 和y 满足关系y=-2x+3则x 与y 正相关;应该是:x 与y 负相关故错误(2)线性回归直线必过点线性回归直线必过中心点解析:3个 【分析】直接利用线性回归直线的相关理论知识的应用求出结果. 【详解】(1)已知变量x 和y 满足关系y=-2x+3,则x 与y 正相关;应该是:x 与y 负相关.故错误. (2)线性回归直线必过点(),x y ,线性回归直线必过中心点.故正确.(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大. 根据课本上有原句,故正确.(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R 2的值越大,说明拟合的效果越好.故正确,根据课本上有原句. 故填3个. 【点睛】本题主要考查了线性回归直线的应用,学生对知识的记忆能力,主要考查学生的运算能力和转换能力,属于中档题.三、解答题21.(1)表格见解析,没有;(2)分布列见解析,67. 【分析】(1)根据表中数据和题中的信息可完善列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2,计算出随机变量X 在不同取值下的概率,可得分布列,进而求得数学期望. 【详解】解:(1)列联表补充如下:。

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)(4)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)(4)

一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表: 售价x (元/千克) 18 20 22 26 28 30月销售量y (千克)180 168 166 160 150 136由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.14.下列命题是假命题...的是( ) A .某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,若用分层抽样的方法抽出一个容量为30的样本,则一般职员应抽出18人; B .用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大;C .已知向量,,则是的必要条件; D .若,则点的轨迹为抛物线.5.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系6.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K2=10,则下列选项正确的是()A.有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响7.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()A.90% B.95% C.97.5% D.99.5%8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:现判断数学成绩与物理成绩有关系,则犯错误的概率不超过()A.0.005 B.0.01 C.0.02 D.0.059.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:根据表中数据得到()277520450530015.96820750320455k⨯⨯-⨯=≈⨯⨯⨯,因为K2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为()A.0.1 B.0.05 C.0.01 D.0.00110.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97511.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率12.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .3210二、填空题13.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c x y c e =拟合时的相关指数为21R ,用y bx a =+拟合时的相关指数为22R ,则2212R R >.14.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.15.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 16.已知下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 17.已知方程是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm ,的单位是kg ,那么针对某个体(160,53)的残差是________.18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bc a b c d a c b d -++++.) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.以下说法正确的是_____________ . ①类比推理属于演绎推理.②设有一个回归方程ˆ23yx =- ,当变量每增加1个单位,y 平均增加3个单位. ③样本相关系数r 满足以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱.④对复数12,z z 和自然数n 有()1212nn n z z z z ⋅=⋅.三、解答题21.奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:(2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关? 下面的临界值表供参考:独立性检验统计量()()()()2n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.22.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 合 计旧养殖法 新养殖法 合 计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg 的网箱数为X ,求X 的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++()2P K k ≥ 0.1000.050 0.010 0.005 0.001k 2.706 3.841 6.635 7.879 10.82823.为了解某班学生喜爱玩游戏是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱玩游戏的学生的概率为35.喜爱 不喜爱 合计男生5女生10(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜爱玩游戏与性别有关?说明你的理由;(3)以该班学生的情况来估计全校女生喜爱玩游戏的情况,用频率代替概率.现从全校女生中抽取3人进一步调查,设抽到喜爱玩游戏的女生人数为ξ,求ξ的期望.下面的临界值表供参考:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)24.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bc K a b a c b d c d +=++++,其中n a b c d =+++.25.某地为响应国家“脱贫攻坚战”的号召,帮助贫困户脱贫,安排贫困人员参与工厂生产.现用A ,B 两条生产线生产某产品.为了检测该产品的某项质量指标值(记为Z ),现随机抽取这两种这两条生产线的产品各100件,由检测结果得到如下频率分布直方图.(Ⅰ)分别估计A ,B 两条生产线的产品质量指标值的平均数(同一组数据中的数据用该组区间的中点值作代表),从平均数结果看,哪条生产线的质量指标值更好?(Ⅱ)计算A 生产线的产品质量指标值的众数和中位数(中位数计算结果精确到小数点后两位).(Ⅲ)该公司规定当92Z ≥时,产品为超优品.根据所检测的结果填写22⨯列联表,并判断是否有95%的把握认为“生产超优品是否与生产线有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++()20P K k ≥0.050 0.010 0.005 0.001 0k 3.8416.6357.87910.82822⨯列联表A 生产线B 生产线 总计超优品 非超优品 总计26.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n ab c d =+++(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下:已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.B解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.4.D解析:D【分析】根据分层抽样的概念易得,解出方程即可判断为真;用独立性检验(列联表法)的判定方法即可得出B为真;根据充分条件和必要条件的定义以及向量的数量积的应用,进行判断即可得到C为真;可将原式化为,表示动点到定点和到动直线距离相等的点的轨迹,但是定点在定直线上,故可判断D.【详解】设一般职员应抽出人,根据分层抽样的概念易得,解得,即一般职员应抽出18人,故A为真;用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大,可知B为真;若,则,即不成立,若,则,即成立,故是的必要条件,即C为真;方程即:,化简得,即表示动点到定点的距离和到直线的距离相等的点的集合,且在直线上,故其不满足抛物线的定义,即D为假,故选D.【点睛】本题主要考查了分层抽样的概念,独立性检验在实际中的应用,充分条件、必要条件的判定,抛物线的定义等,属于中档题.5.B解析:B【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P(K2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A与B有关系.【详解】依据下表:P0.500.400.250.150.100.050.0250.0100.0050.001( K2≥k)2 6.635K>,2 6.6350.01P K=(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A与B有关系,故选B.【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.6.A解析:A【解析】因为7.879<K2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响.故选A.7.C解析:C【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断. 8.D解析:D【解析】因为K2的观测值k=2300(371433585) 12217872228⨯-⨯⨯⨯⨯≈4.514>3.841,所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.D解析:D【解析】10.828,10.0010.99999.90k≥∴-==,则有099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)10.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.11.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.12.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.二、填空题13.①③【分析】由图可知散点图呈整体下降趋势据此判断①的正误;由试验数据得到的点将散布在某一直线周围因此可以认为关于的回归函数的类型为线性函数据此判断②的正误;根据散点图比较两个方程的拟合效果比较那个拟解析:①③ 【分析】由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;. 【详解】在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确; x,,y 之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用21c x y c e =拟合比用y bx a =+拟合效果要好,则2212R R >,故③正确. 故答案为:①③. 【点睛】本题考查由散点图反应两个变量的相关关系,散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,属于中档题.14.93美元【分析】设所受教育百分比分别为且利用回归方程计算即可【详解】设所受教育百分比分别为且根据回归方程为收入相差大约为:即受教育的人口百分比相差则其人均收入相差约美元故答案为:3193美元【点睛】解析:93美元 【分析】设所受教育百分比分别为%,%a b ,且10a b -=,利用回归方程计算即可. 【详解】设所受教育百分比分别为%,%a b ,且10a b -= 根据回归方程为 3.19388.193y x ∧=+, 收入相差大约为:()3.19388.193 3.19388.193 3.1931031.93a b ⨯+-⨯+=⨯=,即受教育的人口百分比相差10%,则其人均收入相差约31.93美元. 故答案为:31.93美元. 【点睛】本题考查了线性回归方程的应用问题,属于中档题.15.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.16.①②③【解析】①相关指数表示解释变量对于预报变量的贡献率越接近于1表示回归效果越好;是正确的;②两个变量相关性越强则相关系数r 的绝对值就越接近于1是正确的;③在回归直线方程中当解释变量每增加一个单位解析:①②③ 【解析】①相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;是正确的;②两个变量相关性越强,则相关系数r 的绝对值就越接近于1,是正确的;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位是正确的,因为回归方程,并不是样本点都落在方程上,故只能是估计值,所以说是平均增长;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小;故原命题错误;故答案为①②③.17.【解析】将x =160代入得所以残差考点:线性回归方程残差 解析:【解析】 将x =160代入,得,所以残差考点:线性回归方程,残差.18.5【分析】根据列联表运用公式求出k 值根据计算出的临界值同临界值表进行比较得到假设不合理的程度【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a 偏高不超重记为b 不偏高超重记为c 不解析:5 【分析】根据列联表运用公式2()()()()()n ad bc k a b c d a c b d -=++++求出k 值,根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度. 【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a,偏高不超重记为b,不偏高超重记为c,不偏高不超重记为D, 则41a b ==,,312c d ==, 所以22()20(41213) 5.934()()()()(41)(312)(43)(112)n ad bc k a b c d a c b d -⨯-⨯==≈++++++++因为5.934 5.024>所以可以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系. 故答案为97.5. 【点睛】本题考查了独立性检验的应用,我们可以利用临界值的大小来决定是否拒绝原来的统计假设.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.③④【解析】分析:①根据类比推理与演绎推理的定义即可判断;②根据回归方程的表达式即可判断;③利用线性相关指数的意义即可判断;④根据复数的乘法运算律即可判断详解:对于①类比推理是合情推理的重要形式则不解析:③④ 【解析】分析:①根据类比推理与演绎推理的定义即可判断;②根据回归方程的表达式,即可判断;③利用线性相关指数r 的意义即可判断;④根据复数的乘法运算律即可判断. 详解:对于①,类比推理是合情推理的重要形式,则不属于演绎推理,故①错误;对于②,根据回归方程为ˆ23yx =-,可得当变量每增加1个单位,y 平均减少3个单位,故②错误;对于③,在回归分析中,r 具有以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱,故③正确;对于④,根据复数的乘法运算律,对复数12,z z 和自然数n 有()1212nn nz z z z ⋅=⋅,故④正确.故答案为③④.点睛:本题考查了命题的真假判断与应用,考查相关关系及复数的运算,是一个考查的知识点比较多的题目,解题本题的关键是理解概念及掌握运算公式,如在回归分析中,r 具有的性质,复数遵循的运算律等.三、解答题21.(1)4人;(2)是否愿意提供志愿者服务与性别有关. 【分析】(1)根据题意,确定愿意提供志愿者服务的男女生人数,进而可求出抽取的男生人数;(2)根据题中数据,由()()()()()22n ad bc a b c d a c b d χ-=++++求出2χ,结合临界值表,即可得出结果. 【详解】(1)由题意,可知男生抽取20642010⨯=+(人).(2)2260(20201010) 6.66730303030χ⨯⨯-⨯=≈⨯⨯⨯,由于6.667 6.635>,所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关. 【点睛】本题主要考查分层抽样,考查独立性检验的思想,属于常考题型. 22.(1)列联表见解析,有把握;(2)分布列见解析,1.8. 【分析】(1)完成列联表求出2K ,从而有99%的把握认为箱产量与养殖方法有关.(2)推导出X 的可能取值为1,2,3,分别求出相应的概率,由此能求出X 的分布列和数学期望. 【详解】解:(1)依题意,得下表:22200(62603840)9.68 6.63510298100100K ⨯-⨯∴=≈>⨯⨯⨯,即2( 6.635)0.010P K ∴>=所以,有99%的把握认为箱产量与养殖方法有关;(2)按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,分别为2箱和3箱,从中再抽3箱,则1,2,3X =则2123353(1)10C C P X C ===,1223356(2)10C C P X C ===,0323351(3)10C C P X C ===,X 的分布列为所以,361123 1.8101010EX =⨯+⨯+⨯= 【点睛】本题考查独立检验的应用,考查离散型随机变量的分布列、数学期望的求法,考查运算求解能力,属于中档题.23.(1)列联表见解析;(2)在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关,理由见解析;(3)65. 【分析】(1)由喜爱游戏学生的概率计算后可填充列联表; (2)根据列联表计算2K 后可得;(3)由题意ξ的可能取值为0,1,2,3,且23,5B ξ⎛⎫⎪⎝⎭,计算出概率得概率分布列,然后由期望公式计算出期望. 【详解】(1)列联表补充如下:(2)∵25020151058.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯∴在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关. (3)从全校女生中随机抽取1人,抽到喜爱游戏的女生的概率为25. 抽到喜爱游戏的女生人数ξ的可能取值为0,1,2,3,23,5B ξ⎛⎫ ⎪⎝⎭其概率为332355kkk P C -⎛⎫⎛⎫=⋅⎪ ⎪⎝⎭⎝⎭,0k =,1,2,3故ξ的分布列ξ的期望值()355E ξ=⨯=.【点睛】本题考查独立性检验,考查列联表及卡方的计算,考查随机变量的分布列和数学期望,考查学生的数据处理能力,运算求解能力,属于中档题.24.(1)有99%的把握认为“脱贫攻坚效果与农民的受教育的发展状况有关”;(2)910【分析】(1)根据列联表计算2K ,与附表数据6.635比较即得结论;(2)先分层抽样确定5位农民代表中有3位农民效果明显,2位农民效果不明显,再用列举法,计算从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率即可. 【详解】解:(1)根据题中列联表得:()2250151910613506.65021292525203K ⨯⨯-⨯==≈⨯⨯⨯由于6.650 6.635>,故有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”; (2)受教育的农民中,效果明显与效果不明显的比例为15:103:2=,所以用分层抽样的方法抽取的5位农民代表中,3位效果明显,2位效果不明显.设这5位农民代表为,,,,A B C d e ,其中,,A B C 效果明显,,d e 效果不明显,从中任选2位调查,结果为:(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e ,(),d e ,共10种情况,其中(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e 满足至少有1位脱贫攻坚效果明显,共9种情况,所以从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率910P =. 【点睛】本题考查了独立性检验、分层抽样和古典概型的概率计算问题,属于中档题. 25.(Ⅰ)81.68;80.4;A 生产线的质量指标值更好;(Ⅱ)众数为80;中位数约为81.58;(Ⅲ)列联表见解析,有. 【分析】(Ⅰ)同一组数据中的数据用该组区间的中点值作估值结合频率可计算出均值; (Ⅱ)频率最大的那组数据中间值为众数,中位数要计算频率不0.5的那一点,它在区间[]76,84上.(Ⅲ)根据频率分布直方图可得各数据,得列联表,计算2K 后可得结论. 【详解】解:(Ⅰ)设A ,B 两条生产线的产品质量指标值的平均数分别为x ,y ,由直方图可得(640.00625720.01825800.05375880.035960.01125)881.68x =⨯+⨯+⨯+⨯+⨯⨯=,。

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》测试卷(答案解析)(1)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》测试卷(答案解析)(1)

一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:临界值参考:(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别无关”C .有99.99%以上的把握认为“喜欢“应用统计”课程与性别有关”D .有99.99%以上的把握认为“喜欢“应用统计”课程与性别无关” 3.以下四个结论,正确的是( )①质检员从匀速传递的产品生产流水线上,每间隔15分钟抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②在回归直线方程0.1.3ˆ1y x =+中,当变量ˆx 每增加一个单位时,变量ˆy增加0.13个单位;③在频率分布直方图中,所有小矩形的面积之和是1;④对于两个分类变量X 与Y ,求出其统计量2K 的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大.A .②④B .②③C .①③D .③④4.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:患肺炎 未患肺炎 总计 吸烟 43 162 205 不吸烟 13 121 134 总计56283339②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表: 母亲身高(cm) 159 160 160 163 159 154 159 158 159 157 女儿身高(cm) 158 159 160 161 161 155 162 157 162 156则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验 D .①独立性检验,②取平均值5.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,根据得到的联表算得2K 的观测值 5.278k ≈. 附表:20()P K k ≥0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参照附表,得到的正确结论是 ( )A .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”B .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别无关”C .有97.5%以上的把握认为“喜欢该节目与性别有关”D .有97.5%以上的把握认为“喜欢该节目与性别无关”6.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响7.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:女 男 总计 读营养说明书 90 60 150 不读营养说明书 30 70 100 总计120130250从调查的结果分析,认为性别和读营养说明书的关系为( ) 附:()20P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关8.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为( )附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 12.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计人数后,得到2×2列联表,则随机变量2K 的观测值为A.0.600 B.0.828C.2.712 D.6.004二、填空题13.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.14.利用独立性检验考察两个分类变量X与Y是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X与Y有关系”.P0.050.0250.0100.005(K2≥k0)k0 3.841 5.024 6.6357.87915.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(℃)181310-1山高y(km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa(ˆa∈R),由此估计出山高为72(km)处的气温为_____℃.16.若两个分类变量X与Y的列联表为:y1y2x11015x 2 40 16则“X 与Y 之间有关系”这个结论出错的可能性为________.17.某学校开展研究性学习活动,一组同学获得了下面的一组试验数据: x 1.99 3 4 5.1 8 y0.991.582.012.353.00现有如下5个模拟函数:①y =0.58x -0.16;②y =2x -3.02;③y =x 2-5.5x +8;④y =log 2x ;⑤y =+1.74请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).18.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 19 ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 合 计旧养殖法 新养殖法 合 计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg 的网箱数为X ,求X 的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++()2P K k ≥ 0.1000.050 0.010 0.005 0.001k 2.706 3.841 6.635 7.879 10.82822.某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人. (1)根据题意,完成下列2×2列联表;阅读方式 性别 偏向网上阅读偏向传统纸质阅读总计男女总计1000(2)根据列联表,判断能否有99.9%的把握认为该大学的大学生的阅读方式与性别有关,说明你的理由.附:22(-)()()()()n ad bcKa b c d a c b d=++++(n=a+b+c+d).P(K2≥k)0.0500.0100.001k3.8416.63510.82823.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.24.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X,求X的概率分布列和数学期望.附:()()()()()2n ad bca b c d a c b dχ-=++++,()n a b c d=+++.临界值表:25.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600] 1(优)216252(良)51012 3(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.82826.为了研究某学科成绩是否与学生性别有关,采用分层抽样的方法,从高二年级抽取了30名男生和20名女生的该学科成绩,得到如图所示男生成绩的频率分布直方图和女生成绩的茎叶图,规定80分以上为优分(含80分).(1)(i)请根据图示,将2×2列联表补充完整;优分非优分总计男生女生总计50(ii )据列联表判断,能否在犯错误概率不超过10o o 的前提下认为“学科成绩与性别有关”?(2)将频率视作概率,从高二年级该学科成绩中任意抽取3名学生的成绩,求成绩为优分人数X 的分布列与数学期望.参考公式:()()()()()22()n ad bc K n a b c d a b c d a c b d -==+++++++. 参考数据:()20P K k ≥ 0.1000.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.A解析:A 【分析】计算212.010.828K ≈>,对比临界值表得到答案. 【详解】()222552020105()53912.010.828()()()()3025302545n ad bc K a b c d a c b d ⨯-⨯-===≈>++++⨯⨯⨯,故在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”. 故选:A. 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D【分析】利用系统抽样和分层抽样的知识判断①的正确性;利用回归直线方程的知识判断②的正确性;利用频率分布直方图的知识判断③的正确性;利用独立性检验的知识判断④的正确性.【详解】①,是系统抽样,不是分层抽样,所以①错误. ②,y增加0.1,所以②错误. ③,在频率分布直方图中,所有小矩形的面积之和是1,所以③正确. ④,对于两个分类变量X与Y,求出其统计量2K的观测值k,观测值k越大,我们认为“X与Y有关系”的把握程度就越大,所以④正确.综上所述,正确的序号为③④.故选:D【点睛】本小题主要考查抽样方法、回归直线方程、频率分布直方图和独立性检验等知识,属于基础题.4.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.5.C解析:C【分析】<,根据附表中的数据,即可得到判断的结论,得到答案.因为5.278 6.635【详解】<,所以不能在犯错误的概率不超过1%的前提下,认为“喜欢该节目与因为5.278 6.635>,所以有97.5%以上的把握认为“喜欢该节目与性别有关”,性别有关”;又5.278 5.024故选C.【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯K的观测值k;(3)查表比较k与临界值的大小关系,作统列联表;(2)根据公式计算2计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)6.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.7.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)8.A解析:A 【解析】由公式可计算得K 2≈11.377>6.635.故选A.点睛:(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.9.A解析:A【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 12.A解析:A 【解析】本题主要考查独立性检验.由题所给统计表可知a=11,b=34,a+b=45,c=8,d=37,c+d=45,a+c=19,b+d=71,n=90,所以,()()()()()220.600n ad bc k a b c d a c b d -=≈++++ .本题选择A 选项.二、填空题13.5【解析】【分析】根据题目中的数据利用的公式求得的值即可作出判断得到答案【详解】根据题目中所给的数据可得到2×2列联表再由公式得k =≈1076因为1076>7879所以约有995的把握认为学生的数学解析:5%【解析】【分析】根据题目中的数据,利用2K的公式,求得2K的值,即可作出判断,得到答案.【详解】根据题目中所给的数据可得到2×2列联表,再由公式得k=≈10.76.因为10.76>7.879,所以约有99.5%的把握认为“学生的数学成绩和物理成绩有关系”.【点睛】本题主要考查了独立性检验的应用,其中解答中认真审题,准确计算2K的值是解答本题的关键,着重考查了推理与运算能力,属于基础题.14.5【解析】∵K2的观测值k=6132>5024且k=6132<6635对照临界值表得有1–0025=975的把握认为X与Y有关系故答案为975解析:5%【解析】∵K2的观测值k=6.132>5.024,且k=6.132<6.635,对照临界值表得,有1–0.025=97.5%的把握认为“X与Y有关系”.故答案为97.5%.15.-6【解析】由题意可得=10=40所以+2=40+2×10=60所以=-2x+60当=72时-2x+60=72解得x=-6解析:-6【解析】由题意可得x=10,y=40,所以ˆa y=+2x=40+2×10=60,所以ˆy=-2x+60,当ˆy=72时,-2x+60=72,解得x=-6.16.1【解析】由题意可得K2的观测值k=≈7227∵P(K2≥6635)≈1所以x与y之间有关系出错的可能性为1解析:1%【解析】由题意可得K2的观测值k=2 10154016)(10164015) (1015)(4016)(1040)(1516) +++⨯-⨯++++(≈7.227,∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%17.④【解析】画出散点图如图所示由图可知上述点大体在函数y=log2x的图象上故选择y=log2x可以近似地反映这些数据的规律故填④答案:④点睛:本题主要考查了线性相关的概念散点图以及函数拟合相关关系的解析:④【解析】画出散点图如图所示.由图可知上述点大体在函数y =log 2x 的图象上,故选择y =log 2x 可以近似地反映这些数据的规律.故填④. 答案:④点睛:本题主要考查了线性相关的概念,散点图,以及函数拟合相关关系的问题,属于中档题,首先根据数据画出散点图,判断变量间的相关关系,其次在拟合选取函数时,主要看函数的单调性,特殊值的适当性,以及图象变化的快慢等等.18.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=19AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果【详解】(1)已知变量x 和y 满足关系y=-2x+3则x 与y 正相关;应该是:x 与y 负相关故错误(2)线性回归直线必过点线性回归直线必过中心点解析:3个 【分析】直接利用线性回归直线的相关理论知识的应用求出结果. 【详解】(1)已知变量x 和y 满足关系y=-2x+3,则x 与y 正相关;应该是:x 与y 负相关.故错误.(2)线性回归直线必过点(),x y ,线性回归直线必过中心点.故正确.(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大. 根据课本上有原句,故正确.(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R 2的值越大,说明拟合的效果越好.故正确,根据课本上有原句. 故填3个. 【点睛】本题主要考查了线性回归直线的应用,学生对知识的记忆能力,主要考查学生的运算能力和转换能力,属于中档题.三、解答题21.(1)列联表见解析,有把握;(2)分布列见解析,1.8. 【分析】(1)完成列联表求出2K ,从而有99%的把握认为箱产量与养殖方法有关.(2)推导出X 的可能取值为1,2,3,分别求出相应的概率,由此能求出X 的分布列和数学期望. 【详解】解:(1)依题意,得下表:2200(62603840)9.68 6.63510298100100K ⨯-⨯∴=≈>⨯⨯⨯,即2( 6.635)0.010P K ∴>=所以,有99%的把握认为箱产量与养殖方法有关;(2)按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,分别为2箱和3箱,从中再抽3箱,则1,2,3X =则2123353(1)10C C P X C ===,1223356(2)10C C P X C ===,0323351(3)10C C P X C ===,X 的分布列为所以,361123 1.8101010EX =⨯+⨯+⨯= 【点睛】本题考查独立检验的应用,考查离散型随机变量的分布列、数学期望的求法,考查运算求解能力,属于中档题.22.(1)表格见解析;(2)有,理由见解析. 【分析】(1)根据题设中的数据,即可得到22⨯列联表;(2)由(1)中的表格中的数据,利用公式,求得2K 的值,结合附表,即可得到结论. 【详解】(1)根据题意,该大学1000名大学生(男、女各占一半), 偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人,可得22⨯列联表如下:221000(400300-200100)50010.8286004005005003K ⨯⨯==>⨯⨯⨯,所以有99.9%的把握认为该大学的大学生的阅读方式与性别有关. 【点睛】本题主要考查了独立性检验的计算与应用,其中解答中认真审题,结合公式求得2K 的值是解答的关键,着重考查推理与运算能力,属于基础题.23.(1)表格见解析,不能在犯错率不超过0.05的前提下认为“体育迷”与性别有关;(2)710. 【分析】(1)根据频率直方图计算出抽取的100人中,“体育迷”的人数,由此可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)由题意得知,“超级体育迷”的人数为5,其中2女性观众分别记为A 、B ,3名男性观众分别记为a 、b 、c ,列举出所有的基本事件,并确定事件“从“超级体育迷”中任意选取2人,至少有1名女性观众”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”的人数为() 100100.020.00525⨯⨯+=人,从而联表如下:将联表中的数据代入公式计算得()2100301045151003.0307525455533K⨯⨯-⨯==≈⨯⨯⨯,因为3.030 3.841<,所以不能在犯错率不超过0.05的前提下认为“体育迷”与性别有关;(2)由频率分布直方图可知,“超级体育迷”为5人,其中2女性观众分别记为A、B,3名男性观众分别记为a、b、c,从“超级体育迷”中任意选取2人,所有的基本事件有:(),A B、(),A a、(),A b、(),A c、(),B a、(),B b、(),B c、(),a b、(),a c、(),b c,共10个,其中,事件“从“超级体育迷”中任意选取2人,至少有1名女性观众”所包含的基本事件有:(),A B、(),A a、(),A b、(),A c、(),B a、(),B b、(),B c,共7个,因此,所求事件的概率为710 P=.【点睛】本题考查利用独立性检验的基本思想解决实际问题,同时也考查了利用古典概型的概率公式求事件的概率,考查列举法的应用,考查计算能力,属于中等题.24.(1)列联表见解析,有把握;(2)分布列见解析,()21 10E X=.【分析】(1)根据题中已知条件完善22⨯列联表,并计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知7~3,10X B⎛⎫⎪⎝⎭,利用二项分布可得出随机变量X的分布列,并由此可计算出随机变量X的数学期望.【详解】(1)由题意得列联表如下:2χ的观测值()2100253733511.29130704258χ⨯⨯-⨯=≈⨯⨯⨯.因为11.29110.828>,所以有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关;(2)由题意得该校1名学生家长“比较了解”的概率为70710010=, 73,10XB ⎛⎫ ⎪⎝⎭,()33731010k kk P X k C -⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,0k =、1、2、3, 即X 的概率分布列如下表所示:所以()31010E X =⨯=. 【点睛】本题考查利用独立性检验解决实际问题,同时也考查了利用二项分布求随机变量的分布列与数学期望值,考查数据处理能力,属于中等题.25.(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率; (2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论. 【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=; (2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()21003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.26.(1)(i )列联表见解析;(ii )能在犯错误概率不超过10o o 的前提下认为该学科成绩与性别有关;(2)分布列见解析;65【分析】(1)(i )本题可通过题意得出男生与女生得优分与非优分的人数,然后填表即可; (ii )可先通过22⨯列联表计算出2K 的观测值,然后与表中数据对比即可得出结果; (2)可通过题意得出优分人数X 服从二项分布23,5B ⎛⎫ ⎪⎝⎭,根据()3323()()55kkkP X k C -==即可绘出成绩为优分人数X 的分布列,然后根据二项分布23,5B ⎛⎫ ⎪⎝⎭即可求出()E X . 【详解】(1)(i )根据图示,将22⨯列联表补充完整如下:(ii )K 的观测值:()()()()()()22250991121 3.125 2.70620302030n ad bc K a b c d a c b d -⨯⨯-⨯===>++++⨯⨯⨯,所以能在犯错误概率不超过10%的前提下认为该学科成绩与性别有关; (2)由于有较大的把握认为该学科成绩与性别有关, 因此可将男女生成绩的优分频率202505f ==视作概率; 从高二年级中任意抽取3名学生的该学科成绩中, 优分人数X 服从二项分布235B ,⎛⎫ ⎪⎝⎭,。

北师大版高中数学高中数学选修2-3第三章《统计案例》检测(有答案解析)

北师大版高中数学高中数学选修2-3第三章《统计案例》检测(有答案解析)

一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6 D .75.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由列联表算得7.8k≈参照附表,得到的正确结论是().A.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:序号1234567891011121314151617181920数学成绩9575809492656784987167936478779057837283物理成绩9063728791715882938177824885699161847886若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系()A.95% B.97.5% C.99.5% D.99.9%7.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040506070根据上表可得回归方程y bx a=+,计算得7b=,则当投入10万元广告费时,销售额的预报值为A.75万元B.85万元C .99万元D .105万元8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005B .0.01C .0.02D .0.059.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)24 33 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bc k a b c d a c b d -=++++并参照附表,得到的正确结论是A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关”11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.已知变量x ,y 的一组观测数据如表所示:据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”.15.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.y2.5m4 4.516.某汽车销售公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:百辆)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,...,8)i =数据作了初步处理,得到年销售量y 与年宣传费具有近似关系:ˆyb x a =+以及一些统计量的值如下:81i i x ==∑372.8,81i i y ==∑450.4,81i i x ==∑54.4,81i i y ==∑76.2 .已经求得近似关系中的系数68b =,请你根据相关回归分析方法预测当年宣传费100x =(千元)时,年销售量y =__________(百辆). 17.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是32;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N P σξ≤=则.其中正确结论的序号为________________ 18.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)19.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.2017年10月9日,教育部考试中心下发了《关于2018年普通高考考试大纲修订内容的通知》,在各科修订内容中明确提出,增加中华优秀传统文化的考核内容,积极培育和践行社会主义核心价值观,充分发挥高考命题的育人功能和积极导向作用.鞍山市教育部门积极回应,编辑传统文化教材,在全是范围内开设书法课,经典诵读等课程.为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中支持态度的为80人.支持不支持合计男性 女性 合计(1)完成22⨯列联表(2)判断是否有99.9%的把握认为性别与支持有关?附:22()()()()()n ad bc K a b c d a c b d -=++++. 2()P K k ≥0.15 0.100.050.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82822.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据画出22⨯列联表;(2)请问能有多大把握认为药物有效?附公式:()()()()()22=n ad bcKa b c d a c b d-++++.23.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)如果从全部受过教育的农民中随机地抽取3名,求抽到脱贫攻坚效果不明显的人数X 的分布列和数学期望(将频率当作概率计算).参考附表:参考公式:()()()()()22n ad bc K a b a c b d c d +=++++,其中n a b c d =+++.24.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.2020年5月22日晚,国际权威医学杂志《柳叶刀》在线发表了全球首个新冠疫苗临床试验结果,该试验结果来自我国的陈薇院士和朱凤才教授团队、由于非人灵长类动物解剖生理、组织器官功能和免疫应答反应等性状与人类非常接近,所以常选择恒河猴进行科研和临床实验.某生物制品研究所将某一型号疫苗用在恒河猴身上进行科研和临床实验,得到部分数据如下表.现从注射疫苗的恒河猴中任取1只,取到感染病毒的恒河猴的概率为25.95%把握认为注射此种疫苗有效? (2)在感染病毒的恒河猴中,按未注射疫苗和注射疫苗的比例抽取5只进行病理分析,然后从这5只恒河猴中随机抽取3只对注射疫苗情况进行核实,求恰好抽到2只未注射疫苗的恒河猴的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.B解析:B 【解析】 【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:当5c =时,()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(本栏目内容,学生用书中以活页形式单独
装订成册!)
一、选择题(每小题6分,共36分)
1.对分类变量X与Y的随机变量2的观测值,说法正确的是( )
A.越大,“X与Y有关系”可信程度越小B.越小,“X与Y有关系”可信程度越小C.越接近于0,“X与Y无关”程度越小D.越大,“X与Y无关”程度越大
【解析】越大,说明“X与Y有关系”成立的可信程度越大,反之越小.
【答案】 B
2.对于独立性检验,下列说法中错误的是( )
A.2的值越大,说明两事件相关程度越大B.2的值越小,说明两事件相关程度越小C.2≤3.841时,有95%的把握说事件A
与B有关
D.2>6.635时,有99%的把握说事件A 与B有关
【解析】在独立性检验中,随机变量2的取值大小可说明两个变量相关的程度.一般地随机变量2的值越大,两变量的相关程度越大;反之就越小.临界值2>6.635说明有99%的把握认为二者有关系;2≤2.706则说明二者几乎无关.因此可知C中的说法是不正确的.【答案】 C
3.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( )
A.b与r符号相同 B.a与r符号相同
C.b与r符号相反 D.a与r符号相反
【解析】 由于b =
∑i =1
n
x i y i
-n x y ∑i =1
n (x i
-x )2
r =
∑i =1
n x i y i
-n x y ∑i =1n (x i -x )
2
∑i =1n
(y i -y )2
分母均为正,而分子相同,故b 与r 同号.
【答案】 A
4.已知x 、y 的取值如下表所示:
若从散点图分析,y 与x 线性相关,且y =0.95x +a ,则a 的值等于( )
A .2.6
B .6.3
C.2 D.4.5
【解析】方法一:直接对照法由表中数据得x=2,y=4.5,在回归直线方程y=bx+a 中,a=y-b x=4.5-0.95×2=2.6,故选A.
方法二:逆向思维法由于线性回归方程一定经过样本中心点(x,y),即(2,4.5),将四个选项中的a值代入方程,然后检验哪一条直线经过点(2,4.5),经检验只有A正确.
【答案】 A
5.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
P( 2≥k)…
0.
25
0.
15
0.
10
0.
02
0.
010
0.
005

k … 1. 2. 2. 5. 6.7.…
323 072 706 024 635 879
A.90% B.95%
C.97.5% D.99.5%
【解析】∵2=6.023>5.024,∴可断言市民收入增减与旅游愿望有关系的可信程度为97.5%,故选C.
【答案】 C
6.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.
杂质高
杂质低

设备
37 121

设备
22 202
根据以上数据,则( )
A.含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.设备是否改造决定含杂质的高低
D.以上答案都不对
【解析】由已知数据得到如下2×2列联表
杂质高

质低


旧设备37 121
15
8
新设备22 202
22
4
合计59 323
38
2
由公式2=382×(37×202-121×22)2 158×224×59×323
≈13.11,
由于13.11>6.635,故有99%的把握认为含杂质的高低与设备是否改造是有关的.
【答案】 A
二、填空题(每小题6分,共18分)
7.在独立性检验中,选用2统计量,用其取值大小来推断独立性是否成立,当2满足条件________时,我们有99%的把握说事件A与B 有关.
【解析】由独立性检验判断表得K2>6.635.
【答案】2>6.635
8.若两个分类变量x和y的列联表为:
y 1y 2
x 15
1
5
x 2
4
1
则x与y之间有关系的概率约为________.【解析】2=
(5+15+40+10)(5×10-40×15)2
≈18.822,(5+15)(40+10)(5+40)(15+10)
查表知P(2≥10.828)≈0.001,
∴x与y之间有关系的概率约为1-0.001=
0.999.
【答案】0.999
9.下列说法:
①将一组数据中的每个数据都加上或减去
同一个常数后,方差恒不变;
②设有一个回归方程y^=3-5x,变量x增加
一个单位时,y平均增加5个单位;
③回归方程y^=bx+a必过点(x,y);
④曲线上的点与该点的坐标之间具有相关
关系;
⑤在一个2×2列联表中,由计算得2=
13.079,则其两个变量间有关系的可能性是90%.
其中错误的是________.
【解析】①正确.由回归方程的定义及最
小二乘法思想,知③正确.②④⑤不正确.【答案】②④⑤
三、解答题(共46分)
10.(15分)下表是某地区的一种传染病与饮用水的调查表.
试作统计分析推断.(注:若K2>10.828,则认为得传染病与饮用水无关)
【解析】根据列联表中数据可计算K2观测值为
=830×(52×218-94×466)2518×312×146×684
≈54.21. 由于54.21>10.828,
说明该地区的传染病与饮用不干净水是有关的.
11.(15分)某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件,根据所给数据:
(1)写出2×2列联表;
(2)判断产品是否合格与设备改造是否有关.
【解析】 (1)由已知数据得
合格品 不合格品 合计 设备
改造后 65 30 95
设备改造前 36 49 85
合计 101 79 18
(2)根据列联表中数据,的观测值为
=180×(65×49-36×30)2101×79×85×95
≈12.38. 由于12.38>10.828,有99.9%的把握认为产品是否合格与设备改造有关.
12.(16分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据. x 3 4 5 6
y 2.5 3 4 4
.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
【解析】
设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图.由图知y与x 间呈线性相关关系,设线性回归方程为y^=bx+a.由公式可求得b=-1.818,a=77.363,
∴线性回归方程为y=-1.818x+77.363.
(2)由线性回归方程知,每增加1 000件产量,单位成本下降1.818元.
(3)产量为6 000件时,单位成本是66.45元/件,单位成本是70元/件时,产量为4 050件.。

相关文档
最新文档