高中数学-统计案例测试题
(必考题)高中数学选修1-2第一章《统计案例》测试卷(答案解析)(3)
一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )表1表2表3 语文 性别不及格 及格 总计 数学 性别不及格 及格 总计 英语 性别不及格 及格 总男 14 36 50 男 10 40 50 男 25 25 女 16 34 50 女 20 30 50 女 5 45 总计3070100总计3070100总计30701A .语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B .数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C .英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D .英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小 3.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C4.在一次抗洪抢险中,准备用射击的方法引爆漂流的汽油桶.现有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击相互独立,且命中概率都是34.则打光子弹的概率是( ) A .9256B .13256C .45512D .910245.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .187.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.喜爱打篮球 不喜爱打篮球 合计男生 25530 女生 151530合计40 20 60附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.20()P K k ≥ 0.100.050.025 0.010 0.005 0.001 0k 2.706 3.8415.0246.6357.78910.828A .99.9%B .99.5%C .99%D .97.5%8.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .139.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125 C .61125 D .6412510.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样11.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.有7个评委各自独立对A 、B 两位选手投票表决,两位选手旗鼓相当,每位评委公平投票且不得弃权.若7位评委依次揭晓票选结果,则A 选手在每位评委投票揭晓后票数始终保持领先的概率是______.14.有9粒种子分种在3个坑内,每坑放3粒,每粒种子发芽概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种,假定每个坑至多补种一次,需要补种的坑数为2的概率等于_______.15.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 16.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.17.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P B A │等于_________.18.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________19.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23. (1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X 表示结束比赛还需打的局数,求X 的分布列及期望.22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X 元,求X 的分布列与数学期望.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.100.05 0.01 0.005 0.001 0k 2.7063.8416.6357.87910.82825.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动 不喜爱运动 总计 男生 ab30 女生 cd20 总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)20()P K k ≥ 0.5000.100 0.050 0.010 0.001 0k 0.4552.7063.8416.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥ 0.0100.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据题目所给的数据填写2×2列联表即可;计算K 的观测值K 2,对照题目中的表格,得出统计结论. 【详解】因为()()2210014341636100103020403070505030705050⨯⨯-⨯⨯⨯-⨯<⨯⨯⨯⨯⨯⨯()2100254552530705050⨯⨯-⨯<⨯⨯⨯,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小. 故选C 【点睛】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题目. 3.B解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.4.B解析:B 【分析】打光所有子弹,分中0次、中一次、中2次. 【详解】5次中0次:5 1 4⎛⎫ ⎪⎝⎭5次中一次:4 153144 C⎛⎫⨯⨯ ⎪⎝⎭5次中两次:前4次中一次,最后一次必中314331 444C⎛⎫⨯⨯⨯ ⎪⎝⎭则打光子弹的概率是514⎛⎫⎪⎝⎭+4153144C⎛⎫⨯⨯ ⎪⎝⎭+314331444C⎛⎫⨯⨯⨯ ⎪⎝⎭=13256,选B【点睛】本题需理解打光所有子弹的含义:可能引爆,也可能未引爆.5.B解析:B【解析】【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.A解析:A【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.8.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.9.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率 3161115125P ⎛⎫=--=⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.10.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A11.B解析:B 【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.C解析:C 【分析】利用相互独立事件概率乘法公式和互斥事件概率加法公式直接求解. 【详解】解:甲、乙两队进行排球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立, 则甲队以3:1获胜的概率是:()()()10.60.610.50.50.610.60.50.510.60.60.50.50.21P =⨯⨯-⨯+⨯-⨯⨯+-⨯⨯⨯=.甲队以3:0获胜的概率是: 20.60.60.50.18P =⨯⨯=则甲队不超过4场即获胜的概率120.210.180.39P P P =+=+= 故选:C 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式和互斥事件概率加法公式等基础知识,考查运算求解能力,属于中档题.二、填空题13.【分析】将比分分为四种情况讨论计算概率【详解】由条件可知前两名投票的都投给选手并且投给每位选手的概率是若投票给两位选手的比分为则概率为若比分为则投给选手的方法有种所以概率为若比分为则投给选手的两票不 解析:532【分析】将比分分为7:0,6:1,5:2,4:3四种情况讨论计算概率. 【详解】由条件可知前两名投票的都投给选手A ,并且投给每位选手的概率是12P =. 若投票给A 、B 两位选手的比分为7:0,则概率为712⎛⎫ ⎪⎝⎭, 若比分为6:1,则投给选手B 的方法有155C =种,所以概率为7152⎛⎫⋅ ⎪⎝⎭若比分为5:2,则投给选手B 的两票不能在第三和第四的位置,有2519C -=种,所以概率为7192⎛⎫⋅ ⎪⎝⎭, 若比分为4:3,则投给A 的票不能是最后一位,且不能占5,6位,有2415C -=种,所以概率为7152⎛⎫⋅ ⎪⎝⎭, 所以概率()7151595232P ⎛⎫=+++⋅=⎪⎝⎭. 故答案为:532【点睛】本题考查独立事件同时发生的概率,重点考查分类的思想,属于中档题型.14.【分析】先计算出粒种子都没有发芽的概率即得出每个坑需要补种的概率然后利用独立重复试验的概率得出所求事件的概率【详解】由独立事件的概率乘法公式可知粒种子没有粒发芽的概率为所以一个坑需要补种的概率为由独 解析:21512【分析】先计算出3粒种子都没有发芽的概率,即得出每个坑需要补种的概率,然后利用独立重复试验的概率得出所求事件的概率. 【详解】由独立事件的概率乘法公式可知,3粒种子没有1粒发芽的概率为31128⎛⎫= ⎪⎝⎭, 所以,一个坑需要补种的概率为18, 由独立重复试验的概率公式可得,需要补种的坑数为2的概率为223172188512C ⎛⎫⋅⋅= ⎪⎝⎭, 故答案为21512. 【点睛】本题考查独立事件概率乘法公式的应用,同时也考查了独立重复试验恰有()k k N *∈次发生的概率,要弄清楚事件的基本类型,并结合相应的概率公式进行计算,考查分析问题和理解问题的能力,属于中等题.15.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.16.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概 解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.17.【解析】因为所以应填答案解析:35【解析】因为()()2254336613,210C C P A P AB C C ====,所以3(|)5P B A =。
高中数学:统计与统计案例练习
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高三数学统计案例试题
高三数学统计案例试题1.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制所在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下【答案】B【解析】则a=-b=-0.857 5.∴回归直线方程为=0.728 6x-0.857 5.要使y≤10,则0.728 6x-0.857 5≤10,∴x≤14.901 9.因此,机器的转速应该控制在15转/s以下.故选B.2.登山族为了了解某山高y(km)与气温x(°C)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(°C)181310-1由表中数据,得到线性回归方程,由此请估计出山高为72(km)处气温的度数为()A.-10B.-8C.-6D.-6【答案】C【解析】由题意可得=10,=40.5,所以=+2=40.5+2×10=60.5,所以,当=72时,,解得x≈-6,故选C.【考点】回归分析3.为了调查某大学学生在周日上网的时间,随机对名男生和名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分5253025151020402010(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的列联表,并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率.表3 :上网时间少于60分钟上网时间不少于60分钟合计附:,其中【答案】(I)225;(II)否;(III).【解析】(I)统计得到女生样本中的上网时间不少于60分钟的频数,根据频数与容量之比等于频率,易得到全校上网时间不少于60分钟的人数;(II)由以上列联表1、2的数据,可统计得到表3的数据,根据独立性检验原理可知:没有90%的把握认为“学生周日上网时间与性别有关”;(III)五名男生中任取两人的基本事件数10个,根据表3可知男生上网超过60分钟与不超过60分钟的人数比为3:2,再写出至少一人超过60分钟的事件数7个,易求得概率为.试题解析:(1)设估计上网时间不少于60分钟的人数,依据题意有,解得:,所以估计其中上网时间不少于60分钟的人数是225人.(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计其中 ,因此,没有90%的把握认为“学生周日上网时间与性别有关”.(3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为,所以5人中上网时间少于60分钟的有3人,记为上网时间不少于60分钟的有2人,记为从中任取两人的所有基本事件为:(),(),(),(),(),(),(),(),(),(),共10种,其中“至少有一人上网时间超过60分钟”包含了7种, .【考点】1、用样本估计总体; 2、独立性检验;3、古典概型的概率求法.4.为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10000 株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:高茎矮茎合计10株玉米,再从这10株玉米中随机选出3株,求选到的3株之中既有圆粒玉米又有皱粒玉米的概率;(2) 根据对玉米生长情况作出的统计,是否能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关?(下面的临界值表和公式可供参考:,其中)【答案】(1);(2) 能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关.【解析】本小题通过统计与概率的相关知识,具体涉及到随机变量的分布列、数学期望的求法和统计案例中独立性检验等知识内容,考查学生对数据处理的能力,对考生的运算求解能力、推理论证能力都有较高要求. 本题属于统计概率部分综合题,对考生的统计学的知识考查比较全面,是一道的统计学知识应用的基础试题. .(1)采用分层抽样的比例关系确定个数,然后利用排列组合的知识,借助随机事件的概率求解;(2)根据已知的公式,经过仔细的计算出的值,然后借助表格进行数据对比,得到相关性的结论.试题解析:(1) 现采用分层抽样的方法,从样本中取出的10株玉米中圆粒的有6株,皱粒的有4株,所以从中再次选出3株时,既有圆粒又有皱粒的概率为. (6分) (2) 根据已知列联表:所以.又,因此能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关. (12分)【考点】(1)随机变量的分布列;(2)统计案例中独立性检验5.(本小题共12分)现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如下表.月收入(单[15,25[25,35[35,45[45,55[55,65[65,75510151055(1)由以上统计数据填下面2乘2列联表并问是否有99%的把握认为“月收入以5500为分界点对“楼市限购令” 的态度有差异;(2)若对在[15,25),[25,35)的被调查中各随机选取两人进行追踪调查,记选中的4人中不赞成“楼市限购令”人数为,求随机变量的分布列。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
高中数学【统计与统计案例】专题练习
高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
高中统计案例试题及答案
高中统计案例试题及答案一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 一组数据的中位数是所有数据排序后位于中间位置的数值,如果数据个数为奇数,则中位数是:A. 第一个数据B. 最后一个数据C. 位于中间位置的数值D. 无法确定答案:C3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 折线图D. 散点图答案:C二、填空题4. 某班级有30名学生,他们的数学成绩分别为:70, 85, 90, 75, 95, 80, 85, 70, 80, 90, 85, 95, 75, 70, 80, 90, 85, 95, 75, 70, 80, 85, 90, 95, 75。
这组数据的平均数是____。
答案:825. 如果一组数据的方差是25,那么它的标准差是____。
答案:5三、简答题6. 描述统计学中的“样本”和“总体”的概念,并举例说明。
答案:在统计学中,“总体”指的是研究对象的全体,而“样本”是从总体中随机抽取的一部分个体。
例如,如果我们想要了解全国高中生的数学成绩水平,全国所有高中生的数学成绩就是总体,而如果我们随机抽取了1000名高中生的数学成绩进行研究,这1000名高中生的数学成绩就是我们的样本。
四、计算题7. 某工厂生产了一批零件,其长度的测量数据如下:20, 22, 21, 23, 20, 21, 22, 21, 22, 23。
请计算这组数据的平均数、中位数、方差和标准差。
答案:平均数 = (20+22+21+23+20+21+22+21+22+23) / 10 = 21.5中位数 = (21+22) / 2 = 21.5方差 = [(20-21.5)² + (22-21.5)² + ... + (23-21.5)²] / 10 = 1.65标准差= √1.65 ≈ 1.29结束语:通过上述试题及答案,我们可以看出,统计学是一门应用广泛的学科,它可以帮助我们更好地理解和分析数据。
(好题)高中数学选修1-2第一章《统计案例》检测(答案解析)(3)
一、选择题1.某单位对某村的贫困户进行“精准扶贫”,若甲、乙贫困户获得扶持资金的概率分别为37和27,两户是否获得扶持资金相互独立,则这两户中至少有一户获得扶持资金的概率为( ) A .2949B .649C .2349D .43492.在一个质地均匀的小正方体的六个面中,三个面标0,两个面标1,一个面标2,将这个小正方体连续抛掷两次,若向上的数字的乘积为偶数,则该乘积为非零偶数的概率为( ) A .14 B .89 C .116D .5323.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 4.“人机大战,柯洁哭了,机器赢了”,2017年5月27日,岁的世界围棋第一人柯洁不敌人工智能系统AlphaGo ,落泪离席.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查.在参与调查的男性中,有人持反对意见,名女性中,有人持反对意见.再运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是( )A .分层抽样B .回归分析C .独立性检验D .频率分布直方图5.一张储蓄卡的密码共有6位数字,每位数字都可以从09中任选一个,某人在银行自动提款机上取钱时,忘记了密码最后一位数字,如果任意按最后一位数字,不超过2次就按对的概率为( )A .25 B .310 C .15D .1106.从345678910,1112,,,,,,,,中不放回地依次取2个数,事件A = “第一次取到的数可以被3整除”,B = “第二次取到的数可以被3整除”,则()P B|?A =( ) A .59B .23C .13 D .297.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >=B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样 8.随机变量a 服从正态分布()21,N σ,且()010.3000P a <<=.已知0,1a a >≠,则函数1xy a a =+-图象不经过第二象限的概率为( ) A .0.3750B .0.3000C .0.2500D .0.20009.下列关于回归分析的说法中错误的是( ) A .回归直线一定过样本中心(,)x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .两个模型中残差平方和越小的模型拟合的效果越好D .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好10.在5道题中有3道理科题和2道文科题,如果一次性抽取 2道题,已知有一道是理科题的条件下,则另一道也是理科题的概率为 A .13B .14C .12D .3511.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .4012.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:A.130 B.190C.240 D.250二、填空题13.掷三个骰子,出现的三个点数的乘积为偶数的概率是________.14.一盒子中装有6只产品,其中4只一等品,2只二等品,从中取产品两次,每次任取1只,做不放回抽样.则在第一次取到的是一等品的条件下,第二次取到的是二等品的概率为__________.15.已知x、y之间的一组数据如下:=+所表示的直线必经过点________.则线性回归方程ˆy a bx16.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________17.已知某种高炮在它控制的区域内击中敌机的概率为0.2,要使敌机一旦进入这个区域后有0.9以上的概率被击中,需要至少布置___________门高炮?(用数字作答,已知=)=,lg30.4771lg20.301018.体育课上定点投篮项目测试规则:每位同学有3次投篮机会,一旦投中,则停止投篮,视为合格,否则一直投3次为止.每次投中与否相互独立,某同学一次投篮投中的概率为p,若该同学本次测试合格的概率为0.784,则p=_____.19.某质检员检验一件产品时,把正品误判为次品的概率是0.1,把次品误判为正品的概率是0.05.如果一箱产品中含有8件正品,2件次品,现从中任取1件让该质检员检验,那么出现误判的概率为___________.20.一名信息员维护甲乙两公司的5G网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求:(i)三个球中有两个红球一个黑球的概率;(ii)第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查结果如下面22⨯列联表.22⨯与性别有关”?(2)现在从这100名学生中按性别采取分层抽样的方法抽取5名学生,如果再从中随机选取2人进行有关“嫦娥五号”情况的宣讲,求选取的2名学生中恰有1名女生的概率.若将频率视为概率. 附:()()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++ 23.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示:(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 24.随着运动App 和手环的普及和应用,在朋友圈、运动圈中出现了每天1万步的健身打卡现象,“日行一万步,健康一辈子”的观念广泛流传.“健康达人”小王某天统计了他朋友圈中所有好友(共400人)的走路步数,并整理成下表:间中点值作代表);(2)若用A 表示事件“走路步数低于平均步数”,试估计事件A 发生的概率;(3)若称每天走路不少于8千步的人为“健步达人”,小王朋友圈中岁数在40岁以上的中老年人有200人,其中健步达人恰有150人,请填写下面22⨯列联表.根据列联表判断有多大把握认为,健步达人与年龄有关?附:()()()()()22n ad bc K a b c d a c b d -=++++25.在疫情这一特殊时期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后进行了摸底考试,某校数学教师为了调查高三学生这次摸底考试的数学成绩与在线学习数学时长之间的相关关系,对在校高三学生随机抽取45名进行调查.知道其中有25人每天在线学习数学的时长是不超过1小时的,得到了如下的等高条形图:(Ⅰ)是否有99%的把握认为“高三学生的这次摸底考试数学成绩与其在线学习时长有关”;(Ⅱ)将频率视为概率,从全校高三学生这次数学成绩超过120分的学生中随机抽取10人,求抽取的10人中每天在线学习时长超过1小时的人数的数学期望和方差.()20P K k ≥ 0.050 0.010 0.001 0k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++26.2022年北京冬奥会的申办成功与“3亿人上冰雪”口号的提出,将冰雪这个冷项目迅速炒“热”.北京某综合大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了100人进行调查,其中女生中对冰球运动有兴趣的占23,而男生有10人表示对冰球运动没有兴趣额.(1)完成22⨯列联表,并回答能否有90%的把握认为“对冰球是否有兴趣与性别有关”?(2)若将频率视为概率,现再从该校一年级全体学生中,采用随机抽样的方法每次抽取1名学生,抽取5次,记被抽取的5名学生中对冰球有兴趣的人数为x ,若每次抽取的结果是相互独立的,求x 的分布列,期望和方差. 附表:22()()()()()n ad bc K a b c d a c b d -=++++【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】考虑都没有获得扶持资金的情况,再计算对立事件概率得到答案. 【详解】根据题意:32291117749p ⎛⎫⎛⎫=---=⎪⎪⎝⎭⎝⎭. 故选:A . 【点睛】本题考查了概率的计算,意在考查学生的计算能力和应用能力.2.D解析:D 【分析】首先确定是条件概率,在出现数字乘积为偶数的前提下,乘积为非零偶数的概率, 首先求两次数字乘积为偶数的概率, 然后两次为非零偶数的概率,再按照条件概率的公式求解. 【详解】两次数字乘积为偶数,可先考虑其反面——只需两次均出现1向上,概率是22169⎛⎫= ⎪⎝⎭, 所以两次数字乘积为偶数的概率P =228169⎛⎫-= ⎪⎝⎭ ; 若乘积非零且为偶数,需连续两次抛掷小正方体的情况为(1,2)或(2,1)或(2,2),P =111152366636⨯⨯+⨯=,.故所求条件概率为55368329P ==.故选:D 【点睛】本题主要考查了条件概率的计算和独立事件,考查了学生的计算能力,属于基础题.3.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.4.C解析:C 【解析】 【分析】根据“性别”以及“反对与支持”这两种要素,符合,从而可得出统计方法。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
(必考题)高中数学选修1-2第一章《统计案例》检测(答案解析)(1)
一、选择题1.为了提升全民身体素质,学校十分重视学生体育锻炼.某校篮球运动员进行投篮练习,若他前一球投进则后一球投进的概率为34,若他前一球投不进则后一球投进的概率为14.若他第1球投进的概率为34,则他第3球投进的概率为( ) A .34B .58C .116D .9162.甲、乙两人进行乒乓球比赛,假设每局比赛甲胜的概率是0.6,乙胜的概率是0.4.那么采用5局3胜制还是7局4胜制对乙更有利?( ) A .5局3胜制B .7局4胜制C .都一样D .说不清楚3.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表经计算2K 的值,则有( )的把握认为玩手机对学习有影响. A .95%B .99%C .99.5%D .99.9%4.袋中装有10个形状大小均相同的小球,其中有6个红球和4个白球.从中不放回地依次摸出2个球,记事件A =“第一次摸出的是红球”,事件B =“第二次摸出的是白球”,则(|)P B A =( )A .25B .415C .49D .595.某射手射击一次命中的概率为0.8,连续两次射击均命中的概率是0.6,已知该射击手某次射中,则随后一次射中的概率是( ) A .34B .45C .35D .7106.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1157.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =8.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样9.若对于变量x 的取值为3,4,5,6,7时,变量y 对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u 的取值为1,2,3,4时,变量v 对应的值依次分别为2,3,4,6,则变量x 和y ,变量u 和v 的相关关系是( ) A .变量x 和y 是正相关,变量u 和v 是正相关 B .变量x 和y 是正相关,变量u 和v 是负相关 C .变量x 和y 是负相关,变量u 和v 是负相关 D .变量x 和y 是负相关,变量u 和v 是正相关 10.在一次独立性检验中,得出列表如下:且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720B .360C .180D .9011.下列有关结论正确的个数为( )①小赵、小钱、小孙、小李到4个景点旅游,每人只去一个景点,设事件A =“4个人去的景点不相同”,事件B =“小赵独自去一个景点”,则()2|9P A B =; ②设,a b ∈R ,则“22log log a b >”是“21a b ->的充分不必要条件;③设随机变量ξ服从正态分布(),7N μ,若()()24P P ξξ<=>,则μ与D ξ的值分别为3,7D μξ==. A .0B .1C .2D .312.通过随机询问72名不同性别的学生在购买食物时是否看营养说明,得到如下列联表:女 男 总计 读营养说明 16 28 44 不读营养说明 20 8 28 总计363672参考公式:22()()()()()n ad bc K a b c d a c b d -=++++20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828则根据以上数据:A .能够以99.5%的把握认为性别与读营养说明之间无关系;B .能够以99.9%的把握认为性别与读营养说明之间无关系;C .能够以99.5%的把握认为性别与读营养说明之间有关系;D .能够以99.9%的把握认为性别与读营养说明之间有关系;二、填空题13.甲、乙两名同学参加一项射击比赛游戏,其中任何一人每射击一次击中目标得2分,未击中目标得0分.若甲、乙两人射击的命中率分别为35和p,且甲、乙两人各射击一次得分之和为2的概率为920.假设甲、乙两人射击互不影响,则p 值为______. 14.对标有不同编号的6件正品和4件次品的产品进行检测,不放回地依次摸出2件.在第一次摸出正品的条件下,第二次也摸到正品的概率是_________.15.如图, A, B, C 表示3种开关,设在某段时间内它们正常工作的概率是分别是0.9 , 0.8 , 0.7 , 如果系统中至少有1个开关能正常工作,则该系统就能正常工作, 那么该系统正常工作的概率是____________16.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.17.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.18.甲、乙两篮球运动员进行定点投篮,每人各投4个球,甲投篮命中的概率为12,乙投篮命中的概率为23,求甲至多命中2个且乙至少命中2个概率____.19.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A;“抽出的学生英语口语测试成绩不低于85分”记为事件B.则P(A|B)的值是_____.20.近年来,新能源汽车技术不断推陈出新,新产品不断涌现,在汽车市场上影响力不断增大.动力蓄电池技术作为新能源汽车的核心技术,它的不断成熟也是推动新能源汽车发展的主要动力.假定现在市售的某款新能源汽车上,车载动力蓄电池充放电循环次数达到2000次的概率为85%,充放电循环次数达到2500次的概率为35%.若某用户的自用新能源汽车已经经过了2000次充电,那么他的车能够充电2500次的概率为______.三、解答题21.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?大龄受试者年轻受试者合计舒张压偏高或偏低舒张压正常合计6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X,求X的分布列和数学期望.运算公式:()()()()()22n ad bcKa b c d a c b d-=++++,对照表:22.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22⨯列联表,并问是否有0099的把握认为“两个分厂生产的零件的质量有差异”.附:22()()()()()n ad bcKa b c d a c b d-=++++23.为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3:1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示. (1)求a 的值及通过电子阅读的居民的平均年龄;(2)把年龄在第123,,组的居民称为青少年组,年龄在第45,组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成上面22⨯列联表,则是否有97.5%的把握认为阅读方式与年龄有关? ()()()()()22n ad bc K a b a d b c c d -=++++()2P K k >0.15 0.100.050.025 0.010 0.005 0.001k2.0722.7063.8415.0246.6357.879 10.82824.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为子调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(]0,2,(]2,4,(]4,6,(]6,8,(]8,10分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天再微信超过4个小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 25.2019年,中国的国内生产总值(GDP )已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产该产品的数量x (千件)有关,经统计得到如下数据:x1 2 3 4 5 6 7 8 y1126144.53530.5282524根据以上数据,绘制了如下的散点图.现考虑用反比例函数模型by a x=+和指数函数模型dx y ce =分别对两个变量的关系进行拟合.为此变换如下:令1xμ=,则y a b μ=+,即y 与μ满足线性关系;令ln νμ=,则ln c dx ν=+,即ν与x 也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为96.54dx y e =,ν与x 的相关系数10.94r =-,其他参考数据如表(其中1ln i i i iy x μν==).(1)求指数函数模型和反比例函数模型中y 关于x 的回归方程;(2)试计算y 与μ的相关系数2r ,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?(3)根据(2)小题的选择结果,该企业采取订单生产模式(即根据订单数量进行生产,产品全部售出).根据市场调研数据,该产品单价定为100元时得到签订订单的情况如表:已知每件产品的原料成本为10元,试估算企业的利润是多少?(精确到1千元) 参考公式:对于一组数据()11,μν,()22,μν,⋅⋅⋅,(),n n μν,其回归直线ναβμ=+的斜率和截距的最小二乘估计分别为:1221ni i i nii n n μνμνβμμ==-=-∑∑,ανβμ=-,相关系数ni in r μνμν-=∑26.为更好地落实农民工工资保证金制度,南方某市劳动保障部门调查了2018年下半年该市100名农民工(其中技术工、非技术工各50名)的月工资,得到这100名农民工的月工资均在[]25,55(百元)内,且月工资收入在[45,50)(百元)内的人数为15,并根据调查结果画出如图所示的频率分布直方图:(1)求n 的值;(2)已知这100名农民工中月工资高于平均数的技术工有31名,非技术工有19名. ①完成如下所示22⨯列联表技术工 非技术工 总计 月工资不高于平均数 50 月工资高于平均数50 总计5050100②则能否在犯错误的概率不超过0.001的前提下认为是不是技术工与月工资是否高于平均数有关系?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.050.01 0.005 0.001 0k 3.8416.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D解析:D 【分析】分两种情况讨论:第2球投进和第2球投不进,利用独立事件的概率公式可得出所求事件的概率. 【详解】分以下两种情况讨论: (1)第2球投进,其概率为3311544448⨯+⨯=,第3球投进的概率为53158432⨯=; (2)第2球投不进,其概率为53188-=,第3球投进的概率为3138432⨯=. 综上所述:第3球投进的概率为1539323216+=,故选D. 【点睛】本题考查概率的求法,考查独立事件概率乘法公式的应用,同时也考查对立事件概率公式的应用,解题时要注意对事件进行分类讨论,考查运算求解能力,属于中等题.2.A解析:A 【分析】分别计算出乙在5局3胜制和7局4胜制情形下对应的概率,然后进行比较即可得出答案. 【详解】当采用5局3胜制时,乙可以3:0,3:1,3:2战胜甲,故乙获胜的概率为:322222340.4+0.40.60.40.40.60.40.3174C C ⨯⨯+⨯⨯≈;当采用7局4胜制时,乙可以4:0,4:1,4:2,4:3战胜甲,故乙获胜的概率为:4333323334560.4+0.40.60.40.40.60.4+0.40.60.40.2898C C C ⨯⨯+⨯⨯⨯⨯≈,显然采用5局3胜制对乙更有利,故选A. 【点睛】本题主要考查相互独立事件同时发生的概率,意在考查学生的计算能力和分析能力,难度中等.3.C解析:C 【解析】分析:利用公式求得观测值2K ,对照数表,即可得出正确的结论. 详解:根据列联表可得()223042168=1020101218K ⨯⨯-⨯=⨯⨯⨯,27.8791010.828K <=<,对照数表知,有99.5%的把握认为玩手机对学习有影响,故选C.点睛:本题考查了独立性检验的应用问题,是基础题目. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.C解析:C 【解析】分析:利用概率的计算公式,求解事件A 和事件A B 的概率,即可利用条件概率的计算公式,求解答案.详解:由题意,事件A =“第一次摸出的是红球”时,则63()105P A ==, 事件A =“第一次摸出的是红球”且事件B =“第二次摸出白球”时,则6412()10945P AB =⨯=, 所以()4(|)()9P AB P B A P A ==,故选C . 点睛:本题主要考查了条件概率的计算,其中熟记条件概率的计算公式和事件的概率是解答的关键,着重考查了分析问题和解答问题的能力,以及推理与计算能力.5.A解析:A 【解析】分析:某次射中,设随后一次射中的概率为p ,利用相互独立事件概率乘法公式能求出p 的值.详解:某次射中,设随后一次射中的概率为p ,∵某射击手射击一次命中的概率为0.8,连续两次均射中的概率是0.5,0.80.6p ,∴= 解得34p =.故选:A .点睛:本题考查概率的求法,涉及到相互独立事件概率乘法公式的合理运用,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想,是基础题.6.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.7.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.8.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A9.D解析:D 【解析】变量x 增加,变量y 减少,所以变量x 和y 是负相关;变量u 增加,变量v 增加,所以变量u 和v 是正相关,因此选D.10.B解析:B 【解析】∵两个分类变量A 和B 没有任何关系,∴()()()()2259010090400 2.70219040090500a a K a a +-⨯=<⨯++,代入验证可知360a =满足,故选B.11.D解析:D 【解析】对于①,4344443273()()464432A PB P AB ⨯====,,所以()2()()9P AB P A B P B ==,故①正确;对于②,当22log log a b >,有0a b >>,而由21a b ->有a b >,因为0,0a b a b a b a b >>⇒>>≠>>> ,所以22log log a b >是21a b ->的充分不必要条件,故②正确;对于③,由已知,正态密度曲线的图象关于直线3ξ=对称,且27σ= 所以3,7D μξ==,故③正确.点睛:本题主要考查了条件概率,充分必要条件,正态分布等,属于难题.这几个知识点都是属于难点,容易做错.12.C解析:C 【解析】2272(1682028)=8.427.87944283636K ⨯⨯-⨯≈⨯⨯⨯>∴性别和读营养说明之间有99.5%的可能性. 本题选择C 选项.二、填空题13.【分析】根据甲乙两人各射击一次得分之和为2的概率为列方程解方程求得的值【详解】甲乙两人各射击一次得分之和为2可能是甲击中乙未击中或者乙击中甲未击中故解得故答案为:【点睛】本小题主要考查相互独立事件概解析:34【分析】根据甲、乙两人各射击一次得分之和为2的概率为920列方程,解方程求得p 的值. 【详解】甲、乙两人各射击一次得分之和为2,可能是甲击中乙未击中,或者乙击中甲未击中,故()339115520p p ⎛⎫⋅-+⋅-= ⎪⎝⎭,解得34p =. 故答案为:34【点睛】本小题主要考查相互独立事件概率计算,属于基础题.14.【解析】设第一次摸出正品为事件第二次摸出正品为事件则事件和事件相互独立在第一次摸出正品的条件下第二次也摸到正品的概率为:故答案为 解析:【解析】设“第一次摸出正品”为事件A ,“第二次摸出正品”为事件B , 则事件A 和事件B 相互独立,在第一次摸出正品的条件下,第二次也摸到正品的概率为:()()655109|6910P AB P B A P A ⨯===().故答案为5915.994【解析】由题意知本题是一个相互独立事件同时发生的概率种开关中至少有个开关能正常工作的对立事件是种开关都不能工作分别记开关能正常工作分别为事件故答案为解析:994 【解析】由题意知本题是一个相互独立事件同时发生的概率,,,A B C ,3种开关中至少有1 个开关能正常工作的对立事件是3种开关都不能工作,分别记,,A B C 开关能正常工作分别为事件123,,A A A ,()()1231,,10.10.20.30.994P E P A A A =-=-⨯⨯=, 故答案为0.994. 16.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.17.乙【解析】线性回归模型中越接近1效果越好故乙效果最好解析:乙 【解析】线性回归模型中2R 越接近1,效果越好,故乙效果最好.18.【分析】甲至多命中2个且乙至少命中2个包含的两个事件是相互独立事件分别做出甲至多命中2个球的概率和乙至少命中两个球的概率根据相互独立事件的概率公式得到结果【详解】甲至多命中2个且乙至少命中2个包含的解析:1118【分析】甲至多命中2个且乙至少命中2个包含的两个事件是相互独立事件,分别做出甲至多命中2个球的概率和乙至少命中两个球的概率,根据相互独立事件的概率公式得到结果. 【详解】甲至多命中2个且乙至少命中2个包含的两个事件是互相独立事件, 设“甲至多命中2个球”为事件A ,“乙至少命中2个球”为事件B ,由题意()41322124411111112222216P A C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=+⨯+⨯= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, ()22342344212128333339P B C C ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ∴甲至多命中2个球且乙至少命中2个球的概率为()()1181116918P A P B ⋅=⨯=,故答案为1118. 【点睛】本题考查独立重复试验,考查离散型随机变量,是一个综合题,解题时注意进球的个数对应的是乙所得的分数,注意分数与进球个数的对应.19.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率 解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为59. 考点:条件概率.20.【分析】记某用户的自用新能源汽车已经经过了2000次充电为事件A 他的车能够充电2500次为事件B 即求条件概率:由条件概率公式即得解【详解】记某用户的自用新能源汽车已经经过了2000次充电为事件A 他的解析:717【分析】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A ,“他的车能够充电2500次”为事件B ,即求条件概率:(|)P B A ,由条件概率公式即得解. 【详解】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A ,“他的车能够充电2500次”为事件B ,即求条件概率:()35%7(|)()85%17P A B P B A P A ===故答案为:717【点睛】本题考查了条件概率的应用,考查了学生概念理解,数学应用,数学运算的能力,属于基础题.三、解答题21.(1)没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)分布列见解析,()32E X = 【分析】(1)根据题意列出列联表,再计算2 4.762 6.635K ≈<,故没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)由分层抽样得抽得样本的大龄受试者有3人,年轻受试者有3人,X 的可能取值为0,1,2,3,再结合超几何分布求概率和期望即可.【详解】解:()122⨯列联表如下:()210010601020 4.762 6.63530702080K ⨯⨯-⨯∴=≈<⨯⨯⨯所以,没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关.(2)由题意得,采用分层抽样抽取的6人中,大龄受试者有3人,年轻受试者有3人, 所以大龄受试者人数为X 的可能取值为0,1,2,3,所以()33361020C P X C ===,()2133369120C C P X C ===, ()1233369220C C P X C ===,()33361320C P X C ===,所以X 的分布列为:所以()0123202020202E X =⨯+⨯+⨯+⨯=. 【点睛】本题第二问解题的关键在于根据题意得抽取的6人中,大龄受试者有3人,年轻受试者有3人,进而根据超几何分布求概率分布列与数学期望,考查运算求解能力,是中档题.22.(1) 72% 64% (2) 有99%的把握认为“两个分厂生产的零件的质量有差异” 【解析】解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%. (2)χ2=()1000360180320140500500680320⨯⨯-⨯⨯⨯⨯≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”. 23.(1)0.035,41.5;(2)有. 【分析】(1)由频率分布直方图求出a 的值,再计算数据的平均值;(2)由题意填写列联表,计算观测值,对照临界值得出结论. 【详解】(1)由频率分布直方图可得:10×(0.01+0.015+a +0.03+0.01)=1, 解得a =0.035,所以通过电子阅读的居民的平均年龄为:20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5;(2)由题意200人中通过电子阅读与纸质阅读的人数之比为3:1, ∴纸质阅读的人数为20014⨯=50,其中中老年有30人,∴纸质阅读的青少年有20人,电子阅读的总人数为150,青少年人数为1500.10.150.35⨯++()=90,则中老年有60人, 得2×2列联表,计算()2200903060202006.061 5.024501501109033K ⨯-⨯==≈>⨯⨯⨯,所以有97.5%的把握认为认为阅读方式与年龄有关. 【点睛】本题考查了频率分布直方图与独立性检验的应用问题,考查了阅读理解的能力,是基础题.24.(1)4.76;(2)有90%的把握认为“微信控”与“性别”有关 【解析】 试题分析:(1)由频率直方图中各概率乘以各方块中点频率相加后即得;(2)从频率直方图中可计算出“微信控”和“非微信控”的男女生人数,再计算出2K 可得. 试题(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76. (2)2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表:所以K 2==≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关.25.(1)指数模型回归方程为0.296.54x y e -=,反比例函数回归方程为10011y x=+;(2)20.99r ≈;用反比例函数模型拟合效果更好;(3)612(千元). 【分析】(1)由96.54dx y e =,得ln ln96.54 4.6y dx dx ν=+⇔=+,将 3.7ν=, 4.5x =代入可得指数模型回归方程.令1xμ=,则y b a μ=+,代入y ,求得b ,a ,可得反比例函数回归方程.(2)求得y 与u 的相关系数为2r ,由12r r <,可得结论. (3)设该企业的订单期望为S (千件),则109811011111123101122222S ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯+⨯ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,可求得订单的期望,从而求得该企业的利润约. 【详解】解:(1)因为96.54dx y e =,所以ln ln96.54 4.6y dx dx ν=+⇔=+, 将 3.7ν=, 4.5x =代入上式,得0.2d =-,所以0.296.54x y e -=.令1xμ=,则y b a μ=+, 因为360458y ==,所以182218183.480.34451001.5380.1158ni ii i i u y u yb u u==-⋅-⨯⨯===-⨯-∑∑,则451000.3411a y b u =-⋅=-⨯=,所以11100y u =+, 所以y 关于x 的回归方程为10011y x=+. 综上,指数模型回归方程为0.296.54x y e -=,反比例函数回归方程为10011y x=+. (2)y 与u 的相关系数为812882222118610.9961.40.616185.588i ii i i i i u y u yr u u y y ===-⋅===≈⨯⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑,因为12r r <,所以用反比例函数模型拟合效果更好. (3)设该企业的订单期望为S (千件),则109811011111123101122222S ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯+⨯ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, 令109811111123102222T ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭①, 则111092111111*********T ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭②, ②-①,得11109211111522222T ⎛⎫⎛⎫⎛⎫⎛⎫-=+++⋅⋅⋅+- ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭,化简得10192T ⎛⎫=+ ⎪⎝⎭,所以101391292256S ⎛⎫=+⨯=+ ⎪⎝⎭,所以该企业的利润约为:3310091009101161232562569256⎡⎤⎢⎥⎛⎫⎛⎫+⨯-+⨯++≈ ⎪ ⎪⎢⎥⎝⎭⎝⎭+⎢⎥⎣⎦(千元). 【点睛】本题考查线性回归方程的求得,相关系数的比较,以及运用数学期望求利润,属于中档题. 26.(1)0.05n =;(2)①列联表见解析;②不能在犯错误的概率不超过0.001的前提下,认为是不是技术工与月工资是否高于平均数有关 【分析】(1)根据频率分布直方图列方程组求得n 的值;(2)根据题意得到22⨯列联表,计算观测值,对照临界值表得出结论. 【详解】 (1)月工资收入在[45,50)(百元)内的人数为15月工资收入在[45,50)(百元)内的频率为:150.15100=; 由频率分布直方图得:(0.020.0420.01)50.151n +++⨯+=0.05n ∴=(2)①根据题意得到列联表:技术工 非技术工总计月工资不高于平均数193150月工资高于平均数3119 50总计 50 50 1002 5.7610.82850505050K ==<⨯⨯⨯ 不能在犯错误的概率不超过0.001的前提下,认为是不是技术工与月工资是否高于平均数有关.【点睛】本题主要考查了独立性检验和频率分布直方图的应用问题,也考查了计算能力及频率应用问题,是基础题.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 3.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据A .0B .1C .2D .35.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -7.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计 男生 18 9 27 女生 8 15 23 合计262450( )附:()()()()()22n ad bc K a b c d a c b d -=++++ P(K 2>k 0) 0.15 0.10 0.05 0.025 0.01 0.001 k 02.0722.7063.8415.0246.63510.828A .0.01B .0.025C .0.10D .0.059.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==10.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下35143178附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.在吸烟与患肺病是否相关的判断中,有下面的说法:(1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.(2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;(3)若2 6.635K >,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是________.14.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:不生二胎 40 40则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30农村170 30根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++.(其中n a b c d =+++为样本容量)23.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?24.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表: x 2 5 8 9 11 y1210887(1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下: i i xi y2i xi i x y1 2 12 4 24 2510255038864644988172511712177∑354529528725.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .喜欢数学不喜欢数学合计男生5女生10(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.4.B解析:B 【解析】 【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.D解析:D由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B9.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .10.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.D解析:D23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Y σ=-=-⨯-= 二、填空题13.(1)【分析】根据题意利用独立性检验的定义与基本思想对题目中的命题进行逐个分析判断即可求解出答案【详解】根据独立性检验的基本思想在犯错误的概率不超过005的前提下认为吸烟与患肺病有关系的意思为有的把解析:(1) 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有95%的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有99%的把握认为这个推理是正确的,而不是说某个人吸烟就有99%的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,2K 是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率.14.-6【解析】由题意可得=10=40所以+2=40+2×10=60所以=-2x+60当=72时-2x+60=72解得x=-6解析:-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.15.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:% 【解析】 试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。
高中数学选修1-2第一章统计案例测试题带详细解答(可编辑修改word版)
1
A、增加3个单位B、增加个单位C、减少3个单位D、减少个单位
3
【答案】C
【解析】
解释变量即回归方程里的自变量xˆ,由回归方程知预报变量yˆ减少 3 个单位
4.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U
与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之
选修 1-2 第一章、统计案例测试
一、选择题
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为ybxa必过点() A.(2,2)B. (1.5 ,4)C.(1.5 ,0)D.(1,2)
【答案】B
【解析】
试题分析:由数据可知x1.5,y4,∴线性回归方程
4
为yb xa必过点(1.5,4)
5 =11.72
. Y =(1+2+3+4+5)
5 =3
∴这组数据的相关系数是r=7.2
19.172 =0.3755,
变量U与V相对应的一组数据为(10,5),(11.3,4),
(11.8,3),(12.5,2),(13,1)
. U =(5+4+3+2+1)
5 =3,
∴这组数据的相关系数是-0.3755,
【解析】
试题分析:由题意,年劳动生产率x(千元)和工人工资y(元)之间回归方程为
y1070x,
故当x增加 1 时,y要增加 70 元,
∴劳动生产率每提高1千元时,工资平均提高70元,故A正确.
高中数学统计案例综合检测试题及答案-word文档
高中数学统计案例综合检测试题及答案选修2-3第三章统计案例综合检测时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4用水量y 4.5 4 3 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15C.5.2 D.5.25[答案] D[解析] x=2.5,y=3.5,∵回归直线方程过定点(x,y),3.5=-0.72.5+a,a=5.25.故选D.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反[答案] A[解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0.3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是()A.0 B.1C.2 D.3[答案] D4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下:甲X 110 120 125 130 135P 0.1 0.2 0.4 0.1 0.2乙X 100 115 125 130 145P 0.1 0.2 0.4 0.1 0.2现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标() A.期望与方差 B.正态分布C.卡方K2 D.概率[答案] A5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.期望与方差 B.排列与组合C.独立性检验 D.概率[答案] C6.(2009海南宁夏理,3)对变量x,y观测数据(x1,y1)(i =1,2,…,10),得散点图1;对变量u,v有观测数据(u1,v1)(i=1,2,…,10),得散点图2.由这两个散点图可以判断.()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.某地2019年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称计算机机械营销物流贸易应聘人数 215830 201950 154676 74570 65280行业名称计算机营销机械建筑化工招聘人数 124620 102935 89115 76516 70436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是() A.计算机行业好于化工行业B.建筑行业好于物流行业C.机械行业最紧张D.营销行业比贸易行业紧张[答案] B[解析] 建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y^=650+80x,下列说法中正确的个数是()①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元;③劳动生产率提高1000元时,则工资约提高730元;④当月工资为810元时,劳动生产率约为2019元.A.1 B.2C.3 D.4[答案] C[解析] 代入方程计算可判断①②④正确.9.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程为y^=b^x+a^必过样本点的中心(x-,y-)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系[答案] C[解析] R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图 B.二维条形图C.等高条形图 D.独立性检验[答案] D[解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55[答案] B[解析] 相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12.下面是某市场农产品的调查表.市场供应量表:单价(元/千克) 2 2.4 2.8 3.2 3.6 4供应量(1000千克) 50 60 70 75 80 90市场需求量表:单价(元/千克) 4 3.4 2.9 2.6 2.3 2供应量(1000千克) 50 60 70 75 80 90根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)[答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)13.当且仅当r满足________时,数据点(xi,yi)(i=1,2,…,n)在一条直线上.[答案] |r|=1[解析] 当数据点(xi,yi)在一条直线上时,y只受x的影响,即数据点完全线性相关,此时|r|=1.14.已知一个回归直线方程为y^=1.5x+45,x{1,7,5,13,19},则y=__________.[答案] 58.5[解析] 因为x=15(1+7+5+13+19)=9,且y=1.5x+45,所以y=1.59+45=58.5.本题易错之处是根据x的值及y^=1.5x+45求出y的值再求y,由y^=1.5x+45求得的y值不是原始数据,故错误.15.对具有线性相关关系的变量x和y,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.x 2 4 5 6 8y 30 40 60 50 70[答案] y^=17.5+6.5x[解析] 由数据表得x=5,y=50,所以a^=y-6.5x=17.5,即回归直线方程为y^=17.5+6.5x.16.(2019广东文,12)某市居民2019~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2019 2019 2019 2009收入x 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:患胃病未患胃病合计生活不规律 60 260 320生活有规律 20 200 220合计 80 460 540根据以上数据回答40岁以上的人患胃病与生活规律有关吗?[解析] k=540(60200-26020)232022080460=24969602590729.638∵9.638>6.63540岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.速度(转/秒) 每小时生产有问题物件数8 512 814 916 11(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?[解析] (1)用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x-=12.5,y-=8.25.于是回归直线的斜率为b^=xiyi -4x-y-x2i-4x-2=25.5350.7286,a^=y--b^x-=-0.8575,所以所求的回归直线方程为y=0.7286x-0.8575.(2)根据公式y^=0.7286x-0.8575,要使y10,则就需要0.7286x-0.857510,x14.9019,即机器的旋转速度不能超过14.9019转/秒.19.(本题满分12分)在从烟台大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:晕船不晕船合计男人 32 51 73女人 8 24 32合计 40 75 115根据此资料你是否认为在恶劣气候航行中,男人比女人更容易晕船?[解析] 男人晕船所占比例为3283100%=0.386,女人晕船所占比例为832100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K2=115(3224-518)2833240751.870.因为1.8702.706,所以我们没有充分的证据说晕船跟男女性别有关.20.(本题满分12分)有两个分类变量X与Y,其一组观测的22列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?y1 y2x1 a 20-ax2 15-a 30+a[解析] 查表可知,要使有90%以上的把握认为X与Y之间有关系,则K22.706,而其观测值k=65[a(30+a)-(20-a)(15-a)]220451550 =13(65a-300)2604550=13(13a-60)26090,解k2.706得a7.19或a2.04.又因为a5且15-a5,aZ,所以a=8,9,故当a取8或9时有90%以上的把握认为“X与Y之间有关系”.[点拨] 首先计算K2值,由题意K22.706,求得a的范围,再结合a5且15-a5,aZ,即可求得a的值.21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:气温x(℃) 26 18 13 10 4 -1杯数y 20 24 34 38 50 64画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系.[解析] 由表中数据画出散点图如图所示.由表中数据得x=16(26+18+13+10+4-1)11.67,y=16(20+24+34+38+50+64)38.33,i=16xiyi=2620+1824+1334+1038+450-164=1910,i =16x2i=262+182+132+102+42+(-1)2=1286,i=16y2i=202+242+342+382+502+642=10172,所以r-0.97,因为|r|0.970.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:播放天数 1 2 3 4 5点击观看的累积人次 51 134 213 235 262播放天数 6 7 8 9 10点击观看的累积人次 294 330 378 457 533(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算.i 1 2 3 4 5 6 7 8 9 10xi 1 2 3 4 5 6 7 8 9 10yi 51 134 213 235 262 294 330 378 457 533xiyi 51 268 639 940 1310 1764 2310 3024 4113 5330x=5.5,y=288.7,i=110x2i=385,i=110y2i=1020953,i=110xiyi=19749 利用上表的结果,计算累积人次与播放天数之间的相关系数r=19749-105.5288.7(385-105.52)(1020953-10288.72)0.9840.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。
最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)
一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3003.为研究某两个分类变量是否有关系,根据调查数据计算得到k≈15.968,因为P(K 2≥10.828)=0.001,则断定这两个分类变量有关系,那么这种判断犯错误的概率不超过( ). A .0.1B .0.05C .0.01D .0.0014.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成95 75 80 94 92 65 67 84 98 7167 93 64 787790 57 83 72 83若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%5.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%6.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ) A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合7.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:不秃发 5 450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0018.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为( ) 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%10.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .11.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( ) x 2 4 5 6 8 y2535605575A .5B .15C .10D .2012.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下 35 143 178 合计722283002()P K k ≥ 0.050 0.010 0.001 k 3.8416.63510.828附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%二、填空题13.若两个分类变量X 与Y 的列联表为:y 1 y 2 x 1 10 15 x 24016则“X 与Y 之间有关系”这个结论出错的可能性为________.14.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.参考公式:K 2=2()()()()()n ad bc a b c d a c b d -++++15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是3;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N Pσξ≤=则.其中正确结论的序号为________________17.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)18.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cossinxyθθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y+=;③极坐标系中,22,3Aπ⎛⎫⎪⎝⎭与()3,0B19④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.19.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太积极参加班级工作合计学习积极性高18725学习积极性一般61925合计242650则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表()2P K k≥0.0250.0100.0050.001k 5.024 6.6357.87910.82820.下列说法中,正确的有_______.①回归直线ˆˆˆy bx a =+恒过点(),x y ,且至少过一个样本点;②根据22⨯列列联表中的数据计算得出2 6.635K ≥,而()26.6350.01P K ≥≈,则有99%的把握认为两个分类变量有关系;③2k 是用来判断两个分类变量是否相关的随机变量,当2k 的值很小时可以推断两个变量不相关;三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:(1)若把年龄在2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?附:()()()()()2n ad bc K a b c d a c b d -=++++.两人年龄都小于20岁的概率.22.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差); 年广告投入x (万元) 2 3 4 5 6 年利润y (十万元)346811模型甲估计值(1)iy^ 残差(1)i e ^模型乙估计值(2)iy^ 残差(2)ie^②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 合 计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg 的网箱数为X ,求X 的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++24.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bc K n a b c d a b c d a c b d -==+++++++临界值表k 3.841 5.024 6.63510.82825.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L(单位:M)的数据,其频率分布直方图如图所示.求a的值,并估计这200名员工月使用流量的平均值x(同一组中的数据用中点值代表);(2)若将月使用流量在800M以上(含800M)的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工女员工合计手机营销达人5非手机营销达人合计200(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X,求X的分布列和数学期望.参考公式及数据:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.()2P K k≥0.150.100.050.0250.0100.005k 2.072 2.706 3.841 5.024 6.6357.87926.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A、B两品种茶叶的产量,某季采摘时,随机选取种植A、B两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?A品种茶叶(亩数)B品种茶叶(亩数)合计高产茶园非高产茶园合计(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++ ()2P K k≥0.0500.0100.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.A【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
高中数学选修2-3 第三章 统计案例 章末检测题
高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
人教新课标高中数学选修1-2第一章测试题及答案
(选修1-2)第一章统计案例——测试题答题时间50分钟,满分100分(命题人:依兰高中 刘 岩)一、选择题(每小题8分,5个小题共40分)1、下列结论正确的是( C )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系③回归分析是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①②B. ①②③C. ①②④D. ①②③④2、设有一个回归方程为y=2-2.5x,则变量x 增加一个单位时( C )A.y 平均增加2.5个单位B.y 平均增加2个单位C.y 平均减少2.5个单位D.y 平均减少2个单位3、已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( C )A.y ∧=1.23x +4B.y ∧=1.23x+5 C. y ∧=1.23x+0.08 D. y ∧=0.08x+1.234、2.下面是一个2×2列联表:则表中a 、b 处的值分别为( A )A .52、60B .52、50C .94、96D .54、52D )A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点6、已知回归直线方程 y bx a =+,其中3a =且样本点中心为(12),,则回归直线方程为( C ) A.3y x =+ B.23y x =-+ C.3y x =-+ D.3y x =-7、为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有( B )A.0B.95%C.99%D.100%8、在回归直线方程 y a bx=+中,回归系数b表示( D )A.当0x=时,y的平均值B.x变动一个单位时,y的实际变动量C.y变动一个单位时,x的平均变动量D.x变动一个单位时,y的平均变动量9、如图所示,图中有5组数据,去掉哪组数据后,剩下的4组数据的线性相关性最大(A)A.E B.C C.D D.A10、如下图所示是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出(C)A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例为60%11、甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关指数R2则试验结果体现A 、B 两变量有更强的线性相关性的同学是( D )A .甲B .乙C .丙D .丁12、对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( B)A .k 越大,推断“X 与Y 有关系”,犯错误的概率越大B .k 越小,推断“X 与Y 有关系”,犯错误的概率越大C .k 越接近于0,推断“X 与Y 无关”,犯错误的概率越大D .k 越大,推断“X 与Y 无关”,犯错误的概率越小二、填空题:(每小题8分, 2个小题共16分)13、对于线性回归方程 =4.75x +257,当x =28时,y 的估计值为_ 390_______.14、从某地区老人中随机抽取500人,其生活能否自理的情况如下表所示:15、对具有线性相关关系的变量x 和y ,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_y_=-10+6.5x .____________.16、若两个分类变量X 与Y 的列联表为:则“X 与Y .三、解答题17.(20分)某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1) 求y 关于x 的回归直线方程.(2) 并预测广告费支出700万元的销售额大约是多少万元? 解:(1)由已知:x =5; y =50; ∑i =15x 2i =145; ∑i =15x i y i =1380 可得b ^=22i i i x y nx yx nx -⋅-∑∑=1380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.所求的回归直线方程是y ^=6.5x +17.5.(2)由(1)可知:回归直线方程是y ^=6.5x +17.5.又700万元=7百万元即 x=7时y ^=6.5×7+17.5=63 (百万元)答:广告费支出700万元销售额大约是6300万元。
(好题)高中数学选修1-2第一章《统计案例》测试卷(包含答案解析)(2)
一、选择题1.下列说法:①对于独立性检验,2χ的值越大,说明两事件相关程度越大;②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y a bx =+中,2b =,1x =,3y =,则1a =;④通过回归直线y bx a =+及回归系数b ,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A .1B .2C .3D .42.甲射击时命中目标的概率为0.75,乙射击时命中目标的概率为23,则甲乙两人各自射击同一目标一次,则该目标被击中的概率为( ) A .12B .1C .56D .11123.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1154.从装有形状大小相同的3个黑球和2个白球的盒子中依次不放回地任意抽取3次,若第二次抽得黑球,则第三次抽得白球的概率等于( ) A .15B .14C .13D .125.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .406.在一次独立性检验中,得出列表如下:合计 190 400a + 590a +且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720 B .360C .180D .907.工人月工资(元)关于劳动生产率x(千元)的回归方程为,下列说法中正确的个数是( )①劳动生产率为1000元时,工资为730元; ②劳动生产率提高1000元,则工资提高80元; ③劳动生产率提高1000元,则工资提高730元; ④当月工资为810元时,劳动生产率约为2000元. A .1B .2C .3D .48.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则()/P B A =( ) A .13B .518C .16D .149.甲乙丙三位同学独立的解决同一个问题,已知三位同学单独正确解决这个问题的概率分别为12,13,15,则有人能够解决这个问题的概率为( ) A .130 B .415C .1115D .131510.甲、乙两位同学各自独立地解答同一个问题,他们能够正确解答该问题的概率分别是23和12,在这个问题至少被一个人正确解答的条件下,甲、乙两位同学都能正确解答该问题的概率为( )A .27B .25C .15D .1911.为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表:及格 不及格 合计 很少使用手机 20 5 25 经常使用手机 10 15 25 合计302050则有( )的把握认为经常使用手机对数学学习成绩有影响.参考公式:()()()()()22=n ad bc K a b c d a c b d -++++,其中n a b c d =+++()2P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.828A .97.5%B .99%C .99.5%D .99.9%12.甲、乙两人独立地破译一份密码,破译的概率分别为11,32,则密码被破译的概率为( ) A .16B .23C .56D .1二、填空题13.有甲、乙两台机床生产某种零件,甲获得正品乙不是正品的概率为14,乙获得正品甲不是正品的概率为16,且每台获得正品的概率均大于12,则甲乙同时生产这种零件,至少一台获得正品的概率是___________.14.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.15.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)16.设甲、乙两套方案在一次试验中通过的概率均为0.3,且两套方案在试验过程中相互之间没有影响,则两套方案在一次试验中至少有一套通过的概率为___________. 17.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.18.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.19.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A ;“抽出的学生英语口语测试成绩不低于85分”记为事件B .则P (A|B )的值是_____.20.2020年新型冠状病毒疫情期间,大学生小白同学在家里根据某款运动软件安排的训练计划进行运动,每天训练一次,连续3天为一个运动周期,若小白每天不能参加训练的概率为14,假设小白每天的训练是相互独立的,若一个训练周期内出现2次不能参加训练,则停止该训练计划,则这个训练计划在第二个完整周期后结束的概率为______.三、解答题21.一网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富.该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”.根据实际评选结果得到了下面22⨯列联表:网红乡土直播员 乡土直播达人 合计 男 10 40 50 女 20 30 50 合计3070100(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,在这6人中选2人作为“乡土直播推广大使”.求这两人中恰有一男一女的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.00122.近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数,(1,2,3,4,5)i ix y i=,数据如下表所示:==2s==.(1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)建立y关于x的回归方程,并预测当A指标数为7时,B指标数的估计值;(3)若城市的网约车A指标数x落在区间(3,3)x s x s-+之外,则认为该城市网约车数量过多,会对城市交通管理带来较大的影响,交通管理部门将介入进行治理,直至A指标数x回落到区间(3,3)x s x s-+之内.现已知2018年11月该城市网约车的A指标数为13,问:该城市的交通管理部门是否要介入进行治理?试说明理由.附:相关公式:()()ni ix x y yr--=∑,121()()()ni iiniix x y ybx x==--=-∑∑,a y bx=-.0.55≈0.95≈.23.随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大.某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取50个用户按年龄分组进行访谈,统计结果如下表.(1)若在第2、3、4组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取15人,则各组应分别抽取多少人?(2)若从第5组的被调查者访谈人中随机选取2人进行追踪调查,求2人中至少有1人愿意选择此款“流量包”套餐的概率.(3)按以上统计数据填写下面2×2列联表,并判断以50岁为分界点,能否在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关;参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.24.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如下图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是500元,设所需要的试验费用为X ,求X 的分布列与数学期望. 附表及公式:()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++25.支付宝作为一款移动支付工具,在日常生活中起到了重要的作用.(1)通过现场调查12位市民得知,其中有10人使用支付宝.现从这12位市民中随机抽取3人,求至少抽到2位使用支付宝的市民的概率;(2)为了鼓励市民使用支付宝,支付宝推出了“奖励金”活动,每使用支付宝支付一次,分别有12,13,16的概率获得0.1,0.2,0.3元奖励金,每次支付获得的奖励金情况互不影响.若某位市民在一天内使用了2次支付宝,记X 为这一天他获得的奖励金数,求X 的概率分布和数学期望.26.新能源汽车已经走进我们的生活,逐渐为大家所青睐.现在有某品牌的新能源汽车在甲市进行预售,预售场面异常火爆,故该经销商采用竞价策略基本规则是:①竞价者都是网络报价,每个人并不知晓其他人的报价,也不知道参与竞价的总人数;②竞价采用“一月一期制”,当月竞价时间截止后,系统根据当期汽车配额,按照竞价人的出价从高到低分配名额.某人拟参加2020年6月份的汽车竞价,他为了预测最低成交价,根据网站的公告,统计了最近5个月参与竞价的人数(如下表) 月份2020.012020.022020.032020.042020.05(1)由收集数据的散点图发现,可用线性回归模型拟合竞价人数y (万人)与月份编号t 之间的相关关系.请用最小二乘法求y 关于t 的线性回归方程:ˆ bt y a =+,并预测2020年6月份(月份编号为6)参与竞价的人数;(2)某市场调研机构对200位拟参加2020年6月份汽车竞价人员的报价进行了一个抽样调查,得到如表所示的频数表:(i )求这200位竞价人员报价的平均值x 和样本方差s 2(同一区间的报价用该价格区间的中点值代替)(ii )假设所有参与竞价人员的报价X 可视为服从正态分布()2,,N μσ且μ与σ2可分别由(i )中所示的样本平均数x 及s 2估计.若2020年月6份计划提供的新能源车辆数为3174,根据市场调研,最低成交价高于样本平均数x ,请你预测(需说明理由)最低成交价. 参考公式及数据:①回归方程ˆˆˆy bx a =+,其中1221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-⋅==--∑∑ ②5521155, 2.6;ii i i i tx y ====≈∑∑③若随机变量X 服从正态分布()2,,N μσ则()()0.6826,220.9544,P X P X μσμσμσμσ-<<+=-<<+= ()330.9974P X μσμσ-<<+=.【参考答案】***试卷处理标记,请不要删除一、选择题1.C 解析:C 【分析】根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】对于命题①,根据独立性检验的性质知,两个分类变量2χ越大,说明两个分类变量相关程度越大,命题①正确;对于命题②,由kxy ce =,两边取自然对数,可得ln ln y c kx =+,令ln z y =,得ln z kx c =+,0.34z x =+,所以ln 40.3c k =⎧⎨=⎩,则40.3c e k ⎧=⎨=⎩,命题②正确;对于命题③,回归直线方程y a bx =+中,3211a y bx =-=-⨯=,命题③正确; 对于命题④,通过回归直线y bx a =+及回归系数b ,可估计和预测变量的取值和变化趋势,命题④错误.故选C. 【点睛】本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.2.D解析:D 【分析】记事件:A 甲乙两人各自射击同一目标一次,该目标被击中,利用独立事件的概率乘法公式计算出事件A 的对立事件的概率,再利用对立事件的概率公式可得出事件A 的概率. 【详解】记事件:A 甲乙两人各自射击同一目标一次,该目标被击中, 则事件:A 甲乙两人各自射击同一目标一次,两人都未击中目标, 由独立事件的概率乘法公式得()321114312P A ⎛⎫⎛⎫=--= ⎪⎪⎝⎭⎝⎭, ()()111111212P A P A ∴=-=-=,故选D. 【点睛】本题考查独立事件的概率乘法公式,解题时要弄清楚各事件之间的关系,可以采用分类讨论,本题采用对立事件求解,可简化分类讨论,属于中等题.3.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案.详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.4.D解析:D 【解析】分析:这是一个条件概率,可用古典概型概率公式计算,即从5个球中取三个排列,总体事件是第二次是黑球,可在第二次是黑球的条件下抽排第一次和第三次球.详解:111223122412C C C P C A ==. 点睛:此题是一个条件概率,条件是第二次抽取的是黑球,不能误以为是求第二次抽到黑球,第三次抽到白球的概率,如果那样求得错误结论为1132353310C C A ⨯=. 5.D解析:D 【解析】由表中数据知,199.51010.511105x =⨯++++=(),1111086585y =⨯++++=(),代入回归直线方程 3.ˆ2yx a =-+中,求得实数 3.28 3.21040a y x =+=+⨯=,故选D. 6.B解析:B 【解析】∵两个分类变量A 和B 没有任何关系,∴()()()()2259010090400 2.70219040090500a a K a a +-⨯=<⨯++,代入验证可知360a =满足,故选B.7.C解析:C 【解析】对于①当劳动生产率为1000元时,工资为65080730y =+=元,故①正确;对于②劳动生产率提高1000元,则工资提高80元正确;故③错误;对于④当月工资为810元时,由81065080x =+得2x =,即劳动生产率约为2000元,故④正确;故选C.8.A解析:A 【解析】由题意事件A={两个点数都不相同},包含的基本事件数是36−6=30, 事件B:出现一个5点,有10种,∴()101303|P B A ==, 本题选择A 选项.点睛:条件概率的计算方法:(1)利用定义,求P (A )和P (AB ),然后利用公式进行计算;(2)借助古典概型概率公式,先求事件A 包含的基本事件数n (A ),再求事件A 与事件B 的交事件中包含的基本事件数n (AB ),然后求概率值.9.C解析:C 【分析】先利用相互独立事件的概率乘法公式求出“三人都未解答这个问题”的概率,利用对立事件的概率公式得到“有人能够解决这个问题”的概率即可. 【详解】三人都未解答这个问题的概率为 (112-)(113-)(115-)415=,故有人能够解决这个问题的概率为14111515-=, 故选:C . 【点睛】本题考查了相互独立事件的概率乘法公式、互斥事件和对立事件的概率公式,考查了正难则反的原则,属于中档题.10.B解析:B 【分析】先计算“这个问题至少被一个人正确解答”和“甲、乙两位同学都能正确解答该问题”概率,再利用条件概率公式计算即可. 【详解】由已知,不妨设A =“这个问题至少被一个人正确解答”,B =“甲、乙两位同学都能正确解答该问题”,因为甲、乙两位同学各自独立正确解答该问题的概率分别是23和12, 故215()111326P A ⎛⎫⎛⎫=---= ⎪⎪⎝⎭⎝⎭,121()233P B =⨯=,易知1()()3P AB P B ==.故()1()235()56P AB P BA P A ===∣. 故选:B. 【点睛】本题考查了条件概率的应用,属于中档题.11.C解析:C 【分析】根据2×2列联表,求出k 的观测值2K ,结合题中表格数据即可得出结论. 【详解】 由题意,可得:222()50(2015105)258.3337.879()()()()302025253n ad bc K a b c d a c b d -⨯⨯-⨯===≈>++++⨯⨯⨯,所以有99.5%的把握认为经常使用手机对数学学习成绩有影响. 故选C. 【点睛】本题考查了独立性检验的应用,考查了计算能力,属于基础题.12.B解析:B 【分析】密码被破译分三种情况:甲破译出密码乙未破译,乙破译出密码甲未破译,甲乙都破译出密码,根据相互独立事件的概率和公式可求解出答案. 【详解】设 “甲独立地破译一份密码” 为事件A , “乙独立地破译一份密码” 为事件B , 则()13P A =,()12P B =,()12133P A =-=,()11122P B =-=, 设 “密码被破译” 为事件C ,则()()()()P C P AB P AB P AB =++11211123232323=⨯+⨯+⨯=, 故选:B. 【点睛】本题以实际问题为背景考查相互独立事件的概念及其发生的概率的计算,考查分析问题和解决问题的能力,属于中档题.二、填空题13.【分析】设甲乙两台机床生产正品的概率分别为则根据题意列方程组解得甲乙同时生产这种零件至少一台获得正品为甲获得正品乙不是正品乙获得正品甲不是正品以及甲乙均获得正品根据概率加法公式求解即可【详解】设甲乙 解析:1112【分析】设甲乙两台机床生产正品的概率分别为p ,q ,则112p <≤,112q <≤,根据题意列方程组()()114116p q q p ⎧-=⎪⎪⎨⎪-=⎪⎩,解得3423p q ⎧=⎪⎪⎨⎪=⎪⎩,“甲乙同时生产这种零件,至少一台获得正品”为甲获得正品乙不是正品,乙获得正品甲不是正品,以及甲乙均获得正品,根据概率加法公式求解即可. 【详解】设甲乙两台机床生产正品的概率分别为p ,q ,则112p <≤,112q <≤. 甲获得正品乙不是正品的概率为14()114p q ∴-=① 又乙获得正品甲不是正品的概率为16()116q p ∴-=② ①②联立得()()114116p q q p ⎧-=⎪⎪⎨⎪-=⎪⎩,解得3423p q ⎧=⎪⎪⎨⎪=⎪⎩则甲乙均获得正品的概率为321432p q ⋅=⨯= 即甲乙同时生产这种零件,至少一台获得正品的概率是1111146212++= 故答案为:1112【点睛】本题考查概率的加法与乘法公式,属于中档题.14.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.15.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2. 因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+,∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.16.51【解析】由于两套方案互不影响故至少有一套方案通过的概率是解析:51 【解析】由于两套方案互不影响,故至少有一套方案通过的概率是2120.3C 0.3(10.3)0.51+⋅⋅-=.17.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.18.【解析】表示在已经发生事件的情况下事件发生的概率又事件恰有一次出现正面包含于事件至少一次出现反面所以所以解析:37【解析】(/)P B A 表示在已经发生事件A 的情况下,事件B 发生的概率,又事件B = “恰有一次出现正面”包含于事件A =“至少一次出现反面”,所以()()(/)()()P AB P B P B A P A P A ==,37(),()88P B P A ==,所以()3()7P B P A =. 19.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率 解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为59. 考点:条件概率.20.【分析】由题意求得一个周期内就停止训练的概率再结合相互独立事件的概率计算公式即可求解【详解】由题意小白每天不能参加训练的概率为若一个训练周期内出现2次不能参加训练可得一个周期内就停止训练的概率为这个 解析:811024【分析】由题意,求得一个周期内就停止训练的概率,再结合相互独立事件的概率计算公式,即可求解.【详解】由题意,小白每天不能参加训练的概率为14,若一个训练周期内出现2次不能参加训练,可得一个周期内就停止训练的概率为221135244432⎛⎫⎛⎫+⨯⨯=⎪ ⎪⎝⎭⎝⎭,这个训练计划持续两个周期的概率为2513811232441024⎛⎫⎛⎫-⨯⨯⨯=⎪ ⎪⎝⎭⎝⎭.故答案为:81 1024.【点睛】本题主要考查了相互独立事件的概率的计算,其中解答中正确理解题意,结合独立事件的概率计算公式求得一个周期内就停止训练的概率是解答的关键,着重考查分析问题和解答问题的能力.三、解答题21.(1)有95%的把握认为“网红乡土直播员”与性别有关系;(2)8 15.【分析】(1)由题中22⨯列联表中的数据代入()()()()()22n ad bcKa b c d a c b d-=++++然后与所给表值进行比较可得答案;(2)列出从这6人中随机抽取2人的所有可能情况,选中的2人中恰有一男一女的所有可能情况可得答案.【详解】(1)由题中22⨯列联表,可得()22100103020404.762 3.84150503070K⨯-⨯=≈>⨯⨯⨯.∴有95%的把握认为“网红乡土直播员”与性别有关系.(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,男性人数为106230⨯=人,记为A,B;女性人数为206430⨯=人,记为a,b,c,d.则从这6人中随机抽取2人的所有可能情况有以下“A,B;A,a;A,b;A,c;A,d;B ,a ; B ,b ; B ,c ; B ,d ;a ,b ; a ,c ; a ,d ; b ,c ; b ,d ; c ,d ”共15种.其中,选中的2人中恰有一男一女的所有可能情况有以下“A ,a ; A ,b ; A ,c ; A ,d ; B ,a ; B ,b ; B ,c ; B ,d ”共8种. ∴选中的2人中恰有一男一女的概率815P =. 【点睛】古典概型的概率的计算方法,首先计算所有基本事件数,再计算事件A 包含的基本事件数,应用古典概率公式计算求解.22.(1)0.95r ≈,y 与x 具有较强的线性相关关系,可用线性回归模型拟合y 与x 的关系;(2)35102y x =+,当7x =时, 4.6y =;(3)要介入进行治理. 【分析】(1)由已知数据可得,x y ,利用公式,求得相关系数r ,即可作出判断,得到结论;(2)由(1),求得b 和ˆa,求得回归直线的方程,代入7x =,即可求得回归方程; (3)由(3,3)(1,11)x s x s -+=-,而1311>,即可得到结论. 【详解】(1)由已知数据可得2456855x ++++==,3444545y ++++==.所以相关系数5()x x y y r --=0.95==≈. 因为0.75r >,所以y 与x 具有较强的线性相关关系,可用线性回归模型拟合y 与x 的关系.(2)由(1)可知()51521()632ˆ010()i i i i i x x y y b x x ==--===-∑∑,354ˆ2ˆ510a y bx =-=-⨯=, 所以y 与x 之间线性回归方程为35102ˆy x =+. 当7x =时,3576102ˆ 4.y=⨯+=. (3)()()3,31,11x s x s -+=-,而1311>,故2018年11月该城市的网约车已对城市交通带来较大的影响,交通管理部门将介入进行治理. 【点睛】本题主要考查了回归直线方程的求解及应用问题,其中解答中,认真审题,正确理解题意,利用公式准确计算是解答此类问题的关键,着重考查了推理与运算能力,属于基础题.23.(1)各组分别为5人,6人,4人;(2)35;(3)在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 【解析】试题分析:(1)三组一共有30人,抽取15人,故两个人抽一人,由此得到抽取的人数分别为5,6,4人.(2)利用列举法列举出所有可能性有15种,其中符合题意的有9种,故概率为35.(3)根据题意填写好表格后,计算29.979 6.635K ≈>,故有在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 试题解:(1)因为1012815=5,15=615=4303030,⨯⨯⨯,所以第2、3、4组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取15人,各组分别为5人,6人,4人.(2)设第5组中不愿意选择此款“流量包”套餐A,B,C,D,愿意选择此款“流量包”套餐人为a,b,则愿意从6人中选取2人有:,,,,,,,,,,,,,,,AB AC AD Aa Ab BC BD Ba Bb CD Ca Cb Da Db ab 共15个结果,其中至少有1人愿意选择此款“流量包”,,,,,,,,,Aa Ab Ba Bb Ca Cb Da Db ab 共9个结果,所以求2人中至少有1人愿意选择此款“流量包”套餐的概率93155P ==. (3)2×2列联表∴()()()()25010310279.979 6.63510271031010273K ⨯⨯-⨯=≈>++++∴在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 24.(1)平均数为6,“长潜伏者”的人数为250人(2)列联表见解析, 有97.5%的把握认为潜伏期长短与年龄有关 (3)分布列见解析,()1750E X = 【分析】(1)由频率分布直方图可计算出潜伏期的均值,再由频率分布直方图可得“长潜伏者”的频率,从而得人数;(2)由所给数据计算出2K 后可得结论;(3)由题意知所需要的试验费用X 所有可能的取值为1000,1500,2000,分别计算出概率得概率分布列,再由期望公式得期望.。
{高中试卷}高一数学统计案例测试题
20XX年高中测试高中试题试卷科目:年级:考点:监考老师:日期:统计案例测试题一一、选择题:本大题共道小题,每小题分,共分,在每小题给出的四个选项中,只有一项符合题目要求1、对于散点图下列说法中正确一个是()(A)通过散点图一定可以看出变量之间的变化规律(B)通过散点图一定不可以看出变量之间的变化规律(C)通过散点图可以看出正相关与负相关有明显区别(D)通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是()(A)预报变量在轴上,解释变量在轴上(B)解释变量在轴上,预报变量在轴上(C)可以选择两个变量中的任意一个变量在轴上(D)可以选择两个变量中的任意一个变量在轴上3、如果根据性别与是否爱好运动的列联表,得到,所以判断性别与运动有关,那么这种判断出错的可能性为()(A)(B)(C)(D)4、下列关于线性回归的说法,不正确的是()(A)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B)在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C)线性回归直线方程最能代表观测值之间的关系;(D)任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为()(A)模型①的相关指数为(B)模型②的相关指数为(C)模型③的相关指数为(D)模型④的相关指数为6、关于如何求回归直线的方程,下列说法正确的一项是()(A)先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B)在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C)在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D)上述三种方法都不可行7、若对于变量与的组统计数据的回归模型中,相关指数,又知残差平方和为,那么的值为()(A)(B)(C)(D)8、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到()(A)(B)(C)(D)9、某医院用光电比色计检验尿汞时,得尿汞含量与消光系数读数的结果如下:如果与之间具有线性相关关系,那么当消光系数的读数为时,()(A)汞含量约为(B)汞含量高于(C)汞含量低于(D)汞含量一定是10、由一组样本数据得到的回归直线方程,那么下面说法正确的是()(A)直线必过点(B)直线必经过一点(C)直线经过中某两个特殊点(D)直线必不过点11、根据下面的列联表得到如下中个判断:①有的把握认为患肝病与嗜酒有关;②有的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为;④认为患肝病与嗜酒有关的出错的可能为;其中正确命题的个数为()(A)(B)(C)(D)12、对于两个变量之间的相关系数,下列说法中正确的是()(A)越大,相关程度越大(B)越小,相关程度越大(C)越大,相关程度越小;越小,相关程度越大(D)且越接近于,相关程度越大;越接近于,相关程度越小;二、填空题:本大题共小题,每小题分,共分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A=,B=,C=,D=,E=;14、如右表中给出五组数据,从中选出四组使其线性相关最大,且保留第一组,那么,应去掉第组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学-统计案例测试题
(时间:120分钟 满分:160分)
一、填空题(本大题共14小题,每小题5分,共70分)
1.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.
其中不是函数关系的有________个. 2.已知线性回归方程y ^
=b ^
x +a ^
,其中a ^
=3且样本点中心为(1,2),则线性回归方程为________.
3.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果(单位:人)
4
由χ2公式可知,填____(“有”或“无”).
5.利用独立性检验来考察两个分类变量X ,Y 是否有关系时,通过查阅临界值表,如果我们发现有95%的把握认为“X 和Y 有关系”,则χ2>________.
6.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来断言“X 与Y 有无关系”.如果χ2>5.024,那么就有把握认为“X 与Y 有关系”的百分比为________.
7.如果某地的财政收入x 与支出y 满足线性回归方程y =a +bx +ε(单位:亿元),其中b =0.8,a =2,|ε|≤0.5.若今年该地区的财政收入为10亿元,则年支出预计不会超出________亿元.
8.已知x 、y
从散点图分析,y 与x 线性相关,且线性回归方程为y =0.95x +a ^
,则a ^
=________.
9
那么A =________,B E =________. 10.以下关于独立性检验的说法中,正确的是______.(填序号) ①独立性检验依赖小概率原理; ②独立性检验得到的结论一定正确;
③样本不同,独立性检验的结论可能有差异;
④独立性检验不是判定两事物是否相关的惟一方法.
11.某单位为了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.
由表中数据得线性回归方程y =b x +a 中b =-2,据此预测当气温为5℃时,用电量的度数约为______.
12.对于线性回归方程y ^
=4.75x +257,当x =28时,y 的估计值为________.
13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2=________.
14
二、解答题(本大题共6小题,共90分)
15.(14分)调查了90名不同男、女大学生对于外出租房的态度,各种态度人数分布见下
16.(14分)为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查
试问:50
17.(14分)现随机抽取了我校10名学生在入学考试中的数学成绩(x )与入学后的第一次考
18.(16分)考察黄烟经过药物处理跟发生青花病的关系,得到如下数据,在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病.未经过药物处理的有185株发生青花病,200株没有发生青花病,试推断经过药物处理跟发生青花病是否有关系.
19.(16分)一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,下列为其试验结果
速度(转/秒)每小时生产有缺点的物件数
8 5
12 8
14 9
16 11
(1)求出机器速度影响每小时生产缺点物件数的线性回归方程;并进行相关性检验.
(2)若实际生产中所容许的每小时最大缺点物件数为10,那么,机器的速度每秒不得超过多少转?
20.(16分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行
分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种
归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^
=bx +a ;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
统计案例 答案
1.3
解析 给出的三个关系都具有不确定性,是相关关系. 2.y ^
=-x +3 3.99.9% 4.无 5.3.841 6.97.5% 7.10.5
解析 当x =10时,y ^
=2+0.8×10+ε=10+ε, ∵|ε|≤0.5,∴y ^
≤10. 5. 8.2.6
解析 x =2,y =4.5,∴回归直线过(2,4.5), ∴4.5=0.95×2+a ^ , ∴a ^
=2.6.
9.47 92 88 82 53 10.①③④ 11.40 12.390 13.16.373 14.90%
解析 经计算,得χ2=
500×(178×21-278×23)2
(178+23)×(178+278)×(278+21)×(23+21)
≈2.925>2.706,∴有关的可能性为90%.
15.解 χ2
=90×(23×22-17×28)240×50×51×39
≈0.02<2.706,
故认为性别与外出租房的态度无关. 16.解 根据列联表中的数据,得到
χ2=339×(43×121-162×13)2205×134×56×283
=7.469.
因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关.
17.解 x =1
10
×(120+108+…+99+108)=107.8,
y =1
10
×(84+64+…+57+71)=68,
∑10
i =1x 2i =1202+1082+…+992+1082
=116 584, ∑10i =1y 2i =842+642+…+572+712
=47 384, ∑10i =1
x i y i =120×84+108×64+…+108×71=73 796,
所以,相关系数为
r =73 796-10×107.8×68
(116 584-10×107.82)(47 384-10×682)
≈0.750 6,由检验水平0.05及n -2=6,查得r 0.05=0.707, 由r >r 0.05知两次数学考试成绩有很强的线性相关关系. 18.解
根据公式χ2
=210×260×85×385
≈9.788.
由于9.788>7.879,所以我们有99.5%的把握认为经过药物处理跟发生青花病是有关系的. 19.解 用x 来表示机器速度,y 表示每小时生产的有缺点的物件数,那么4个样本数据为:
(x 1,y 1)=(8,5) (x 2,y 2)=(12,8) (x 3,y 3)=(14,9) (x 4,y 4)=(16,11)
(1)x =12.5,y =8.25,∑4
i =1x i y i =438,4x y =412.5,∑4
i =1x 2i =660,∑4
i =1
y 2i =291,
所以r =
∑4
i =1
x i y i -4x y (∑4
i =1x 2i -4x 2)(∑4
i =1
y 2i -4y 2
)
=
438-412.5
(660-625)×(291-272.25)
=25.5656.25=25.5025.62
≈0.995.
因为r >0.75,所以y 与x 有线性相关关系. 可求b ^
≈0.728 6,a ^
=y -b ^
x =-0.857 5 ∴y ^
=0.728 6x -0.857 5.
(2)由使y ^
≤10⇒0.728 6x -0.857 5≤10, 所以x ≤14.9≈15.
所以机器的转速应控制在15转/秒以下.
20.解 (1)设抽到不相邻两组数据为事件A ,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,
所以P (A )=1-410=3
5
.
所以选取的2组数据恰好是不相邻2天的数据的概率是3
5
.
(2)由数据,求得x =12,y =27,
由公式,求得b ^ =52
,a ^
=y -b ^ x =-3.
所以y 关于x 的线性回归方程为y ^ =5
2
x -3.
(3)当x =10时,y ^ =5
2×10-3=22,|22-23|<2;
同样,当x =8时,y ^ =5
2
×8-3=17,|17-16|<2.
所以,该研究所得到的线性回归方程是可靠的.。