文科数学二轮复习:专题限时集训7 用样本估计总体
用样本估计总体课件(第2课时)课件
提高代表性的方法
随机抽样、加大样本量、分层抽 样等。
03 样本的获取方法
随机抽样
01
02
03
简单随机抽样
每个样本单位被选中的概 率相等,适合样本量小的 情况。
分层随机抽样
将总体分成若干层,再从 各层中随机抽取一定数量 的样本单位。
系统随机抽样
将总体中的样本单位按一 定顺序排列,再按照固定 的间隔进行随机抽取。
以及样本数据的准确性。
比例估计在市场调查、民意调 查等领域应用广泛。
回归估计
回归估计是另一种常用的统计推断方 法,通过建立回归模型来估计总体参 数。
在进行回归估计时,需要选择合适的 自变量、建立合适的回归模型,并对 模型进行检验和调整。
回归估计的基本思想是利用已知的自 变量和因变量之间的关系,通过回归 分析来预测因变量的值。
定义
01
非抽样误差是由于除抽样之外的其他因素引起的误差,如测量
误差、系统偏差等。
产生原因
02
由于非随机因素导致样本与总体之间存在偏差。
控制方法
03
提高测量精度、消除系统偏差等,以减少非抽样误差的影响。
误差的来源与控制
抽样误差和非抽样误差是样本估计总体过程中常见的误 差来源。
控制非抽样误差的方法包括提高测量精度、消除系统偏 差等。
经济研究应用
总结词
经济研究中,样本估计总体被广泛应用于宏观经济数据的统计和分析。
详细描述
通过收集部分企业的财务数据、生产数据等,利用样本数据来估计和预测整体经 济的运行状况,如GDP、失业率、通货膨胀率等。这种方法可以帮助政府和决策 者了解经济形势、制定经济政策,促进经济发展和社会稳定。
高中数学复习:用样本估计总体
教材研读 栏目索引
1.判断正误(正确的打“√”,错误的打“✕”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.
(√) (2)一组数据的众数可以是一个或几个,中位数也具有相同的结论.( ✕) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后, 原有的具体数据信息就被抹掉了. ( √ )
所分组数 增加,⑧ 组距 减小,相应的频率分布折线图就会越来 越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
教材研读 栏目索引
3.茎叶图的优点
茎叶图的优点是可以⑨ 保留 原始数据,而且可以⑩ 随时 记录.
4.样本的数字特征
(1)众数、中位数、平均数
教材研读 栏目索引
众数 中位数
定义(求法) 一组数据中出现次数
(1)求极差(一组数据中① 最大值 与最小值的差). (2)决定② 组距 与组数. (3)将数据③ 分组 . (4)列④ 频率分布表 . (5)画⑤ 频率分布直方图 .
教材研读 栏目索引
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的⑥中点 ,就 得到频率分布折线图. (2)总体密度曲线:一般地,随着样本容量的增加,作频率分布直方图时⑦
栏目索引
第五节 用样本估计总体
总纲目录 栏目索引
1.作频率分布直方图的步骤
教 2.频率分布折线图和总体密度曲线 材 研 3.茎叶图的优点 频率分布直方图
点 突
考点二 茎叶图
破 考点三 数字特征
总纲目录 栏目索引
教材研读
教材研读 栏目索引
1.作频率分布直方图的步骤
则下面结论中不正确的是 ( A )
教材研读 栏目索引
高考数学 用样本估计总体 专题
高考数学用样本估计总体专题课下练兵场命题报告难度及题号知识点容易题(题号)中等题(题号)稍难题(题号)用样本的频率分布估计总体的频率分布1、3、4812茎叶图的应用2、911用样本的数字特征估计总体的数字特征56、7、10一、选择题1.一个容量为20的样本数据,分组后,组别与频数如下:组别(10,20](20,30](30,40](40,50](50,60](60,70]频数23454 2 则样本在(20,50]上的频率为() A.12%B.40% C.60% D.70%解析:本题考查样本的频率运算.据表知样本分布在(20,50]的频数3+4+5=12,故其频率为1220=0.6.答案:C2.甲、乙两名同学在五次《数学基本能力》测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是X甲、X乙,则下列结论正确的是()A.X甲>X乙,甲比乙成绩稳定B.X甲>X乙,乙比甲成绩稳定C.X甲<X乙,甲比乙成绩稳定D.X甲<X乙,乙比甲成绩稳定解析:由茎叶图知识,可知道甲的成绩为68、69、70、71、72,平均成绩为70;乙的成绩为63、68、69、69、71,平均成绩为68;再比较标准差:甲的标准差为15[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,乙的标准差为15[(63-68)2+(68-68)2+(69-68)2+(69-68)2+(71-68)2]=655>2,故甲比乙的成绩稳定.答案:A3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析:面积为频率,在[50,60)的频率为0.3,所以大约有200×0.3=60辆.答案:C4.(2009·福建高考)一个容量为100的样本,其数据的分组与各组的频数如下:组别频数(0,10]12(10,20]13(20,30]24(30,40]15(40,50]16(50,60]13(60,70]7则样本数据落在(10,40]()A.0.13 B.0.39 C.0.52 D.0.64解析:由列表知样本数据落在(10,40]上的频数为52,∴频率为0.52.5.甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是() A.0.350.258.1 B.0.350.258.8C.0.250.358.1 D.0.250.358.8解析:乙击中8环的概率为1-0.2-0.2-0.35=0.25;甲击中10环的概率为1-0.2-0.15-0.3=0.35;甲击中环数的平均值为7×0.2+8×0.15+9×0.3+10×0.35=8.8.答案:D6.(2009·四川高考)设矩形的长为a,宽为b,其比满足b:a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是() A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:x甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613,∴x甲与0.618更接近.二、填空题7.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是____________.解析:这10个数的中位数为a+b2=10.5.这10个数的平均数为10.要使总体方差最小,即(a-10)2+(b-10)2最小.又∵(a-10)2+(b-10)2=(21-b-10)2+(b-10)2=(11-b)2+(b-10)2=2b2-42b+221,∴当b=10.5时,(a-10)2+(b-10)2取得最小值.又∵a+b=21,∴a=10.5,b=10.5.答案:10.5,10.58.某地教育部门为了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图).则这10 000人中数学成绩在段的约是________人.解析:本题考查了频率直方图的一些知识,由图在的频率为0.008×10,所以在10 000人中成绩在的学生有10 000×0.008×10=800人.答案:8009.(2010·珠海模拟)如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.解析:从茎叶图上可得甲得分:8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙得分:8,12,14,17,18,19,21,27,28,29,平均值为19.3,∴平均得分高的运动员是甲. 答案:甲 三、解答题10.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位 mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1) x 甲=99+100+98+100+100+1036=100 mm ,x 乙=99+100+102+99+100+1006=100 mm , 甲2S =16=73 mm 2. 2乙S =16=1 mm 2.(2)因为甲2S >甲2S ,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.11.甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5项预赛成绩记录如下:甲 82 82 79 95 87 乙9575809085(1)用茎叶图表示这两组数据;(2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(3)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由. 解:(1)作出茎叶图如下:(2)记甲被抽到的成绩为x ,乙被抽到的成绩为y ,用数对(x ,y )表示基本事件: (82,95) (82,75) (82,80) (82,90) (82,85) (82,95) (82,75) (82,80) (82,90) (82,85) (79,95) (79,75) (79,80) (79,90) (79,85) (95,95) (95,75) (95,80) (95,90) (95,85) (87,95) (87,75) (87,80) (87,90) (87,85) 基本事件总数n =25.记“甲的成绩比乙高”为事件A ,事件A 包含的基本事件: (82,75) (82,80) (82,75) (82,80) (79,75) (95,75) (95,80) (95,90) (95,85) (87,85) (87,75) (87, 80) 事件A 包含的基本事件数是m =12. 所以P (A )=m n =1225.(3)派甲参赛比较合适.理由如下: x甲=85,x 乙=85,2甲S =31.6,2乙S =50.∵x甲=x 乙,2甲S <2乙S ,∴甲的成绩较稳定,派甲参赛比较合适.12.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8. (1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图; (3)估计成绩在[60,90)分的学生比例;(4)估计成绩在85分以下的学生比例.解:(1)频率分布表如下:成绩分组频数频率频率/组距[40,50)20.040.004[50,60)30.060.006[60,70)100.20.02[70,80)150.30.03[80,90)120.240.024[90,100)80.160.016合计5010.1 (2)频率分布直方图和折线图为:(3)所求的学生比例为0.2+0.3+0.24=0.74=74%.(4)所求的学生比例为1-(0.12+0.16)=1-0.28=0.72=72%.。
高考数学用样本估计总体知识点大全
高考数学用样本估计总体知识点大全推荐文章总经理工作评语大全热度:乡镇补贴细则大全热度: 2017在校大学生入党申请书范文大全热度: 2019清明祭扫演讲稿大全热度:2017建军90周年观后感大全热度:高中数学课程标准中,用样本估计总体已经成为必修内容,下面是店铺给大家带来的高考数学用样本估计总体知识点大全,希望对你有帮助。
高考数学用样本估计总体知识点一、频率分布的概念1、概念:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2、频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
注;(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率频率,故每组样本的频率为组距×,即矩形的面积. 组距组距。
(3)直方图中每组样本的频数为频率×总体数.3、频率分布折线图、总体密度曲线(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(2)总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。
二、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
1、茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
第2节 用样本估计总体--2025年高考数学复习讲义及练习解析
第二节用样本估计总体课标解读考向预测1.会用统计图表对总体进行估计,会求n 个数据的第p 百分位数.2.能用样本的数字特征估计总体集中趋势和总体离散程度.用样本估计总体在高考中出题频率较高,常结合频率分布直方图、样本的数字特征出题.预计2025年高考将会以与统计图表的识读、成对数据的统计分析相综合的形式呈现.必备知识——强基础1.总体百分位数的估计(1)第p 百分位数的定义一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有01p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.(2)四分位数常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第0225百分位数也称为第一四分位数或下四分位数,第0375百分位数也称为第三四分位数或上四分位数.2.样本的数字特征(1)众数:一组数据中04出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于05最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把06a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.总体平均数、方差、标准差与样本平均数、方差、标准差名称定义总体均值(总体平均数)、方差、标准差一般式:如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y-=Y1+Y2+…+Y NN=1N∑Ni=1Y i为07总体均值,又称总体平均数,称S2=1N∑Ni=1(Y i-Y-)2为08总体方差,S=S2为09总体标准差加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体均值为Y-=101N∑ki=1f i Y i,总体方差为S2=111N∑ki=1f i(Y i-Y-)2样本均值(样本平均数)、方差、标准差如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y-=y1+y2+…+y nn=1n∑ni=1y i为12样本均值,又称样本平均数,称s2=1n∑ni=1(y i-y-)2为13样本方差,s=s2为14样本标准差说明:(1)在简单随机抽样中,我们常用样本平均数、方差、标准差去估计总体平均数、方差、标准差.(2)总体平均数、方差、标准差是一个确定的数,样本平均数、方差、标准差具有随机性(因为样本具有随机性).(3)一般情况下,样本量越大,估计越准确1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广若数据x1,x2,…,x n的平均数为x-,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x-+a,方差为m2s2.1.概念辨析(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)一组数据的方差越大,说明这组数据越集中.()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案(1)×(2)×(3)√2.小题热身(1)(人教A 必修第二册习题9.2T1改编)下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A .3.2B .3.0C .4.4D .2.5答案A解析把该组数据按照由小到大的顺序排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i =10×25%=2.5,不是整数,得第3个数据3.2是第25百分位数.(2)(多选)(人教B 必修第二册习题5-1B T3改编)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B .这组数据的平均数为3C .这组数据的中位数为4D .这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A 正确;这组数据的平均数为1+3×2+5×36=113,B 错误;这组数据的中位数为3+52=4,C 正确;这组数据的众数为5,D 错误.(3)(人教B 必修第二册练习B T4改编)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用比例分配的分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980h ,1020h ,1032h ,则抽取的100件产品的平均使用寿命为________h.答案1013解析由比例分配的分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品件数分别为25,50,25,则抽取的100件产品的平均使用寿命为1100×(980×25+1020×50+1032×25)=1013(h).(4)已知一组数据的频率分布直方图如图,则众数是________,平均数是________.答案6567解析因为最高小长方形底边中点的横坐标为65,所以众数为65;平均数x -=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.考点探究——提素养考点一百分位数的计算例1(1)(2023·江苏南通海安质量监测)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:借书数量/本5678910频数/人58131194则这50名学生的借书数量的上四分位数是()A .8B .8.5C .9D .10答案C解析由50×75%=37.5,故第75百分位数为借书数量从小到大排序后的第38个,又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数(第75百分位数)是9.(2)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成频率分布直方图(如图所示).其中分数在[90,100]这一组内的纵坐标为a ,则该次体能测试成绩的80%分位数约为________分.答案92解析由频率分布直方图知,10×(0.002+0.004+0.014+0.020+a+0.035)=1,得a=0.025.因为0.02+0.04+0.14+0.20+0.35=0.75,所以该次体能测试成绩的80%分位数落在[90,100]内,设其为x,则由(x-90)×0.025=0.05,解得x=92.【通性通法】计算一组n个数据第p百分位数的步骤【巩固迁移】1.为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x =()A.58或64B.59或64C.58D.59答案A解析将已知的6个数从小到大排序为45,49,53,57,61,79.若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件;若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;若57<x<79,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则|x-61|=3,解得x=58或x=64.故选A.2.(2024·安徽十校联考)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是68,63,77,76,82,88,92,93,则这8名学生成绩的75%分位数是()A.88分B.89分C.90分D.92分答案C解析8名学生的成绩从小到大排列为63,68,76,77,82,88,92,93,因为8×75%=6,所以75%分位数为第6个数和第7个数的平均数,即12×(88+92)=90(分).考点二总体集中趋势的估计例2(1)(2024·山东临沂模拟)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则()A.a>b>c B.c>b>aC.c>a>b D.b>c>a答案B解析将生产的件数由小到大排列为10,12,14,14,15,15,16,17,17,17,a=110×(15+17+14+10+15+17+17+16+14+12)=14.7,b=15,c=17.因此c>b>a.故选B.(2)(多选)(2023·湖北荆州中学模拟)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是()A.该公司职工的测试成绩不低于60分的人数约占总人数的80%B.该公司职工测试成绩的中位数约为70分C.该公司职工测试成绩的平均值约为68分D.该公司职工测试成绩的众数约为60分答案BC解析对于A,该公司职工的测试成绩不低于60分的频率为(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,∴该公司职工测试成绩的中位数约为60+0.5-0.30.4×20=70分,故B 正确;对于C ,该公司职工测试成绩的平均值约为x -=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68分,故C 正确;对于D ,该公司职工测试成绩的众数约为60+802=70分,故D 错误.故选BC.【通性通法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:各组区间的中点值与对应频率之积的和.【巩固迁移】3.某市市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w 为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w 至少定为3.(2)当w =3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=10.5(元).即当w =3时,该市居民该月的人均水费估计为10.5元.考点三总体离散程度的估计例3甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x -甲=18×(82+81+79+78+95+88+93+84)=85,x -乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x -甲=x -乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.【通性通法】标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.【巩固迁移】4.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下:试验序号i 12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),z 1,z 2,…,z 10的样本平均数为z -,样本方差为s 2.(1)求z -,s 2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z -≥2s 210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x -=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y -=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z -=x --y -=552.3-541.3=11,z i =x i -y i 的值分别为9,6,8,-8,15,11,19,18,20,12,故s 2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z -=11,2s 210=2 6.1=24.4,故有z -≥2s 210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.考点四分层随机抽样的均值与方差例4为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间的均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为________.答案 1.04解析该地区中学生每天睡眠时间的平均数为8001200+800×9+12001200+800×8=8.4(小时),该地区中学生每天睡眠时间的方差为8001200+800×[0.5+(9-8.4)2]+12001200+800×[1+(8-8.4)2]=1.04.【通性通法】在分层随机抽样中,如果第一层的样本量为m ,平均值为x -,方差为s 21;第二层的样本量为n ,平均值为y -,方差为s 22,则样本的平均值为w -=m x -+n y -m +n,样本的方差为s 2=1m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}.特别地,在比例分配的分层随机抽样中,我们可以直接用样本平均数w -估计总体平均数W -,用样本方差s 2估计总体方差S 2.【巩固迁移】5.(2023·安徽宣城模拟)某学校有男生400人,女生600人,为调查该校全体学生每天运动时间的情况,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生每天运动时间的平均值为80分钟,方差为10,女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计该校全体学生每天运动时间的方差为()A .15B .16C .96D .112答案D解析由题意,用比例分配的分层随机抽样的方式抽取样本,且该样本中男、女生的比为400600=23,不妨设抽取的男、女生人数分别为2n ,3n ,那么样本的总数为5n .则所有样本的平均值为15n ×(80×2n +60×3n )=68,方差为2n 5n ×[10+(80-68)2]+3n5n×[20+(60-68)2]=112.故选D.6.为了了解全区科级干部“党风廉政知识”的学习情况,采用比例分配的分层随机抽样方法,从全区320名正科级干部和1280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行测试.经过测试后,两组各自将测试成绩统计分析如下表:分组人数平均成绩正科级干部组a 80副科级干部组b70则40名科级干部测试成绩的平均分x -=________.答案72解析样本量与总体中的个体数的比为40320+1280=140,则抽取的正科级干部人数a =320×140=8,副科级干部人数b =1280×140=32.所以这40名科级干部测试成绩的平均分x -=80×8+70×3240=72.课时作业一、单项选择题1.(2023·天津河西区三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是58,67,73,74,76,82,82,87,90,92,93,98,则这12名学生成绩的第三四分位数是()A .88分B .89分C .90分D .91分答案D解析12名学生的成绩(单位:分)由小到大排列为58,67,73,74,76,82,82,87,90,92,93,98,∵12×75%=9,∴这12名学生成绩的第三四分位数是90+922=91(分).2.(2024·重庆南开中学月考)为了解某高中学生的身高情况,按年级采用比例分配的分层随机抽样的方法抽取样本,抽到高一、高二、高三年级的学生人数分别为100,200,300,样本中高一、高二、高三这三个年级学生的平均身高分别为x -,y -,z -,则估计该高中学生的平均身高为()A .16x -+13y -+12z-B .x -+y -+z -2C .12x -+13y -+16z-D .x -+y -+z -3答案A解析样本量为100+200+300=600,样本平均数为100600x -+200600y -+300600z -=16x -+13y -+12z -,所以估计该高中学生的平均身高为16x -+13y -+12z -.3.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B解析讲座前问卷答题的正确率的中位数为70%+75%2=72.5%>70%,故A 错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B 正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C 错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D 错误.故选B.4.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A .众数为2B .平均数为2.5C .方差为1.6D .标准差为4答案C解析由题中数据可得,众数为2和3,故A 错误;平均数x -=5+5+…+2+110=3,故B错误;方差s 2=(5-3)2+(5-3)2+…+(2-3)2+(1-3)210=1.6,标准差为 1.6≠4,故C 正确,D 错误.5.(2023·河北唐山一中模拟)对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件使用寿命的85%分位数为()A .500hB .450hC .350hD .550h答案A解析电子元件寿命小于500h 的百分比为+32000+1400+85%,则这批电子元件使用寿命的85%分位数为500h .故选A .6.某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(单位:分,满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确的是()A .这100名教师的测试成绩的极差是20分B .这100名教师的测试成绩的众数是90分C .这100名教师的测试成绩的中位数是87.5分D .这100名教师中测试成绩不低于90分的人数占比超过50%答案C解析对于A ,由题意知,这100名教师的测试成绩的最高分与最低分无法确定,故极差无法确定,故A 错误;对于B ,由题图易知这100名教师的测试成绩的众数为87.5分,故B 错误;对于C ,设这100名教师的测试成绩的中位数为x 分,则(0.02+0.04)×5+(x -85)×0.08=0.5,解得x =87.5,故C 正确;对于D ,这100名教师中测试成绩不低于90分的人数占比为(0.03+0.03)×5×100%=30%,30%<50%,故D 错误.故选C.7.已知两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数、方差均相同,则两组数据合并为一组数据后,()A .中位数一定不变,方差可能变大B .中位数一定不变,方差可能变小C .中位数可能改变,方差可能变大D .中位数可能改变,方差可能变小答案A解析不妨设x 1≤x 2≤x 3≤x 4≤x 5,y 1≤y 2≤y 3≤y 4≤y 5,则两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数分别为x 3,y 3,则x 3=y 3,两组数据合并为一组数据后,中位数为x 3+y 32=x 3=y 3,故中位数一定不变,设x 1,x 2,x 3,x 4,x 5的平均数为x -,方差为s 21,y 1,y 2,y 3,y 4,y 5的平均数为y -,方差为s 21,则∑5i =1x i =5x -,∑5i =1x 2i =5(s 21+x -2),∑5i =1y i =5y -,∑5i =1y 2i =5(s 21+y -2),则两组数据合并为一组数据后的平均数z -=110(∑5i =1x i +∑5i =1y i )=110(5x -+5y -)=x -+y -2,方差s 2=110[∑5i =1(x i -z -)2+∑5i =1(y i -z -)2]=110(∑5i =1x 2i +∑5i =1y 2i -10z -2)=110[5(s 21+x -2)+5(s 21+y -2)-10z -2]=s 21+x -2+y -22-z -2=s 21+x -2+y -22-=s 21+(x --y -)24≥s 21,当且仅当x -=y -时,等号成立,故方差可能变大,一定不会变小.故选A.8.某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名(每次考试无并列名次).现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学:平均数为3,众数为2;乙同学:中位数为3,众数为3;丙同学:众数为3,方差小于3;丁同学:平均数为3,方差小于3.则一定符合推荐要求的同学是()A .甲和乙B .乙和丁C .丙和丁D .甲和丁答案D解析对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求;对于乙同学,中位数为3,众数为3,可举反例:3,3,6,不满足要求;对于丙同学,众数为3,方差小于3,可举特例:3,3,6,则平均数为4,方差s 2=13×[2×(3-4)2+(6-4)2]=2<3,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为x 1,x 2,x 3,若x 1,x 2,x 3中至少有一个大于等于6,则方差s 2=13[(x 1-3)2+(x 2-3)2+(x 3-3)2]>3,与已知条件矛盾,所以x 1,x 2,x 3均不大于5,满足要求.二、多项选择题9.(2024·重庆模拟)一组数据按从小到大的顺序排列为2,3,3,x ,7,10,若这组数据的平均数是中位数的54倍,则下列说法正确的是()A .x =4B .众数为3C .中位数为4D .方差为233答案BCD解析一组数据按从小到大的顺序排列为2,3,3,x ,7,10,∵这组数据的平均数是中位数的54倍,∴16×(2+3+3+x +7+10)=54×3+x 2,解得x =5,故A 错误;众数为3,故B 正确;中位数为3+52=4,故C 正确;平均数为16×(2+3+3+5+7+10)=5,方差为16×[(2-5)2+(3-5)2+(3-5)2+(5-5)2+(7-5)2+(10-5)2]=233,故D 正确.故选BCD.10.(2023·湖北武汉二中模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A .甲的成绩的平均数等于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的第80百分位数等于乙的成绩的第80百分位数D .甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,甲的成绩的平均数为4+5+6+7+85=6,乙的成绩的平均数为3×5+6+95=6,A 正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B 错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C 正确;甲的成绩的极差为8-4=4,乙的成绩的极差为9-5=4,D 错误.故选AC.三、填空题11.(2023·四川资阳中学第一次质量检测)某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其第50百分位数为________.答案8.5解析由题意可知,共有7个数据并且已经按照从小到大的顺序排列,其第50百分位数即为这组数据的中位数,所以其第50百分位数是第4个数据,为8.5.12.(2024·江西八所重点中学联考)某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x 1,x 2,…,x 50的方差为8,则数据3x 1-1,3x 2-1,…,3x 50-1的方差为________.答案72解析样本数据x 1,x 2,…,x 50的方差为8,所以数据3x 1-1,3x 2-1,…,3x 50-1的方差为32×8=72.13.若已知30个数x 1,x 2,…,x 30的平均数为6,方差为9;现从原30个数中剔除x 1,x 2,…,x 10这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数x 11,x 12,…,x 30的方差为________.答案8解析由题意得x 1+x 2+…+x 30=6×30=180,x 21+x 22+…+x 230=9×30+30×62=1350,x 1+x 2+…+x 10=8×10=80,x 21+x 22+…+x 210=5×10+10×82=690,所以剩余的20个数的平均数为180-8020=5,x 211+x 212+…+x 230=1350-690=660,所以剩余的20个数的方差为660-20×2520=8.14.已知一个样本的样本量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为x -,方差为s 2,则x -=________,s 2=________.答案15103解析设这10个数据为x 1,x 2,…,x 9,15,则x -=15×10-159=15.又s 2=(x 1-15)2+(x 2-15)2+…+(x 9-15)29,(x 1-15)2+(x 2-15)2+…+(x 9-15)2+(15-15)210=3,所以s 2=309=103.四、解答题15.(2023·哈尔滨九中三模)某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间(0,25],(25,50],(50,75],(75,100]内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数;(2)用样本估计总体,经销商参考以下两种销售方案进行销售:方案一:将得分的平均数换算为等级,按换算后的等级出售;方案二:分等级出售.不同等级水果的售价如下表所示:等级一级二级三级四级售价(万元/吨)21.81.41.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.解(1)这20筐水果得分的平均数为120×(17+23+29+31+34+40+46+50+51+51+58+62+62+68+71+78+79+80+85+95)=55.5.(2)方案一:由于得分的平均数55.5∈(50,75],所以可以估计这批水果的销售单价为1.8万元/吨.方案二:设这批水果售价的平均值为x -万元/吨,由已知数据得,得分在(0,25]内的有17,23,共2个,所以估计四级水果所占比例为110;得分在(25,50]内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为310;得分在(50,75]内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为720;得分在(75,100]内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为14.则x -=2×14+1.8×720+1.4×310+1.2×110=1.67(万元/吨).所以从经销商的角度考虑,采用方案一的售价较高,所以采用方案一较好.16.电动摩托车的续航里程,是指电动摩托车在蓄电池满电量的情况下一次能行驶的最大距离,为了解A ,B 两个不同型号电动摩托车的续航里程,现从某卖场库存电动摩托车中随机抽取A ,B 两个型号的电动摩托车各5台,在相同条件下进行测试,统计结果如下:电动摩托车编号12345A 型续航里程(km)120125122124124B 型续航里程(km)118123127120a已知A ,B 两个型号被测试电动摩托车续航里程的平均值相等,(1)求a 的值;(2)小李需要购买一款电动摩托车,从中位数和方差相结合的角度,帮小李选择一款电动摩托车,并说明理由.解(1)因为A ,B 两个型号被测试电动摩托车续航里程的平均值相等,所以120+125+122+124+1245=118+123+127+120+a5,解得a =127.(2)A 型号被测试电动摩托车续航里程从小到大排列为120,122,124,124,125;B 型号被测试电动摩托车续航里程从小到大排列为118,120,123,127,127.所以A 型号被测试电动摩托车续航里程的中位数为124km ,B 型号被测试电动摩托车续航里程的中位数为123km ,即A 型号的中位数大于B 型号的中位数,A 型号被测试电动摩托车续航里程的平均数为x -A =120+125+122+124+1245=123,则A 型号被测试电动摩托车续航里程的方差为s 2A =(120-123)2+(125-123)2+(122-123)2+2×(124-123)25=165,B 型号被测试电动摩托车续航里程的方差为s 2B =(118-123)2+(123-123)2+(120-123)2+2×(127-123)25=665,所以B 型号的方差大于A 型号的方差,所以B 型号被测试电动摩托车续航里程数不稳定,波动比较大,而A 型号的中位数大于B 型号的中位数,所以小李应选择A 型号电动摩托车.17.(多选)(2024·重庆诊断)为了解市民对亚运会体育节目收视情况,随机抽取了200名观众进行调查,其中女性占40%.根据调查结果分别绘制出男、女观众收看亚运会系列节目时长的频率分布直方图,则下列说法正确的是()A .m =0.1B .男观众收看节目时长的众数为8小时C .女观众收看节目的平均时长小于男观众收看节目的平均时长D .收看节目达到9小时的观众中女性人数是男性人数的13答案ABC解析由男观众收看亚运会系列节目时长的频率分布直方图,得(0.050+0.075×2+0.200+m )×2=1,解得m =0.1,故A 正确;由男观众收看亚运会系列节目时长的频率分布直方图,得男观众收看节目时长的众数为7+92=8小时,故B 正确;女观众收看节目的平均时长为(4×0.1+6×0.2+8×0.15+10×0.05)×2=6.6(小时),男观众收看节目的平均时长为(4×0.05+6×0.075+8×0.2+10×0.1+12×0.075)×2=8.3(小时),女观众收看节目的平均时长小于男观众收看节目的平均时长,故C 正确;收看节目达到9小时的观众中,女性人数为200×40%×0.05×2=8,男性人数为200×60%×0.175×2=42,故D 错误.18.(多选)(2023·湖北武汉调研)某市今年夏天迎来罕见的高温炎热天气,当地气象部门统计。
高中数学用样本估计总体
总体中所有个体值与总体平均数之差的平方的平均数,是衡量数据分散程度的量 。总体方差是参数,而样本方差是统计量。
样本比例和总体比例
样本比例
样本中某事件发生的次数与样本容量 的比值,用于估计总体比例。计算公 式为 $frac{a}{n}$,其中 $a$ 是事 件发生的次数,$n$ 是样本容量。
高中数学用样本估计总体
汇报人: 202X-01-02
contents
目录
• 样本和总体 • 用样本估计总体 • 样本估计总体的误差 • 用样本估计总体的应用 • 案例分析
01
样本和总体
样本和总体的定义
总体
研究对象的全体集合,表示为N。
样本
从总体中随机抽取的一部分个体,表示为n。
样本和总体的关系
05
案例分析
案例一:某品牌电视的市场占有率
总结词
通过调查某地区一定数量的家庭或零售商,了解他们购买电视的品牌偏好,从而估算该品牌电视在该 地区的整体市场占有率。
详细描述
选取一定数量的家庭或零售商作为样本,通过问卷调查或访谈的方式了解他们购买电视的品牌偏好。 然后,根据样本数据计算该品牌电视的市场占有率,并使用合适的统计方法对结果进行估计和误差分 析。
总体比例
总体中某事件发生的次数与总体容量 的比值。在统计学中,总体比例通常 作为参数来估计。
03
样本估计总体的误差
抽样误差和非抽样误差
抽样误差
由于从总体中随机抽取样本而产 生的误差,这种误差可以通过增 加样本量和提高样本代表性来减 小。
非抽样误差
由于调查过程中的非随机因素, 如测量误差、记录误差等而产生 的误差,这种误差难以控制和消 除。
案例二:某班级的数学成绩分布
2024版高考数学总复习:用样本估计总体课件
4.样本的数字特征
1
(x
+x
+…+x
)
1
2
n
如果有n个数据x1,x2,…,xn,那么平均数为=________________,
ҧ
标准差为s=
1
1 − ҧ
2
+ 2 − ҧ
2
+ ⋯ + − ҧ
2
1
2+(x -)
2+…+(x -)
2]
[(x
-
)
ҧ
ҧ
ҧ
1
2
n
方差为s2=____________________________________.
2
3
4
5
D
解析:由频率分布直方图知,评分在区间[82,86)内的影视作品
的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品
数量是400×0.2=80.
1
2
3
4
5
5.已知样本量为200,在样本的频率分布直方图中,共有n个小长方
形.若中间一个小长方形的面积等于其余(n-1)个小长方形面积和
第二步:决定组数和组距,组距=______;
组数
分组
第三步:将数据_____,通常对组内数值所在区间取左闭右开区间,
最后一组取闭区间;
第四步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
频率
组距
横轴表示样本数据,纵轴表示______,每个小长方形的面积表示样
,
(1)若数据x1 ,x2 ,…,xn 的平均数为 ,则mx
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 专题限时集训7 回归分析、独立性检验
专题限时集训(七) 回归分析、独立性检验(对应学生用书第91页)(限时:40分钟)1.(2017·某某一模)下列说法错误的是( )【导学号:07804050】A .回归直线过样本点的中心(x ,y )B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^就增加0.2个单位C [根据相关定义知选项A ,B ,D 均正确;选项C 中,对分类变量X 与Y ,随机变量K 2的观测值k 越大,对判断“X 与Y 有关系”的把握程度越大,故C 错误.选C.]2.(2017·某某名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为C .99.5%D .95%D [由图表中数据可得,当k >3.841时,有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的几率,也就是有95%的把握认为变量之间有关系,故选D.]3.(2017·某某七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元):广告费x 2 3 4 5 6 销售额y2941505971由上表可得回归方程为y ^=10.2x +a ^,据此模型,预测广告费为10万元时销售额约为( )【导学号:07804051】A .101.2万元B .108.8万元C .111.2万元D .118.2万元C [根据统计数据表,可得x =15×(2+3+4+5+6)=4,y =15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C.]4.(2017·某某二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如图77所示的两个等高堆积条形图.图77根据这两幅图中的信息,下列哪个统计结论是不正确的( ) A .样本中的女生数量多于男生数量B .样本中有理科意愿的学生数量多于有文科意愿的学生数量C .样本中的男生偏爱理科D .样本中的女生偏爱文科D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.] 5.(2016·某某模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )图78(1)图78(2)图78(3)图78(4)A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3A [由给出的四组数据的散点图可以看出,图(1)和图(3)是正相关,相关系数大于0,图(2)和图(4)是负相关,相关系数小于0,图(1)和图(2)的点相对更加集中,所以相关性要强,所有r 1接近于1,r 2接近于-1,由此可得r 2<r 4<r 3<r 1.故选A.] 6.(2017·某某一模)设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD .若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kgD [因为回归直线方程y ^=0.85x -85.71中x 的系数为0.85>0,因此y 与x 具有正线性相关关系,所以选项A 正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x ,y ),所以选项B 正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加 1 cm ,则其体重约增加0.85 kg ,所以选项C 正确,选项D 不正确.]7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是( )ABCDC[当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选项C的图对应的带状区域的宽度越窄.故选C.]8.(2017·某某南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线合计愿生452065不愿生132235合计5842100由K2=n ad-bc2a+b c+d a+c b+d,得K2=100×45×22-20×13265×35×58×42≈9.616.参照下表,P(K2≥k)0.0500.0100.001k 3.841 6.63510.828A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”C[K2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.]二、填空题9.(2017·某某二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.【导学号:07804052】6 [x =5=5,y =5=5,代入回归直线方程,得14+c5=0.85×5-0.25,解得c =6.]10.(2017·某某百校联盟二模)已知x 、y 的取值为:从散点图可知y 与x 呈线性相关关系,且回归直线方程为y =1.2x +a ,则当x =20时,y 的取值为________.27.6 [由表格可知x =3,y =7.2,所以这组数据的样本点的中心是(3,7.2),根据样本点的中心在回归直线上,得7.2=a ^+1.2×3,得a ^=3.6,所以这组数据对应的回归直线方程是y ^=1.2x +3.6,将x =20代入,得y =1.2×20+3.6=27.6.]11.(2017·某某某某五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如下:已知x ,y 的关系符合回归方程y =b x +a ,其中b =-20.若该品牌的饮料的进价为2元,为使利润最大,零售价应定为________元. 3.75 [x =3.5,y =40,∴a ^=40-(-20)×3.5=110, ∴回归直线方程为:y ^=-20x +110,利润L =(x -2)(-20x +110)=-20x 2+150x -220, ∴x =15040=3.75元时,利润最大,故答案为3.75.]12.(2017·某某三中二模)以模型y =c e kx(e 为自然对数的底)去拟合一组数据时,为了求出回归直线方程,设z =ln y ,其变换后得到线性回归方程为z =0.4x +2,则c =________. e 2[∵y =c e kx,∴两边取对数,可得ln y =ln(c e kx )=ln c +ln e kx=ln c +kx , 令z =ln y ,可得z =ln c +kx , ∵z =0.4x +2, ∴ln c =2, ∴c =e 2.] 三、解答题13.(2017·某某一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图79所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.图79(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系? (2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X 的分布列及数学期望. 附:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (K 2≥k 0)0.025 0.010 0.005 k 05.0246.6357.879正常 偏高 合计 男性 16 4 20 女性 12 8 20 合计281240K 2=n ad -bc 2a +bc +d a +cb +d =40×16×8-4×12220×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4,P (X =0)=⎝⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫1-352=4625, P (X =1)=C 1245⎝⎛⎭⎪⎫1-45⎝⎛⎭⎪⎫1-352+⎝ ⎛⎭⎪⎫1-452C 1235·⎝ ⎛⎭⎪⎫1-35=44625, P (X =2)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫1-352+C 1245⎝ ⎛⎭⎪⎫1-45·C 1235·⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫352=169625, P (X =3)=C 1245⎝ ⎛⎭⎪⎫1-45⎝ ⎛⎭⎪⎫352+⎝ ⎛⎭⎪⎫452C 1235·⎝⎛⎭⎪⎫1-35=264625, P (X =4)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫352=144625,所以X 的分布列为X 0 1 2 3 4 P462544625169625264625144625所以E (X )=0×625+1×625+2×625+3×625+4×625=2.8.14.(2017·某某三湘名校联盟三模)为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y =C 1x 2+C 2与模型②:y =e C 3x +C 4作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系.温度x /℃ 20 22 24 26 28 30 32 产卵数y /个6 10 21 24 64 113 322 t =x 2 400 484 576 676 784 900 1024 z =ln y1.792.303.043.184.164.735.77xtyz26692803.57错误! 错误! 错误! 错误!1157.540.430.32 0.00012其中t i =x 2i ,t =∑ni =1t i ,z i =ln y i ,z =∑ni =1z i ,附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=β^u +α^的斜率和截距的最小二乘估计分别为:β^=∑ni =1u i -uv i -v∑ni =1u i -u2,α^=v -β^u .图710(1)在答题卡中分别画出y 关于t 的散点图、z 关于x 的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).图711(2)根据表中数据,分别建立两个模型下y 关于x 的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C 1,C 2,C 3,C 4与估计值均精确到小数点后两位)(参考数据:e 4.65≈104.58,e4.85≈127.74,e5.05≈156.02)(3)若模型①、②的相关指数计算得分分别为R 21=0.82,R 22=0.96,请根据相关指数判断哪个模型的拟合效果更好.【导学号:07804053】[解] (1)画出y 关于t 的散点图,如图1;z 关于x 的散点图,如图2.图1 图2根据散点图可判断模型②更适宜作为回归方程类型. (2)对于模型①:设t =x 2,则y =C 1x 2+C 2=C 1t +C 2,其中C ^1=∑7i =1t i -ty i -y∑7i =1t i -t2=0.43,C ^2=y -C ^1t =80-0.43×692=-217.56,所以y =0.43x 2-217.56,当x =30时,估计温度为y 1=0.43×302-217.56=169.44. 对于模型②:y =e C 3x +C 4⇒z =ln y =C 3x +C 4,word 其中C ^3=∑7i =1 z i -z x i -x∑7i =1x i -x2=0.32,C ^4=z -C ^3x =3.57-0.32×26=-4.75.所以y =e 0.32x -4.75,当x =30时,估计温度为y 2=e0.32×30-4.75=e 4.85≈127.74. (3)因为R 21<R 22,所以模型②的拟合效果更好.。
高考数学总复习考点知识专题讲解57---用样本估计总体
2.在如图所示的茎叶图所示的数据中,众数和中位数分 别是( B )
A.23,26 B.31,26 C.24,30 D.26,30
[解析] 由茎叶图得到所有的数据从小到大排列依次为 12,14,20,23,25,26,30,31,31,41,42 , ∴ 众 数 和 中 位 数 分 别 为 31,26.故选 B.
的一个数据(或两个 它对极端值的不敏感有 数据的平均数)
时也会成为缺点
平均数
平均数与每一个样本数
如果有 n 个数据 x1,据有关,可以反映出更
x2,…,xn,那么这 多的关于样本数据全体
n 个数的平均数 x = 的信息,但平均数受数
x1+x2+…+xn ________n______
据中的极端值的影响较 大,使平均数在估计总
中国 CBA 篮球赛中甲、乙两篮球运动员上赛季某些场 次比赛的得分如下:
甲:12,15,24,25,31,31,36,36,37,39,44,49. 乙:8,13,14,16,21,23,24,26,28,33,38,39. (1)画出两组数据的茎叶图; (2)试比较这两位运动员的得分水平.
[解] (1)为便于对比分析,可将茎放在中间共用,叶分 列左、右两侧.如图.
某城市 100 户居民的月平均用电量(单位:千瓦时),以 [160,180) , [180,200) , [200,220) , [220,240) , [240,260) , [260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[200,240),[240,260),[260,280), [280,300]的四组用户中,用分层抽样的方法抽取 11 户居民, 则月平均用电量在[220,240]的用户中应抽取多少户?
第04讲 用样本估计总体(主干知识复习)(学生版)-2023年新高二暑期数学衔接(新人教版)
第04讲用样本估计总体【学习目标】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),3.结合实例,理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),4.结合实例,理解离散程度参数的统计含义,5.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义【基础知识】一、频率分布直方图1.制作频率分布直方图的步骤第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图。
2.解决频率分布直方图问题时要抓住3个要点(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.二、样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数3.平均数:样本数据的算术平均数,即x =()121n x x x n+++ .4.百分位数:求总体百分位数的估计,首先要从小到大排列数据,然后计算出i =n ×p %,当i 不是整数要取整,当i 是整数,则百分位数为第i 项与第(i +1)项数据的平均数.5.方差与标准差(1)标准差是样本数据到平均数的一种平均距离.(2)方差:()()()2222121n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦ (n x 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差:s =6.平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.7.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.8.用频率分布直方图估计众数、中位数、平均数的方法(1)众数为频率分布直方图中最高矩形底边中点横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
高考文科数学《用样本估计整体》课件
(Ⅲ)36 名工人中年龄在 x -s 与 x +s 之间有多少人?所占的百分比是
多少(精确到 0.01%)?
解:(Ⅰ)根据系统抽样的方法,抽取容量为 9 的样本,因此分成 9 组,每组 4 人,由于第一组中用随机抽样抽到的年龄数据为 44,且编号间隔为 4,因此,
(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当 w=3 时,估计该市居 民该月的人均水费.
解:(Ⅰ)由用水量的频率分布直方图知, 该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的 频率依次为 0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过 3 立方米的居民占 85%,用水量不超过 2 立方米的居民占 45%. 依题意,w 至少定为 3. (Ⅱ)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率 分布表:
组号 1 2 3 4 5 6 7 8
(10, (12, (17, (22, 分组 [2,4] (4,6] (6,8](8,10]
12] 17] 22] 27]
频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05
标准差的__________.通常用样本方差估计总体方差,当样本容量接近总体容量时,样 本方差很接近总体方差.
自查自纠:
1.(1)频率分布 分布 数字特征 数字特征
频率 (2)组距
各小长方形的面积
1
(3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录
2.(1)最多 平均数 1n(x1+x2+…+xn) 相等
(3) 连 接 频 率 分 布 直 方 图 中 各 小 长 方 形 上 端 的 中 点 , 就 得 到 频 率 分 布
样本估计总体公式
样本估计总体公式在我们的数学世界里,样本估计总体公式就像是一个神奇的魔法棒,能帮助我们从一小部分样本中推测出整个总体的情况。
先来说说啥是样本估计总体吧。
想象一下,咱们要了解一个大果园里苹果的平均重量,可果园里的苹果太多啦,没法一个个都称一遍。
这时候,咱们就随机摘几个苹果称一称,这几个苹果就是样本,通过对样本的研究来估计整个果园苹果的平均重量,这就是样本估计总体。
样本估计总体公式有很多种,比如说样本均值、样本方差等等。
咱们就拿样本均值来说吧,公式就是:样本均值 = (样本中所有数据的和)÷(样本数量)。
这个公式看起来简单,用处可大着呢!我记得有一次,我们学校组织了一场义卖活动。
为了估计同学们带来的义卖物品的平均价格,我们就采用了样本估计总体的方法。
老师先从众多的物品中随机挑选了 20 件,把它们的价格都记录下来。
比如说,一个漂亮的笔记本是 5 元,一个可爱的小玩偶是 8 元,一支精致的钢笔是 12 元……就这样,把这 20 件物品的价格加起来,再除以 20 ,就得到了这 20 件物品的平均价格。
然后,我们根据这个平均价格,大致推测出了所有义卖物品的平均价格,这样就能更好地制定销售策略啦。
在实际生活中,样本估计总体的应用可多啦!比如市场调查人员想知道消费者对某种新产品的满意度,他们不可能去问每一个消费者,那就抽取一部分消费者进行调查,通过分析这部分人的意见来估计总体的满意度。
再比如,工厂要检测一批产品的质量,也不可能把所有产品都检测一遍,那就抽取一部分产品进行检测,通过这部分产品的质量情况来估计整批产品的质量。
样本估计总体公式虽然好用,但也不是万能的。
如果样本选取不具有代表性,那估计的结果可能就不准确啦。
比如说,要估计一个城市居民的收入水平,如果只抽取高收入人群作为样本,那估计出来的结果肯定会偏高,不能反映真实情况。
所以呀,在使用样本估计总体公式的时候,一定要认真、谨慎地选取样本,这样才能得到比较准确的估计结果。
高三文科数学二轮复习:专题限时集训7用样本估计总体
专题限时集训 (七 )用样本预计整体建 A、B 各用: 45 分 ]A高考达]一、1.(2016 ·山西考前模 )某同学将全班某次数学考成整理成率散布直方后,并将每个小矩形上方段的中点接起来获取率散布折(如 7-5 所示 ),据此估此次考成的众数是()7-5A .100 B.110C.115D.120C剖析率散布折可知众数115,故 C.]2.(2016 ·南昌二模 )如 7-6 所示是一本的率散布直方.若本容量100,本数据在15,20)内的数是 ()7-6A.50 B.40C.30D.14C因 15,20]的小矩形的面 1-0.04 ×5-0.1 ×5=0.3,因此本落在15,20]的数 0.3 ×100=30,故 C.]3.(2016 ·青模 )已知数据 x1,x2,x3,⋯,x50,500(位: kg),此中 x1, x2,x3,⋯,x50是某班 50 个学生的体重,50 个学生体重的均匀数x, 中位数 y,x1,x2, x3,⋯, x50,51个数据的均匀数、中位数分与,y比,以下500x法正确的选项是 ()【学号: 85952030】A.均匀数必定大,中位数必定大B.均匀数必定大,中位数可能不C.均匀数可能不,中位数可能不D.均匀数可能不,中位数可能小B然 500 大于 50 个学生的均匀体重, 51 个数据的均匀数必定增大,中位数可能增大也可能不,故 B.]4.(2016 ·沈阳模 )从某小学随机抽取100 名同学,已将他的身高(位:厘米 )数据制成率散布直方(如 7-7).若要从身高在120,130),130,140),140,150]三内的学生中,用分抽的方法取18 人参加一活,从身高在140,150]内的学生中取的人数()7-7A .2 B.3C.4D.5B依意可得 10×(0.005+0.010+0.020+a+0.035)=1,解得 a= 0.030,故身高在 120,130),130,140),140,150]三内的学生比率 3∶2∶1,因此从身高在140,150]内的学生中取的人数 3.]7-85.(2016 · 州模 )某共有 6 名工人,他某日加工部件个数的茎叶如7-8 所示,此中茎十位数,叶个位数,日加工部件个数大于本均的工人秀工人.从 6 名工人中,任取 2 人,起码有 1 名秀工人的概率 () 84A.15B.931 C.5 D.9C 依题意,均匀数x=20+60+ 30++9+1+= 22,故优异工人只有62 人,用 a, b 表示优异工人,用 c,d,e,f 表示非优异工人,故任取 2 人的状况以下:(a,b),(a,c), (a,d),(a,e),(a, f), (b,c),(b, d),(b, e),(b,f),(c,d),(c,e), (c,f),(d,e), (d,f),(e, f)共 15 种,此中起码有 1 名优异工人只有9 39 种状况,故所求概率 P=15=5.]二、填空题6.某中学共有女生 2 000 人,为了认识学生体质健康状况,随机抽取100 名女生进行体质监测,将她们的体重 (单位: kg)数据加以统计,获取如图 7-9 所示的频次散布直方图,则直方图中 x 的值为 ________;试预计该校体重在 55,70)的女生有________人.图 7-90.024 1 000 由5×(0.06+0.05+0.04+x+0.016+0.01)=1,得x=0.024.在样本中,体重在 55,70)的女生的频次为 5×(0.01+0.04+0.05)=0.5,因此该校体重在55,70)的女生预计有 2 000 ×0.5= 1 000 人. ]7.某校展开“爱我海西、爱我家乡”拍照竞赛,9 位评委为参赛作品 A 给出的分数如茎叶图7-10 所示.记分员在去掉一个最高分和一个最低分后,算得均匀分为91,复核员在复核时,发现有一个数字(茎叶图中的x)没法看清,若记分员计算无误,则数字 x 应当是 ________.图 7-101 当x≥4时,89+ 89+92+93+ 92+91+ 946407=7≠ 91,∴x<4,∴ 89+ 89+92+93+92+91+ x+ 90=91, 7∴x=1.]8.从甲、乙两种苗中各抽了 10 株苗的高度,其茎叶如 7-11.依据茎叶,苗的均匀高度高的是 __________种苗,苗得整的是 __________ 种苗.【学号: 85952031】7-11乙甲依据茎叶可知,甲种苗中的高度比集中,甲种苗比乙种苗得整;而通算可得, x 甲=27, x 乙=30,即乙种苗的均匀高度大于甲种苗的均匀高度. ]三、解答9.(2016 ·太原二模)某校从高一年学生中随机抽取40 名学生,将他的期中考数学成(分100 分,成均不低于40 分的整数)分红以下六段:40,50),50,60),⋯,90,100],获取如 7-12 所示的率散布直方.7-12(1)若校高一年共有学生 640 名,估校高一年期中考数学成不低于 60 分的人数;(2)在抽取的 40 名学生中,若从数学成在 40,50)与 90,100]两个分数段内随机取 2 名学生,求 2 名学生的数学成之差的不大于 10 的概率.解](1)由 10×(0.005+0.01+ 0.02+a+0.025+ 0.01)= 1,得 a=0.03.2 分依据率散布直方,成不低于 60 分的率 1-10×(0.005+0.01)=0.85.4 分预计期中考试数学成绩不低于60 分的人数约为 640×0.85= 544(人).6 分(2)成绩在 40,50)分数段内的人数为40×0.05= 2,成绩在 90,100]分数段内的人数为 40×0.1=4,则记在 40,50)分数段的两名同学为 A1,A2,在 90,100]分数段内的同学为 B1,B2,B3,B4.若从这 6 名学生中随机抽取 2 人,则总的取法共有 15 种.8 分假如 2 名学生的数学成绩都在 40,50)分数段内或都在 90,100]分数段内,那么这2 名学生的数学成绩之差的绝对值不大于10,则所取2 名学生的数学成绩之差的绝对值不大于10 的取法有 (A1, A2), (B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共 7 种取法,因此所求概7率为 P=15.12 分10.(2016 ·郑州一模 )为了整改道路交通次序,某地考虑将对行人闯红灯进行处罚.为了更好地认识市民的态度,在一般行人中随机选用了200 人进行检查,当不处分时,有 80 人会闯红灯,处分时,获取以下数据:处分金额 x(单位:元 )5101520会闯红灯的人数 y50402010若用表中数据所得频次取代概率.(1)当罚金定为 10 元时,行人闯红灯的概率会比不进行处分降低多少?(2)将先取的200 人中会闯红灯的市民分为两类:A 类市民在罚金不超出10 元时就会更正行为; B 类是其余市民.现对 A 类与 B 类市民按分层抽样的方法抽取 4 人挨次进行深度问卷,则前两位均为 B 类市民的概率是多少.解] (1)设“当罚金定为 10 元时,闯红灯的市民更正行为”为事件A,2分401则 P(A)=200=5.4分10 元时,比不拟订处分,行人闯红灯的概率会降低1因此当罚金定为5.6 分(2)由题可知 A 类市民和 B 类市民各有 40 人,故分别从 A 类市民和 B 类市民中各抽出 2 人,设从 A 类市民中抽出的 2 人分别为 A1,A2,从 B 类市民中抽出的 2 人分别为B1,B2.设“A 类与 B 类市民按分层抽样的方法抽取 4 人挨次进行深度问卷”为事件 M,8 分则事件 M 中第一抽出 A1的事件有: (A1,A2,B1,B2),(A1,A2,B2,B1),(A1,B1,A2,B2),(A1,B1,B2,A2),(A1,B2,A2,B1),(A1,B2,B1,A2),共 6 种.同理第一抽出 A2, B1,B2的事件也各有 6 种.故事件 M 共有 24 种.10 分设“抽取 4 人中前两位均为 B 类市民 ”为事件 N ,则事件 N 有(B 1,B 2, A 1,A 2),(B 1,B 2,A 2,A 1),(B 2,B 1,A 1,A 2),(B 2,B 1,A 2,A 1).41∴ P (N)=24=6.12 分B 组 名校冲刺 ]一、选择题1.已知甲、乙两组数据的茎叶图如图7-13 所示,若它们的中位数同样,均匀数也同样,则图中的mm , n 的比值 n =()图 7-131A .1B.33 2C.8D.9C 由茎叶图可知乙的中位数是32+34=33,依据甲、乙两组数据的中位数相2同,可得 m =3,因此甲的均匀数为27+33+39= 33,又由甲、乙两组数据的均匀3数同样,可得20+n +32+ 34+38= 33,解得 n =8,因此 m =3,应选 C.]4n 82.(2016 ·山西四校二联 )某学校组织学生参加数学测试,成绩的频次散布直方图如图 7-14,数据的分组挨次为 20,40),40,60), 60,80),80,100),若低于 60 分的人数是 15,则该班的学生人数是 ()图 7-14A .45 B.50 C.55D.6015 B∵ 20,40),40,60)的频次为 (0.005+0.01) ×20=0.3,∴该班的学生人数是0.3=50.]3.为了认识某城市今年准备报考飞翔员的学生的体重状况,将所得的数据整理后,画出了频次散布直方图(如图7-15),已知图中从左到右的前 3 个小组的频次之比为1∶2∶3,第2 小组的频数为120,则抽取的学生人数是()图 7-15A.240 B.280C.320D.480D 由频次散布直方图知:学生的体重在65~75 kg 的频次为 (0.012 5+0.0375) ×5= 0.25,则学生的体重在 50~65 kg 的频次为 1- 0.25=0.75.从左到右第 2 个小组的频次2为 0.75 ×=0.25. 6因此抽取的学生人数是120÷0.25= 480,应选 D.]4.3 个老师对某学校高三三个班级各85 人的数学成绩进行剖析,已知甲班平均分为 116.3 分,乙班均匀分为114.8 分,丙班均匀分为115.5 分,成绩散布直方图如图7-16,据此推测高考取考生发挥差别较小的班级是()A .甲C.丙图 7-16 B.乙D.没法判断C因为均匀分相差不大,由直方图知丙班中,学生成绩主要集中在110~ 120区间上且均匀分较高,其次是乙,分数相对甲来说比较集中,相对丙而言相对分散.数据最分别的是甲班,固然均匀分较高,但学生两极分化,相互差距较大,根据标准差的计算公式和性质知甲的方差大于乙的方差大于丙的方差,因此丙班的学生发挥差别较小.应选 C.]二、填空题5.已知某单位有 40 名员工,现要从中抽取 5 名员工,将全体员工随机按1~40 编号,并按编号次序均匀分红 5 组.按系统抽样方法在各组内抽取一个号码.图 7-17(1)若第 1 组抽出的号码为 2,则所有被抽出员工的号码为________;(2)分别统计这 5 名员工的体重 (单位: kg),获取体重数据的茎叶图如图 7-17 所示,则该样本的方差为 ________.40(1)2,10,18,26,34(2)62(1)分段间隔为5=8,则所有被抽出员工的号码为2,10,18,26,34.1(2) x =5(59+62+ 70+73+81)=69.1222222s =5(59-69)+ (62- 69)+(70-69) + (73- 69)+(81-69)] =62.]6.如图 7-18 是某个样本的频次散布直方图,分组为 100,110),110,120),120,130),130,140),140,150),已知 a,b,c 成等差数列,且区间 130,140)与 140,150)上的数据个数相差 10,则区间 110,120)上的数据个数为 __________.图 7-1820由频次散布直方图得 130,140)上的频次为 0.025 ×10= 0.25,140,150)上的频次为 0.015 ×10=0.15.设样本容量为 x,则由题意知 0.25x-0.15x=0.1x=10,解得 x=100.因为 a,b,c 成等差数列,则 2b=a+c.又 10a+10b+10c=1-0.25-0.15= 0.6? a+ b+ c=0.06? 3b= 0.06,解得 b=0.02.故区间 110,120)上的数据个数为10×0.020 ×100= 20.]三、解答题7.从甲、乙两部门中各任选10 名员工进行职业技术测试,测试成绩 (单位:分)数据的茎叶图如图7-19(1)所示:(1)(2)图 7-19(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分别程度(只要给出结论 );(2)甲组数据频次散布直方图如图7-19(2)所示,求 a,b,c 的值;(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20 的概率.解] (1)甲组数据的中位数为78+79= 78.5,乙组数据的中位数为75+82=78.5.22从茎叶图能够看出,甲组数据比较集中,乙组数据比较分别.3 分(2)由题图易知 a=0.05,b=0.02, c=0.01.7 分(3)从甲、乙两组数据中各任取一个,获取的所有基本领件共有100 个,此中满164足“两数之差的绝对值大于 20”的基本领件有 16 个,故所求概率P=100=25.12分8.(2016 ·河南六市联考 )在某大学自主招生考试中,所有选报Ⅱ类理想的考生所有参加了“数学与逻辑”和“阅读与表达”两个科目的考试,成绩分为A,B,C,D,E 五个等级.某考场考生的两科考试成绩的数据统计如图 7-20 所示,此中“数学与逻辑”科目的成绩为 B 的考生有 10 人.图 7-20(1)求该考场考生中“阅读与表达”科目中成绩为 A 的人数;(2)若等级 A,B,C,D,E 分别对应 5 分, 4 分,3 分, 2 分, 1 分,求该考场考生“数学与逻辑”科目的均匀分;(3)已知参加本考场测试的考生中,恰有 2 人的两科成绩均为A,在起码一科成绩为 A 的考生中,随机抽取 2 人进行访谈,求这 2 人的两科成绩均为 A 的概率.解] (1)因为“数学与逻辑”科目中成绩等级为 B 的考生有 10 人,因此该考场有10÷0.25=40(人),2 分因此该考场考生中“阅读与表达”科目中成绩等级为 A 的人数为 40×(1-0.375-0.375- 0.15-0.025)=40×0.075=3.4 分(2)该考场考生“数学与逻辑”科目的均匀分为 1×(40 ×0.2)+ 2×(40 ×0.1)+3×(40 ×0.375)+4×(40 ×0.25)+5×(40 ×0.075)] 40÷=2.9.8 分(3)由题图可知,“数学与逻辑”科目的成绩为 A 的有 3 人,“阅读与表达”科目的成绩为 A 的有 3 人,因为恰有 2 人的两科成绩等级均为 A,因此还有 2 人只有一个科目得分为 A.设这 4 人为甲,乙,丙,丁,此中甲,乙是两科成绩都是 A 的同学,则在起码一科成绩等级为 A 的考生中,随机抽取2人进行访谈,基本领件空间为Ω={{甲,乙},{ 甲,丙 } ,{ 甲,丁 } ,{ 乙,丙 } ,{ 乙,丁 } ,{丙,丁 }} ,一共有 6 个基本领件.设“随机抽取 2 人进行访谈,这 2 人的两科成绩等级均为 A”为事件 B,因此事1件 B 中包括的基本领件有 1 个,则 P(B)=6.12 分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题限时集训(七)用样本估计总体[建议A、B组各用时:45分钟][A组高考达标]一、选择题1.(2016·山西考前模拟)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图7-5所示),据此估计此次考试成绩的众数是()图7-5A.100 B.110C.115D.120C[分析频率分布折线图可知众数为115,故选C.]2.(2016·南昌二模)如图7-6所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是()图7-6A.50 B.40C.30D.14C[因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]3.(2016·青岛模拟)已知数据x1,x2,x3,…,x50,500(单位:kg),其中x1,x2,x3,…,x50是某班50个学生的体重,设这50个学生体重的平均数为x, 中位数为y,则x1,x2,x3,…,x50,500这51个数据的平均数、中位数分别与x,y 比较,下列说法正确的是()A.平均数一定变大,中位数一定变大B.平均数一定变大,中位数可能不变C.平均数可能不变,中位数可能不变D.平均数可能不变,中位数可能变小B[显然500大于这50个学生的平均体重,则这51个数据的平均数一定增大,中位数可能增大也可能不变,故选B.]4.(2016·沈阳模拟)从某小学随机抽取100名同学,现已将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图7-7).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()图7-7A.2 B.3C.4D.5B[依题意可得10×(0.005+0.010+0.020+a+0.035)=1,解得a=0.030,故身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为3.]图7-85.(2016·郑州模拟)某车间共有6名工人,他们某日加工零件个数的茎叶图如图7-8所示,其中茎为十位数,叶为个位数,日加工零件个数大于样本均值的工人为优秀工人.从该车间6名工人中,任取2人,则至少有1名优秀工人的概率为()A.815 B.49C.35 D.19C[依题意,平均数x=20+60+30+(7+9+1+5)6=22,故优秀工人只有2人,用a,b表示优秀工人,用c,d,e,f表示非优秀工人,故任取2人的情况如下:(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f)共15种,其中至少有1名优秀工人只有9种情况,故所求概率P=915=35.]二、填空题6.某中学共有女生2 000人,为了了解学生体质健康状况,随机抽取100名女生进行体质监测,将她们的体重(单位:kg)数据加以统计,得到如图7-9所示的频率分布直方图,则直方图中x的值为________;试估计该校体重在[55,70)的女生有________人.图7-90.024 1 000[由5×(0.06+0.05+0.04+x+0.016+0.01)=1,得x=0.024.在样本中,体重在[55,70)的女生的频率为5×(0.01+0.04+0.05)=0.5,所以该校体重在[55,70)的女生估计有2 000×0.5=1 000人.]7.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图7-10所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.图7-10 1[当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x<4,∴89+89+92+93+92+91+x+907=91,∴x=1.]8.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图7-11.根据茎叶图,树苗的平均高度较高的是__________种树苗,树苗长得整齐的是__________种树苗.图7-11乙甲[根据茎叶图可知,甲种树苗中的高度比较集中,则甲种树苗比乙种树苗长得整齐;而通过计算可得,x甲=27,x乙=30,即乙种树苗的平均高度大于甲种树苗的平均高度.]三、解答题9.(2016·太原二模)某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成如下六段:[40,50),[50,60),…,[90,100],得到如图7-12所示的频率分布直方图.图7-12(1)若该校高一年级共有学生640名,试估计该校高一年级期中考试数学成绩不低于60分的人数;(2)在抽取的40名学生中,若从数学成绩在[40,50)与[90,100]两个分数段内随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.[解](1)由10×(0.005+0.01+0.02+a+0.025+0.01)=1,得a=0.03.2分根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.4分估计期中考试数学成绩不低于60分的人数约为640×0.85=544(人).6分(2)成绩在[40,50)分数段内的人数为40×0.05=2,成绩在[90,100]分数段内的人数为40×0.1=4,则记在[40,50)分数段的两名同学为A1,A2,在[90,100]分数段内的同学为B1,B2,B3,B4.若从这6名学生中随机抽取2人,则总的取法共有15种.8分如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值不大于10,则所取2名学生的数学成绩之差的绝对值不大于10的取法有(A1,A2),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共7种取法,所以所求概率为P=715.12分10.(2016·郑州一模)为了整顿道路交通秩序,某地考虑将对行人闯红灯进行处罚.为了更好地了解市民的态度,在普通行人中随机选取了200人进行调查,当不处罚时,有80人会闯红灯,处罚时,得到如下数据:(1)当罚金定为10元时,行人闯红灯的概率会比不进行处罚降低多少?(2)将先取的200人中会闯红灯的市民分为两类:A类市民在罚金不超过10元时就会改正行为;B类是其他市民.现对A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷,则前两位均为B类市民的概率是多少.[解](1)设“当罚金定为10元时,闯红灯的市民改正行为”为事件A,2分则P(A)=40200=15.4分所以当罚金定为10元时,比不制定处罚,行人闯红灯的概率会降低15.6分(2)由题可知A类市民和B类市民各有40人,故分别从A类市民和B类市民中各抽出2人,设从A类市民中抽出的2人分别为A1,A2,从B类市民中抽出的2人分别为B1,B2.设“A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷”为事件M,8分则事件M中首先抽出A1的事件有:(A1,A2,B1,B2),(A1,A2,B2,B1),(A1,B1,A2,B2),(A1,B1,B2,A2),(A1,B2,A2,B1),(A1,B2,B1,A2),共6种.同理首先抽出A2,B1,B2的事件也各有6种.故事件M共有24种.10分设“抽取4人中前两位均为B类市民”为事件N,则事件N有(B1,B2,A1,A2),(B1,B2,A2,A1),(B2,B1,A1,A2),(B2,B1,A2,A1).∴P(N)=424=16.12分[B组名校冲刺]一、选择题1.已知甲、乙两组数据的茎叶图如图7-13所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值mn=()图7-13A.1 B.1 3C.38 D.29C[由茎叶图可知乙的中位数是32+342=33,根据甲、乙两组数据的中位数相同,可得m=3,所以甲的平均数为27+33+393=33,又由甲、乙两组数据的平均数相同,可得20+n +32+34+384=33,解得n =8,所以m n =38,故选C.]2.(2016·山西四校二联)某学校组织学生参加数学测试,成绩的频率分布直方图如图7-14,数据的分组依次为[20,40),[40,60),[60,80),[80,100),若低于60分的人数是15,则该班的学生人数是( )图7-14A .45B.50C.55D.60B [∵[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.]3.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图7-15),已知图中从左到右的前3个小组的频率之比为1∶ 2∶ 3,第2小组的频数为120,则抽取的学生人数是( )图7-15A .240B.280C.320D.480D [由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)× 5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25.所以抽取的学生人数是120÷0.25=480,故选D.]4.3个老师对某学校高三三个班级各85人的数学成绩进行分析,已知甲班平均分为116.3分,乙班平均分为114.8分,丙班平均分为115.5分,成绩分布直方图如图7-16,据此推断高考中考生发挥差异较小的班级是()图7-16A.甲 B.乙C.丙D.无法判断C[由于平均分相差不大,由直方图知丙班中,学生成绩主要集中在110~120区间上且平均分较高,其次是乙,分数相对甲来说比较集中,相对丙而言相对分散.数据最分散的是甲班,虽然平均分较高,但学生两极分化,彼此差距较大,根据标准差的计算公式和性质知甲的方差大于乙的方差大于丙的方差,所以丙班的学生发挥差异较小.故选C.]二、填空题5.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.图7-17(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图7-17所示,则该样本的方差为________.(1)2,10,18,26,34(2)62[(1)分段间隔为405=8,则所有被抽出职工的号码为2,10,18,26,34.(2)x=15(59+62+70+73+81)=69.s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.]6.如图7-18是某个样本的频率分布直方图,分组为[100,110),[110,120),[120,130),[130,140),[140,150),已知a ,b ,c 成等差数列,且区间[130,140)与[140,150)上的数据个数相差10,则区间[110,120)上的数据个数为__________.图7-1820 [由频率分布直方图得[130,140)上的频率为0.025×10=0.25,[140,150)上的频率为0.015×10=0.15.设样本容量为x ,则由题意知0.25x -0.15x =0.1x =10,解得x =100.因为a ,b ,c 成等差数列,则2b =a +c .又10a +10b +10c =1-0.25-0.15=0.6⇒a +b +c =0.06⇒3b =0.06,解得b =0.02.故区间[110,120)上的数据个数为10×0.020×100=20.]三、解答题7.从甲、乙两部门中各任选10名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图7-19(1)所示:(1) (2)图7-19(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论);(2)甲组数据频率分布直方图如图7-19(2)所示,求a ,b ,c 的值;(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20的概率.[解](1)甲组数据的中位数为78+792=78.5,乙组数据的中位数为75+822=78.5.从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散.3分(2)由题图易知a=0.05,b=0.02,c=0.01.7分(3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有100个,其中满足“两数之差的绝对值大于20”的基本事件有16个,故所求概率P=16100=425.12分8.(2016·河南六市联考)在某大学自主招生考试中,所有选报Ⅱ类志向的考生全部参加了“数学与逻辑”和“阅读与表达”两个科目的考试,成绩分为A,B,C,D,E五个等级.某考场考生的两科考试成绩的数据统计如图7-20所示,其中“数学与逻辑”科目的成绩为B的考生有10人.图7-20(1)求该考场考生中“阅读与表达”科目中成绩为A的人数;(2)若等级A,B,C,D,E分别对应5分,4分,3分,2分,1分,求该考场考生“数学与逻辑”科目的平均分;(3)已知参加本考场测试的考生中,恰有2人的两科成绩均为A,在至少一科成绩为A的考生中,随机抽取2人进行访谈,求这2人的两科成绩均为A的概率.[解](1)因为“数学与逻辑”科目中成绩等级为B的考生有10人,所以该考场有10÷0.25=40(人),2分所以该考场考生中“阅读与表达”科目中成绩等级为A的人数为40×(1-0.375-0.375-0.15-0.025)=40×0.075=3.4分(2)该考场考生“数学与逻辑”科目的平均分为[1×(40×0.2)+2×(40×0.1)+3×(40×0.375)+4×(40×0.25)+5×(40×0.075)]÷40=2.9.8分(3)由题图可知,“数学与逻辑”科目的成绩为A的有3人,“阅读与表达”科目的成绩为A的有3人,因为恰有2人的两科成绩等级均为A,所以还有2人只有一个科目得分为A.设这4人为甲,乙,丙,丁,其中甲,乙是两科成绩都是A的同学,则在至少一科成绩等级为A的考生中,随机抽取2人进行访谈,基本事件空间为Ω={{甲,乙},{甲,丙},{甲,丁},{乙,丙},{乙,丁},{丙,丁}},一共有6个基本事件.设“随机抽取2人进行访谈,这2人的两科成绩等级均为A”为事件B,所以事件B中包含的基本事件有1个,则P(B)=16.12分11。