高考数学(人教a版,理科)题库:抽样方法与总体分布的估计(含答案)
高考理科数学抽样方法与总体分布的估计复习资料
第k号(1≤k≤8),则在其余组中分别抽取第
k+8n(n=1,2,3,…,19)号,此时每个个
体被取到的概率为
1
.
8
2020/12/8
12
• (级3)品分、层二抽级样品法、:三按级比品例、等12外600 品 ,18中分抽别取在一
48×1 =6个,641 × =8个,321 × =4个, 1
16×8 =2个,每8 个个体被取到8 的概率6 分别 8
的简单随机抽样方法有
;
.
抽签法 随机数表法
2020/12/8
3
• 3.将总体分成 均衡的几个部分,然后按照预 先定出的规则,从每一部分抽取 一个个体
,得到所需要的样本,称这样的抽样为系统 抽样.
• 4所. 将占总的体比分例成几部分,然后按照各部 分
抽样,得到所需要的样本,称这样的抽样为
分层抽层样,其中所分成的各部分叫做 .
• (2)某工厂有1 003名工人,从中抽取10人作 某项调查,试简述抽样过程.
2020/12/8
14
• 解:(1)采用分层抽样可按一、二、三级品 的个数之比5∶3∶2,从一级品中抽取10个 ,从二级品中抽取6个,从三级品中抽取4 个.抽取时,将一级品中100个产品按00, 01,02,…,99编号;将二级品中的60个 产品按00,01,02,…,59编号,将三级 品中的40个产品按00,01,02,…,39编 号,用随机数表法分别抽10个,6个,4个 产品,这样取得一个容量为20的样本.
图等来表示.
• 7.当样本容量无限增大,分组的组距无限缩
小时,频率分布直方图就会无限接近于一
条光滑曲线,称这条曲线为
.
总体密度曲线
2019-2020学年高中数学 12.3抽样方法、总体分布的估计课时提能训练 理 新人教A版.doc
2019-2020学年高中数学 12.3抽样方法、总体分布的估计课时提能训练理新人教A版一、选择题(每小题6分,共36分)1.具有A、B、C三种性质的总体,其容量为63,A、B、C三种性质的个体之比为1∶2∶4,现按分层抽样法抽取个体进行调查.如果抽取的样本容量为21,则A、B、C三种元素分别抽取的个数为( )(A)12,6,3 (B)12,3,6(C)3,6,12 (D)3,12,62.某次数学竞赛后,指导老师统计了所有参赛学生的成绩(成绩都为整数,满分120分)并且绘制了“得分情况分布图”(如图),从该条形图所对应的频率分布直方图估计学生的平均成绩为( )(A)79.5 (B)80.6(C)87.8 (D)96.53.(2012·南宁模拟)某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )(A)90 (B)75 (C)60 (D)454.(2012·北海模拟)某工厂生产了某种产品18 000件,它们来自甲、乙、丙3个车间,现采用分层抽样的方法对这批产品进行抽样检查.已知从甲、乙、丙3个车间依次抽取产品的件数恰好组成一个等差数列,则这批产品中乙车间生产的产品件数是( )(A)9 000 (B)4 500 (C)3 000 (D)6 0005.(2012·柳州模拟)如图是容量为100的某一个样本的频率分布直方图,则样本数据在[6,10)内的频率和频数分别是( )(A)0.08,8 (B)0.24,24(C)0.32,32 (D)0.36,366.(预测题)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为( )(A)1 013 h (B)1 000 h (C)983 h (D)1 213 h二、填空题(每小题6分,共18分)7.某中学高一、高二、高三三个年级的学生数之比为12∶11∶10.现用分层抽样的方法从所有学生中抽出一个容量为n的样本,已知从高一学生中抽取的人数为60人,那么此样本的容量n=.8.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样的方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出人.9.某学院的A、B、C三个专业共有1 200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取名学生.三、解答题(每小题15分,共30分)10.(易错题)某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的物理成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50,60),[60,70),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:(1)求出物理成绩低于50分的学生人数;(2)估计这次考试物理学科及格率(60分及以上为及格);(3) 从物理成绩不及格的学生中选两人,求他们成绩至少有一个不低于50分的概率.11.对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h以内的概率;(4)估计电子元件寿命在400 h以上的概率.【探究创新】(16分)某学校共有高一、高二、高三学生2 000名,各年级男、女生人数如图:已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在高三年级抽取多少名?(3)已知y>245,z≥245,以(y,z)为坐标构成平面直角坐标系的点,从这些点中任取3个,求满足y-z>0的点的个数ξ的分布列和数学期望.答案解析1.【解析】选C.由于每个个体被抽取的概率相等,所以每层抽取的个体数与该层的个体数成正比,于是A、B、C三种元素分别抽取21×17,21×27,21×47,即3,6,12个.2.【解析】选C.通过转换图形所得的各分数段的成绩频率分布表为:[70,80)其平均数约为65×18+75×316+85×14+95×732+105×532+115×116≈87.8.3.【解题指南】先根据频率分布直方图求出小于100克的频率,然后求出样本总数,进而求出样本中净重大于或等于98克并且小于104克的产品的个数. 【解析】选A.样本中产品净重小于100克的频率为 (0.050+0.100)×2=0.3,频数为36.样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90. 4.【解题指南】利用分层抽样的方法及等差数列的基本性质a 1+a 3=2a 2求解.【解析】选D.∵从甲、乙、丙3个车间抽取产品的件数恰好组成一个等差数列,∴甲、乙、丙3个车间的产品数成等差数列.设甲、乙、丙3个车间的产品数分别为a 1、a 2、a 3,则a 1+a 2+a 3=3a 2=18 000,a 2=6 000.5.【解析】选C.样本数据在[6,10)内的频率为0.08×4=0.32, 频数为0.32×100=32.6.【解题指南】利用分层抽样分别求出第一、二、三分厂的产量然后求出平均值.【解析】选A.利用分层抽样可知从3个分厂抽出的100件电子产品中,每个厂中的产品个数比为1∶2∶1,故分别有25,50,25个.再由三个厂算出的平均值可得100件产品的总的平均寿命为 980×25+1 020×50+1 032×25100=1 013(h).7.【解析】由于抽样时,每个个体被抽取的概率均相等,所以从所有学生中抽出的一个容量为n 的样本中,高一学生占1212+11+10=411,由411n =60,得n =165.答案:165【变式备选】一个总体分为A ,B 两层,其个体数之比为4∶1,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中甲、乙都被抽到的概率为128,则总体中的个体数为 .【解析】设B 层中个体数为x ,由分层抽样的方法可知容量为10的样本中,B 层的个体数为2, ∴2x1C =128⇒x =8. ∴A 层中个体数为32,则总体中的个体数为40. 答案:408.【解析】在[2 500,3 000)月收入段内的频率为0.000 5×500=0.25, 所以应抽出100×0.25=25(人). 答案:259.【解析】由题知C 专业有学生1 200-380-420=400,那么C 专业应抽取的学生数为120×4001 200=40(名).答案:4010.【解析】(1)因为各组的频率和等于1,故低于50分的频率为: f =1-(0.015×2+0.03+0.025+0.005)×10=0.1. 所以低于50分的人数为60×0.1=6(人).(2)依题意,成绩60分及以上的分数所在的第三、四、五、六组(低于50分的为第一组),频率和为 (0.015+0.03+0.025+0.005)×10=0.75. 所以,抽样学生成绩的及格率是75%.于是,可以估计这次考试物理学科及格率约为75%.(3)“成绩低于50分”及“[50,60)”的人数分别是6,9.所以从成绩不及格的学生中选两人,他们成绩至少有一个不低于50分的概率:P =1-6×515×14=67.【方法技巧】解决频率分布直方图应用题的方法(1)在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量;(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率;(3)对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论. 11.【解析】(1)频率分布表如下:(2)频率分布直方图如图:累积频率分布图如图:(3)由频率分布表可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故估计电子元件寿命在400 h以上的概率为0.35.【探究创新】【解析】(1)由已知有x2 000=0.19,∴x=380.(2)由(1)知高二男女生一起750人,又高一学生750人,所以高三男女生一起500人,按分层抽样,高三年级应抽取482 000×500=12(人);(3)因为y+z=500,y>245,z≥245,所以基本事件有:y=246,z=254;y=247,z=253;y=248,z=252;y=249,z=251;y=250,z=250;y=251,z=249;y=252,z=248;y=253,z=247;y=254,z=246;y=255,z=245.一共10个基本事件.其中女生比男生多,即y>z的基本事件有:y=251,z=249,y=252,z=248;y=253,z=247;y=254,z=246;y =255,z =245.共5个基本事件. 所以ξ=0,1,2,3. P(ξ=0)=35310C C =112.P(ξ=1)=2155310C CC =512.P(ξ=2)=1255310C C C =512.P(ξ=3)=35310C C =112.∴ξ的分布列为∴E ξ=512+1012+312=1812=32.。
高考数学 抽样方法与总体分布的估计 讲题
例2 (2021全国乙文,17,12分)某厂研制了一种生产高精产品的设备,为检 验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各 生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
新设备
10.1
10.4
10.1
10.0
10.1
旧设备
9.8
10.0
考法二 样本的数字特征及其应用 1.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它 们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意 义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述 波动大小. 2.有关平均数、方差的一些结论 1)若x1,x2,…,xn的平均数为 x,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx +a. 2)设数据x1,x2,…,xn的方差为s2,则 ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再
把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
分层随机抽样.
2)应用范围:总体由差异明显的几个部分组成.
3)分层随机抽样的关键是根据样本特征的差异进行分层,实质是等比例
抽样,抽样比= 样本容量 = 各层所抽取的个体数 .
0.3)×0.3+(1-0.3)×0.3×0.3=0.189; ②“抽取的3人中有3人在[7.5,8.5)内”=ABC,得P2=P(ABC)=P(A)P(B)· P(C)=0.3×0.3×0.3=0.027, 所以抽取的3人中至少有两人去年可支配收入在[7.5,8.5)内的概率为P1+ P2=0.189+0.027=0.216.
抽样方法与总体分布的估计
抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一样地,设一个总体的个体数为N ,假如通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称如此的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情形,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估量总体,是研究统计问题的差不多思想方法,样本中所有数据(或数据组)的频数和样本容量的比,确实是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.能够用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,确实是一次随机试验,从总体中抽取一个容量为n 的样本,确实是进行了n 次试验,试验连同所显现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情形,从中抽查了100名运动员的年龄,就那个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1002.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯C.103 D.101 3.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为 A.640 B.320 C.240 D.1604.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).●典例剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情形,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情形,记这项调查为②.则完成①、②这两项调查宜采纳的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假如在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估量电子元件寿命在100~400 h 以内的概率; (4)估量电子元件寿命在400 h 以上的概率.剖析:通过本题可把握总体分布估量的各种方法和步骤. 解:(1)频率分布表如下:(2)频率分布直方图如下:100 200 300 400 500 600 寿命(h )寿命(h )1.000.800.600.400.20累(3)由累积频率分布图能够看出,寿命在100~400 h 内的电子元件显现的频率为0.65,因此我们估量电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件显现的频率为0.20+0.15=0.35,故我们估量电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练 夯实基础1.(2004年江苏,6)某校为了了解学生的课外阅读情形,随机调查了50名学生,得到他们在某一天各自课外阅读所用时刻的数据,结果用下面的条形图表示,依照条形图可得这50名学生这一天平均每人的课外阅读时刻为2015105人数(人)时间(h )0 0.5 1.0 1.5 2.0A.0.6 hB.0.9 hC.1.0 hD.1.5 h 2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,73.某单位共有N 个职工,要从N 个职工中采纳分层抽样法抽取n 个样本,已知该单位的某一部门有M 个职员,那么从这一部门中抽取的职工数为___________.4.下图是容量为100的样本的频率分布直方图,试依照图形中的数据填空:组距0.00.00.02样本数据(1)样本数据落在范畴[6,10)内的频率为___________; (2)样本数据落在范畴[10,14)内的频数为___________; (3)总体在范畴[2,6)内的概率约为___________.●思悟小结1.采纳什么抽样方法,要视情形来定:当总体中的个体较少时,一样可用随机抽样;当总体中的个体较多时,一样可用系统抽样;当总体由差异明显的几部分组成时,一样可用分层抽样.2.用样本估量总体,是研究统计问题的一个差不多思想方法.用样本估量总体,本节要紧研究在整体上用样本的频率分布估量总体的分布.教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最差不多的抽样方法.三种抽样方法的共同点:差不多上等概率抽样,表达了抽样的公平性;三种抽样方法各有其特点和适用的范畴.2.总体分布反映了总体在各个范畴内取值的概率.当总体中所取不同数值比较少时,常用条形图表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法能够不同);(4)汇合成样本.5.解决总体分布估量问题的一样程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别运算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估量.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.。
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
抽样方法与总体分布的估计
抽样比= 样个本体=容总量量.
各层样本容量 各层个体数量
例
(1)(2017河北石家庄二中三模,3)某校为了解1 000名高一新生的身体状
况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~
1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽
样抽取的号码为 ( C )
y
∴z y=21y2, ,z=18,
2 6(z 6),
若用分层抽样的方法抽取12个观测点的数据,则容城应抽取的数据个数
为12× =142,故选C.
6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
A.16 B.17 C.18 D.19
(2)(2017山东淄博二模,6)为了调研雄安新区的空气质量状况,某课题组 对雄县、容城、安新3县的空气质量进行了调查,按地域特点在三县内 设置空气质量观测点,已知三县内观测点的个数分别为6,y,z,依次构成 等差数列,且6,y,z+6成等比数列,若用分层抽样的方法抽取12个观测点 的数据,则容城应抽取的数据个数为 ( C ) A.8 B.6 C.4 D.2
6.样本的数字特征
(1)众数、中位数、平均数
数字特征 样本数据
频率分布直方图
众数
出现⑤ 次数最多 的数据
取最高的小矩形底边中点的横坐标
中位数
高中数学:抽样方法与总体分布的估计
抽样方法与总体分布的估计 一、高考考点梳理1.随机抽样例1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 32.用样本估计总体通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的频率分布;另一种是用样本的数字特征估计总体的数字特征(1)用样本的频率分布估计总体的频率分布①频率分布直方图的理解a.纵轴表示组距频率,即小长方形的高=组距频率; b.小长方形的面积=组距×组距频率=频率; c.数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.②频率分布折线图a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;b.总体密度曲线:随着样本容量的增加,作图时所分组数不断增多,组距减小,相应的频率分布折线图会越来越接近一条光滑曲线,即总体密度曲线。
③茎叶图的特点茎是指中间的一列数,通常为十位;叶是从茎的旁边生长出来的数,通常为个位。
(2)用样本的数字特征估计总体的数字特征①平均数、中位数、众数 数字特征 样本数据 平均数样本数据的算数平均数 中位数将数据按大小顺序依次排列, 处在最中间位置的一个数据(或最中间两个数据的平均数) 众数出现次数最多的数据②样本方差与标准差设样本的元素为n x x x ,,,21 ,样本的平均数为x ,则a.样本方差:()()()[]2222121s x x x x x x nn -++-+-= b.样本标准差: ()()()[]222211s x x x x x x n n -++-+-=③关于平均数、方差的有关性质a.若n x x x ,,,21 的平均数为x ,则a ,,,21+++n mx a mx a mx 的平均数为a x m +;b.若n x x x ,,,21 的方差为s 2,则a ,,,21+++n mx a mx a mx 的方差为22m s 。
高考数学抽样方法
题目(选修Ⅱ)第一章概率与统计抽样方法与总体分布的估计 高考要求1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本2.会用样本频率分布去估计总体分布 知识点归纳1.简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为Nn; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等,是不放回抽样.⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.2.抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法. 3.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k Nn(N为总体中的个体的个数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N'能被n整除,这时k=Nn'.③在第一段用简单随机抽样确定起始的个体编号l④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本)系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样5.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.8.总体:在数理统计中,通常把被研究的对象的全体叫做总体.9.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.10.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.11.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。
高考数学真题 抽样方法与总体分布的估计
11.4抽样方法与总体分布的估计考点一随机抽样1.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在[139,151]上的有4组,所以抽取4人,故选B.2.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90B.100C.180D.300答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1600∶900=16∶9,可以得到样本中的老年教师的人数为916×320=180,故选C.3.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703 500=n3 500+1 500,解之得n=100.4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选D. 评析随机抽样的要求是每个个体被抽中的概率相等,与具体的方法无关.5.(2014广东文,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C由系统抽样的定义知,分段间隔为1 00040=25.故答案为C.6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.评析本题考查了分层抽样,准确理解分层抽样的意义是解题关键.7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.8.(2013陕西理,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.9.(2018课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 . 答案 分层抽样解析 本题考查抽样方法.因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为 . 答案 25解析 男生人数为900-400=500.设应抽取男生x 人,则由45900=x500得x=25.即应抽取男生25人. 11.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生. 答案 60 解析420×300=60(名). 12.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校. 答案 18;9解析 应从小学中抽取150150+75+25×30=18(所).应从中学中抽取75150+75+25×30=9(所).评析 本题考查分层抽样及数据处理能力.13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是 . 答案 12解析 男女运动员人数比例为5698-56=43, 分层抽样中男女人数比例不变,则女运动员人数为 28×37=12.故应抽取女运动员人数是12.评析本题考查分层抽样方法.考查学生运算求解能力.考点二用样本估计总体1.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.()根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A本题考查统计,数据分析.观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.2.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x=3.故选A.3.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.4.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月.故选D.5.(2015课标Ⅱ理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D 不正确.6.(2020课标Ⅲ文,3,5分)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A.0.01B.0.1C.1D.10答案 C 由已知条件可知样本数据x 1,x 2,…,x n 的平均数x =x 1+x 2+…+x nn,方差s 12=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=0.01,则数据10x 1,10x 2,…,10x n 的平均数为10x 1+10x 2+…+10x nn=10x .所以这组数据的方差s 22=1n [(10x 1-10x )2+(10x 2-10x )2+…+(10x n -10x )2]=100n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=100s 12=100×0.01=1,故选C.7.(2015安徽理,6,5分)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8B.15C.16D.32答案 C 设样本数据x 1,x 2,…,x 10的标准差为s,则s=8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s=16. 8.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2答案 D 设增加工资后10位员工下月工资均值为x ',方差为s'2,则x '=110[(x 1+100)+(x 2+100)+…+(x 10+100)]=110(x 1+x 2+…+x 10)+100=x +100;方差s'2=110[(x 1+100-x ')2+(x 2+100-x ')2+…+(x 10+100-x ')2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2.故选D. 9.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2= . 答案165解析 记星期一到星期五收到的信件数分别为x 1,x 2,x 3,x 4,x 5,则x =x 1+x 2+x 3+x 4+x 55=10+6+8+5+65=7.∴s 2=15[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2+(x 5-x )2]=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165. 评析 本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属中等难度题.10.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .8 9 9 90 1 1答案 90解析 本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.方法总结 要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数的概念进行计算.11.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .答案(1)3(2)6 000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.(2014江苏,文6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm.答案24解析60×(0.015+0.025)×10=24(株).13.(2019课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:√74≈8.602.解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21. 产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100∑i=15n i (y i-y )2=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结 利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.14.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) 频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).易错警示利用频率分布直方图求众数、中位数与平均数时,应注意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.15.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)依题意,w至少定为3.(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05(10分) 根据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)思路分析第(1)问,需要计算该市居民月用水量在各区间上的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.评析本题考查了频率分布直方图及用样本估计总体,属中档题.16.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4 683 5 136 46 4 26 2 4 5 5 6 8 8 6 4 37 3 3 4 6 9 9 28 6 5 18 3 2 1 7 5 5 29 1 3通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”, 则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2) =P(C B1C A1)+P(C B2C A2) =P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48. 17.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.18.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户).19.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.20.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门49797665332110 98877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.评析本题考查利用茎叶图进行中位数,概率的相关计算,考查用样本的数字特征估计总体的数字特征,运用统计与概率的知识与方法解决实际问题的能力,考查数据处理能力及应用意识.21.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9[16,18)2 合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9. 故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085. 课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125. (3)样本中的100名学生该周课外阅读时间的平均数在第4组.22.(2013课标Ⅰ文,18,12分)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析 (1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y ,由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.评析 本题考查数据的平均数和茎叶图,考查数据的分析处理能力和应用意识.23.(2013安徽文,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1、x2,估计x1-x2的值.解析(1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=5 6.(2)设甲、乙两校样本平均数分别为x'1、x'2,根据样本茎叶图可知,30(x'1-x'2)=30x'1-30x'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15. 因此x'1-x'2=0.5.故x1-x2的估计值为0.5分.评析本题考查随机抽样与茎叶图等统计学的基本知识,考查学生用样本估计总体的思想以及数据分析处理能力.24.(2020课标Ⅰ文,17,12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解析(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100=0.4;。
§11.4 抽样方法与总体分布的估计(试题部分)
§11.4抽样方法与总体分布的估计基础篇固本夯基【基础集训】考点一随机抽样1.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次有关,第一次可能性最大B.与第几次有关,第一次可能性最小C.与第几次无关,与抽取的第几个样本有关D.与第几次无关,每次可能性相等答案D2.某单位员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是1,则该单位员工总数为()45A.110B.100C.900D.800答案B3.《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A.2B.4C.5D.6答案B4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案10考点二用样本估计总体5.甲、乙两组数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C6.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1℃,则甲地该月5天11时的气温数据的标准差为()甲乙9826892 m 03 1 1A.2B.√2C.10D.√10 答案 B7.某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两个频率分布直方图:已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t 的关系式为y={-1,t <95,0,95≤t <100,1,100≤t <105,2,t ≥105.若以上面数据的频率作为概率,分别从用A 配方和B 配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为( )A.0.125B.0.195C.0.215D.0.235 答案 B8.某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4 答案 C9.对某商店一个月(30天)内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 3 4 5 62 5 0 23 3 1 24 4 8 95 5 5 7 7 8 8 9 0 0 1 1 4 7 9 1 7 8A.46,45,56B.46,45,53C.47,45,56D.45,47,53 答案 A10.某大型企业为鼓励员工多利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,通过抽样,得到100位员工每人手机月平均使用流量L(单位:M)的数据,其频率分布直方图如图:将频率视为概率,回答以下问题:(1)从该企业的员工中随机抽取3人,求这3人中至多有1人手机月平均使用流量不超过900M的概率;(2)据了解,某网络运营商推出两款流量套餐,详情如下:套餐名称月套餐费(单位:元)月套餐流量(单位:M)A20700B301000流量套餐的规则是:每月1日收取套餐费.如果手机实际使用流量超出套餐流量,则需要购买流量叠加包,每一个叠加包(包含200M 的流量)需要10元,可以多次购买;如果当月流量有剩余,将会被清零.该企业准备为所有员工订购其中一款流量套餐,并支付所有费用.请分别计算两种套餐所需费用的数学期望,并判断该企业订购哪一款套餐更经济.解析(1)依题意,知(0.0008+a+0.0025+0.0035+0.0008+0.0002)×100=1,解得a=0.0022.从该企业的员工中随机抽取3人,可近似地看作独立重复试验,每人手机月平均使用流量不超过900M的概率为1-(0.0008+0.0002)×100=0.9,设事件A为“3人中至多有1人手机月平均使用流量不超过900M”,则P(A)=C31×0.9×0.12+0.13=0.028.(2)若该企业选择A套餐,设一位员工所需的费用为X元,则X可以为20,30,40,X的分布列为X203040P0.30.60.1E(X)=20×0.3+30×0.6+40×0.1=28.若该企业选择B套餐,设一位员工所需的费用为Y元,则Y可以为30,40,Y的分布列为Y3040P0.980.02E(Y)=30×0.98+40×0.02=30.2,∵30.2>28,∴该企业订购A套餐更经济.综合篇知能转换【综合集训】考法一频率分布直方图的应用1.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的1,则该组的频数为.3答案502.(2018福建六校联考,19)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29 [16,18] 2 合计 100(1)求频率分布直方图中的a,b 的值;(2)从课外阅读时间在[14,18]的学生中任选2人,求恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的概率. 解析 (1)课外阅读时间落在[6,8)的有22人,频率为0.22,所以a=0.222=0.11. 课外阅读时间落在[2,4)的有8人,频率为0.08, 所以b=0.082=0.04. (2)课外阅读时间落在[14,16)的有2人,记为m,n,课外阅读时间落在[16,18]的有2人,记为x,y,则从课外阅读时间落在[14,18]的学生中任选2人的事件包含(m,n),(m,x),(m,y),(n,x),(n,y),(x,y),共6种, 其中恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的事件有(m,x),(m,y),(n,x),(n,y),共4种, 所以所求概率P=46=23.3.(2019安徽六安第二中学联考,19)每年5月到7月是芒果的成熟季节.某大学校内也种植了很多食用芒果树.据该校后勤处负责人介绍,他们校内的芒果种植过程中没有使用过农药,也没有路边那种绿化芒的污染,可以放心食用.2018年该校的芒果也迎来了大丰收.6月25日,该校南北校区集中采摘芒果,并将采摘到的芒果免费派送给学校师生.现随机从一些芒果树上摘下100个芒果,其质量分布在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400)(单位:克)内,经统计得频率分布直方图如图所示.(1)现按分层抽样从质量在[250,300),[300,350)内的芒果中随机抽取9个,再从这9个中随机抽取3个,记随机变量X 表示质量在[300,350)内的芒果个数,求X 的分布列及数学期望;(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,假如你是经销商去收购芒果,该校当时还未摘下的芒果大约还有10 000个,现提供如下两种收购方案: A:所有芒果以10元/千克收购;B:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购. 通过计算确定你会选择哪种方案.解析 (1)9个芒果中,质量在[250,300)和[300,350)内的分别有6个和3个. 则X 的可能取值为0,1,2,3. P(X=0)=C 63C 93=2084,P(X=1)=C 62C 31C 93=4584,P(X=2)=C 61C 32C 93=1884,P(X=3)=C 33C 93=184.(4分)所以X 的分布列为X 0123P208445841884184X 的数学期望E(X)=0×2084+1×4584+2×1884+3×184=1.(6分)(2)方案A:经销商需支付学校的金额为(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).(9分)方案B:质量低于250克的芒果,经销商需支付学校的金额为(0.002+0.002+0.003)×50×10 000×2=7 000(元),质量高于或等于250克的芒果,经销商需支付学校的金额为(0.008+0.004+0.001)×50×10 000×3=19 500(元), 总计支付7 000+19 500=26 500元.由于25 750<26 500,故方案B 经销商支出金额更多,应选方案A.(12分) 思路分析 (1)确定X 的取值,求取相应值的概率,列分布列并求数学期望; (2)分别求经销商选择A,B 方案的支出金额,比较可知结果.4.(2018湖南重点名校大联考)2016年年底,某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取若干市民对该项目进行评分(满分100分),绘制如图所示的频率分布直方图,并将分数从低到高分为四个等级:满意度评分 低于60分 60分到79分 80分到89分 不低于90分 满意度等级不满意基本满意满意非常满意已知满意度等级为基本满意的有680人.(1)若市民的满意度评分相互独立,以满意度样本估计全市市民满意度.现从全市市民中随机抽取4人,求至少有2人非常满意的概率;(2)在等级为不满意的市民中,老年人占13,现从该等级市民中按年龄分层抽取15人了解不满意的原因,并从中选取3人担任整改督导员,记X 为老年督导员的人数,求X 的分布列及数学期望E(X);(3)相关部门对该项目进行验收,验收的硬性指标是:市民对该项目的满意指数不低于0.8,否则该项目需进行整改,根据你所学的统计知识,判断该项目能否通过验收,并说明理由.(注:满意指数=满意度评分的平均分100)解析 (1)由频率分布直方图可知10×(0.035+a+0.020+0.014+0.004+0.002)=1,所以a=0.025,所以市民非常满意的概率为0.025×10=14.又市民的满意度评分相互独立,故所求事件的概率P=1-C 40(14)0(34)4-C 41(14)1(34)3=1-189256=67256. (2)按年龄分层抽样抽取15人了解不满意的原因,则老年人有15×13=5(人),由题意知X 的可能取值为0,1,2,3, P(X=0)=C 103C 153=2491,P(X=1)=C 51C 102C 153=4591,P(X=2)=C 52C 101C 153=2091,P(X=3)=C 53C 153=291. 所以X 的分布列为X 0123P249145912091291所以E(X)=0×2491+1×4591+2×2091+3×291=1. (3)能通过验收.理由:由频率分布直方图,得市民满意度评分的平均分为(45×0.002+55×0.004+65×0.014+75×0.020+85×0.035+95×0.025)×10=80.7,因此市民对该项目的满意指数为80.7100=0.807,因为0.807>0.8,所以该项目能通过验收.考法二 样本的数字特征及其应用5.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2 D.x >4,s 2>2 答案 A6.(2018河北石家庄教学质量检测(二),9)某学校A 、B 两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差; ④B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为( )A.①④B.②③C.②④D.①③ 答案 A7.(2019上海浦东期中教学质量检测(二模),10)已知6个正整数,它们的平均数是5,中位数是4,唯一众数是3,则这6个数方差的最大值为 .(精确到小数点后一位) 答案 12.38.(2018安徽淮北一模,19)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行测试,统计结果如图:(1)根据茎叶图计算M9,M10两种型号手机的平均待机时间;(2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由;(3)从待机时间在75小时以上的6台被测试手机中随机抽取2台,求至少有一台手机是M9的概率.解析(1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为x M9=16×(56+69+65+70+76+84)=70(小时),M10型号手机的平均待机时间为x M10=16×(79+72+70+80+81+80)=77(小时).(2)M9型号手机待机时间方差大于M10型号手机待机时间方差.理由:M9型号手机待机时间的数据分布比较分散,波动较大;M10型号手机待机时间的数据分布比较集中,波动较小.(3)记M9型号手机待机时间在75小时以上的被测手机为A1,A2,M10型号手机待机时间在75小时以上的被测手机为B1,B2,B3,B4,从6台被测手机中任取2台有C62=15种取法,其中不符合题意的取法有(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共6种,所以所求的概率P=15-615=35.【五年高考】1.(2019课标Ⅲ,3,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A3.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A4.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D5.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案186.(2019课标Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4683513646426245568864373346992865183217552913通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.思路分析(1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图进行比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.8.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.教师专用题组(2011课标,19,12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数82042228B 配方的频数分布表指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110]频数412423210(1)分别估计用A 配方,B 配方生产的产品的优质品率;(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为y={-2, t <94,2, 94≤t <102,4, t ≥102.从用B 配方生产的产品中任取一件,其利润记为X(单位:元),求X 的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)解析 (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)用B 配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42, 即X 的分布列为X -2 2 4 P0.040.540.42X 的数学期望EX=-2×0.04+2×0.54+4×0.42=2.68.失分警示思路分析 列分布列时各利润值对应的概率由于粗心而出现对应或计算错误. 评析 本题考查频率分布表及随机变量的分布列和数学期望,属于容易题.【三年模拟】一、单项选择题(每题5分,共50分)1.(2019江西吉安一模,4)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( ) 附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A.3 B.16 C.38 D.20 答案 D2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n 的样本,其中高中生有24人,那么n 等于( ) A.12 B.18 C.24 D.36 答案 D3.(2018湖北部分重点中学模拟,3)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为()A.19B.110C.15D.18答案B4.(2018湖南衡阳二模,4)已知样本x1,x2,…,x n的平均数为x,样本y1,y2,…,y m的平均数为y(x≠y),若样本x1,x2,…,x n,y1,y2,…,y m的平均数z=ax+(1-a)y,其中0<a<12,则n,m(n,m∈N*)的大小关系为()A.n=mB.n≥mC.n<mD.n>m答案C5.(2020届河南安阳第一次调研,3)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数答案D6.(2020届广西南宁10月摸底,3)某校8位学生的本次月考成绩恰好都比上一次的月考成绩高出50分,则以该8位学生这两次的月考成绩各自组成样本,则这两个样本不变的数字特征是()A.方差B.中位数C.众数D.平均数答案A7.(2020届安徽阜阳颍上二中等三校入学考,3)演讲比赛共有9位评委分别给出某位选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A8.(2020届河北深州中学9月质量监测,6)为了从甲、乙两组学生中选一组参加“喜迎祖国七十华诞,共建全国文明城市”知识竞赛活动,班主任老师将这两组学生最近6次的测试成绩进行统计,得到如图所示的茎叶图.若甲、乙两组的平均成绩分别是x甲、x乙,则下列说法正确的是()A.x甲>x乙,乙组比甲组成绩稳定,应选乙组参加竞赛B.x甲>x乙,甲组比乙组成绩稳定,应选甲组参加竞赛C.x 甲<x 乙,甲组比乙组成绩稳定,应选甲组参加竞赛D.x 甲<x 乙,乙组比甲组成绩稳定,应选乙组参加竞赛 答案 D9.(2018湖北孝感二模,5)某校高三年级10个班参加合唱比赛得分的茎叶图如图所示,若这组数据的平均数是20,则1a +9b的最小值为( )1 2 3 5 9 7 23a58bA.1B.32C.2D.52答案 C10.(2019安徽合肥二模,5)下表是某电器销售公司2018年度各类电器营业收入占比和净利润占比统计表:空调类 冰箱类 小家电类 其他类 营业收入占比 90.10% 4.98% 3.82% 1.10% 净利润占比95.80%-0.48%3.82%0.86%则下列判断中不正确...的是( ) A.该公司2018年度冰箱类电器销售亏损B.该公司2018年度小家电类电器营业收入和净利润相同C.该公司2018年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2018年度空调类电器销售净利润占比将会降低 答案 B二、多项选择题(每题5分,共15分)11.(2020届山东夏季高考模拟,9)下图为某地区2006年—2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年—2018年( ) A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势 B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同 C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量 D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大 答案 AD12.(改编题)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,( ) A.这七人年龄的众数变为40 B.这七人年龄的平均数变为49 C.这七人年龄的中位数变为60 D.这七人年龄的标准差变为24 答案 ABC13.(改编题)某赛季甲、乙两名篮球运动员各6场比赛得分情况如下:场次123456甲得分 31 16 24 34 18 9 乙得分 23 21 32 11 35 10则下列说法正确的是( )A.甲运动员得分的极差小于乙运动员得分的极差B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定 答案 BD三、填空题(共5分)14.(2018陕西榆林第二中学第七次模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽查了一个容量为n 的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n 的值为 .答案 100四、解答题(共25分)15.(2020届广西桂林十八中第一次月考,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1 400万元的年度销售任务.已知这200名销售员去年完成的销售额都在区间[2,22](单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如图所示的频率分布直方图. (1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a 的值和样本中完成年度任务的销售员人数;(2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,设获得此奖励的2名销售员在第4组的人数为X,求X 的分布列和期望.解析 (1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴样本中完成年度任务的销售员人数为6. (2)X 的可能取值为0,1,2,P(X=0)=C 30C 32C 62=15,P(X=1)=C 31C 31C 62=35,P(X=2)=C 32C 30C 62=15, ∴X 的分布列如下:X 012P153515。
§11.4 抽样方法与总体分布的估计(试题部分)
§11.4抽样方法与总体分布的估计基础篇固本夯基【基础集训】考点一随机抽样1.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次有关,第一次可能性最大B.与第几次有关,第一次可能性最小C.与第几次无关,与抽取的第几个样本有关D.与第几次无关,每次可能性相等答案D2.某单位员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是1,则该单位员工总数为()45A.110B.100C.900D.800答案B3.《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A.2B.4C.5D.6答案B4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案10考点二用样本估计总体5.甲、乙两组数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C6.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1℃,则甲地该月5天11时的气温数据的标准差为()甲乙9826892 m 03 1 1A.2B.√2C.10D.√10 答案 B7.某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两个频率分布直方图:已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t 的关系式为y={-1,t <95,0,95≤t <100,1,100≤t <105,2,t ≥105.若以上面数据的频率作为概率,分别从用A 配方和B 配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为( )A.0.125B.0.195C.0.215D.0.235 答案 B8.某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4 答案 C9.对某商店一个月(30天)内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 3 4 5 62 5 0 23 3 1 24 4 8 95 5 5 7 7 8 8 9 0 0 1 1 4 7 9 1 7 8A.46,45,56B.46,45,53C.47,45,56D.45,47,53 答案 A10.某大型企业为鼓励员工多利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,通过抽样,得到100位员工每人手机月平均使用流量L(单位:M)的数据,其频率分布直方图如图:将频率视为概率,回答以下问题:(1)从该企业的员工中随机抽取3人,求这3人中至多有1人手机月平均使用流量不超过900M的概率;(2)据了解,某网络运营商推出两款流量套餐,详情如下:套餐名称月套餐费(单位:元)月套餐流量(单位:M)A20700B301000流量套餐的规则是:每月1日收取套餐费.如果手机实际使用流量超出套餐流量,则需要购买流量叠加包,每一个叠加包(包含200M 的流量)需要10元,可以多次购买;如果当月流量有剩余,将会被清零.该企业准备为所有员工订购其中一款流量套餐,并支付所有费用.请分别计算两种套餐所需费用的数学期望,并判断该企业订购哪一款套餐更经济.解析(1)依题意,知(0.0008+a+0.0025+0.0035+0.0008+0.0002)×100=1,解得a=0.0022.从该企业的员工中随机抽取3人,可近似地看作独立重复试验,每人手机月平均使用流量不超过900M的概率为1-(0.0008+0.0002)×100=0.9,设事件A为“3人中至多有1人手机月平均使用流量不超过900M”,则P(A)=C31×0.9×0.12+0.13=0.028.(2)若该企业选择A套餐,设一位员工所需的费用为X元,则X可以为20,30,40,X的分布列为X203040P0.30.60.1E(X)=20×0.3+30×0.6+40×0.1=28.若该企业选择B套餐,设一位员工所需的费用为Y元,则Y可以为30,40,Y的分布列为Y3040P0.980.02E(Y)=30×0.98+40×0.02=30.2,∵30.2>28,∴该企业订购A套餐更经济.综合篇知能转换【综合集训】考法一频率分布直方图的应用1.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的1,则该组的频数为.3答案502.(2018福建六校联考,19)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29 [16,18] 2 合计 100(1)求频率分布直方图中的a,b 的值;(2)从课外阅读时间在[14,18]的学生中任选2人,求恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的概率. 解析 (1)课外阅读时间落在[6,8)的有22人,频率为0.22,所以a=0.222=0.11. 课外阅读时间落在[2,4)的有8人,频率为0.08, 所以b=0.082=0.04. (2)课外阅读时间落在[14,16)的有2人,记为m,n,课外阅读时间落在[16,18]的有2人,记为x,y,则从课外阅读时间落在[14,18]的学生中任选2人的事件包含(m,n),(m,x),(m,y),(n,x),(n,y),(x,y),共6种, 其中恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的事件有(m,x),(m,y),(n,x),(n,y),共4种, 所以所求概率P=46=23.3.(2019安徽六安第二中学联考,19)每年5月到7月是芒果的成熟季节.某大学校内也种植了很多食用芒果树.据该校后勤处负责人介绍,他们校内的芒果种植过程中没有使用过农药,也没有路边那种绿化芒的污染,可以放心食用.2018年该校的芒果也迎来了大丰收.6月25日,该校南北校区集中采摘芒果,并将采摘到的芒果免费派送给学校师生.现随机从一些芒果树上摘下100个芒果,其质量分布在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400)(单位:克)内,经统计得频率分布直方图如图所示.(1)现按分层抽样从质量在[250,300),[300,350)内的芒果中随机抽取9个,再从这9个中随机抽取3个,记随机变量X 表示质量在[300,350)内的芒果个数,求X 的分布列及数学期望;(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,假如你是经销商去收购芒果,该校当时还未摘下的芒果大约还有10 000个,现提供如下两种收购方案: A:所有芒果以10元/千克收购;B:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购. 通过计算确定你会选择哪种方案.解析 (1)9个芒果中,质量在[250,300)和[300,350)内的分别有6个和3个. 则X 的可能取值为0,1,2,3. P(X=0)=C 63C 93=2084,P(X=1)=C 62C 31C 93=4584,P(X=2)=C 61C 32C 93=1884,P(X=3)=C 33C 93=184.(4分)所以X 的分布列为X 0123P208445841884184X 的数学期望E(X)=0×2084+1×4584+2×1884+3×184=1.(6分)(2)方案A:经销商需支付学校的金额为(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).(9分)方案B:质量低于250克的芒果,经销商需支付学校的金额为(0.002+0.002+0.003)×50×10 000×2=7 000(元),质量高于或等于250克的芒果,经销商需支付学校的金额为(0.008+0.004+0.001)×50×10 000×3=19 500(元), 总计支付7 000+19 500=26 500元.由于25 750<26 500,故方案B 经销商支出金额更多,应选方案A.(12分) 思路分析 (1)确定X 的取值,求取相应值的概率,列分布列并求数学期望; (2)分别求经销商选择A,B 方案的支出金额,比较可知结果.4.(2018湖南重点名校大联考)2016年年底,某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取若干市民对该项目进行评分(满分100分),绘制如图所示的频率分布直方图,并将分数从低到高分为四个等级:满意度评分 低于60分 60分到79分 80分到89分 不低于90分 满意度等级不满意基本满意满意非常满意已知满意度等级为基本满意的有680人.(1)若市民的满意度评分相互独立,以满意度样本估计全市市民满意度.现从全市市民中随机抽取4人,求至少有2人非常满意的概率;(2)在等级为不满意的市民中,老年人占13,现从该等级市民中按年龄分层抽取15人了解不满意的原因,并从中选取3人担任整改督导员,记X 为老年督导员的人数,求X 的分布列及数学期望E(X);(3)相关部门对该项目进行验收,验收的硬性指标是:市民对该项目的满意指数不低于0.8,否则该项目需进行整改,根据你所学的统计知识,判断该项目能否通过验收,并说明理由.(注:满意指数=满意度评分的平均分100)解析 (1)由频率分布直方图可知10×(0.035+a+0.020+0.014+0.004+0.002)=1,所以a=0.025,所以市民非常满意的概率为0.025×10=14.又市民的满意度评分相互独立,故所求事件的概率P=1-C 40(14)0(34)4-C 41(14)1(34)3=1-189256=67256. (2)按年龄分层抽样抽取15人了解不满意的原因,则老年人有15×13=5(人),由题意知X 的可能取值为0,1,2,3, P(X=0)=C 103C 153=2491,P(X=1)=C 51C 102C 153=4591,P(X=2)=C 52C 101C 153=2091,P(X=3)=C 53C 153=291. 所以X 的分布列为X 0123P249145912091291所以E(X)=0×2491+1×4591+2×2091+3×291=1. (3)能通过验收.理由:由频率分布直方图,得市民满意度评分的平均分为(45×0.002+55×0.004+65×0.014+75×0.020+85×0.035+95×0.025)×10=80.7,因此市民对该项目的满意指数为80.7100=0.807,因为0.807>0.8,所以该项目能通过验收.考法二 样本的数字特征及其应用5.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2 D.x >4,s 2>2 答案 A6.(2018河北石家庄教学质量检测(二),9)某学校A 、B 两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差; ④B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差.A.①④B.②③C.②④D.①③ 答案 A7.(2019上海浦东期中教学质量检测(二模),10)已知6个正整数,它们的平均数是5,中位数是4,唯一众数是3,则这6个数方差的最大值为 .(精确到小数点后一位) 答案 12.38.(2018安徽淮北一模,19)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行测试,统计结果如图:(1)根据茎叶图计算M9,M10两种型号手机的平均待机时间;(2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由;(3)从待机时间在75小时以上的6台被测试手机中随机抽取2台,求至少有一台手机是M9的概率.解析(1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为x M9=16×(56+69+65+70+76+84)=70(小时),M10型号手机的平均待机时间为x M10=16×(79+72+70+80+81+80)=77(小时).(2)M9型号手机待机时间方差大于M10型号手机待机时间方差.理由:M9型号手机待机时间的数据分布比较分散,波动较大;M10型号手机待机时间的数据分布比较集中,波动较小.(3)记M9型号手机待机时间在75小时以上的被测手机为A1,A2,M10型号手机待机时间在75小时以上的被测手机为B1,B2,B3,B4,从6台被测手机中任取2台有C62=15种取法,其中不符合题意的取法有(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共6种,所以所求的概率P=15-615=35.【五年高考】1.(2019课标Ⅲ,3,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A3.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A4.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D5.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案186.(2019课标Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4683513646426245568864373346992865183217552913通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.思路分析(1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图进行比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.8.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.教师专用题组(2011课标,19,12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110]频数82042228B 配方的频数分布表指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110]频数412423210(1)分别估计用A 配方,B 配方生产的产品的优质品率;(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为y={-2, t <94,2, 94≤t <102,4, t ≥102.从用B 配方生产的产品中任取一件,其利润记为X(单位:元),求X 的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)解析 (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)用B 配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42, 即X 的分布列为X -2 2 4 P0.040.540.42X 的数学期望EX=-2×0.04+2×0.54+4×0.42=2.68.失分警示思路分析 列分布列时各利润值对应的概率由于粗心而出现对应或计算错误. 评析 本题考查频率分布表及随机变量的分布列和数学期望,属于容易题.【三年模拟】一、单项选择题(每题5分,共50分)附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A.3 B.16 C.38 D.20答案D2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36答案D3.(2018湖北部分重点中学模拟,3)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为()A.19B.110C.15D.18答案B4.(2018湖南衡阳二模,4)已知样本x1,x2,…,x n的平均数为x,样本y1,y2,…,y m的平均数为y(x≠y),若样本x1,x2,…,x n,y1,y2,…,y m的平均数z=ax+(1-a)y,其中0<a<12,则n,m(n,m∈N*)的大小关系为()A.n=mB.n≥mC.n<mD.n>m答案C5.(2020届河南安阳第一次调研,3)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数答案D6.(2020届广西南宁10月摸底,3)某校8位学生的本次月考成绩恰好都比上一次的月考成绩高出50分,则以该8位学生这两次的月考成绩各自组成样本,则这两个样本不变的数字特征是()A.方差B.中位数C.众数D.平均数答案A7.(2020届安徽阜阳颍上二中等三校入学考,3)演讲比赛共有9位评委分别给出某位选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A8.(2020届河北深州中学9月质量监测,6)为了从甲、乙两组学生中选一组参加“喜迎祖国七十华诞,共建全国文明城市”知识竞赛活动,班主任老师将这两组学生最近6次的测试成绩进行统计,得到如图所示的茎叶图.若甲、乙两组的平均成绩分别是x甲、x乙,则下列说法正确的是()A.x 甲>x 乙,乙组比甲组成绩稳定,应选乙组参加竞赛B.x 甲>x 乙,甲组比乙组成绩稳定,应选甲组参加竞赛C.x 甲<x 乙,甲组比乙组成绩稳定,应选甲组参加竞赛D.x 甲<x 乙,乙组比甲组成绩稳定,应选乙组参加竞赛 答案 D9.(2018湖北孝感二模,5)某校高三年级10个班参加合唱比赛得分的茎叶图如图所示,若这组数据的平均数是20,则1a +9b的最小值为( )1 2 3 5 9 7 23a58bA.1B.32C.2D.52答案 C10.(2019安徽合肥二模,5)下表是某电器销售公司2018年度各类电器营业收入占比和净利润占比统计表:空调类 冰箱类 小家电类 其他类 营业收入占比 90.10% 4.98% 3.82% 1.10% 净利润占比95.80%-0.48%3.82%0.86%则下列判断中不正确...的是( ) A.该公司2018年度冰箱类电器销售亏损B.该公司2018年度小家电类电器营业收入和净利润相同C.该公司2018年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2018年度空调类电器销售净利润占比将会降低 答案 B二、多项选择题(每题5分,共15分)11.(2020届山东夏季高考模拟,9)下图为某地区2006年—2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年—2018年( ) A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势 B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同 C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量 D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大 答案 AD12.(改编题)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,()A.这七人年龄的众数变为40B.这七人年龄的平均数变为49C.这七人年龄的中位数变为60D.这七人年龄的标准差变为24答案ABC13.(改编题)某赛季甲、乙两名篮球运动员各6场比赛得分情况如下:场次123456甲得分31162434189乙得分232132113510则下列说法正确的是()A.甲运动员得分的极差小于乙运动员得分的极差B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定答案BD三、填空题(共5分)14.(2018陕西榆林第二中学第七次模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽查了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为.答案100四、解答题(共25分)15.(2020届广西桂林十八中第一次月考,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1400万元的年度销售任务.已知这200名销售员去年完成的销售额都在区间[2,22](单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如图所示的频率分布直方图.(1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a的值和样本中完成年度任务的销售员人数;(2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,设获得此奖励的2名销售员在第4组的人数为X,求X的分布列和期望.解析(1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴样本中完成年度任务的销售员人数为6.。
高考数学抽样方法与总体分布的估计专题检测(带答案)
高考数学抽样方法与整体散布的预计专题检测(带答案)当试验次数无穷增大时,试验结果的频次值就成为相应的概率,获得右表,除了抽样造成的偏差,精准地反应了总体取值的概率散布规律,以下是高考数学抽样方法与整体分布的预计专题检测,请考生实时练习。
一、选择题1.为了认识所加工一批部件的长度,抽测了此中200 个部件的长度,在这个问题中,200 个部件的长度是().A. 整体B.个体是每一个部件C.整体的一个样本D. 样本容量分析200 个部件的长度是整体的一个样本.答案C2.用随机数表法从100 名学生 (此中男生 25 人 )中抽取 20 人进行评教,某男学生被抽到的概率是().A. B. C. D.分析冷静量N=100的整体中抽取一个容量为n=20 的样本,每个个体被抽到的概率都是=.答案C.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的均匀值为 1,则样本方差为().A. B. C. D.2分析由题可知样本的均匀值为1,因此 =1,解得 a=-1,因此样本的方差为 [(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案D4.甲、乙两人在一次射击竞赛中各射靶 5 次,两人成绩的条形统计图以下图,则().A.甲的成绩的均匀数小于乙的成绩的均匀数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差分析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.因此甲、乙的成绩的均匀数均为6, A 错 ;甲、乙的成绩的中位数分别为6,5, B 错;甲、乙的成绩的方差分别为[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=,C对;甲、乙的成绩的极差均为 4,D 错 .答案 C.为了检查某商场货架上的奶粉能否含有三聚氰胺,要从编号挨次为 1 到 50 的袋装奶粉中抽取 5 袋进行查验,用每部分选用的号码间隔同样的系统抽样方法确立所选用的5袋奶粉的编号可能是 ().A.5,10,15,20,25B.2,4,8,16,32C.1,2,3,4,5D.7,17,27,37,47分析利用系统抽样,把编号分为 5 段,每段10 个,每段抽取一个,号码间隔为10,应选 D.答案D.一组数据的均匀数是 2.8,方差是 3.6,若将这组数据中的每一个数据都加上60,获得一组新数据,则所得新数据的均匀数和方差分别是().A.57.2,3.6B.57.2,56.4C.62.8,63.6D.62.8,3.6分析均匀数增添,方差不变.答案D二、填空题.体育彩票 000001~ 100000 编号中,凡彩票号码最后三位数为 345 的中一等奖,采纳的抽样方法是________.分析系统抽样的步骤可归纳为:整体编号,确立间隔,总体分段,在第一段内确立开端个体编号,每段内规则取样等几步 .该抽样切合系统抽样的特色.答案系统抽样.某学校为认识学生数学课程的学习状况,在 1 000 名学生中随机抽取 200 名,并统计这200 名学生的某次数学考试成绩,获得了样本的频次散布直方图(如图 ).依据频次散布直方图可预计这 1 000 名学生在该次数学考试中成绩不低于60 分的学生人数是 ________.分析低于 60 分学生所占频次为 (0.002+0.006+0.012)10=0.2 ,故低于 60 分的学生人数为 1 0000.2=200 ,因此不低于 60 分的学生人数为 1 000-200=800.答案800.沈阳市某高中有高一学生600 人,高二学生 500 人,高三学生 550 人,现对学生对于消防安全知识认识状况进行分层抽样检查,若抽取了一个容量为n 的样本,此中高三学生有 11 人,则 n 的值等于 ________.分析由=,得n=33(人).答案33.某年级 120 名学生在一次百米测试中,成绩所有介于13 秒与 18 秒之间 .将测试结果分红 5 组:[13,14) ,[14,15) ,[15,16) ,[16,17) ,[17,18] ,获得以下图的频次散布直方图.假如从左到右的 5 个小矩形的面积之比为13∶ 7∶6∶ 3,那么成绩在[16,18] 的学生人数是___________________________________________________ _______________.分析成绩在[16,18]的学生的人数所占比率为=,因此成绩在[16,18] 的学生人数为120=54.答案54 三、解答题.某公路设计院有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取n 个人参加市里召开的科学技术大会.假如采纳系统抽样和分层抽样的方法抽取,不用剔除个体,假如参会人数增添 1 个,则在采纳系统抽样时,需要在整体中先剔除 1 个个体,求n.整体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为,分层抽样的比率是,抽取的工程师人数为6=,技术员人数为12=,技工人数为18=,因此 n 应是 6 的倍数, 36 的约数,即n=6,12,18.当样本容量为 (n+1) 时,整体容量是35 人,系统抽样的间隔为,由于一定是整数,因此n 只好取 6.即样本容量n=6..某校高一某班的某次数学测试成绩(满分为 100 分) 的茎叶图和频次散布直方图都受了不一样程度的损坏,但可见部分如图,据此解答以下问题:(1)求分数在 [50,60] 的频次及全班人数;(2)求分数在 [80,90] 之间的频数,并计算频次散布直方图中[80,90] 间的矩形的高 .解 (1)分数在 [50,60] 的频次为 0.00810=0.08.由茎叶图知,分数在[50,60] 之间的频数为2,因此全班人数为=25.(2)分数在 [80,90] 之间的频数为 25-2-7-10-2=4 ,频次散布直方图中 [80,90] 间的矩形的高为 10=0.016..汽车行业是碳排放量比较大的行业之一,欧盟规定,从2019年开始,对 CO2 排放量超出 130 g/km 的 MI 型新车进行处罚(视为排放量超标 ) ,某检测单位对甲、乙两类 MI 型品牌的新车各抽取了 5 辆进行 CO2 排放量检测,记录以下 (单位:g/km) :甲 80 110 120 140 150 乙 100 120 x y 160 经测算发现,乙类品牌车 CO2 排放量的均值为乙 =120 g/km.(1)求甲类品牌汽车的排放量的均匀值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO2 的排放量稳固性好,求 x 的取值范围 .解 (1)甲类品牌汽车的 CO2 排放量的均匀值甲 ==120(g/km) ,察看内容的选择,我本着先静后动,由近及远的原则,有目的、有计划的先安排与少儿生活靠近的,能理解的察看内容。
2011年高考数学总复习 提能拔高限时训练:抽样方法与总体分布的估计(练习 详细答案)大纲人教版
提能拔高限时训练53 抽样方法与总体分布的估计一、选择题1.一个容量为n 的样本,分成若干组,已知某组的频率和频数分别为0.125和40,则n 的值为( )A .640B .320C .240D .160 解析:∵样本容量频数频率=,∴样本容量320125.040==n .故选B . 答案:B则第6组的频率为( )A .0.14B .14C .0.15D .15解析:运用频率、频数的定义,注意它们的区别以及频率范围,易知频数为15,则频率为0.15.故选C . 答案:C3.为了了解一批电器的质量技术参数,现从中抽取100件电器进行检测,这个问题中的样本是( )A .这批电器的技术参数B .100件电器C .100D .抽取的100件电器的技术参数 解析:样本指抽取的100件电器的技术参数,而不是这100件电器. 答案:D4.在简单随机抽样中,某一个个体被抽到的可能性( ) A .与第几次抽样有关,第一次抽到的可能性要大些 B .与第几次抽样无关,每次抽到的可能性都相等 C .与第几次抽样有关,最后一次抽到的可能性大些D .与第几次抽样无关,每次都是等可能地抽取,但各次抽到的可能性不一样解析:在简单随机抽样过程中,某一个体被抽到的可能性都相等,与第几次抽样无关. 答案:B5.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( )A .30B .25C .20D .15 解析:在总体中,松树所占比重为152000300004=,故样本中松树也占152,也就是150×152=20(棵).答案:C 6.从2 004名学生中选取50名组成参观团,若采用下面的方法选取,先用简单随机抽样法从2 004人中剔除4人,剩下的2 000人再按系统抽样的方法进行,则每人入选的概率( ) A .不全相等 B .均不相等C .都相等且为002125 D .都相等且为401解析:抽样的原则是每个个体被抽到的概率都相等,所以每人入选的概率为002125. 答案:C7.一工厂生产了某种产品18 000件,它们来自甲、乙、丙3个车间,现采用分层抽样的方法对这批产品进行抽样检查.已知从甲、乙、丙3个车间依次抽取产品的件数恰好组成一个等差数列,则这批产品中乙车间生产的产品件数是( )A .9 000B .4 500C .3 000D .6 000 解析:∵从甲、乙、丙3个车间抽取产品的件数恰好组成一个等差数列, ∴甲、乙、丙三个车间的产品数成等差数列.设产品数分别为a 1、a 2、a 3,则a 1+a 2+a 3=3a 2=18 000,a 2=6 000, 故选D . 答案:D8.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中随机抽取n 名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数应为( )A .10B .9C .8D .7 解析:∵307210=, ∴从高三学生中抽取的人数应为1030300=. 答案:A9.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图,从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( )A .48米B .49米C .50米D .51米 解析:由频率分布直方图,知水位为50米的组距频率为1%,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50米. 答案:C10.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,45 解析:成绩小于17秒的人数的百分比为(0.02+0.18+0.36+0.34)×1=0.9; 成绩大于等于15秒且小于17秒的人数为(0.36+0.34)×1×50=35. 答案:A 二、填空题11.某学校共有师生2 400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本.已知从学生中抽取的人数为150,那么该学校的教师人数是_____________. 解析:教师的人数为2 400×160150160 =150.答案:15012.为了了解某市参加高考体检的学生的体能状况,经抽样调查1 000名男生的肺活量(mL ),得到如下频率分布直方图,根据图形,可得这1 000名学生中肺活量在[3 000,3 600)的学生人数是______________.解析:300×0.000 5+300×0.001=0.45,1 000×0.45=450. 答案:45013.利用简单随机抽样的方法,从n 个个体(n >13)中抽取13个个体,若第二次抽取时余下的每个个体被抽到的概率为31,则在整个抽样过程中,各个个体被抽取到的概率为_______.解析:由题意得311113=--n , ∴n=37.∴各个个体在整个抽样过程中被抽到的概率为3713. 答案:3713 14.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数的等比数列,则剩下三组中频数最高的一组的频数为_____________.解析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79, 故后三组共有的频数为21,依题意211)1(31=--•qq a ,a 1(1+q +q 2)=21. ∴a 1=1,q =4.∴后三组频数最高的一组的频数为16. 答案:16 三、解答题 15.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按照5天一组分组统计,绘制了频率分布直方图(如下图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列各题.(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪一组获奖率较高? 解:(1)依题意可算出第三组的频率为511464324=+++++.设共有n 件作品,则5112=n , ∴n=60(件).(2)由题中直方图可看出第四组上交作品数量最多,共有1820660=⨯(件).(3)第四组获奖率为951810=,第六组获奖率为9632201602==⨯, ∴第六组获奖率较高.寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数2030804030(1)列出频率分布表; (2)画出频率分布直方图;(3)估计电子元件寿命在100 h ~400 h 以内的概率. 寿命(h ) 频数 频率 100~200 20 0.10 200~300 30 0.15 300~400 80 0.40 400~500 40 0.20 500~600 30 0.15 合计2001(3)由频率分布表可以看出,寿命在100 h ~400 h 的电子元件出现的频率为0.65,故我们估计电子元件寿命在100 h ~400 h 的概率为0.65. 教学参考例题 志鸿优化系列丛书【例1】用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是__________.解析:不妨设在第1组中随机抽到的号码为x,则在第16组中应抽出的号码为120+x. 设第1组抽出的号码为x,则第16组应抽出的号码是8×15+x =126, ∴x=6. 答案:6【例2】某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为___________.解析:分层抽样应按各层所占的比例从总体中抽取. ∵120∶16∶24=15∶2∶3,又共抽出20人, ∴各层抽取的人数分别为20×2015=15人,20×202=2人,20×203=3人. 答案:15、2、3。
高考数学真题分类解析总复习资料考点36 抽样方法、总体分布的估计
- 1 - 温馨提示:
此题库为Word 版,请按住Ctrl,滑动鼠标滚轴,调节合适的观 看比例,关闭Word 文档返回原板块。
考点36 抽样方法、总体分布的估计
一、选择题
1.(2012·四川高考文科·T3)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( )
(A )101 (B )808 (C )1212 (D )2012
【解题指南】由分层抽样的定义求解,甲社区驾驶员的抽样比例和四个社区驾驶员总人数的抽样比例相同.
【解析】选B.甲社区驾驶员的抽样比例为
121968=,四个社区驾驶员总人数的抽样比例为12212543101N N +++=,由10118
N =得808N =. 关闭Word 文档返回原板块。
新人教范文高考数学总复习专题训练抽样方法总体分布的估计
抽样方法、总体分布的估计1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B )()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法()C 系统抽样法,分层抽样法 ()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++=K 50 . 3.设有n 个样本12,,,n x x x L ,其标准差为x s ,另有n 个样本12,,,n y y y L ,且35k k y x =+ (1,2,,)k n =L ,其标准差为y s ,则下列关系正确的是 ( B )4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B ) ()A 小时 ()B 小时 ()C 小时 ()D 小时 5.x 是12100,,x x x K 的平均数,a 是1240,,x x x K 的平均数,b 是4142100,,x x x K 的平均数,则x ,a ,b 之间的关系为4060100a b x +=. 6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 9.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.10. 现有30个零件,需从中抽取10个进行检查,问如何采用简单随机抽样得到一个容量为10的样本?11.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?时间(小时) 甲 乙13.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
新高考一轮复习人教版 抽样方法与总体分布的估计 作业1
11.4抽样方法与总体分布的估计一、选择题1.(2021云南师大附中适应性考试,3)某单位有管理人员、业务人员、后勤人员共m人,其中业务人员有120人,现采用分层抽样的方法从管理人员、业务人员、后勤人员中抽取部分职工了解他们的健康状况,若抽取的管理人员有6人,且抽取的管理人员与业务人员的比为1∶4,抽取的后勤人员比业务人员少20人,则m的值为()A.170B.180C.150D.160答案A∵抽取的管理人员有6人,且抽取的管理人员与业务人员的比为1∶4,抽取的后勤人员比业务人员少20人,∴抽取的业务人员有4×6=24人,抽取的后勤人员有24-20=4人,根据分层抽样的特点可得24 120=4+6+24m,故m=170,故选A.2.(2021江西萍乡二模,6)2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案C从题图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的植树棵数为10,11个班中只有2、3、8三个班的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11五个班的植树棵数都不少于15棵,将这五个班的植树棵数各取出5棵,加到2、3、8班中去,这样除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树棵数多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从题图中明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D 正确.故选C.3.(2022届湘豫名校联盟11月联考,5)某校为了解学生体能素质,随机抽取了50名学生进行体能测试,并将这50名学生成绩整理得如下频率分布直方图.根据此频率分布直方图,下列结论中不正确的是( )A.这50名学生中成绩在[80,100]内的人数占比为20%B.这50名学生中成绩在[60,80)内的有26人C.这50名学生成绩的中位数为70D.这50名学生的平均成绩x =68.2(同一组中的数据用该组区间的中点值做代表)答案 C 根据频率分布直方图,这50名学生中成绩在[80,100]内的频率为(0.012+0.008)×10=0.20,A 正确;这50名学生中成绩在[60,80)内的人数为(0.032+0.020)×10×50=26,B 正确;(0.008+0.020)×10=0.28<0.5,(0.008+0.020+0.032)×10=0.6>0.5,可得这50名学生成绩的中位数在(60,70)内,C 错误;平均数x =(45×0.008+55×0.020+65×0.032+75×0.020+85×0.012+95×0.008)×10=68.2,D 正确.故选C. 4.(2021南宁摸底,5)一组数据的平均数为m,方差为n,将这组数据的每个数都乘a(a>0)得到一组新数据,则下列说法正确的是( ) A.这组新数据的平均数为m B.这组新数据的平均数为a+m C.这组新数据的方差为an D.这组新数据的标准差为a √n答案 D 设原数据为x 1,x 2,…,x p ,共p 个,则平均数m=x 1+x 2+…+x pp ,方差n=1p [(x 1-m)2+(x 2-m)2+…+(x p -m)2], 对于选项A 、B,新数据的平均数为ax 1+ax 2+…+ax p p =a(x 1+x 2+…+x p )p=am,故A 、B 错误;对于选项C,新数据的方差为1p [(ax 1-am)2+(ax 2-am)2+…+(ax p -am)2]=a 2×1p ×[(x 1-m)2+(x 2-m)2+…+(x p -m)2]=a 2n,故C 错误; 对于选项D,新数据的标准差为√a 2n =a √n ,故D 正确.故选D.5.(2022届华大新高考联盟11月质量测评,7)“幸福感指数”是指某个人主观地评价自己对目前生活状态的满意程度的指标.常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.甲、乙两位同学分别随机抽取10位本地市民,调查他们的幸福感指数,甲得到10位市民的幸福感指数分别为6,7,7,7,8,8,8,9,10,10,乙得到10位市民的幸福感指数的平均数为8,方差为0.4,则这20位市民幸福感指数的方差为( )A.0.4B.0.8C.1D.2答案 C 设乙得到的10位市民的幸福感指数分别为x 1,x 2,…,x 10,甲得到的10位市民的幸福感指数分别为x 11,x 12,…,x 20,由题意可得x 1+x 2+…+x 10=8×10=80,x 11+x 12+…+x 20=80,所以这20位市民幸福感指数的和∑i=120x i =x 1+x 2+…+x 20=160,平均数x =120∑i=120x i =16020=8, 由题意知,乙得到10位市民的幸福感指数的方差为110∑i=110(x i -8)2=110(∑i=110x i 2-10×82)=0.4,又∑i=110x i =80,所以x 12+x 22+…+x 102=644.由题意得x 112+x 122+…+x 202=656,所以∑i=120x i 2=644+656=1300,所以这20位市民的幸福感指数的方差为120∑i=120(x i -8)2=120(∑i=120x i 2-20x 2)=120×(1300-20×82)=1,故选C.二、解答题6.(2022届四川绵阳中学质量检测二,17)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行评分,评分的频数分布表如下:区间 [50,60) [60,70) [70,80) [80,90) [90,100]女性用户2040 80 50 10男性用户4575906030(1)完成频率分布直方图,计算女性用户评分的平均值,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(2)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“评分良好用户”与性别有关?参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K 2≥k 0)0.10 0.050 0.010 0.001 k 02.7063.8416.63510.828解析 (1)对于女性用户,评分在[50,60)的频率为20200=0.1,评分在[60,70)的频率为40200=0.2,评分在[70,80)的频率为80200=0.4,评分在[80,90)的频率为50200=0.25,评分在[90,100]的频率为10200=0.05.对于男性用户,评分在[50,60)的频率为45300=0.15,评分在[60,70)的频率为75300=0.25,评分在[70,80)的频率为90300=0.3,评分在[80,90)的频率为60300=0.2,评分在[90,100]的频率为30300=0.1,所以女性用户和男性用户的频率分布直方图分别如图所示:女性用户评分的平均值为55×0.1+65×0.2+75×0.4+85×0.25+95×0.05=74.5.由图可得女性用户评分的波动小,男性用户评分的波动大. (2)根据打分的频数分布表得列联表如下:评分良好用户非评分良 好用户 合计女 140 60 200 男 180 120 300 合计320180500K 2=500×(140×120-60×180)2200×300×320×180≈5.2>2.706,故有90%的把握认为“评分良好用户”与性别有关.7.(2022届成都蓉城名校联盟联考一,18)书籍是精神世界的入口,阅读让精神世界闪光,阅读逐渐成为许多人的一种生活习惯,每年4月23日为世界读书日.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,估计这100位年轻人每天阅读时间的平均数x (单位:分钟,同一组数据用该组数据区间的中点值表示);(2)若年轻人每天阅读时间X 近似地服从正态分布N(μ,100),其中μ近似为样本平均数x ,求P(64<X ≤94); (3)为了进一步了解年轻人的阅读方式,研究机构采用分层抽样的方法从每天阅读时间位于分组[50,60),[60,70),[80,90)的年轻人中抽取10人,再从中任选3人进行调查,求抽到每天阅读时间位于[80,90)的人数ξ的分布列和数学期望. 参考数据:若X~N(μ,δ2),则①P(μ-δ<X≤μ+δ)≈0.6827;②P(μ-2δ<X≤μ+2δ)≈0.9545;③P(μ-3δ<X≤μ+3δ)≈0.9973. 解析 (1)根据频率分布直方图得x =(55×0.010+65×0.020+75×0.045+85×0.020+95×0.005)×10=74. (2)由题意知μ=74,δ=10,X~N(74,100),所以P(64<X ≤94)=P(μ-δ<X≤μ+2δ)≈0.6827+0.95452=0.8186.(3)由于每天阅读时间位于分组[50,60),[60,70)和[80,90)的频率之比为1∶2∶2,故抽取的10人中位于这三组的人数分别为2,4,4, 随机变量ξ的所有可能取值为0,1,2,3,P(ξ=0)=C 63C 103=16,P(ξ=1)=C 62C 41C 103=12,P(ξ=2)=C 61C 42C 103=310,P(ξ=3)=C 43C 103=130,ξ的分布列为:ξ 0123P16 12310 130∴E(ξ)=0×16+1×12+2×310+3×130=65.8.(2022届北京一六一中学开学考试,18)已知表1和表2是某年部分日期天安门广场升旗时刻表. 表1:某年部分日期的天安门广场升旗时刻表日期升旗时刻日期升旗时刻1月1日7:367月9日4:531月21日7:317月27日5:072月10日7:148月14日5:243月2日6:479月2日5:423月22日6:169月20日5:594月9日5:4610月8日6:174月28日5:1910月26日6:365月16日4:5911月13日6:566月3日4:4712月1日7:166月22日4:4612月20日7:31表2:某年2月部分日期的天安门广场升旗时刻表日期升旗时刻日期升旗时刻日期升旗时刻2月1日7:232月11日7:132月21日6:59 2月3日7:222月13日7:112月23日6:57 2月5日7:202月15日7:082月25日6:552月7日 7:17 2月17日 7:05 2月27日6:522月9日7:15 2月19日 7:02 2月28日6:49(1)从表1的日期中随机选出一天,试估计这一天的升旗时刻早于7:00的概率;(2)甲,乙两人各自从表2的日期中随机选择一天观看升旗,且两人的选择相互独立.记X 为这两个人中观看升旗的时刻早于7:00的人数,求X 的分布列和数学期望E(X); (3)将表1和表2中的升旗时刻化为分数后作为样本数据(如7:31化为73160).记表2中所有升旗时刻对应数据的方差为s 2,表1和表2中所有升旗时刻对应数据的方差为s *2,判断s 2与s *2的大小.(只需写出结论)解析 (1)记事件A 为“从表1的日期中随机选出一天,这一天的升旗时刻早于7:00”,在表1的20个日期中,有15个日期的升旗时刻早于7:00,所以P(A)=1520=34.(2)X 的可能取值为0,1,2.记事件B 为“从表2的日期中随机选出一天,这天的升旗时刻早于7:00”,则P(B)=515=13,P(B )=1-P(B)=1-13=23.所以P(X=0)=P(B )·P(B )=23×23=49,P(X=1)=C 21×13×23=49, P(X=2)=P(B)·P(B)=13×13=19.所以X 的分布列为X 0 1 2P49 49 19E(X)=0×49+1×49+2×19=23.(3)s 2<s *2.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章统计与概率
第1讲抽样方法与总体分布的估计
一、选择题
1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ).
A.总体 B.个体是每一个零件
C.总体的一个样本 D.样本容量
解析200个零件的长度是总体的一个样本.
答案 C
2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).
A.
1
100
B.
1
25
C.
1
5
D.
1
4
解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽
到的概率都是n
N
=
1
5
.
答案 C
3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).
A. 6
5
B.
6
5
C. 2 D.2
解析由题可知样本的平均值为1,所以a+0+1+2+3
5
=1,解得a=-1,所
以样本的方差为1
5
[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案 D
4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则().
A .甲的成绩的平均数小于乙的成绩的平均数
B .甲的成绩的中位数等于乙的成绩的中位数
C .甲的成绩的方差小于乙的成绩的方差
D .甲的成绩的极差小于乙的成绩的极差
解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,1
5×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=12
5,C 对;甲、乙的成绩的极差均为4,D 错. 答案 C
5.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ). A .5,10,15,20,25
B .2,4,8,16,32
C .1,2,3,4,5
D .7,17,27,37,47
解析 利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D. 答案 D
6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ). A .57.2,3.6 B .57.2,56.4 C .62.8,63.6 D .62.8,3.6 解析 平均数增加,方差不变. 答案 D 二、填空题
7.体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的抽样方法是________.
解析系统抽样的步骤可概括为:总体编号,确定间隔,总体分段,在第一段内确定起始个体编号,每段内规则取样等几步.该抽样符合系统抽样的特点.答案系统抽样
8.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.
解析低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800.
答案800
9.沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________.
解析由
n
600+500+550
=
11
550,得n=33(人).
答案33
10.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是
__________________________________________________________________.
解析 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=9
20,所以成绩
在[16,18]的学生人数为120×9
20=54. 答案 54 三、解答题
11.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取
n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.
当样本容量是n 时,由题意知,系统抽样的间隔为36
n
,分层抽样的比例是
n 36
,
抽取的工程师人数为
n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n
36
×18
=n
2,所以n 应是6的倍数,36的约数,即n =6,12,18.
当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35
n +1
必须是整数,所以n 只能取6.即样本容量n =6.
12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
解 (1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为2
0.08=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.
13.汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO 2
排放量超过130 g/km 的MI 型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI 型品牌的新车各抽取了5辆进行CO 2排放量检测,记录如下(单位:g/km):
2乙(1)求甲类品牌汽车的排放量的平均值及方差;
(2)若乙类品牌汽车比甲类品牌汽车CO 2的排放量稳定性好,求x 的取值范围. 解 (1)甲类品牌汽车的CO 2排放量的平均值x 甲=80+110+120+140+1505=
120(g/km),
甲类品牌汽车的CO 2排放量的方差
s 2
甲=(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)25
=600.
(2)由题意知乙类品牌汽车的CO2排放量的平均值x乙=100+120+x+y+160
5
=120(g/km),得x+y=220,故y=220-x,所以乙类品牌汽车的CO2排放量的方差
s2乙=(100-120)2+(120-120)2+(x-120)2+(220-x-120)2+(160-120)2
5,
因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s2
乙<s2
甲
,解得
90<x<130.
14.已知某单位有50名职工,现要从中抽取10名
职工,将全体职工随机按1~50编号,并按编号顺序
平均分成10组,按各组内抽取的编号依次增加5进行
系统抽样.
(1)若第5组抽出的号码为22,写出所有被抽出职工
(2)的号码;
(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图
所示,求该样本的方差;
(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73
公斤)的职工,求体重为76公斤的职工被抽取到的概率.
解(1)由题意,第5组抽出的号码为22.
因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.
(2)因为10名职工的平均体重为
x=1
10(81+70+73+76+78+79+62+65+67+59)=71,
所以样本方差为:s2=1
10(10
2+12+22+52+72+82+92+62+42+122)=52.
(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).
记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.
4 10=2 5.
故所求概率为P(A)=
高考资源网( ) 您身边的高考专家
高考资源网版权所有,侵权必究!
(上海,甘肃,内蒙,新疆,陕西,山东,湖北)七地区试卷投稿QQ 2355394501。