高考数学复习与策略专题7 用样本估计总体

合集下载

用样本的数字特征估计总体-高考数学复习

用样本的数字特征估计总体-高考数学复习

1. (多选)如图是某班50名学生期中考试数学成绩的频率分布直方
图,其中成绩分组区间是[40,50),
[50,60),[60,70),[70,80),
[80,90),[90,100],则下列说
法正确的是(

A. 图中的 x 的值为0.018
B. 该班50 名学生期中考试数学成绩的众数是75
C. 该班50 名学生期中考试数学成绩的中位数是72
目录
1
C O N T E N T S
2
3
知识 逐点夯实
考点 分类突破
课时 跟踪检测
PART
1
知识 逐点夯实
课前自修
必备知识 系统梳理 基础重落实
目录
高中总复习·数学
1. 总体百分位数的估计
(1)百分位数
定义
意义
百 一组数据的第 p 百分位数是这样一个值,
分 它使得这组数据中 至少
有 p %的数据小
为 ,第二层抽取 n 个,即 y 1, y 2,…, yn ,平均数为 ,则


x 1, x 2,…, xm , y 1, y 2,…, yn 的平均数 =




.


(2)中位数:将一组数据按大小依次排列,处于
最中间 位置

的一个数据(或最中间两个数据的平均数)叫做这组数据的
目录
高中总复习·数学
2. 平均数、方差的公式推广
若数据 x 1 , x 2 ,…, x n 的平均数为 ത ,方差为 s 2 ,那么 mx 1 +
a , mx 2 + a , mx 3 + a ,…, mx n + a 的平均数是 m ത + a ,方

人教版高中数学高考一轮复习--用样本估计总体(课件)

人教版高中数学高考一轮复习--用样本估计总体(课件)
2.在实际问题中,总体平均数、总体方差和总体标准差都是未知的,一般用
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2

高三总复习用样本估计总体教师版

高三总复习用样本估计总体教师版
∴频率为0.52.答案:C
5.甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:
由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是()
A.0.350.25 8.1B.0.350.258.8
C.0.250.358.1D.0.250.358.8
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.用茎叶图刻画数据的两个优点,
(1)所有数据都可以从数据中得到;
(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较大时,茎叶图的效果就不是很好了.
甲的平均数为: ,即 。
方差为:

乙的平均数:
乙的方差为:
[探究四]综合问题
例4:对某校高一年级学生参加社区服务次数进行统计,随机抽取 名学生作为样本,得到这 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:
分组
频数
频率
10
0.25
25
2
0.05
合计
M
1
⑴求出表中 、 及图中 的值;
0.6 3.7 2.2 1.5 2.8
1.7 1.2 2.1 3.2 1.0
(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);
(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);

用样本估计总体知识讲解

用样本估计总体知识讲解

用样本估计总体【学习目标】1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.5.会用样本的基本数字特征估计总体的基本数字特征.【要点梳理】要点一、频率分布的概念频率分布是指一个样本数据在各个小X围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值与最小值的差,即求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.要点二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.要点诠释:总体密度曲线能够精确地反映了总体在各个X围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.要点三、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.要点诠释:茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.要点四、众数、中位数与平均数1.众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.2.中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.3.平均数样本数据的算术平均数,即121()n x x x x n=+++.要点诠释:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.要点五、标准差与方差 1.标准差样本数据1,2,,n x x x 的标准差的算法:(1)算出样本数据的平均数x .(2)算出每个样本数据与样本数据平均数的差:()12i x x i n -=, ,, (3)算出(2)中()12i x x i n -=, ,,的平方. (4)算出(3)中n 个平方数的平均数,即为样本方差. (5)算出(4)中平均数的算术平方根,,即为样本标准差. 其计算公式为:(n s x =+-2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:2222121[()()()]n s x x x x x x n=-+-++-要点诠释:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差. 数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.【典型例题】类型一:频率分布表、频率分布直方图例1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【答案】(1)60 (2)四组18(3)六组【解析】(1)依题意知第三组的频率为41 2346415=+++++.∵第三组的频数为12,∴本次活动的参评作品数为126015=件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有66018 234641⨯=+++++(件).(3)第四组的获奖率是105 189=,第六组上交的作品数量为1603234641⨯=+++++(件),∴第六组的获奖率为26 39 =.显然第六组的获奖率较高.【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.举一反三:【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.例2.阅高考试卷有一个环节叫“试批”.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:分):135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在100~120分之间的比例;(4)设该省有20万考生,估计该省考生数学成绩不与格的人数(满分150分,90分与以上视为与格);(5)根据折线图估计该省考生的数学成绩在哪一个分数段的人数将会最多.【思路点拨】理解频率分布直方图的具体含义.【解析】100个数据中,最大值为135,最小值为80,极差为135-80=55.把100个数据分成11组,这时组距55511===极差组数.(1)频率分布表如下:分组频数频率频率组距[80,85) 1 0.01 0.002[85,90) 2 0.02 0.004[90,95) 4 0.04 0.008[95,100)14 0.14 0.028[100,105)24 0.24 0.048[105,110)15 0.15 0.030[110,115)12 0.12 0.024[115,120)9 0.09 0.018[120,125)11 0.11 0.022[125,130) 6 0.06 0.012[130,135] 2 0.02 0.004 合计100 1 0.2注:表中加上“频率组距”一列,这是为画频率直方图准备的,因为它是频率直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图与折线图,见下图.(3)从频率分布表中可知,这100名考生的数学成绩在100~120分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在100~120分之间的比例为60%(0.60=60%).(4)100名考生中,数学成绩不与格的频率为0.01+0.02=0.03.比例为3%.200000×3%=6 000(人).估计该省考生数学成绩不与格的有6000人.(5)折线图的最高点位于100~105之间,据此估计该省考生的数学成绩在100~105分这个分数段的人数将会最多.【总结升华】本例中,决定分点时,直接使用了最小值加组距,即80+5k(k=1,2,…,11),而没有把最小值减去某一个数(例如80-0.5=79.5)作为第1个分点,这是因为100个分数是明确的,即它们都在80~135之间.凡事都要具体问题具体分析,不可教条化.本例是把5分看成一个分数段,统计各段的情况.举一反三:【变式1】一个容量为20的样本,分组后,组距与频数如下[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()A.120B.14C.12D.710【答案】 D【解析】根据频率的计算公式频率=频数样本容量求解.频率2345147 2345422010+++===+++++.【变式2】对某电子元件进行寿命追踪调查,情况如下:寿命/h 100~200 200~300 300~400 400~500 500~600个数20 30 80 40 30 (1)列出频率分布表;(2)画出频率分布直方图;(3)估计该电子元件寿命在100~400 h以内的占总体的比例;(4)估计该电子元件寿命在400 h以上的在总体中占的比例.【解析】(1)样本频率分布表如下:寿命/h 频数频率100~200 20 0.10200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布直方图如下图所示;(3)估计该电子元件寿命在100~400 h以内占总体的比例为65%;(4)估计该电子元件寿命在400 h以上的在总体中占的比例为35%.类型二:众数、中位数、平均数(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.【思路点拨】理解平均数、中位数、众数的概念. 【答案】(1)2091 1500 1500 (2)3288 (3)中位数和众数 【解析】 (1)平均数是40003500200021500100055003020150033x ++⨯++⨯+⨯+⨯=+150********≈+=(元), 中位数是1500元,众数是1500元. (2)平均数是2850018500200021500100055003020'150015001788328833x ++⨯++⨯+⨯+⨯=+≈+=(元),中位数是1500元,众数是1500元.(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.【总结升华】(1)深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,结合实际情况,灵活运用.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各数据的重心. 举一反三:【变式1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12. (1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. 【答案】 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++又因为频率=第二小组频数样本容量所以 121500.08===第二小组频数样本容量第二小组频率(2)由图可估计该学校高一学生的达标率约为171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.类型三:方差、标准差已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.【解析】 (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)21251013146s =+++++甲[2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2]=150(2×900+5×400+10×100+13×0+14×100+6×400)=172, 2150s =乙(4×900+4×400+16-100+2×0+12×100+12×400)=256. ∴22s s <乙甲,∴甲组成绩较乙组成绩稳定,故甲组成绩好些.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),∴乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好【总结升华】 要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.举一反三: 【变式1】甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm) 甲机床:10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm ,从计算的结果来看哪台机床加工这种零件较合适? 【解析】101001011.101.102.10101=⨯=++=)(甲 x ,1010101104.103.10101=⨯=+++=)(乙 x .∴[]2222101.10101.10102.10101)()()(甲-+-+-= s =0.032mm []22221010104.10103.10101)()()(乙-+-+-= s =0.062mm . ∴2甲s <2乙s∴用甲机床比乙机床稳定,即用甲机床加工较合适. 类型四:茎叶图例5.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下: 甲:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙:83,86,93,99,88,103,98,114,98,79,78,106,101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据. 【答案】乙同学的成绩比较稳定【解析】 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好. 举一反三:【变式1】在某高中篮球联赛中,甲、乙两名运动员的得分如下:甲:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54; 乙:6,15,17,18,21,27,28,33,35,38,40,44,56. (1)用茎叶图表示上面的样本数据,并求出样本数据的中位数;(2)根据(1)中所求的数据分析甲、乙两名运动员中哪一位发挥得更加稳定. 【解析】(1)茎叶图如图所示.甲运动员的中位数是37,乙运动员的中位数是28.(2)从茎叶图上可以看出甲运动员的得分大致对称,中位数是37,乙运动员的得分也大致对称,中位数是28,因此,甲运动员发挥得比较稳定,总体得分比乙运动员高.【变式2】随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图. (1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.【答案】(1)乙班(2)57 【解析】(1)由茎叶图可知:甲班身高集中于160179之间, 而乙班身高集中于170180之间. 因此乙班平均身高高于甲班; (2) 15816216316816817017117917918217010+++++++++==x甲班的样本方差为:()()()()()()()()()()222222222211581701621701631701681701681701017017017117017917017917018217057[-+-+-+-+-+-+-+-+-+-]=。

高考数学 用样本估计总体 专题

高考数学  用样本估计总体  专题

高考数学用样本估计总体专题课下练兵场命题报告难度及题号知识点容易题(题号)中等题(题号)稍难题(题号)用样本的频率分布估计总体的频率分布1、3、4812茎叶图的应用2、911用样本的数字特征估计总体的数字特征56、7、10一、选择题1.一个容量为20的样本数据,分组后,组别与频数如下:组别(10,20](20,30](30,40](40,50](50,60](60,70]频数23454 2 则样本在(20,50]上的频率为() A.12%B.40% C.60% D.70%解析:本题考查样本的频率运算.据表知样本分布在(20,50]的频数3+4+5=12,故其频率为1220=0.6.答案:C2.甲、乙两名同学在五次《数学基本能力》测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是X甲、X乙,则下列结论正确的是()A.X甲>X乙,甲比乙成绩稳定B.X甲>X乙,乙比甲成绩稳定C.X甲<X乙,甲比乙成绩稳定D.X甲<X乙,乙比甲成绩稳定解析:由茎叶图知识,可知道甲的成绩为68、69、70、71、72,平均成绩为70;乙的成绩为63、68、69、69、71,平均成绩为68;再比较标准差:甲的标准差为15[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,乙的标准差为15[(63-68)2+(68-68)2+(69-68)2+(69-68)2+(71-68)2]=655>2,故甲比乙的成绩稳定.答案:A3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析:面积为频率,在[50,60)的频率为0.3,所以大约有200×0.3=60辆.答案:C4.(2009·福建高考)一个容量为100的样本,其数据的分组与各组的频数如下:组别频数(0,10]12(10,20]13(20,30]24(30,40]15(40,50]16(50,60]13(60,70]7则样本数据落在(10,40]()A.0.13 B.0.39 C.0.52 D.0.64解析:由列表知样本数据落在(10,40]上的频数为52,∴频率为0.52.5.甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是() A.0.350.258.1 B.0.350.258.8C.0.250.358.1 D.0.250.358.8解析:乙击中8环的概率为1-0.2-0.2-0.35=0.25;甲击中10环的概率为1-0.2-0.15-0.3=0.35;甲击中环数的平均值为7×0.2+8×0.15+9×0.3+10×0.35=8.8.答案:D6.(2009·四川高考)设矩形的长为a,宽为b,其比满足b:a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是() A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:x甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613,∴x甲与0.618更接近.二、填空题7.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是____________.解析:这10个数的中位数为a+b2=10.5.这10个数的平均数为10.要使总体方差最小,即(a-10)2+(b-10)2最小.又∵(a-10)2+(b-10)2=(21-b-10)2+(b-10)2=(11-b)2+(b-10)2=2b2-42b+221,∴当b=10.5时,(a-10)2+(b-10)2取得最小值.又∵a+b=21,∴a=10.5,b=10.5.答案:10.5,10.58.某地教育部门为了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图).则这10 000人中数学成绩在段的约是________人.解析:本题考查了频率直方图的一些知识,由图在的频率为0.008×10,所以在10 000人中成绩在的学生有10 000×0.008×10=800人.答案:8009.(2010·珠海模拟)如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.解析:从茎叶图上可得甲得分:8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙得分:8,12,14,17,18,19,21,27,28,29,平均值为19.3,∴平均得分高的运动员是甲. 答案:甲 三、解答题10.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位 mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1) x 甲=99+100+98+100+100+1036=100 mm ,x 乙=99+100+102+99+100+1006=100 mm , 甲2S =16=73 mm 2. 2乙S =16=1 mm 2.(2)因为甲2S >甲2S ,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.11.甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5项预赛成绩记录如下:甲 82 82 79 95 87 乙9575809085(1)用茎叶图表示这两组数据;(2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(3)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由. 解:(1)作出茎叶图如下:(2)记甲被抽到的成绩为x ,乙被抽到的成绩为y ,用数对(x ,y )表示基本事件: (82,95) (82,75) (82,80) (82,90) (82,85) (82,95) (82,75) (82,80) (82,90) (82,85) (79,95) (79,75) (79,80) (79,90) (79,85) (95,95) (95,75) (95,80) (95,90) (95,85) (87,95) (87,75) (87,80) (87,90) (87,85) 基本事件总数n =25.记“甲的成绩比乙高”为事件A ,事件A 包含的基本事件: (82,75) (82,80) (82,75) (82,80) (79,75) (95,75) (95,80) (95,90) (95,85) (87,85) (87,75) (87, 80) 事件A 包含的基本事件数是m =12. 所以P (A )=m n =1225.(3)派甲参赛比较合适.理由如下: x甲=85,x 乙=85,2甲S =31.6,2乙S =50.∵x甲=x 乙,2甲S <2乙S ,∴甲的成绩较稳定,派甲参赛比较合适.12.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8. (1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图; (3)估计成绩在[60,90)分的学生比例;(4)估计成绩在85分以下的学生比例.解:(1)频率分布表如下:成绩分组频数频率频率/组距[40,50)20.040.004[50,60)30.060.006[60,70)100.20.02[70,80)150.30.03[80,90)120.240.024[90,100)80.160.016合计5010.1 (2)频率分布直方图和折线图为:(3)所求的学生比例为0.2+0.3+0.24=0.74=74%.(4)所求的学生比例为1-(0.12+0.16)=1-0.28=0.72=72%.。

用样本估计整体的基本步骤

用样本估计整体的基本步骤

用样本估计整体的基本步骤
用样本估计整体的基本步骤通常包括以下几个部分:
1.确定研究目标和总体:首先确定你想要估计的总体,即你
希望得到关于整体特征的估计值。

2.定义样本和抽样方法:确定你将要使用的样本大小和抽样
方法。

样本应该以代表性的方式从总体中选择,以确保估计的结果具有统计学上的可靠性。

3.收集数据:采用所选择的抽样方法从总体中抽取样本,并
收集样本数据。

确保采样过程是随机的,以避免样本选择上的偏差。

4.数据整理和分析:对收集到的样本数据进行整理和分析。

这包括描述性统计分析、计算样本统计量等。

5.估计总体参数:根据样本数据,计算出所需的总体参数的
估计值。

例如,估计总体均值、总体比例等。

这通常涉及到对样本统计量的计算和推断。

6.确定估计的精度和置信水平:评估估计结果的精度和可靠
性。

这可以通过计算估计值的置信区间来完成,确定估计结果所在的范围。

7.结果解释和推断:将估计结果解释给目标受众。

解释估计
结果的含义、置信水平以及可能的限制。

8.结论和报告:根据估计结果,得出结论并撰写报告。

将报
告中包含所采用的方法、数据分析流程、估计结果和相关
的解释。

在用样本估计整体时,确保使用恰当的统计方法和技术,并遵循相关的统计学原则和假设。

此外,维护数据的质量和准确性也是十分重要的,以确保估计结果的可靠性和有效性。

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。

高考数学科学复习创新方案:用样本估计总体

高考数学科学复习创新方案:用样本估计总体

用样本估计总体[课程标准]1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.会计算样本均值和样本方差,结合具体实例,掌握分层随机抽样的样本均值和样本方差.4.能用样本估计总体的取值规律.5.能用样本估计百分位数,理解百分位数的统计含义.1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的06中点,就得到频率分布折线图.3.不同统计图的特点及适用类型(1)不同的统计图在表示数据上的特点扇形图主要用于直观描述各类数据占总数的07比例,条形图和直方图主要用于直观描述不同类别或分组数据的08频数和09频率,折线图主要用于描述数据随10时间的变化趋势.(2)不同的统计图适用的数据类型条形图适用于描述11离散型的数据,直方图适用于描述12连续型的数据.4.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据13小于或等于这个值,且至少有(100-p)%的数据14大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按15从小到大排列原始数据.第2步,计算i=16n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第17j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的18平均数.5.总体集中趋势的估计(1)平均数、中位数和众数等都是刻画“19中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.(2)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用20平均数、21中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用22众数.6.频率分布直方图中平均数、中位数、众数的求法(1)样本平均数:可以用每个小矩形底边中点的23横坐标与小矩形面积的乘积之和近似代替.(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该24相等.(3)将最高小矩形所在的区间25中点的横坐标作为众数的估计值.7.方差、标准差(1)假设一组数据为x 1,x 2,…,x n ,则①平均数x -=x 1+x 2+…+x n n,②方差s 2=261n ∑n i =1__(x i -x -)2,③标准差s =271n ∑n i =1(x i -x -)2.(2)如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为Y -,则称S 2=1N ∑N i =1(Y i -Y -)2为总体方差,S =S 2为总体标准差.如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i =1,2,…,k ),则总体方差为S 2=1N ∑k i =1f i (Y i -Y -)2.(3)如果一个样本中个体的变量值分别为y 1,y 2,…,y n ,样本平均数为y -,则称s 2=1n ∑n i =1(y i -y -)2为样本方差,s =s 2为样本标准差.(4)标准差刻画了数据的离散程度或波动幅度,标准差28越大,数据的离散程度越大;标准差29越小,数据的离散程度越小.(5)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w -,样本方差为s 2.以分两层抽样的情况为例,假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 21;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为s 22.则x -=1m ∑m i =1x i ,s 21=1m ∑m i =1(x i -x -)2,y -=1n ∑n i =1y i ,s 22=1n∑n i =1(y i -y -)2.则①w -=30m m +n x -+n m +n y -,②s 2=311m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}=321m +n (ms 21+ns 22)+mn m +n (x --y -)2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则:①数据x 1+a ,x2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是()A .样本x 1,x 2,…,x n 的标准差B .样本x 1,x 2,…,x n 的中位数C .样本x 1,x 2,…,x n 的极差D .样本x 1,x 2,…,x n 的平均数答案AC 解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.2.(多选)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B.这组数据的平均数为3 C.这组数据的中位数为4 D.这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A正确;平均数为1+3×2+5×36=113,B错误;中位数为3+52=4,C正确;众数为5,D错误.3.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.10答案C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案D解析由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.5.(人教B必修第二册5.1.2练习A T2改编)90,92,92,93,93,94,95,96,99,100的75%分位数为________,80%分位数为________.答案9697.5解析10×75%=7.5,10×80%=8,所以75%分位数为x8=96,80%分位数为x8+x9 2=96+992=97.5.多角度探究突破角度扇形图例1(多选)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案BCD解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选BCD.角度折线图例2(2023·乌鲁木齐二模)如图为2012~2022年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是()A.2012~2022年电子信息制造业企业利润总额逐年递增B.2017~2022年工业企业利润总额逐年递增C.2012~2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速D.2019~2022年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值答案C解析对于A,由折线图可知,2018年电子信息制造业企业利润总额增速为负值,利润总额较上一年下降,A错误;对于B,由折线图可知,2019年工业企业利润总额增速为负值,利润总额较上一年下降,B错误;对于C,2012~2017年电子信息制造业企业利润总额增速为正,利润总额较上一年增长,且其增速大于当年工业企业利润总额增速,C正确;对于D,2019~2022年中,工业企业利润总额增速都小于电子信息制造业企业利润总额增速,则这几年中工业企业利润总额增速的均值小于电子信息制造业企业利润总额增速的均值,D错误.故选C.角度频率分布直方图例3(1)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18答案B=50,所以第三组的人数为解析志愿者的总人数为20(0.24+0.16)×150×0.36=18,有疗效的人数为18-6=12.故选B.(2)(多选)(2024·菏泽东明县开学考试)某小区为了让居民了解更多垃圾分类的知识,对500名小区居民进行了培训,并进行了培训结果测试,从中随机抽取50名居民的成绩(单位:分),按照[50,60),[60,70),…,[90,100]分成5组,并制成了如图所示的频率分布直方图,则下列结论正确的是()A.所抽取的50名居民成绩的平均数约为74B.所抽取的50名居民成绩的中位数约为75C.50名居民成绩的众数约为85D.参加培训的居民中约有100人的成绩不低于85分答案AD解析因为频率和为1,可得0.1+0.3+0.3+10x+0.1=1,所以m=0.02,所抽取的50名居民成绩的平均数约为55×0.1+65×0.3+75×0.3+85×0.2+95×0.1=74,故A正确;设中位数为x,因为0.1+0.3<0.5,0.1+0.3+0.3>0.5,所以x∈(70,80),所以0.1+0.3+0.03(x-70)=0.5,所以x=70+103≠75,故B错误;50名居民成绩的众数无法由频率分布直方图判断出来,故C错误;成绩不低于85分的频率为0.2×0.5+0.1=0.2,参加培训的居民中成绩不低于85分的约有0.2×500=100人,故D正确.故选AD.常见统计图的特点(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(多选)(2023·太原模拟)十项全能是田径运动中全能项目的一种,是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是()A.在400米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大答案BD解析对于A,由雷达图可知,400米跑项目中,甲的得分比乙的得分高,A 错误;对于B,由雷达图可知,在跳高和标枪项目中,甲、乙水平相当,B正确;对于C,甲的各项得分的波动较大,乙的各项得分均在(600,800]内,波动较小,C错误;对于D,甲的各项得分的极差约为1000-470=530,乙的各项得分的极差小于200,D正确.故选BD.2.(多选)(2023·济南三模)某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知无人机社团和数学建模社团的人数相等,则下列说法正确的是()A.高一年级学生人数为120B.无人机社团的人数为17C.若按比例分层随机抽样从各社团选派20人,则无人机社团选派的人数为3D.若甲、乙、丙三人报名参加社团,则共有60种不同的报名方法答案AC解析由题中所给的数据可知,民族舞社团的人数为12,占高一年级学生人数的比例为10%,所以高一年级学生人数为12÷10%=120,英文剧场社团的人数为120×35%=42,辩论社团的人数为30,无人机社团的人数=数学建模社团的人数=(120-42-30-12)÷2=18,占高一年级学生人数的比例是18×100%=15%,120A正确,B错误;按比例分层随机抽样20人,无人机社团应派出20×15%=3人,C正确;甲、乙、丙三人报名参加社团,每人有5种选法,共有53=125种不同的报名方法,D错误.故选AC.多角度探究突破角度总体百分位数的估计例4(1)一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15B.25C.50D.75答案A解析将该组数据由小到大排列的结果为6,7,15,36,39,40,41,42,43,47,49,一共11个数,由11×25%=2.75,11×50%=5.5,11×75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.故选A.(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分位数是________(结果保留两位小数).答案124.44解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为70%+0.0225×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.由120+0.80-0.70≈124.44,故此班的模拟考试成绩的80%分位数约为124.44.0.0225角度比例分配的分层随机抽样的均值与方差例5(多选)(2023·大连二十四中模拟)大连市教育局为了解二十四中学、第八中学、育明中学三所学校的学生文学经典名著的年阅读量,采用比例分配的分层随机抽样方法抽取了一个容量为120的样本.其中,从二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21.据此估计,三所学校的学生文学经典名著的年阅读量的()A.均值为6.3B.均值为6.5C.方差为17.52D.方差为18.25答案BD解析设二十四中学、第八中学、育明中学三组数据中每个人的数据分别为x i(i=1,2,3,…,35),y i(i=1,2,3,…,40),z i(i=1,2,3,…,45),均值===6.5,方差=+=++==1×[(9+2.52)×35+(15+0.52)×40+(21+1201.52)×45]=18.25.故选BD.角度均值方差的应用例6(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i,y i(i=1,2,…,10).试验结果如下:试验序号i12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i=x i-y i(i=1,2,…,10),z1,z2,…,z10的样本平均数为z-,样本方差为s2.(1)求z-,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z-≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x-=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y-=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z-=x--y-=552.3-541.3=11,z i=x i-y i的值分别为9,6,8,-8,15,11,19,18,20,12,故s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z-=11,2s210=26.1=24.4,故有z-≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.1.频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b].(2)确定小于a和小于b的数据所占的百分比分别为f a%,f b%,则第p百分位数为a+p%-f a%f b%-f a%×(b-a).2.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n [(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.1.(2023·合肥模拟)若一组样本数据x1,x2,…,x n的平均数为10,另一组样本数据2x1+4,2x2+4,…,2x n+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为()A.17,54B.17,48C.15,54D.15,48答案A解析由题意可知,数据x1,x2,…,x n的平均数为10,则=10,则=10n,所以数据2x1+4,2x2+4,…,2x n+4的平均数为=1n错误!(2x i+4)=2n错误!i +4=2×10+4=24,方差为s′2=1n错误!(2x i+4)-(2x-+4)]2=4n错误!(x i-10)2=4n错误!2i-4n×n×102=-400=8,所以=102n,将两组数据合并后,新数据x1,x2,…,x n,2x1+4,2x2+4,…,2x n+4的平均数为==12错误!=1×(3×10+4)=17,方差为s″2==21(5×102n-860n+458n)=54.故选A.2n2.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________(填“众数”“中位数”或“平均数”).答案中位数解析因为7位获奖者的分数肯定是13名参赛选手中较高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.3.(2024·西安开学考试)某校开展了航天知识竞赛活动,竞赛分为初赛和复赛两个阶段.全校共有1000名学生参加,将他们的初赛成绩(成绩都在[50,100]内)分为[50,60),[60,70),[70,80),[80,90),[90,100]5组,得到如图所示的频率分布直方图.(1)求a的值,并估计全校学生初赛成绩的平均数(同一组中的数据以这组数据的中间值作为代表);(2)若规定初赛成绩前20%的学生进入复赛,试估计进入复赛的分数线n.解(1)由(0.010+0.020+a+0.030+0.005)×10=1,解得a=0.035,所以全校学生初赛成绩的平均数估计为55×0.1+65×0.2+75×0.35+85×0.3+95×0.05=75.(2)由频率分布直方图可知,成绩在[80,100]内的频率为0.35>0.2,成绩在[90,100]内的频率为0.05<0.2,则分数线n 位于区间[80,90)内,故n =90-0.2-0.050.3×10=85.课时作业一、单项选择题1.(2024·吕梁开学考试)一组数据按从小到大的顺序排列为1,3,5,6,m ,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是()A .7.5B .8C .9D .9.5答案C解析这组数据一共8个数,中位数是6+m 2,极差为13-1=12,所以6+m2=12×58,解得m =9,又8×60%=4.8,则该组数据的第60百分位数是第5个数据9.故选C.2.已知数据x 1,x 2,x 3,x 4,x 5,x 6的平均数是5,方差是9,则x 21+x 22+x 23+x 24+x 25+x 26=()A .159B .204C .231D .636答案B解析根据题意,数据x 1,x 2,x 3,x 4,x 5,x 6的平均数x -=5,方差s 2=9,则s 2=16(x 21+x 22+x 23+x 24+x 25+x 26)-x -2=9,变形可得x 21+x 22+x 23+x 24+x 25+x 26=204.故选B.3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均可能受影响.故选A.4.(2023·滨州二模)某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中的数据用该组区间中点值近似代替)()A.x3<x1<x2B.x2<x1<x3C.x1<x3<x2D.x1<x2<x3答案A=2.5,即x1=2.5,平均数x2=解析由频率分布直方图可知,众数为2+320.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,所以x3<x1<x2.故选A.5.(2023·商洛模拟)如图为国家统计局于2023年1月20日发布的2016~2022年全国R&D经费总量与R&D经费与GDP之比的数据图表,则()A.R&D经费总量的平均数超过23000亿元B.R&D经费总量的中位数为19678亿元C.R&D经费与GDP之比的极差为0.45%D.R&D经费与GDP之比增幅最大的是2021年到2022年答案C解析对于A,R&D经费总量的平均数为1×(15677+17606+19678+221447+24393+27956+30870)≈22617.7,所以A错误;对于B,R&D经费总量的中位数为22144亿元,所以B错误;对于C,R&D经费与GDP之比的极差为2.55%-2.10%=0.45%,所以C正确;对于D,R&D经费与GDP之比增幅最大的是2019年到2020年,所以D错误.故选C.6.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B=72.5%>70%,故A 解析讲座前问卷答题的正确率的中位数为70%+75%2错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D错误.故选B.7.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下列叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D解析由图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确;平均最高气温高于20℃的月份为六月、七月、八月,只有3个,D错误.8.(2024·重庆南岸模拟)已知某人收集了一个样本量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为X-,方差为s2,则()A.X-<70,s2>75B.X->70,s2<75C.X-=70,s2>75D.X-=70,s2<75答案D解析因为80+70=60+90,因此平均数不变,即X-=70,设其他48个数据依次为a1,a2,…,a48,因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,所以50(s2-75)=100-400-100=-400<0,所以s2<75.故选D.二、多项选择题9.(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案BD解析对于A,设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则n-m=x1+x2+x3+x4+x5+x66-x2+x3+x4+x54=2(x1+x6)-(x2+x3+x4+x5)12,因为没有确定2(x1+x6),x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,例如1,2,3,4,5,6,可得m=n=3.5,又如1,1,1,1,1,7,可得m=1,n=2,再如1,2,2,2,2,2,可得m=2,n=116,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42,故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如2,4,6,8,10,12,则平均数n=16×(2+4+6+8+10+12)=7,标准差s1=16×[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=1053,而4,6,8,10的平均数m=14×(4+6+8+10)=7,标准差s2=14×[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=5,显然1053>5,即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.10.某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.这组数据的极差为50B.这组数据的众数约为76C.这组数据的中位数约为5407D.这组数据的第75百分位数约为85答案CD解析由频率分布直方图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;这组数据的众数约为12×(70+80)=75,故B错误;因为(0.005+0.02)×10=0.25<0.5,0.25+0.035×10=0.6>0.5,所以中位数位于[70,80)之间,设中位数为x,则0.25+(x-70)×0.035=0.5,解得x=540,即7,故C正确;0.6+0.03×10=0.9>0.75,故第75百分位这组数据的中位数约为5407=85,故D正确.故选CD.数约为80+0.75-0.60.0311.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0时,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体均值为2时,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题12.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数?甲:________,乙:________,丙:________.答案众数平均数中位数解析甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数=8;据8出现的次数最多;乙:该组数据的平均数x-=4+6×3+8+9+12+138=8.丙:该组数据的中位数是7+9213.某校组织学生参与航天知识竞答活动,某班8位同学的成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).答案7或8或9或10(填上述四个数中任意一个均可)解析7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m这组数据的第25百分位数为7,而8×0.25=2,所以7为从小到大排列后第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.14.(2024·邯郸一中期末)土壤修复是使遭受污染的土壤恢复正常功能的技术受到不同程度的污染,但随着新发展理念的深入贯彻落措施.中国现有耕地有近15实,国家对环境保护工作越来越重视.2021年我国正式启动(含已招标项目,不含未招标、流标项目)的土壤修复工程项目共510个,合同总金额为121.56亿元,覆盖全国除西藏、港、澳、台的30个省(区、市).如图为2021年30个省(区、市)土壤修复工程类项目数量的前十名,则这30个省(区、市)土壤修复工程类项目数据的第80百分位数是________,若图中未列出的其他20个省(区、市)土壤修复工程类项目数量的方差为44.7,则这30个省(区、市)土壤修复工程类项目数据的总体方差为________.。

高考数学专题复习:用样本估计总体数字特征

高考数学专题复习:用样本估计总体数字特征

高考数学专题复习:用样本估计总体数字特征一、单选题1.已知一组数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,那么另一组数据121x -,221x -,321x -,421x -,521x -,621x -的方差是( )A .13B .23C .43D .832.已知样本9,x ,10,y ,11的平均数是10,标准差是2,则xy 的值为( ) A .96B .97C .91D .873.给定一组数据:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,则这组数据的第25百分位数是( ) A .3.0B .3.2C .4.4D .5.34.若样本1x ,2x ,…n x ,的平均数.方差分别为x 、2s ,则样本135x +,235x +,35n x +,的平均数.方差分别为( ) A .x 、2s B .35x +、2s C .35x +、29sD .35x +、()235s +5.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.766.下表是校篮球队某队员若干场比赛的得分数据.则该队员得分的40百分位数是( ) A .5B .6C .7D .87.四名同学各掷骰子5次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断出该同学所掷骰子一定没有出现点数1的是( )A .平均数为4,中位数为5B .平均数为5,方差为2.4C .中位数为4,众数为5D .中位数为4,方差为2.88.已知一组数据如下:1,2,5,6,11,则该组数据的方差为( ) A .12.4B .12.3C .12.2D .12.19.已知一组数据的平均数是3,方差是4,且这组数据的平方和是这组数据和的平方的19,则这组数据的个数是( ) A .10B .13C .15D .1610.小明和小红5次考试数学成绩统计如下:则成绩较为稳定的那个同学成绩的方差为( ) A .110B .108C .22D .411.已知一组数据的频率分布直方图如图所示,则估计该组数据的平均数为( )A .64B .65C .66D .6712.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为( ) A .87 B .87.5 C .89 D .91二、填空题13.数据35124a a a a a ,,,,的方差22222123450.8)20(s a a a a a =++-++,则样本数据121a +,221a +,345212121a a a +++,,的平均数为________. 14.甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数小于乙同学成绩的中位数; ②甲同学的平均分比乙同学的平均分高; ③甲同学的平均分比乙同学的平均分低; ④甲同学成绩的方差小于乙同学成绩的方差. 上面说法正确的是________.15.在某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,若不知道样本数据,只知道抽取了男生30人,其身高平均数170x =,抽取了女生20人,其身高平均数160y =.据此估计高一年级全体学生身高的值为________.16.已知样本数据1x ,2x ,3x ,4x ,5x 的方差为2,则样本数据132x -,232x -,332x -,432x -,532x -的方差为________. 三、解答题17.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中x 的值; (2)求月平均用电量的中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?18.某校对高一期中数学考试成绩(单位:分)进行分析,随机抽取100名学生,将分数按照[30,50),[50,70),[70,90),[90,110),[110,130),[130,150]分成6组,制成了如图所示的频率分布直方图:(1)估计该校高一期中数学考试成绩的均值;(2)估计该校高一期中数学考试成绩的第80百分位数.19.某种产品的质量以其质量指标值m 衡量,并按照质量指标值m 划分等级如下:现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m ,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).(1)求第75百分位数(精确到0.1);(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少;(3)将频率视为概率,已知该企业的这种产品中每件一等品的利润是10元,每件二等品和三等品的利润都是6元,试估计该企业销售600件这种产品,所获利润是多少元.20.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)90,100.50,60,[)80,90,[]60,70,[)70,80,[)(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分,众数,中位数.参考答案1.C 【分析】利用方差的性质求解. 【详解】因为数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,由方差的性质知,数据121x -,221x -,321x -,421x -,521x -,621x -的方差是214233⨯=.故选:C. 2.C 【分析】由平均数得20x y +=,由标准差得()()22101018x y -+-=,联立可得xy . 【详解】 依题意得91011105x y++++=,则20x y +=①.()()()()()()()222222221129101010111010102101055x y x y ⎡⎤⎡⎤=-+-+-+-+-=+-+-⎣⎦⎣⎦,则()()22101018x y -+-=②.由①②得22218x y +=,所以()()2224002189122x y x y xy +-+-===. 故选:C. 3.B 【分析】根据1025% 2.5⨯=,判断该组数据的第25百分位数即可. 【详解】这组数据是从小到大排序的,共10个数,而1025% 2.5⨯=,所以这组数据的第25百分位数是第3个数据,即3.2. 故选:B. 4.C【分析】由样本数据由i x 变为35i x +,结合平均数、方差的性质,即求新样本中的平均数、方差. 【详解】由题意,12...n x x x x n-+++=,2211()n i i s x x n -==-∑,∴样本135x +,235x +,35n x +的平均数135x x --=+,而2219s s =. 故选:C 5.D 【分析】利用均值的计算公式以及方差的计算公式,准确运算,即可求解. 【详解】由题意,总体的均值为4006007.577.210001000⨯+⨯=, 根据分层抽样的性质,可得总体的方差为:22400600[1(7.57.2)][0.5(7.27)]0.4360.4240.7610001000⨯+-+⨯+-=+=. 故选:D. 6.C 【分析】按所给数据求出各得分的频率,然后根据百分位数定义计算. 【详解】由所给数据,总数为212311111++++++=, 得分3,6,7,10,11,13,30的频率分别为2123111,,,,,,11111111111111, 前3个得分频率和为540%11>,前2个得分的频率和为340%11<,因此40百分位数应该是第三个频率211对应的得分为7分. 故选:C . 7.B 【分析】依据数字特征的定义,依次对选项验证即可. 【详解】解:对于选项A ,1,2,5,6,6符合条件,故A 错,对于选项B ,若平均数为5且出现点数1,则只能为1,6,6,6,6,此时方差为22(15)4(65)45-+⨯-=,故B 对,对于选项C ,1,2,4,5,5符合条件,故C 错, 对于选项D ,1,4,4,5,6,平均数为()11445645++++=,方差()()()2221145464 2.85⎡⎤-+-+-=⎣⎦,符合条件,故D 错, 故选:B . 8.A 【分析】先求出平均数,再根据平均数计算即可求得方差. 【详解】 ()112561155x =++++=,()()()()()2222221621525556511512.455s ⎡⎤=-+-+-+-+-==⎣⎦ 故选:A 9.B 【分析】设这组数据分别为12,,.,n x x x ⋯,根据平均数公式及方差公式即可得的12.3n x x x n ++⋯+=,()()()2221233.34n x x x n -+-+⋯+-=,从而得到22212.n x x x ++⋯+,再依题意得到方程,解得即可; 【详解】解:设这组数据分别为12,,.,n x x x ⋯,则12.3n x x x n ++⋯+=,()()()2221233.34,n x x x n -+-+⋯+-=所以()()()2222221212.6.33.34,n n x x x x x x n ++⋯+-++⋯++++⋯+=所以()22212.1894,n x x x n n n ++⋯+-+=从而22212.13n x x x n ++⋯+=.因为这组数据的平方和是这组数据和的平方的19,所以()2211339n n n ⨯==,解得13n =或0n =(舍去). 故选:B 10.D 【分析】依次求得两位同学的成绩的平均数,再根据结果求得两位同学成绩的方差即可得出结果. 【详解】小明数学成绩的平均值为11(107111110109113)1105x =++++=,所以成绩的方差为22122221(107110)(111110)(110110)(109110)(113110)45s ⎡⎤=-+-+-+-+-=⎣⎦ 小红数学成绩的平均值为21(99110111108112)1085x =++++=,所以成绩的方差为22222221(99108)(110108)(111108)(108108)(112108)225s ⎡⎤=-+-+-+-+-=⎣⎦. 因为2212s s <,所以小明同学的成绩更稳定,方差为21=4s .故选:D 11.D 【分析】根据频率分布直方图的平均数的计算公式,准确计算,即可求解. 【详解】根据频率分布直方图的平均数的计算公式,可得:(550.03650.04750.015850.01950.005)1067x =⨯+⨯+⨯+⨯+⨯⨯=. 故选:D. 12.C 【分析】根据一组数的百分位数的定义直接计算即可. 【详解】该组数据从小到大排序为85,87,88,90,92,共5个数据,而560%3⨯=, 所以这组数据的第60百分位数为8890892+=. 故选:C.13.9或7- 【分析】设样本数据35124a a a a a ,,,,的平均数为a ,推出2580a =,解得4a =±,由此即可求出结果. 【详解】 由题意知,222222123450.2(80)s a a a a a =++++-,设样本数据35124a a a a a ,,,,的平均数为a ,则222222123450.2[()()()()()]s a a a a a a a a a a =-+-+-+-+-22222212345123450.2[2()5]a a a a a a a a a a a a =++++-+++++ 222222123450.2(5)a a a a a a =++++-,所以2580a =,解得4a =±,又12345222221a a a a a ++1,+1,+1,+1,的平均数为21a +, 当4a =时,21=9a +; 当4a =-时,21=-7a +. 故答案为:9或-7 14.①③④ 【分析】根据茎叶图中的数据,对题目中的命题进行分析、判断正误即可. 【详解】解:根据茎叶图中数据知,对于①,甲同学成绩的中位数是1(8082)812⨯+=,乙同学成绩的中位数是1(8788)87.52⨯+=,所以甲的中位数小于乙的中位数,①正确;对于②,甲同学的平均分为1(727680828690)816⨯+++++=, 乙同学的平均分为1(697887889296)856⨯+++++=, 所以甲同学的平均分比乙同学的平均分低,②错误; 对于③,甲同学的平均分比乙同学的平均分低,③正确;对于④,计算甲的方差为2222221107[(9)(5)(1)159]63⨯-+-+-+++=, 乙的方差为2222221244[(16)(7)23711]63⨯-+-++++=, 所以甲的方差小于乙的方差,④正确.所以正确的命题序号是①③④.故答案为:①③④.15.166【分析】根据平均数的计算公式即可求出结果.【详解】 估计高一年级全体学生身高的值为301702016016650⨯+⨯=, 故答案为:16616.18【分析】利用方差的性质求解即可.【详解】样本数据1x ,2x ,3x ,4x ,5x 的方差为22S =, 所以样本数据132x -,232x -,332x -,432x -,532x -的方差为:23218⨯=.故答案为:1817.(1)0.0075;(2)中位数是224;(3)5户.【分析】(1)根据小矩形的面积之和等于1即可求x 的值;(2)根据中位数左右两侧小矩形面积等于0.5可得中位数;(3)先计算每个区间抽取的户数,再计算抽样比例,即可求解.【详解】(1)由直方图的性质得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 解得:0.0075x =;(2)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+-=,解得:224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户, 抽样比为112515105+++=15, 所以月平均用电量在[)220,240的用户抽取12555⨯=户. 18.(1)93分;(2)115分.【分析】(1)由每组数据中点值乘以频率相加可得均值;(2)计算出110分以下的频率和为0.75,因此80%分位数在[)110130,,还需频率0.05,区间[)110130,的频率是0.2,还需通过计算可得结论. 【详解】解:(1)数学成绩在:[)3050,频率0.0050200.1⨯=, [)5070,频率0.0050200.1⨯=, [)7090,频率0.0075200.15⨯=, [)90110,频率0.0200200.4⨯=, [)110130,频率0.0100200.2⨯=, []130150,频率0.0025200.05⨯=,样本均值为:400.1600.1800.151000.41200.21400.0593⨯+⨯+⨯+⨯+⨯+⨯=,可以估计样本数据中数学成绩均值为93分,据此可以估计该校高一下学期期中数学考试成绩估计93分.(2)由(1)知样本数据中数学考试成绩在110分以下所占比例为0.10.10.150.40.75+++=在130分以下所占比例为0.750.20.95+=因此,80%分位数一定位于[)110130,内,由 0.80.75110201150.950.75-+⨯=-, 可以估计样本数据的第80百分位数约为115分,据此可以估计该校高一下学期期中数学考试成绩第80百分位数约为115分19.(1)109.8;(2)3;(3)4500(元).【分析】(1)先利用频率分布直方图的性质求出0.030x =,由第75百分位数在图中表现为该数的左侧频率为0.75,根据这一点可求第75百分位数;(2)先根据频率分布直方图以及等级划分规则算出三种等级的频率,从而得样本中各等级的件数,再利用分层随机抽样的按比例抽取求解;(3)根据(2)中算出的频率求利润的估计值.【详解】(1)由题得,()0.00250.00900.01000.02000.02600.0025101x ++++++⨯=,解得0.030x =.又[65,105)的频率为0.625,[105,115)的频率为0.26,所以第75百分位数在[105,115)内第75百分位数为0.750.62510510109.80.26-+⨯≈. (2)由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为(0.00250.0100)100.125+⨯=,(0.02000.0300)100.5+⨯=,(0.02600.00900.0025)100.375++⨯=.所以在200件样本中,三等品、二等品、一等品的件数分别为25,100,75,所以按照产品等级用比例分配分层随机抽样的方法抽取8件产品, 则应抽取的一等品的件数分别为7583200⨯=. (3)由(2)知,从该企业的这种产品中任取一件是一等品的概率为0.375,是二等品或三等品的概率为0.625.故该企业销售600件这种产品,所获利润约为6000.375106000.62564500⨯⨯+⨯⨯=(元) 20.(1)0.005;(2)平均分为73,众数为65,中位数为2153. 【分析】(1)根据概率之和等于1,即所以小矩形的面积之和等于1,即可求解;(2)根据平均分,众数,中位数的概念结合频率分布直方图即可求出平均分,众数,中位数.【详解】解:(1)由频率分布直方图可得:()1020.020.030.041a ⨯+++=,∴0.005a =.(2)平均分550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯⨯⨯+⨯⨯=+(分) 众数为60702+=65分. 中位数为()0.50.005100.0410215700.033-⨯+⨯+=(分).。

用样本估计总体课件-2025届高三数学一轮复习

用样本估计总体课件-2025届高三数学一轮复习
2025届高考数学一轮复习讲义
统计与成对数据的统计分析之
用样本估计总体
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少
有%的数据小于或等于这个值,且至少有 − %的数据大于或等于
这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
, = , , ⋯ , .试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 = − = , , ⋯ , ,记 , ,⋯ , 的样本平均数为,样本
考点二 总体集中趋势的估计
例2 (多选)(2024·山东济南模拟)某学校发起了“畅读经典,欢度新年”活
动,根据统计数据可知,该校共有1 200名学生,所有学生每天读书时间
均在 到 之间,他们的日阅读时间的频率分布直方图如图
所示.则下列结论正确的是(
)
A.该校学生日阅读时间的众数约为70
⋅ [ +
+
+

+
,样本的方差为
+
− ].
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;

《用样本估计总体》PPT下载

《用样本估计总体》PPT下载

由样本平均数估计总体平均数,2000棵苹果树平均每棵产量约
为85 kg,总产量的估计值为85×2000=170000(kg).
知识讲解
知识总结
1.用样本估计总体是统计的基本思想,而总体的平均数和方差是最 重要的两个数字特征.在统计中,我们常用样本平均数(或方差)估计 总体平均数(或方差).
2.当调查的对象有破坏性或数量较大时,常采用样本估计总体的方 法解决实际问题.
用样本中比例估计总体中的比例
“鱼塘问题”小明与客户签订销售合同,需要了解自己鱼塘里鱼的数
量,请你帮小明设计一个合理的方案.
你还知道哪些与此类似的问题? 例如:估计不透明袋子中球的数目 估计树林中鸟的数目等等.
知识讲解
1.用样本估计总体
为了估计全校初中女生的平均身高,九年级(一)班8个课外学习小
组采用随机抽样的方法,分别抽取容量为25和100的样本,样本平均数
知识讲解
例1 工人师傅用车床加工一种直径为20 mm的轴,从某天加工的
轴中随机抽取了10件,测得其直径(单位:mm)如下:
20.1 19.9 20.3 20.2 19.8
19.7 19.9 20.3 20.0 19.8
(2)求总体平均数和总体方差的估计值.
(2)总体平均数和总体方差的估计值分别为 20 mm和0.042 mm2.
使用环保方便袋的数量,数据如下(单位:只):
6,5,7,8,7,5,8,10,5,9,利用上述数据估计该小区2000户家庭一周内
需要环保方便袋约( B )
A.2000只
B.14000只
C.21000只
D.98000只
解析:
1 10
×(6+5+7+8+7+5+8+10+5+9)×2000=14

高考数学总复习考点知识专题讲解57---用样本估计总体

高考数学总复习考点知识专题讲解57---用样本估计总体

2.在如图所示的茎叶图所示的数据中,众数和中位数分 别是( B )
A.23,26 B.31,26 C.24,30 D.26,30
[解析] 由茎叶图得到所有的数据从小到大排列依次为 12,14,20,23,25,26,30,31,31,41,42 , ∴ 众 数 和 中 位 数 分 别 为 31,26.故选 B.
的一个数据(或两个 它对极端值的不敏感有 数据的平均数)
时也会成为缺点
平均数
平均数与每一个样本数
如果有 n 个数据 x1,据有关,可以反映出更
x2,…,xn,那么这 多的关于样本数据全体
n 个数的平均数 x = 的信息,但平均数受数
x1+x2+…+xn ________n______
据中的极端值的影响较 大,使平均数在估计总
中国 CBA 篮球赛中甲、乙两篮球运动员上赛季某些场 次比赛的得分如下:
甲:12,15,24,25,31,31,36,36,37,39,44,49. 乙:8,13,14,16,21,23,24,26,28,33,38,39. (1)画出两组数据的茎叶图; (2)试比较这两位运动员的得分水平.
[解] (1)为便于对比分析,可将茎放在中间共用,叶分 列左、右两侧.如图.
某城市 100 户居民的月平均用电量(单位:千瓦时),以 [160,180) , [180,200) , [200,220) , [220,240) , [240,260) , [260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[200,240),[240,260),[260,280), [280,300]的四组用户中,用分层抽样的方法抽取 11 户居民, 则月平均用电量在[220,240]的用户中应抽取多少户?

课标高考复习课教学设计——用样本估计总体及线性相关关系

课标高考复习课教学设计——用样本估计总体及线性相关关系

2 热 点 问题 是 频 率 分 布 直 方 图 、 叶 图 和 用 样 本 . 茎 的 数 字特 征估 计 总 体 的数 字 特 征 . 三 、 点 精 讲 要 1用 样 本 的 数 字 特 征 估 计 总体 的 数字 特 征 . ( )众数 、 位 数 1 中
本估计总体 的思想 , 会用样本 的频率 分布估计 总体分 征; 初步体会样本频率分布和数字特征的随机性 ;
准 差.
关 的 过 程. 道 最 小 二 乘 法 的 思 想 , 根 据 给 出 的 线 知 能 性 回归 方程 系数 公 式 建 立 线 性 回归 方 程. 二、 题走 向 命 “ 计 ”是 在初 中 “ 汁 仞 步 ”基 础上 的深 化和 扩 统 统 展 , 讲主要会用样 本的频 率分 布估 汁总 体的 分布 , 本
出散 点 图 , 并利 用 散 点 图 直 观认 识 变 量 间 的 相 关
大 尔 ;
~‘… 的 做 数 。 n 据 这个…方

; 时 : . 同
r f
( 一 :叫 做这 个 数据 的 标 )
( ) 历 用 不 同 估 算 方 法 描 述 两 个 变 量 线 性 桐 2 经
i中 I小学越学砷学 版
高 研 考 究
高 中
课标 高考 复 习课 教 学设 计
用样 本估计 总体 及
安 徽 省 五 河 县 刘集 中学 (3 3 3 刘 瑞 美 233 )
关系


课标要求 :
考 查 基 础 知 识 为主 线 .
预 测 2 1 年 新 课 标 高考 对 本部 分 的考 察 是 : 0 1
( )通 过 实 例 理 解 样 本 数 据 标 准 差 的 意 义和 作 2 用 , 会计算数据标准差 ; 学 ( )能 根据 实 际 问题 的需 求 合理 地 选 取 样 本 , 3 从 样 本 数 据 中 提 取 基 本 的 数 字 特 征 ( 平 均 数 、 ; 。 如 标隹 差 ) 并 作 出合 理 的 解 释 ; , ( ) 解 决 统 计 问题 的过 程 中 , 一 步 体 会 用 样 4 在 进 f

高考数学专题复习:用样本估计总体

高考数学专题复习:用样本估计总体

高考数学专题复习:用样本估计总体一、单选题1.某班50名学生在一次百米测试中,成绩全部不小于13秒且小于19秒,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别是()A.90%,35 B.90%,45C.10%,35 D.10%,452.某同学郑一粒均匀的骰子5次,记录每次骰子出现的点数,若其中至少出现了1次点数6,则这组数据不可能得出的统计结果是()A.平均数为3,中位数为2 B.中位数为3,众数为2C.平均数为2,方差为3 D.中位数为3,方差为2.83.某中学有10个学生社团,每个社团的人数分别是70,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165 B.160 C.150 D.1704.四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为2,方差为2.4 B.中位数为3,众数为2C.平均数为3,中位数为2 D.中位数为3,方差为2.85.某市2020年各月的平均气温(℃)数据的茎叶图如下,则这组数据的中位数是()A .21B .22C .22.5D .236.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 ,x x 甲乙,则下列说法正确的是( )A . x x >甲乙,乙比甲成绩稳定,应选乙参加比赛B . x x >甲乙,甲比乙成绩稳定,应选甲参加比赛C . x x <甲乙,甲比乙成绩稳定,应选甲参加比赛D . x x <甲乙,乙比甲成绩稳定,应选乙参加比赛7.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( )A .242,x s ==B .24,2x s =>C .24,2x s =<D .24,2x s ><8.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( ) A .82B .84C .89D .969.某校高一甲、乙两个班分别有男生24名、15名,现用比例分配的分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行评估.已知甲班、乙班男生身高的样本平均数分别为175cm 、177.6cm ,以所抽取样本的平均身高作为两个班男生的平均身高,则两个班男生的平均身高为( )A .176cmB .176.3cmC .176.6cmD .176.9cm10.设一组样本数据12,,n x x x 的平均值为2,则数据1229,29,,29n x x x ++⋅⋅⋅+的平均值为( ) A .11B .12C .13D .1411.某同学掷骰子4次,并记录了每次骰子出现的点数,得出平均数为2,方差为12的统计结果,则下列点数中一定不出现的是( ) A .1B .2C .3D .512.某单位共有A 、B 、C 三个部门,三部门人员平均年龄分别为38岁、24岁、42岁,又已知A 和B 两部门人员平均年龄为30岁,B 和C 两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为( ) A .34岁 B .35岁C .36岁D .37岁二、填空题13.一组数6,5,4,3,3,3,2,2,2,1的80%分位数为________.14.学校进行30秒跳绳测试,某小组8名同学的跳绳个数如下面的茎叶图所示,则该组数据的方差为________.15.某企业生产甲、乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:由于表格被污损,数据a ,b 看不清,统计员只记得甲、乙两种产品检测数据的平均数和方差都相等,则ab =________.16.已知样本数据1x ,2x ,⋯,2020x 的平均数与方差分别是m 和n ,若2(1i i y x i =-+=,2,⋯,2020),且样本数据的1y ,2y ,⋯,2020y 平均数与方差分别是n 和m ,则222122020x x x ++⋯+=________.三、解答题17.高一年级期末考试成绩各分数段[)0,90,[)90,105,[)105,120,[)120,135,[]135,150的频率分布如下图.(Ⅰ)计算高一年级所有同学成绩的中位数;(Ⅱ)用各分数段的中间值代替各分数段的平均值,并且删去[)0,90,[]135,150两个分数段,试估计高一年级期末考试成绩的平均值;(Ⅲ)若高一年级有1000人,把成绩从低到高编号,用系统抽样的方法从中抽取一个容量为20的样本,其中一个个体的编号为63,请写出抽样在[)105,120之间的个体的编号.18.20名学生某次数学考试成绩(单位:分)的频率分布直方图如图.(1)求频率分布直方图中a 的值;(2)估计总体中成绩落在[)50,60中的学生人数;(3)根据频率分布直方图估计20名学生数学考试成绩的众数,中位数;19.甲、乙两位同学要参加数学竞赛,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,绘制成茎叶图如下(单位:分).(1)分别写出甲、乙两位同学6次预赛成绩的众数、中位数;(2)计算甲、乙两位同学6次预赛成绩的平均数与方差,并判断谁的成绩更稳定.20.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)确定直方图中x 的值,并求月平均用电量的众数和中位数;(2)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[)220,240内的用户中应抽取多少户?21.下表为30位学生参加语文竞赛的成绩,并由小到大排列.(1)求第一、二、三四分位数;(2)求第10百分位数;(3)求第95百分位数.22.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)①求在这些用户中,用电量在区间[100,250)内的居民数;②如果按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,那么用电量在[150,200)内的居民数应抽取多少?参考答案1.A 【分析】频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.建立相应的关系式,即可求得. 【详解】解:从频率分布直方图上可以看出1(0.060.04)0.9x =-+=,50(0.360.34)35y =⨯+=,故选:A . 2.C 【分析】对于选项ABD ,举出满足条件且出现点数为6的例子,对于选项C ,由于至少出现一个点数6,结合平均数为2,计算方差即可判断作答. 【详解】对于A ,中位数为2的5个点数是1,1,2,5,6,平均数为1125635++++=,选项A 可能出现;对于B ,中位数为3,众数为2的5个点数是2,2,3,4,6或2,2,3,5,6均符合要求,即选项B 可能出现;对于C ,因平均数为2,且至少出现了1次点数6,则方差221(62) 3.25s >-=,即方差不可能为3,选项C 不可能出现;对于D ,中位数为3的5个点数是1,2,3,3,6,平均数为1233635++++=,方差2222221[(13)(23)(33)(33)(63)] 2.85s =-+-+-+-+-=,选项D 可能出现.故选:C 3.C 【分析】将数字从小到大(或从大到小)排列,得到众数和中位数,再算出平均数,即可得到答案. 【详解】人数分别是10,30,30,40,40,50,60,60,60,70,则众数为60,中位数为4050452+=,平均数为103030404050606060704510+++++++++=,∴平均数,众数,中位数的和为:60+45+45=150. 故选:C. 4.A 【分析】选项A ,利用反证法说明一定含6,选项BCD 中依次举例说明可能含有6即可. 【详解】对于A ,若平均数为2,且出现点数6,则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6,所以A 可以判断;对于B ,当掷骰子出现的结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点6,所以B 不能判断;对于C ,当掷骰子出现的结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点6,所以C 不能判断;对于D ,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,则平均数为1(12336)35x =++++=,方差为2222221[(13)(23)(33)(33)(63)] 2.85S =-+-+-+-+-=,所以可以出现点6,所以D 不能判断. 故选:A. 5.B 【分析】由茎叶图得到数据最中间的两个数是21和23,即得解. 【详解】由茎叶图可知,数据最中间的两个数是21和23, 所以数据的中位数为21+23=222. 故选:B 6.D 【分析】根据茎叶图中的数据计算平均数得的平均数是82,乙的平均数是87,再根据茎叶图分析甲与乙的稳定性即可得答案. 【详解】由茎叶图可知,甲的平均数是727879858692826+++++=,乙的平均数是788687879193876+++++=,所以乙的平均数大于甲的平均数,即 x x <甲乙, 从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛. 故选:D. 7.C 【分析】由已知条件,根据平均数和方差的计算公式进行求解即可. 【详解】 根据题意有47448x ⨯+==, 而()22724428s ⨯+-=<.故选:C. 8.C 【分析】利用百分位数的定义分析求解即可. 【详解】解:因为780% 5.6⨯=,所以这名学生七次月考数学成绩的第80百分位数为89. 故选:C. 9.A 【分析】由题知13个的样本中,甲班男生有8人,乙班男生有5人,进而得两个班男生的平均身高为()11758177.6517613⨯+⨯=. 【详解】解:根据题意,抽出来的13个的样本中,甲班男生有241382415⨯=+人,乙班男生有151352415⨯=+人,所以根据题意得两个班男生的平均身高为()11758177.6517613⨯+⨯= 故选:A 10.C 【分析】利用平均数公式求解即可. 【详解】 因为122nx x x n+++=,所以12292929n x x x n++++++,()122913n x x x n+++=+=,故选:C. 11.D 【分析】利用方差的公式检验四个选项的正误即可得正确选项. 【详解】当有一个数是5,则()25291442-=>,所以5一定不出现;当有一个数是3时,()23211442-=<,所以3可能出现; 当有一个数是2时,()2221042-=<,所以2可能出现; 当有一个数是1时,()21211442-=<,所以1可能出现;故选:D. 12.B 【分析】设A 、B 、C 三个部门的人数分别为,,a b c ,根据已知条件列出方程组可求出34a b =,54c b =,然后再根据平均数的计算公式,即可求出该单位全体人员的平均年龄.【详解】设A 、B 、C 三个部门的人数分别为,,a b c ,由题意得382430244234a b a b b c b c+⎧=⎪⎪+⎨+⎪=⎪+⎩,所以3454a b c b ⎧=⎪⎪⎨⎪=⎪⎩, 所以该单位全体人员的平均年龄为3538244238244244353544b b b a bc a b c b b b ⨯++⨯++==++++. 故选:B13.4.5【分析】将数据按从小到大的顺序排列,第8和第9个数的平均数即可.【详解】一组数6,5,4,3,3,3,2,2,2,1按从小到大的顺序排列,可得1,2,2,2,3,3,3,4,5,6,共10个,由1080%8⨯=,所以该组数据的80%分位数为45 4.52+=, 故答案为:4.5.14.17.5【分析】先求出该组数据的平均数,再由方差公式即可求出.【详解】 由图可知,该组数据的平均数为4144454750515254488+++++++=, 所以方差为()()()()2222222217431234617.58⎡⎤⨯-+-+-+-++++=⎣⎦. 故答案为:17.5.15.72【分析】求出均值可得17a b +=,再由方差相等可得()()22881a b -+-=,解方程组即可求解.【详解】77+7.5+9+9.56+8.5+8.5+=8=55a x xb ++==甲乙,可得17a b += ①, ()()()()()22222878787.58989.5 5.5D =-+-+-+-+-=甲 ,则()()()()()2222286888.588.58 5.5D a b =-+-+-+-+-=乙,可得()()22881a b -+-= ②, 由①②可得89,98a a b b ==⎧⎧⎨⎨==⎩⎩,所以72ab = , 故答案为:72 .16.4040【分析】由样本数据的平均数、方差的性质列方程组求出1m =,1n =,从而2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=,由此能求出222122020x x x ++⋯+的值. 【详解】由题意得:2m n m n -+=⎧⎨=⎩, 解得1m =,1n =, ∴2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=, 22212202012202020202()2020x x x x x x ∴++⋯++-++⋅⋅⋅+=,2221220201220202()220204040x x x x x x ∴++⋯+=++⋅⋅⋅+=⨯=.故答案为:4040.17.(Ⅰ)110分;(Ⅱ)111.5分;(Ⅲ)413,463,513,563,613,663.【分析】(1)根据中位数的概念即可求解;(Ⅱ)结合加权平均数的计算公式即可求出结果;(Ⅲ)由系统抽样中等间隔即可求出结果.【详解】(1)由题图可知[)0,90和[)90,105分数段内的人数占总人数的40%,故中位数在[)105,120分数段内从低到高13处,则中位数为1105151103+⨯=(分). (Ⅱ)[)90,105,[)105,120,[)120,135三个分数段的中间值分别为97.5,112.5,127.5,人数比为25%:30%:20%5:6:4=,则估计高一年级期末考试成绩的平均值为97.55112.56127.54111.5564⨯+⨯+⨯=++(分). (Ⅲ)由题图可得[)0,90分数段内有150人,[)90,105分数段内有250人,[)105,120分数段内有300人,则[)105,120分数段内的编号是从401到700,由题意,两个相邻样本的编号差为10005020=,则在分数段[)105,120内抽取的个体的编号为413,463,513,563,613,663. 18.(1)0.005a =;(2)2人;(3)众数为75,中位数为5407. 【分析】(1)由频率和为1可求出a 的值;(2)先求出成绩落在[)50,60的频率,从而可求出频数;(3)由图可知众数在第3组,从而可得众数为7080752+=,由于前2组的频率和小于0.5,前3组的频率和大于0.5,所以中位数在第3组,列方程可求得结果【详解】(1)()23762101a a a a a ++++⨯=,解得0.005a =.(2)由频率分布直方图得成绩落在[)50,60中的频率为2100.1a ⨯=,∴估计总体中成绩落在[)50,60中的学生人数为:200.12⨯=人.(3)根据频率分布直方图估计20名学生数学考试成绩的众数为:7080752+=, 由于前2组的频率和10(0.010.015)0.250.5⨯+=<,前3组的频率和10(0.010.0150.035)0.60.5⨯++=>,所以中位数在第3组,设中位数为x ,则()()0.010.015100.035700.5x +⨯+-= 解得5407x =,所以中位数为540719.(1)甲同学6次预赛成绩的众数为82分,中位数为82分,乙同学6次预赛成绩的众数为85分,中位数为81.5分;(2)甲同学预赛的平均成绩82分;乙同学预赛的平均成绩81分,甲同学预赛成绩的方差为313;乙同学预赛成绩的方差为13;甲同学成绩更稳定. 【分析】(1)甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85,进而可得答案;(2)根据茎叶图,计算即可得平均数与方差,再根据数字特征的意义即可得答案.【详解】(1)由茎叶图可知,甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85;所以,甲同学6次预赛成绩的众数为82分,中位数为8282822+=(分),乙同学6次预赛成绩的众数为85分,中位数为808381.52+=(分) (2)甲同学预赛的平均成绩121223880826x --++++=+=分 乙同学预赛的平均成绩243035580816x --++++=+=分, 甲同学预赛成绩的方差为22222221131(7882)(7982)(8282)(8282)(8382)(8882)63s ⎡⎤=-+-+-+-+-+-=⎣⎦ 乙同学预赛成绩的方差为222222221(7681)(7781)(8081)(8381)(8581)(8581)136s ⎡⎤=-+-+-+-+-+-=⎣⎦ 由2221s s >,所以,甲同学成绩更稳定20.(1)0.0075x =,众数为230度,中位数224度;(2)5户.【分析】(1)由频率和为1列方程可求出x 的值,由[)220,240对应的频数最大,可求出众数,由前3组的频率和小于0.5,前4组的频率和大于0.5,所以中位数在第4组,设中位数为t 度,则0.50.45220200.25t -=+⨯; (2)利用分层抽样的比进行求解即可【详解】(1)因为()0.0020.00250.0050.00950.0110.0125201x ++++++⨯=,所以0.0075x =; 由频率分布直方图可知:[)220,240对应的频数最大,所以众数为230度;因为前三组频率之和为()0.0020.00950.011200.450.5++⨯=<,第四组频率为0.0125200.25⨯=,且0.450.250.70.5+=>,所以中位数在第四组数据中,设中位数为t 度, 所以0.50.45220202240.25t -=+⨯=. (2)因为[)220,240,[)240,260,[)260,280,[]280,300的频率之比为()()()()0.012520:0.007520:0.00520:0.0025205:3:2:1⨯⨯⨯⨯=,所以月平均用电量在[)220,240内的用户中应抽取:51155321⨯=+++户, 答:月平均用电量在[)220,240内的用户中应抽取5户.21.(1)第一四分位数为65,第二四分位数为75.5,第三四分位数为85;(2)56.5;(3)99.【分析】(1)由30×25%,30×50%,30×75%分别确定第一、二、三四分位数的位置即可; (2)由30×10%确定第10百分位数的位置; (3)由30×95%确定第95百分位数的位置 【详解】解:(1)30×25%=7.5,取第8项数据,所以第一四分位数为65,30×50%=15,取第15、16项数据的平均数,所以第二四分位数为75762+=75.5;30×75%=22.5,取第23项数据,所以第三四分位数为85.(2)30×10%=3,取第3、4项数据的平均数,所以第10百分位数为55582+=56.5. (3)30×95%=28.5,取第29项数据,所以第95百分位数为99. 22.(1)x =0.0044;(2)①70户;②3(户).【分析】(1)由频率分布直方图,列出方程,能求出直方图中x 的值.(2)①先求出用电量在[100,250)内的频率为0.7,由此能求出在这些用户中,用电量在区间[100,250)内的居民数.②用电量在[150,200)内的户数为30户,由此利用分层抽样的性质能求出用电量在[150,200)内的居民数应该抽取的户数.【详解】(1)由频率分布直方图得:(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得直方图中x=0.0044.(2)①用电量在[100,250)内的频率为:(0.0036+0.0060+0.0044)×50=0.7,∴在这些用户中,用电量在区间[100,250)内的居民数为100×0.7=70户.②用电量在[150,200)内的户数为0.0060×50×100=30(户),按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,用电量在[150,200)内的居民数应该抽取:130310⨯=(户).。

高中数学复习:用样本估计总体

高中数学复习:用样本估计总体

教材研读 栏目索引
1.判断正误(正确的打“√”,错误的打“✕”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.
(√) (2)一组数据的众数可以是一个或几个,中位数也具有相同的结论.( ✕) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后, 原有的具体数据信息就被抹掉了. ( √ )
所分组数 增加,⑧ 组距 减小,相应的频率分布折线图就会越来 越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
教材研读 栏目索引
3.茎叶图的优点
茎叶图的优点是可以⑨ 保留 原始数据,而且可以⑩ 随时 记录.
4.样本的数字特征
(1)众数、中位数、平均数
教材研读 栏目索引
众数 中位数
定义(求法) 一组数据中出现次数
(1)求极差(一组数据中① 最大值 与最小值的差). (2)决定② 组距 与组数. (3)将数据③ 分组 . (4)列④ 频率分布表 . (5)画⑤ 频率分布直方图 .
教材研读 栏目索引
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的⑥中点 ,就 得到频率分布折线图. (2)总体密度曲线:一般地,随着样本容量的增加,作频率分布直方图时⑦
栏目索引
第五节 用样本估计总体
总纲目录 栏目索引
1.作频率分布直方图的步骤
教 2.频率分布折线图和总体密度曲线 材 研 3.茎叶图的优点 频率分布直方图
点 突
考点二 茎叶图
破 考点三 数字特征
总纲目录 栏目索引
教材研读
教材研读 栏目索引
1.作频率分布直方图的步骤
则下面结论中不正确的是 ( A )
教材研读 栏目索引

高考理数复习 用样本估计总体

高考理数复习 用样本估计总体

解析
在考查中,样本的数字特征常与频率分布直方图、茎 叶图等知识交汇命题. 常见的命题角度有: (1)样本的数字特征与直方图交汇; (2)样本的数字特征与茎叶图交汇; (3)样本的数字特征与优化决策问题.
(1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数; (3) 在 月 平 均 用 电 量 为 [220,240) , [240,260) , [260,280) , [280,300]的四组用户中,用分层抽样的方法抽取 11 户居民, 则月平均用电量在[220,240)的用户中应抽取多少户?
第三节
用样本估计总体
最大值 组距 分组
频率分布表
最小值
组数
频率分布直方图
中点 所分的组数 组距
3.茎叶图的优点
保留 所有信息,而且可以 茎叶图的优点是不但可以 _____
_____ 随时 记录,这对数据的记录和表示都能带来方便. [提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁 边生长出来的数.
x1+x2+…+xn _____________ n
样本数据全体的信息,但平
均数受数据中的极端值的影 响较大,使平均数在估计总 体时可靠性降低
(2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用 s 表示,s= 1 2 2 2 [ x 1- x +x2- x +…+xn- x ]. n
甲组
B.5,7 D.7,7
乙组 9 6 6 0 1 2 9 6 9 6 x
(
)
A.7,8 C.8,5
9
y
解析
2.(2015· 湖南高考)在一次马拉松比赛中,35 名运动员的成绩 (单位:分钟)的茎叶图如图所示.
13 0 0 3 4 5 6 6 8 8 8 9 14 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0 1 2 2 3 3 3

2017高考数学二轮复习与策略课件 专题7 用样本估计总体

2017高考数学二轮复习与策略课件 专题7 用样本估计总体

上一页
返回首页
下一页
第二十四页,编辑于星期六:二十一点 十五分。
2017版高三二轮复习与策略
热点题型 2 茎叶图 题型分析:结合样本数据和茎叶图对总体作出估计是高考命题的热点,应引 起足够的重视,难度中等.
上一页
返回首页
下一页
第二十五页,编辑于星期六:二十一点 十五分。
2017版高三二轮复习与策略
(2)以这 1 000 名购物者购物金额落在相应区间的频率作为概率,求一个购物者
获得优惠券金额不少于 150 元的概率.
上一页
返回首页
下一页
第二十二页,编辑于星期六:二十一点 十五分。
2017版高三二轮复习与策略
[解] (1)购物者的购物金额 x 与获得优惠券金额 y 的频率分布如下表:
x 0.3≤x<0.5 0.5≤x<0.6 0.6≤x<0.8 0.8≤x≤0.9
其中根据茎叶图能得到的统计结论的编号为( )
A.①③
B.①④
C.②③
D.②④
上一页
返回首页
下一页
第十一页,编辑于星期六:二十一点 十五分。
2017版高三二轮复习与策略
B [甲地该月 14 时的气温数据分布在 26 和 31 之间,且数据波动较大,而乙 地该月 14 时的气温数据分布在 28 和 32 之间,且数据波动较小,可以判断结论① ④正确,故选 B.]
上一页
返回首页
下一页
第七页,编辑于星期六:二十一点 十五分。
2017版高三二轮复习与策略
2.某雷达测速区规定:凡车速大于或等于 70 km/h 的汽车视为“超速”,并
将受到处罚,如图 7-2 是某路段的一个检测点对 200 辆汽车的车速进行检测所得结
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题7用样本估计总体
提炼1频率分布直方图
(1)频率分布直方图中横坐标表示组距,纵坐标表示频率
组距
,频率=组距×
频率
组距
.
(2)频率分布直方图中各小长方形的面积之和为1.
(3)利用频率分布直方图求众数、中位数与平均数,在频率分布直方图中:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
提炼2茎叶图的优点
(1)所有的信息都可以从茎叶图中得到.
(2)可以帮助分析样本数据的大致频率分布情况.
提炼3样本的数字特征
(1)众数、中位数.
(2)样本平均数x=1
n(x1+x2+…+x n).
(3)样本方差s2=1
n[(x1-x)
2+(x
2
-x)2+…+(x n-x)2].
(4)样本标准差
s=1
n[(x1-x)
2+(x
2
-x)2+…+(x n-x)2].
回访1频率分布表或频率分布直方图
1.(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),
制成了如图7-1所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()
图7-1
A.56 B.60
C.120
D.140
D[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+
0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选
D.]
图7-2
2.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图7-2是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有() A.30辆 B.40辆
C.60辆
D.80辆
B[由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).]
回访2茎叶图
3.(2015·山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图7-3所示的茎叶图.考虑以下结论:
图7-3
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为()
A.①③ B.①④
C.②③ D.②④
B[甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.]
4.(2015·湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图7-4所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()
A.3 B.4
C.5
D.6
B[35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.]
热点题型1频率分布直方图
题型分析:频率分布直方图多以生活中的实际问题为背景,考查学生运用已知数据分析问题的能力,难度中等.
(2016·潍坊模拟)某高中为了解全校学生每周参与体育运动
的情况,随机从全校学生中抽取100名学生,统计他们每周参与体育运动的时间如下:
(2)①估计该校学生每周参与体育运动的时间的中位数及平均数;
②若该校有学生3 000人,根据以上抽样调查数据,估计该校学生每周参与体育运动的时间不低于8小时的人数.
[解] (1)频率分布直方图如图所示:
(2)①由数据估计中位数为4+2640×4=6.6, 8分
估计平均数为2×0.24+6×0.4+10×0.28+14×0.06+18×0.02=6.88. 10分
②将频率看作概率知P (t ≥8)=0.36,
∴3 000×0.36=1 080. 12分
解决该类问题的关键是正确理解已知数据的含义.掌握图表中各个量的意义,通过图表对已知数据进行分析.
提醒:(1)小长方形的面积表示频率,其纵轴是频率组距
,而不是频率. (2)各组数据频率之比等于对应小长方形的高度之比.
[变式训练1] 某电子商务公司随机抽取1 000名网络购物者进行调查.这1
000名购物者2015年网上购物金额(单位:万元)均在区间[0.3,0.9]内,样本分组为:[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7),[0.7,0.8),[0.8,0.9],购物金额的频率分布直方图如下:
图7-5
电子商务公司决定给购物者发放优惠券,其金额(单位:元)与购物金额关系如下:
(2)以这1 000名购物者购物金额落在相应区间的频率作为概率,求一个购物者获得优惠券金额不少于150元的概率.
[解](1)购物者的购物金额x与获得优惠券金额y的频率分布如下表:

50×400+100×300+150×280+200×20
1 000=96. 4分
(2)由获得优惠券金额y与购物金额x的对应关系,有
P(y=150)=P(0.6≤x<0.8)=(2+0.8)×0.1=0.28,
P(y=200)=P(0.8≤x≤0.9)=0.2×0.1=0.02,10分
从而,获得优惠券不少于150元的概率为
P(y≥150)=P(y=150)+P(y=200)=0.28+0.02=0.3. 12分
热点题型2茎叶图
题型分析:结合样本数据和茎叶图对总体作出估计是高考命题的热点,应引起足够的重视,难度中等.
(2016·福州模拟)长时间用手机上网严重影响着学生的身体健康,某校为了解A,B两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本,绘制成茎叶图如图7-6所示(图中的茎表示十位数字,叶表示个位数字).
图7-6
(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均上网时间较长;
(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机提取一个不超过21的数据记为b,求a>b的概率.
[解](1)A班样本数据的平均值为1
5(9+11+14+20+31)=17. 3分
由此估计A班学生每周平均上网时间17小时;
B班样本数据的平均值为1
5(11+12+21+25+26)=19,由此估计B班学生每
周平均上网时间较长. 6分
(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21,从A班和B班的样本数据中各随机抽取一个共有:9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,21),(11,21),(14,11),(14,12),(14,21),
其中a>b的情况有(14,11),(14,12)两种,
故a >b 的概率P =29. 12分
作茎叶图时先要弄清“茎”和“叶”分别代表什么,根据茎叶图,可以得到数据的众数、中位数,也可从图中直接估计出两组数据的平均数大小与稳定性.
[变式训练2] (名师押题)某车间20名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
[解] (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21. 2分
(2)这20名工人年龄的茎叶图如下:
6分
(3)这20名工人年龄的平均数x =120(19×1+28×3+29×3+30×5+31×4
+32×3+40×1)=30, 8分
故方差s 2=
1
20[1×(19-30)
2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-
30)2+3×(32-30)2+1×(40-30)2]=1
20×(121+12+3+0+4+12+100)=12.6.
12分。

相关文档
最新文档