苏教版数学高一-14-15苏教版数学必修3第二章《统计》章末整合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学·必修3(苏教版)
题型一三种抽样的选择
某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是________.
解析:总体人数为28+54+81=163(人),样本容量为36.若按
36∶163取样,无法得到整数解.故考虑先剔除1人,抽样比变为36∶162=2∶9,则中年人取54×29=12(人);青年人取81×2
9=18(人);
先从老年人中剔除1人,老年人取27×2
9=6(人).这样组成容量为
36的样本.
答案:先从老年人中剔除1人,再用分层抽样
规律总结:根据简单随机抽样、系统抽样、分层抽样三种抽样方法的共同点、适用范围和各自特点,恰当选取抽样方法.在抽取样本时,要按照各种抽样方法的步骤进行.三种抽样方法的比较见下表:
机抽样或系
分组成进行抽取
统抽样
变式训练
1.为调查小区平均每户居民的月用水量,下面是3名学生设计的方案:
学生甲:我把这个用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们小区居民的每一个住户发一张用水调查表,只要一两天就可以统计出小区平均每户居民的月用水量;
学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给这些住户打电话,问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量.
请你分析上述3名学生设计的调查方案能够准确地获得小区平均每户居民的月用水量吗?为什么?你有何建议?
解析:学生甲的方案得到的样本不能够反映不上网的居民的月用水量情况,其所得到的样本代表性差,不能很准确地获得小区平均每户居民的月用水量;
学生乙的方案实际上是普查,花费的人力、物力、时间更多一些,但是如果统计过程不出错,可以准确地得到小区平均每户居民的月用水量;
学生丙的方案是一种随机抽样法,在所在小区的每户居民都装有电话的前提下,建议采用随机抽样法获得数据,即用学生丙的方案,既节省人力、物力、时间,又可以得到比较精确的结果.
题型二估计总体的分布
有1个容量为100的样本,数据的分组及各组的频数如下:
15.5,18.5)16,21.5,24.5)22,27.5,30.5)10,8.
(1)列出样本的频率分布表(含累计频率);
(2)画出频率分布直方图和累积频率分布图;
(3)根据累积频率分布估计小于30的数据约占多大百分比.
分析:按照画频率分布直方图的要求操作.
解析:(1)样本的频率分布表如下:
分组频数频率累计频率
12.5~
6 0.06 0.06
15.5
15.5~
16 0.16 0.22
18.5
18.5~
18 0.18 0.40
21.5
21.5~
22 0.22 0.62
24.5
24.5~
20 0.20 0.82
27.5
27.5~
10 0.10 0.92
30.5
30.5~
8 0.08 1.00
33.5
合计100 1.00
(2)频率分布直方图如图(1)所示,累积频率分布图如图(2)所示.
(3)在累积频率分布图中找到横坐标为30的点,然后量出这个点的纵坐标约为0.90,这说明小于30的数据约占90%.
规律总结:(1)频率分布表列出的是各个区间内取值的频率;
(2)频率分布直方图是用矩形的面积的大小来表示各个区间内取值的机会的,可直观地看出在各个区间内机会的差异.
用样本估计总体一般分两种:一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、方差等)估计总体的数字特征.
用样本频率分布估计总体的分布就是利用样本的频率分布表和频率分布直方图对总体情况做出估计,有时也利用频率分布折线图和茎叶图对总体估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,这样根据样本的频率分布我们可以大致估计出总体的分布,但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这
条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示;数据的效果较好,它不但可以保留所有信息,而且可以随时记录,这给数据的记录和表示都能带来方便.
变式训练
2.李老师为了分析期中数学考试情况,从全级1 500人中抽了50人,将分数分为5组,第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组90~100分的频数是多少?频率是多少?全级学生分数在90~100分的大约有多少人?
解析:第四组的频数为0.08×50=4,则第五组的频数为50-10
=0.04,故全级分数在90~100的约有-23-11-4=2,频率为2
50
0.04×1 500=60(人).
题型三估计总体的数字特征
甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):
试根据这组数据估计哪一种小麦品种的产量比较稳定.
分析:与样本的稳定和波动有关的数字特征是方差.只需计算方差即可.
解析:甲品种的样本平均数为10,样本方差为
÷5=0.02,
乙品种的样本平均数也为10,样本方差为
÷5=0.24>0.02.
所以,由这组数据可以认为甲种小麦的产量比较稳定.
规律总结:用样本数字特征估计总体的数字特征就是为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征做出估计.众数就是样本数据中出现最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值;标准差是反映样本数据分散程度大