用样本的频率分布估计总体分布 (1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1课时用样本的频率分布估计总体分布
[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P65~P70,回答下列问题.
(1)画频率分布直方图的步骤有哪些?
提示:求极差→决定组距与组数→决定组距与组数→将数据分组→列频率分布表→画频率分布直方图.
(2)频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?
提示:频率分布直方图的纵轴表示频率/组距,各小长方形面积之和为1.
(3)频率分布折线图和总体密度曲线各指什么?
提示:连接频率分布直方图中各小长方形上端的中点就得到频率分布折线图;当频率分布直方图中组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑的曲线,称之为总体密度曲线.
2.归纳总结,核心必记
(1)用样本估计总体、数据分析的基本方法
①用样本估计总体的两种情况
(ⅰ)用样本的频率分布估计总体分布.
(ⅱ)用样本的数字特征估计总体的数字特征.
②数据分析的基本方法
(ⅰ)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.
(ⅱ)借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.
(2)绘制频率分布直方图的步骤
(3)频率分布折线图和总体密度曲线
(4)茎叶图
①茎叶图的制作方法(以两位数据为例):
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
②茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长.
[问题思考]
(1)频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?
提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率
组距×组距=频率,
各组频率的和等于1,因此各小矩形的面积的和等于1.
(2)茎叶图中对“叶”和“茎”有什么要求?
提示:茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.
[课前反思]
通过以上预习,必须掌握的几个知识点:
(1)绘制频率分布直方图的步骤: ;
(2)频率分布折线图和总体密度曲线的制作方法:;
(3)茎叶图的制作方法:.
[思考]频率分布表、频率分布直方图各有什么优缺点?
名师指津:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
讲一讲
1.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
[尝试解答]以4为组距,列表如下:
频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
(1)频率分布表中极差、组距、组数的关系 ①若极差组距为整数,则极差组距
=组数;
②若极差组距不为整数,则极差组距的整数部分+1=组数.
(2)确定频率分布直方图中组距和组数的注意点
组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
练一练
1.有一容量为50的样本,数据的分组及各组的数据如下:[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45],3.
(1)列出样本频率分布表; (2)画出频率分布直方图及折线图.
解:(1)由所给的数据,不难得出以下样本的频率分布表:
数据段 [10,15) [15,20) [20,25) [25,30) 频数 4 5 10 11 频率 0.08 0.10 0.20 0.22 数据段 [30,35) [35,40) [40,45] 总计 频数
9
8
3
50
频率0.180.160.06 1
(2)频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
观察下面茎叶图,它的中间部分像一棵树的茎,两边部分像这棵树的茎上长出来的叶子.
[思考]怎样理解认识茎叶图?
名师指津:茎叶图也是用来表示数据的一种图,它的思路是将数组中的数按位数进行比较,将高位数字作为一个主干(茎),将低位数字作为分枝(叶),列在主干的一侧,这样就可以清楚地看到每个主干后面有几个数,每个数具体是多少.
讲一讲
2.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:
甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两运动员的水平.
[尝试解答](1)作出茎叶图如图所示:
(2)由(1)中的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运