用样本估计总体课件PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何利用频率分布直方图估计样本的数字 特征? 提示: (1) 在频率分布直方图中,中位数左边和右边的 直方图的面积相等,由此可以估计中位数的 值. (2) 平均数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横坐标 之和. (3) 众数:在频率分布直方图中,众数是最高的 矩形的中点的横坐标.
(3)频率分布直方图及特点 ①频率分布直方图 以横轴表示样本分组,纵轴表示频率与组距的比值,以每 个组距为底,以各频率除以组距的商为高,分别画成矩形,这 样就得到了频率分布直方图.
②频率分布直方图的特点. 从频率分布直方图可以清楚地看出数据分布的总 体态势, 但是从直方图本身得不出原始的数据内容. 所 以,把数据表示成直方图后,原有的具体数据信息就 被抹掉了.
3.样本的数字特征
最多
_ _ _ 1 2 2 2 [( x1 x) ( x2 x) ( xn x) ] n
_ _ _ 1 2 2 [(x1 x) ( x2 x) ( xn x) 2 ] n
注:标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大;标准差、 方差越小,数据的离散程度越小.
1.样本的频率分布 (1)样本的频率分布的定义 根据随机所抽样本可能性的大小,分别计算某一事件出现的频率, 这些频率的分布规律(取值状况), 就叫做样本的频率分布. 为了能直观地 显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事 件的频数,以及计算所得的相应频率列在一张表中,叫做样本频率分布 表.
3. 几种表示频率分布方法的特性 (1)随机性: 频率分布表、频率分布直方图、频率分布折线图都由样本决定, 因此它们随着样本的改变而改变.当抽取的样本变化时,所形成的样 本频率分布一般会与前一个样本频率分布有所不同.但是,它们都可 以近似地看作总体的分布. (2)规律性: 即前面提到的随着样本容量增加,频率分布逐步趋近于总与不足 频率分布表在数量表示上比较确切,但不够直观、 频率分布表 形象.分析数据分布的总体态势不太方便. 频率分布直方图能够很容易地表示大量数据,非常 直观地表明分布的形状,使我们能够看到在分布表 频率分布直 中看不清楚的数据模式.但是从直方图本身得不到 方图 原始的数据内容,也就是说,把数据表示成直方图 后,原有的具体数据信息就被抹掉了. 频率分布折线图的优点是它反映了数据的变化趋 频率分布折 势. 如果样本容量不断增大, 分组的组距不断缩小, 线图 那么折线图就趋向于总体分布的密度曲线. 频数 (频率 ) 频数 (频率 )条形图用其高表示各值的频数 (频率 ), 方 条形图 便计算机操作, 和直方图一样给人明显的直觉印象 .
(2)用样本的频率分布估计总体的分布 从一个总体得到一个包含大量数据的样本时,我们很难从一个个数 字中直接看出样本所含的信息.如果把这些数据形成频数分布或频率分 布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情 况.用样本估计总体,是研究统计问题的一个基本思想方法,而对于总 体分布,我们总是用样本的频率分布对它进行估计.
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图 中点 ,就得频率分 中各小长方形上端的______ 布折线图. 样本容量的增加,作 (2)总体密度曲线:随着________ 图时所分组数增加, 组距 减小,相应的频 率折线图会越来越接近于一条光滑曲线, 即总体 密度曲线.
4.茎叶图
(1)茎是指____________, 中间的一列数 从茎的旁边生长出来的数 叶是指____________________. 在样本数据较少时,用茎叶图表示数据的效果
较好. (2) 茎叶图有以下两个突出的优点: ①茎叶图上没有原始数据的损失; ②可随时记录,方便记录与表示.
(5)总体密度曲线 ①如果样本容量越大,所分组数越多,图中表示的频率分布就 越接近于总体在各个小组内所取值的个数与总数比值的大小.设想 如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图 实际上是越来越接近于总体的分布, 它可以用一条光滑曲线 y=f(x) 来描绘,这条光滑曲线就叫做总体密度曲线. ②并非所有的总体都存在密度曲线,如一些离散型总体. ③总体密度曲线反映了总体在各个范围内取值的百分比,它能 给我们提供更加精细的信息,总体在某一区间取值的百分比就是该 区间与该曲线所夹的曲边梯形的面积. ④总体密度曲线一般的分布规律是呈中间高、两边低的“山 峰”形分布.总体的数据大致呈对称分布,并且大部分数据都集中 在靠近中间的区间内.总体密度曲线精确地反映了一个总体在各个 区域内取值的规律.
(6)茎叶图 茎叶图是一种将样本数据有条理地列出来,从中观察样本分布 情况的图. 茎是指中间的一列数,叶是从茎的旁边生长出来的数. 在样本数据较少时.用茎叶图表示数据的效果较好.但当样本 数据较多时,茎叶图就显得不太方便了.
验算 考试中某学生拿出骰子,摇出十道选择题答案。 快结束时他突然又拿出来摇。 监考老师终于忍无可忍:“你在干什么?” 学生答:“我在验算。”
4.平均数、标准差、方差的计算 (1)平均数的计算方法 a1+a2+…+an ①定义法: n 个数据 a1, a2, …, an 的平均数- A= . n ②利用加权平均数公式 a.若取值为 x1, x2,… xn 的频率分别为 p1,p2,…, pn,则其 平均数为 - x = p1x1+ p2x2+…+pnxn. b.在 n 个数据中,如果 x1 出现 f1 次, x2 出现 f2 次,…, xk 出 现 fk 次 (f1 + f2 + … + fk = n) , 则这 n 个 数的 平均 数 为 : - x= x1f1+ x2f2+…+ xkfk n
(4).作频率分布直方图的步骤
最大值 最小值
组距 组数
频率分布表
频率分布直方图 注:频率分布直方图中,矩形块面积表示落在相应区 域的数据频率,各矩形面积之和等于1.
(4)频率分布折线图 把频率分布直方图各个长方形上边的中点用线段连接起来,就 得到频率分布折线图,如图所示.为了方便看图,一般习惯于把频 率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际 的意义.
相关文档
最新文档