高二数学用样本的数字特征估计总体的数字特征
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 众数考查各数据出现的频率,大小只与这 组数据中的部分数据有关,当一组数据中 有不少数据多次重复出现时,其众数往往 更能反映问题. • (2)一组数据的中位数是唯一的,求中位数 时,必须先将这组数据按从小到大(或从大 到小)的顺序排列,如果数据的个数是奇数, 那么最中间的一个数据是这组数据的中位 数,如果数据的个数为偶数,那么,最中 间两个数据的平均数是这组数据的中位 数.
2.样本方差、标准差 设样本数据 x1,x2,x3,„,xn 的平均数为- x ,称 1 S =n[(x1-- x )2+(x2-- x )2+„+(xn-- x )2]和
2
S=
(x1- x )2+(x2- x )2+„+(xn- x )2 为这些样本 n
数据的样本方差和样本标准差.
• 重点:理解样本标准差的意义和作用,会 计算样本标准差. • 难点:理解样本标准差的意义和作用,形 成对数据处理的评价意识.
• 2 .众数、中位数、平均数与频率分布直 方图的关系: • (1)众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标. • (2)在样本数据中,有50%的个体小于等于 中位数,所以在频率分布直方图中,中位 数左边和右边的直方图面积相等.
• (3)平均数是频率分布直方图的重心,代表 了一组数据的数值平均水平,在频率分布 直方图中,平均数是直方图的平衡点.用 频率分布直方图估计平均数时,平均数的 估计值约等于频率直方图中每个小矩形的 面积乘以小矩形底边中点的横坐标之和. • (4)样本中位数与通过频率分布直方图估计 的中位数可能会有所不同,原因是频率分 布直方图已经损失了一些样本信息. • 总体的特征数字获得方法有: ( 一 ) 直接利 用样本数据估计. ( 二 ) 利用频率分布直方 图估计.
• (3)如果有 n个数x1,x2,x3,„,xn,那么= 总体中所有个体的平均数 叫做这n个数的平均数. 样本中所有个体的平均数 • 叫做总体平均数. • 叫做样本平均数.
(x1+x2+„+xn)
• 如果在n个数中,x1出现f1次,x2出现f2 (x 次,„,xk出现fk次(这里f1+ f1 fk=xn , 1+x2f2+„+ kf) k) 2f+„+ 那么= 叫做这n个数的加 权平均数.其中f1,f2,„,fk叫做权.
中位数可能出现在所给数据中,也可能不在所给数 据中.当一组数据中的个别数据变动较大时,可用中位 数描述其集中趋势. (3)平均数定量的反映了数据集中趋势所处的平均水 平.平均数的大小与一组数据里每个数据均有关系,任 何一个数据的变动都会引起平均数的变化.当数据较大 时,用公式- x = x′ +a 简化计算.
• 同一个总体由于抽取的样本不同,样本平 均数、样本方差(标准差)也都会有差 异.这样就会影响我们对总体的估计,选 用哪个估计总体更准确呢,那就是抽样时 保证样本的代表性要强,其估计就准 确.统计学是一门与数据打交道的学科, 其基本内容就是研究如何搜集、整理、计 算和分析数据,从中找出一些规律,从而 去对总体的情况作出估计.
• 2.2.2 用样本的数字特征估 计总体的数字特征
• 1.众数、中位数、平均数 最多 • (1)在一组数据中,出现次数 的数据 叫做这组数据的众数. • (2) 将一组数据从小到大 ( 或从大到小 )顺序 中间 中间 依次排列,把处在 位置的 一个数据 (或 两个数据的平均数)叫做这组数据 的中位数. 0.5 • 即:中位数是样本数据中,累积频率为 时所对应的样本数据值.
• 我们已经学习了用图、表来组织样本数据, 并且学习了如何通过图、表所提供的信息, 用样本的频率分布估计总体的分布.为了 从整体上更好地把握总体的规律,我们还 需要通过样本的数据对总体的数字特征进 行研究.
• 一、要真正弄清每一个概念及有关公式的 含义、作用 • 1 .众数、中位数、平均数都从不同描述一组数据集中趋势的量. • (1)一组数据中的众数可能不止一个,众数 是一组数据中出现次数最多的数据,而不 是该数据出现的次数.如果有两个数据出 现的次数相同,并且比其它数据出现次数 都多,那么这两个数据都是这组数据的众 数.
• 2.(1)总体特征数是指描述总体平均水平 的总体平均数和描述总体波动状况的总体 方差(标准差)等.在实践中总体包括很多 数据,其平均数、标准差往往很难求或不 可求,通常的做法是用样本的平均数与标 准差去估计总体的平均数或标准差,这与 前面用样本的频率分布来近似地代替总体 分布是类似的.只要样本的代表性好,这 样做就是合理的.
• 众数体现了样本数据的最大集中点,但它 对其它数据信息的忽视使得无法客观地反 映总体特征;中位数是样本数据所占频率 的等分线,它不受少数几个极端值的影响, 这在某些情况下是优点,但它对极端值的 不敏感有时也成为缺点.因为这些极端值 有时是不能忽视的.
• 由于平均数与每一个样本数据有关,所以 任何一个样本数据的改变都会引起平均数 的改变,这是众数、中位数都不具有的性 质.也正因为这个原因,与众数、中位数 比较,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极 端值的影响较大,使平均数在估计总体时 可靠性降低. • 实际问题中求得的平均数、众数和中位数 应带上单位.
• 二、1.(1)单从众数、中位数、平均数、最 大值、最小值、极差(全距)来分析数据, 各个数据的波动情形无法更好更全面的体 现.最大、小值,极差更多地体现数据的 波动幅度.我们要考察样本数据的分散程 度大小,可以看样本数据到平均数的一种 平均距离.
• (2)标准差、方差描述了一组数据围绕平均 数波动的大小,标准差(方差)越大,数据 的波动范围就越大,分布就越分散,标准 差(方差)越小,数据的波动程度就越小, 数据离散程度就小,分布就越集中.方差 与原始数据单位不同,平方后可能夸大了 偏差的程度.所以虽然方差与标准差在刻 划样本数据的分散程度上是一样的,但实 际解决问题时一般多采用标准差. • (3)标准差、方差的取值范围是[0,+∞), 当方差、标准差为0时,样本各数据全相 等.