(完整版)用样本的数字特征估计总体的数字特征

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.2.2用样本的数字特征估计总体的数字特征 (两课时)

零号作业

一、众数、中位数、平均数

1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.

(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.

(3)在直方图中为最高矩形下端中点的横坐标 2、中位数:

(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.

[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.

(3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半

3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x

n

x 1+x 2+…+x n

n

(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.

(3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差

1、标准差

(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算

s =

1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2

]可以用计算器或计算机计算标准差.

(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小.

2.方差

(1)定义:标准差的平方,

即s 2

=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]

(2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞)

3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2

+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为

4、规律总结

(1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.

用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据

(2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.

(3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.

列出一组样本数据的频率分布表步骤

说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.

2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.

用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.

3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.

一号作业1

1、众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.

(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.在直方图中为最高矩形下端中点的____________

最多不止集中趋势横坐标

2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.

(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______.

.中间唯一集中趋势相等

3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.

(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的. ______

x1+x2+…+x n

n

平均水平信息极端值乘积之和

4.标准差

(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.

可以用计算器或计算机计算标准差.

(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1

n[(x1-x)2+(x2-x)2+…+(x n-x)2]平均数大小

5.方差(1)定义:标准差的平方,

即s2=________________________________________.

(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.

(3)取值范围:___________.

1

n[(x1-x)2+(x2-x)2+…+(x n-x)2] 标准差[0,+∞)

数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.

典例讲解

中位数、众数、平均数的应用

例1据报道,某公司的33名职工的月工资(以元为单位)如下:

(1)求该公司的职工月工资的平均数、中位数、众数;

(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)

(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.

[解析](1)平均数是

x=1 500+

4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×20

33

≈1 500+591=2 091(元).

中位数是1 500元,众数是1 500元.

(2)平均数是x′=1 500+

28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×20

33

≈1 500+1 788=3 288(元).

中位数是1 500元,众数是1 500元.

(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.

练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;

乙群54,3,4,4,5,5,6,6,6,57.

(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?

相关文档
最新文档