用样本的数字特征估计总体的数字特征(众数、中位数、平均数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解法二:求组中值与对应频率之积的和

6.25×0.05+6.75×0.17+

7.25×0.33+7.75×0.37+

8.25×0.06+8.75×0.02=7.39(h).

答:估计该校学生的日平均睡眠时间约为7.39 h.

例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.

分析:上述百分比就是各组的频率.

解:估计该单位职工的平均年收入为

12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).

答:估计该单位人均年收入约为26 125元

小结:1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;

2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;

3.形成对数据处理过程进行初步评价的意识.

五.巩固练习:

“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.

你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?

这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.

在这里应该注意以下几点:

1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.

2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.

3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.

4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.

5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.

课堂检测

个范围,可以用各组区间的组中值近似地表示.

解法一:总睡眠时间约为

6.25×5+6.75×17+

7.25×33+7.75×37+

8.25×6+8.75×2=739(h),

故平均睡眠时间约为7.39 h.

解法二:求组中值与对应频率之积的和

6.25×0.05+6.75×0.17+

7.25×0.33+7.75×0.37+

8.25×0.06+8.75×0.02=7.39(h).

答:估计该校学生的日平均睡眠时间约为7.39 h.

例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.

分析:上述百分比就是各组的频率.

解:估计该单位职工的平均年收入为

12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元). 答:估计该单位人均年收入约为26 125元

相关文档
最新文档