高中数学知识点精讲精析 总体和样本
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18.1 总体和样本
要点精讲
1.用样本的数字特征估计总体的数字特征
(1)众数、中位数
在一组数据中出现次数最多的数据叫做这组数据的众数;
将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;
(2)平均数与方差
如果这n个数据是,那么叫做这n个数据平均数;
如果这n个数据是,那么叫做这n个数据方差;同时叫做这n个数据的标准差。
2.频率分布直方图、折线图与茎叶图
样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多
典型例题
【例1】某工厂人员及工资构成如下:
(1)指出这个问题中的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?
【答案】由表格可知:众数为200.
∵2 200+1 500=3 700>1100+2 000十100=3 200,
∴中位数为220.
平均数为(2200+1500+1100+2000+100)÷23
=6 900÷23=300.
虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.平均数受数据中的极端值的影响校大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观.
【解析】本题着眼于众数、中位数、平均数各自的特点,以及其适应对象.
【例2】对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27,38,30,37,35,31;
乙:33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀. 【答案】x 甲=61(27+38+30+37+35+31)= 6198
=33,
s2甲=61[(27-33)2+(38-33)2+…+(31-33)2]=61
×94≈15.7
x 乙=61(33+29+38+34+28+36)=6198
=33
s2乙=61[(33-33)2+(29-33)2+…+(36-33)2]=61
×76≈12.7 ∴x 甲=x 乙, s2甲>s2乙.说明甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀. 【解析】这显然是要计算两组数据的x 与s2,然后加以比较并作出判断.虽然两人的平均速度相同,但乙的方差较小,说明乙比甲更稳定. 温馨提示: 本题若仅由乙甲x x ,易产生这两人成绩一样好的错觉,这表明在实际问题中,仅靠期望值(即平均数)不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差):标准差大说明取值分散性大;标准差小说明取值分散性小或者说取值比较集中、稳定.