用样本估计总体知识讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体
【学习目标】
1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
5.会用样本的基本数字特征估计总体的基本数字特征.
【要点梳理】
要点一、频率分布的概念
频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:
1.计算一组数据中最大值与最小值的差,即求极差
2.决定组距与组数
3.将数据分组
4.列频率分布表
5.画频率分布直方图
要点诠释:
频率分布直方图的特征:
1.从频率分布直方图可以清楚的看出数据分布的总体趋势.
2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
要点二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线的定义:
在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
要点诠释:
总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.
要点三、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
要点诠释:
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
要点四、众数、中位数与平均数
1.众数
一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出
一项决定,考察全班同学对它赞成与否就可以用众数.
2.中位数
将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.
3.平均数
样本数据的算术平均数,即121
()n x x x x n
=
+++.
要点诠释:
由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.
要点五、标准差与方差 1.标准差
样本数据1,2,
,n x x x 的标准差的算法:
(1)算出样本数据的平均数x .
(2)算出每个样本数据与样本数据平均数的差:()12i x x i n -=, ,, (3)算出(2)中()12i x x i n -=, ,,的平方. (4)算出(3)中n 个平方数的平均数,即为样本方差. (5)算出(4)中平均数的算术平方根,,即为样本标准差. 其计算公式为:
(n s x =
+-
2.方差
从数学的角度考虑,人们有时用标准差的平方2
s (即方差)来代替标准差,作为测量样本数据分散程度的工具:
2222121
[()()()]n s x x x x x x n
=
-+-++-
要点诠释:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差. 数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.
【典型例题】
类型一:频率分布表、频率分布直方图
例1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【答案】(1)60 (2)四组18(3)六组
【解析】(1)依题意知第三组的频率为
41 2346415
=
+++++
.
∵第三组的频数为12,
∴本次活动的参评作品数为12
60
1
5
=件).
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有
6
6018 234641
⨯=
+++++
(件).
(3)第四组的获奖率是105 189
=,
第六组上交的作品数量为
1
603
234641
⨯=
+++++
(件),
∴第六组的获奖率为26 39 =.
显然第六组的获奖率较高.
【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.举一反三:
【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.
例2.阅高考试卷有一个环节叫“试批”.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:分):
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112