抽样方法与总体分布的估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考理数
§11.5 抽样方法与总体分布的估计
知识清单
考点一 随机抽样 1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个① 不放
回 地抽 取n个个体作为样本(n≤N),如果每次抽取时各个个体被抽到的机
会都 相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2 3 7 3 3 3 111
5 10 10 500 125
(2)根据题意5,年1龄0 分10别为5 4110岁,4170岁5,5030岁的教师过关的概率分别为 , ,
300
∴p= =0.65,第四组共有1 000×0.15=150人,∴a=150×0.4=60,
23
第五组共有1 000×0.1=100人,∴q=30÷100=0.3.
5 10
3
10
综上,a=60,3p=07.65,q7=0.31.47
2 7 7 3 3 7 224 56
5 10 10 500
5 10 10
6 z 2y,
若用分层抽样的 y方2 法6抽(z 取61),2个观测点的数据,则容城应抽取的数据个数 为12× =4,故选C.
12 6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
考点二 用样本估计总体 1.频率分布表:把反映总体频率分布的表格称为频率分布表. 2.频率分布直方图:能够反映样本的频率分布规律的直方图. 3.频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的
中点 顺次连接起来,就得到频率分布折线图. 4.总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,
x)2
( x2
x)2
( xn
x)2
]
注意:方差和标准差描述了一组数据与平均数的离散程度,反映了一组 数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波 动性越大.
方法 1 抽样方法
方法技巧
1.三种抽样方法的区别与联系
2.系统抽样的最基本特征是“等距性”,一般地,每组内所抽取的号 码依据第一组抽取的号码和组距唯一确定,每组抽取的号码依次构成一
2.系统抽样 将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部
3.分层抽样 (1)定义:一般地,在抽样时,将总体③ 分成互不交叉 的层,然后按照一 定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在 一起作为样本,这种抽样方法是一种分层抽样. (2)应用范围:总体是由④ 差异明显 的几个部分组成的.
个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽
取的号码ak=m+(k-1)d.
3.分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,
抽样比体数量
(1)(2017河北石家庄二中三模,3)某校为了解1 000名高一新生的身体状 况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~
则相 应的频率折线图将趋于一条光滑曲线,即总体密度曲线. 5.茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位
)两部
6.样本的数字特征
(1)众数、中位数、平均数
数字特征 样本数据
频率分布直方图
众数
出现⑤ 次数最多 的数据
取最高的小矩形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一 把频率分布直方图划分为左右两个面积
例2 (2017四川遂宁射洪中学三诊,18)射洪县教育局从去年参加了计 算机职称考试,并且年龄在[25,55]岁的教师中随机抽取n人的成绩进行 了调查,得到如下统计表和各年龄段人数的频率分布直方图:
(1)补全频率分布直方图,并求a、p、q的值; (2)若用以上数据来估计今年参考老师的过关情况,并将每组的频率视 作对应年龄阶段老师的过关概率,考试是否过关互不影响.现有三名教 师参加该次考试,年龄分别为41岁、47岁、53岁.记ξ为过关的人数,请利 用相关数据求ξ的分布列和数学期望.
解析 (1)∵从1 000名学生中抽取一个容量为40的样本,
∴系统抽样的分段间隔为1 0=0205,设第一组随机抽取的号码为x, 则抽取的第18组的号码为x+4107×25=443,∴x=18.故选C.
(2)∵三县内观测点的个数分别为6,y,z,且依次构成等差数列,且6,y,z+6
成等比数列,∴ ∴y=12,z=18,
1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽
样抽取的号码为 ( C )
A.16 B.17 C.18 D.19
(2)(2017山东淄博二模,6)为了调研雄安新区的空气质量状况,某课题组 对雄县、容城、安新3县的空气质量进行了调查,按地域特点在三县内 设置空气质量观测点,已知三县内观测点的个数分别为6,y,z,依次构成 等差数列,且6,y,z+6成等比数列,若用分层抽样的方法抽取12个观测点 的数据,则容城应抽取的数据个数为 ( C ) A.8 B.6 C.4 D.2
解析 (1)根据频率和为1,得年龄在[30,35)内的频率为1-(0.04+0.04+0.03
+0.02+0.01)×5=0.3,∴0 .3=0.06, ∴补全的频率分布直方5图如图所示:
第一组的人数为120=200,频率为0.04×5=0.2,∴n= 20=01 000.
0.6
0.2
第二组19的5 频率为0.3,∴第二组的人数为1 000×0.3=300,
个数据(或最中间两个数据的平均数)
相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数
(2)方差和标准差
每个小矩形的面积乘小矩形底边中点的 横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:s2=1 [(x1x- )2+(xx2- )2+…x+(xn- )2];
标准差:sn= 1.
n [(x1
§11.5 抽样方法与总体分布的估计
知识清单
考点一 随机抽样 1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个① 不放
回 地抽 取n个个体作为样本(n≤N),如果每次抽取时各个个体被抽到的机
会都 相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2 3 7 3 3 3 111
5 10 10 500 125
(2)根据题意5,年1龄0 分10别为5 4110岁,4170岁5,5030岁的教师过关的概率分别为 , ,
300
∴p= =0.65,第四组共有1 000×0.15=150人,∴a=150×0.4=60,
23
第五组共有1 000×0.1=100人,∴q=30÷100=0.3.
5 10
3
10
综上,a=60,3p=07.65,q7=0.31.47
2 7 7 3 3 7 224 56
5 10 10 500
5 10 10
6 z 2y,
若用分层抽样的 y方2 法6抽(z 取61),2个观测点的数据,则容城应抽取的数据个数 为12× =4,故选C.
12 6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
考点二 用样本估计总体 1.频率分布表:把反映总体频率分布的表格称为频率分布表. 2.频率分布直方图:能够反映样本的频率分布规律的直方图. 3.频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的
中点 顺次连接起来,就得到频率分布折线图. 4.总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,
x)2
( x2
x)2
( xn
x)2
]
注意:方差和标准差描述了一组数据与平均数的离散程度,反映了一组 数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波 动性越大.
方法 1 抽样方法
方法技巧
1.三种抽样方法的区别与联系
2.系统抽样的最基本特征是“等距性”,一般地,每组内所抽取的号 码依据第一组抽取的号码和组距唯一确定,每组抽取的号码依次构成一
2.系统抽样 将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部
3.分层抽样 (1)定义:一般地,在抽样时,将总体③ 分成互不交叉 的层,然后按照一 定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在 一起作为样本,这种抽样方法是一种分层抽样. (2)应用范围:总体是由④ 差异明显 的几个部分组成的.
个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽
取的号码ak=m+(k-1)d.
3.分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,
抽样比体数量
(1)(2017河北石家庄二中三模,3)某校为了解1 000名高一新生的身体状 况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~
则相 应的频率折线图将趋于一条光滑曲线,即总体密度曲线. 5.茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位
)两部
6.样本的数字特征
(1)众数、中位数、平均数
数字特征 样本数据
频率分布直方图
众数
出现⑤ 次数最多 的数据
取最高的小矩形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一 把频率分布直方图划分为左右两个面积
例2 (2017四川遂宁射洪中学三诊,18)射洪县教育局从去年参加了计 算机职称考试,并且年龄在[25,55]岁的教师中随机抽取n人的成绩进行 了调查,得到如下统计表和各年龄段人数的频率分布直方图:
(1)补全频率分布直方图,并求a、p、q的值; (2)若用以上数据来估计今年参考老师的过关情况,并将每组的频率视 作对应年龄阶段老师的过关概率,考试是否过关互不影响.现有三名教 师参加该次考试,年龄分别为41岁、47岁、53岁.记ξ为过关的人数,请利 用相关数据求ξ的分布列和数学期望.
解析 (1)∵从1 000名学生中抽取一个容量为40的样本,
∴系统抽样的分段间隔为1 0=0205,设第一组随机抽取的号码为x, 则抽取的第18组的号码为x+4107×25=443,∴x=18.故选C.
(2)∵三县内观测点的个数分别为6,y,z,且依次构成等差数列,且6,y,z+6
成等比数列,∴ ∴y=12,z=18,
1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽
样抽取的号码为 ( C )
A.16 B.17 C.18 D.19
(2)(2017山东淄博二模,6)为了调研雄安新区的空气质量状况,某课题组 对雄县、容城、安新3县的空气质量进行了调查,按地域特点在三县内 设置空气质量观测点,已知三县内观测点的个数分别为6,y,z,依次构成 等差数列,且6,y,z+6成等比数列,若用分层抽样的方法抽取12个观测点 的数据,则容城应抽取的数据个数为 ( C ) A.8 B.6 C.4 D.2
解析 (1)根据频率和为1,得年龄在[30,35)内的频率为1-(0.04+0.04+0.03
+0.02+0.01)×5=0.3,∴0 .3=0.06, ∴补全的频率分布直方5图如图所示:
第一组的人数为120=200,频率为0.04×5=0.2,∴n= 20=01 000.
0.6
0.2
第二组19的5 频率为0.3,∴第二组的人数为1 000×0.3=300,
个数据(或最中间两个数据的平均数)
相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数
(2)方差和标准差
每个小矩形的面积乘小矩形底边中点的 横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:s2=1 [(x1x- )2+(xx2- )2+…x+(xn- )2];
标准差:sn= 1.
n [(x1