第14讲 随机抽样
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第14讲 随机抽样
第一部分 知识梳理 1.简单随机抽样
(1)相关概念:总体、个体、样本、样本容量。 (2)基本思想:用样本估计总体。
(3)简单随机抽查概念。一般的,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本
)(N n ≤,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
其特点:①总体个数有限;②逐个抽取;③不放回抽样;④等可能抽样。 (4)抽样方法:①抽签法;②随机数表。 2.系统抽样
(1)定义:当总体元素个数很大时,样本容量不宜太小,这时可将总体分为均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本(等距抽样)。 (2)步骤:①编号;②分段;③不确定起始个体编号;④按规则抽取。 3。分层抽样
(1)定义:当总体由差异明显的几部分组成时,为了使抽取的样本更好的反应总体情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样。
适用特征①总体由差异明显的几部分组成;②分成的各层互不重叠;③各层抽取的比例等于样本客样在总体中的比例,即
N
n 。 4.三种抽样方法的区别和联系
类别 共同点
各自特点 相互联系
适用范围 简单随机抽样
抽样过程中每个个体被抽到的机会相
等
从总体中逐个抽取 最基本的抽样方法
总体容量较小时
系统抽样
将总体分成均衡的几部分,按事先制定的规则在各部分
抽取 在起始部分抽样时,采用简单随机
抽样 总体容量较大时
分层抽样
将总体按某种特征分成几层,分层进
行抽取
各层抽样时可采用简单随机抽样或系
统抽样
总体由差异明显的几部分组成时
5.用样本的频率分布估计总体的分布(统计图表) 1)列频率分布表,画频率分布直方图:
(1)计算极差(2)决定组数和组距(3)决定分点(4)列频率分布表(5)画频率分布直方图 2)茎叶图;3、扇形图; 4、条形图;5、折线图; 6、散点图。
说说茎叶图的特点:______________________________________________________________________ 6.用样本的数字特征估计总体的数字特征 1)有关概念
(1)众数:频率分布最大值所对应的样本数据(或出现最多的那个数据)。 (2)中位数:累积频率为0.5时,所对应的样本数据。 (3)平均数:)(1
21n x x x n
x +++=
(4)三个概念的区别:①都是描述一组数据集中趋势的量,平均数较重要。②平均数的大小与每个数相关。③众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数更能反映问题,中位数仅与排列有关。 2)样本方差与样本标准差
(1)样本方差:(
)()(
)[]2
222121
x x x x x x n
S n -++-+-=
样本方差大说明样本差异和波动性大。
(2)样本标准差:方差的算术平方根(
)()(
)[]2
22211
x x x x x x n
S n -++-+-=
(
)
[]
()
22
2221222221211x x x x n
x n x x x n S n n -+++=-+++=
(3)要有单位,方差的单位是原数据的单位的平方,标准差的单位与原数据单位同。
7.变量的相关性:
1)变量与变量之间存在着的两种关系①函数关系:确定性关系。②相关关系:自变量的取值带有一定的随机性的两个变量之间的关系。
当一个变量的值由小变大时另一个变量也由小变大叫正相关,当一个变量的值由小变大时另一个变量也由大变小叫负相关。③异同点
2)两个变量的线性关系①回归分析对具有相关关系的两个变量进行统计分析的方法。②散点图 3)回归直线方程
①回归直线,bx a y += ,回归直线方程,b a ,回归系数,y
为了区分y ,表示取i x 时,y 相应的观察值。 ②最小二乘法 ③回归直线方程求法
1)分别计算∑∑∑===n
i i i n
i i n
i i y x y x y x 1
1
2
1
2
,,,,2)分别计算x b y a x n x
y x n y
x b n
i i
n
i i
i -=--=
∑∑==
,2
1
21
3)代入bx a y +=
可得回归方程。
第二部分 精讲点拨
考点1 三种抽样方法的选择
例1 一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。
小结:根据三种抽样方法的共同点,适用范围和各自的特点,恰当选取抽样方法。
[]1.EX 某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( ) (A)①用简单随机抽样法,②用系统抽样法 (B)①用分层抽样法,②用简单随机抽样法 (C)①用系统抽样法,②用分层抽样法 (D)①用分层抽样法,②用系统抽样法
[]2.EX 某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆舒畅行检验,这三种型号的轿车依次应抽取__________________辆