大学课程《统计学》之抽样分布与参数估计a
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、抽样推断的有关概念
• (一)总体和样本
• 1、总体(N)
– 所要认识对象的全体。有限总体
和 无限总体
• 2、样本(n)
– 所抽取的一部分单位。
– (1)大样本(n>30) – (2)小样本(n≤30)
(二)样本容量与样本个数 • 1.样本容量
– 是一个样本中所包含的单位数。
• 2.样本个数
– 即样本可能数目。是指从一个总体中可能抽取
(四)总体参数和样本统计量
• 1、总体参数:用来描述总体特征的指标
X
x
P
P
• 2、样本统计量:描述样本特征的指标 p S p (S 2 p ) x S (S2 x )
– 总体参数是一个常数,而样本统计量是一个随机变量
• 3、参数估计概念
(五)抽样框
• 是有关总体全部单位的名录,是实施 抽样的基础
• 2.正态分布的再生定理、
2 – 若变量服从正态分布(u, ),从中抽出容 量为n的样本,则样本平均数也服从正态分布 2 (u, )。
• 3、中心极限定理
n
第二节
抽样分布
一、三种分布含义
• 总体分布:
– 总体中各单位取值形成的分布。往往未知
• 样本分布
– 样本各单位取值形成的分布。能反映总体分 布,特别当n较大时,就接近总体分布
• (三)样本方差的抽样分布
– 若总体为正态分布,则随机抽取的样本方差 的比值服从自由度为n-1的卡方分布。
第三节
参数估计
一、估计量的优良标准
• 无偏性
– 估计量的数学Βιβλιοθήκη Baidu望等于被估计的总体参数, 则该估计量为无偏估计量。
• 有效性
– 估计量的方差越小,则估计越有效。
• 一致性
– 随样本容量的增大,估计量的值越来越接近 被估计总体的参数。
E( x )
x
2 N n
n ( N 1
)
• 2.样本平均数的分布规律
– (1)若总体服从正态分布,则无论样本容
量如何,样本均值服从正态分布; – (2)若总体为非正态分布,样本为大样本 ( n≥30),样本均值近似服从正态分布
样本统计量的抽样分布
• (二)样本比例的抽样分布
– 当样本容量足够大时(np ≥5),样本比例 近似服从正态分布,其数学期望为总体比例 P
– ①等额分配:在各类型组中分配同等单位数。 – ②等比例分配:按各类型组在总体中所占比例分配样本单 n1 n 2 nk n 位数。即: N1 N 2 Nk N – ③最优分配:按各类型组的规模大小和差异程度,确定各 类型组的样本单位数。
3、等距抽样(系统抽样、机械抽样)
• 概念:将总体各单位标志值按某一标志顺序排
– 名称抽样框 – 区域抽样框 – 时间表抽样框
理想抽样框应该与目标总体一致,包含
全部总体单位。
二、抽样组织形式
• 随机抽样
• 非随机抽样
– 任意抽样技术 – 简单随机抽样 – 判断抽样技术 – 类型抽样 – 配额抽样技术 – 等距抽样 –固定样本连续 – 整群抽样 调查法 – 阶段抽样
1.简单随机抽样
• 概念:又称纯随机抽样。它是不对总体作
任何加工整理,直接从总体中随机抽取调 查单位的抽样调查方法。简单随机抽样是 最常用的纯随机抽样。
• 方法:
–抽签法 –随机数表法
2、类型抽样(分层抽样、分类抽样)
• (1)概念:将总体全部单位按某个标志分成 若干个类型组,然后从各类型组中采用简单 随机抽样方式或其它方式抽取样本单位。 • (2)样本单位数在各类型组中的分配方式
多少个样本。与抽样方法有关。
(三)抽样方法
• 1、重复抽样
–从总体的N 个单位中要随机抽取一个容量为n的 样本,每次从总体中抽出一个单位后,经过调查 又把它放回到总体中,重新再参加下一次抽选。
• 2、不重复抽样
– 就是每抽出一个单位后,就不再放回总体 中去参加以后的抽取。实际上不重复抽样 就等于一次同时从总体中抽取n个单位。
Z ) 1
2
做不等式的等价变换后得:
1 概率下:x Z
抽样极限误差
2
x Z 2 n n
(二)总体方差未知
样本平均数服从正态分布,但要用样本方差代替 总体方差。此时其标准化后的样本统计量 x S x态分布近似 服从自由度为n-1的t分布(大样本时可以正
第五章
抽样分布与参数估计
-w y l-
内容:
• 第一节 抽样的基本概念
• 第二节 抽样分布
• 第三节 参数估计
• 第四节 样本容量的确定
第一节
抽样的基本概念
一、抽样推断
• (一)概念
– 从被研究现象的总体中按照随机原 则抽取一部分单位进行调查,并依 据调查结果对全部研究对象的数量 特征作出具有一定可靠程度的估计 ,以达到对全部研究对象认识的一 种统计方法。
• 抽样分布
– 所有可能的样本,其样本统计量的具体数值 表现出的分布。是进行参数估计的基础。
• (一)样本平均数的抽样分布 • 1.样本平均数的期望值与方差
– 重复抽样下:
• 样本平均数的期望值:
• 样本平均数的标准差:
E( x )
x
n
– 不重复抽样下:
• 样本平均数的期望值: • 样本平均数的标准差:
队,然而按一定的间隔抽取样本单位。
• 排队的方法:①按无关标志 ②按有关标志 • 抽取样本单位的方法
– ①按相等的距离取样 ②对称等距取样
• 抽取第一个样本单位的方法
– ①随机抽取 ②居中抽取
4、整群抽样
• 概念:把总体分为若干群,从总体群中抽 取若干样本群,对抽中的群进行全数登记 调查。 如:某水泥厂一昼夜的产量为14400袋, 现每隔144分钟抽取1分钟的水泥(10袋) 检查平均每袋重量和一级品率
5、阶段抽样
• 概念:抽样时,先抽总体中较大范围
的单位,再从中选的较大范围的单位 中抽取较小范围的单位,依此类推, 最后得到样本的基本单位。
• 例:某地区有300户居民,分成10群,现 从10群中抽6群,再从抽中的群中每群抽 2户调查其平均收入
三、大数定理和中心极限定理
• 1.大数定理
– 当n充分大时,样本平均与总体平均之间的误 差可有很大的把握被控制在任意给定的范围内
参数估计
• 二、参数估计的方法
– (一)点估计
Xx
Pp
s
2
2
– (二)区间估计
–
–
1、平均数的区间估计
2、成数的区间估计
三、总体均值的区间估计
• (一)总体方差已知
– 样本平均数服从正态分布。其标准化后的样本统计量
x 服从标准正态分布。则有:
x
P ( Z
2
x
x