第四章_抽样与抽样估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意: (1)统计量只依赖于样本,而不包含任 何未知参数。
(2)由于样本具有随机性,统计量属于 随机变量。
抽样误差
• 在抽样调查中,误差来源有登记性误差和代表性误差。
• 登记性误差是指在调查和汇总过程中由于观察、测量、
登记、计算等方面的差错或被调查者提供虚假资料而 造成的误差。
• 代表性误差是指用样本指标推断总体指标时,由于样
一般正态分布与标准正态分布的联系
一般正态分布
Z X
x
标准正态分布
1
Z
大数定理与中心极限定理
1. 大数定理是样本平均估计总体平均的理论依 据。由于从总体中抽出的样本是独立且与总 体同分布的,因此,当样本容量n充分大时, 样本平均与总体平均之间的误差可以有很大 把握被控制在任意给定的要求之内,所以可 以用样本平均估计总体平均。
❖由于频率取值在0~1之间,因此0≤p≤1。
概率的古典定义
❖ 如果某一随机试验的结果有限,而且各个
结果在每次试验中出现的可能性相同,则 事件A发生的概率为该事件所包含的基本 事件个数 m 与样本空间中所包含的基本事 件个数 n 的比值,记为
P( A)
事件A所包含的基本事件个数 =m 样本空间所包含的基本事件个数 n
的期望值和方差存在,则从该总体中
相互独立地随机抽取容量为n的样本,
则样本平均数也是随机变量,当n足够
大时(一般要大于30),该样本平均
数近似地服从数学期望为X ,方差为 2
的正态分布。
n
即:
2
x ~ N(X, )
n
统计量
• 样本指标又称样本统计量或估计量,是根据样本
资料计算的、用以估计和推断相应总体指标的综
f(x) B
A
C x
标准正态分布
1. 若一个正态分布的 0, 1 ,则称该分布为标准
正态分布 ,记为:Z ~ N(0,1)。相应的分布密度 函数为 :
(x)
1
x2
e2
,
x
2
2、任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布:
Z X ~ N (0,1)
即若X~N( , ),则 Z X ~ N (0,1)
2、(1)中心极限定理的基本思想是:从直观上
看,如果一个随机变量决定于大量乃至无穷 随机因素的总和,其中每个随机因素的单独 作用微不足道,而且各个因素的作用相对均 匀,则称该随机变量服从或近似服从正态分 布。
大数定理与中心极限定理
(2)从中心极限定理可以得出一个重要结
论:无论总体服从何种分布,只要它
本结构与总体结构不一致,样本不能完全代表总体而 产生的误差。代表性误差有系统误差和随机误差。
• 系统误差是指由于非随机因素引起的样本代表性不足
而产生的误差。随机误差是指遵循随机原则,由于随 机因素(偶然性因素)引起的代表性误差。
第四章 抽样与抽样估计
• 第一节 抽样推断基础 • 第二节 抽样分布 • 第三节 抽样估计的基本方法
学习目标
1. 了解抽样和抽样分布的基本概念 2. 理解抽样分布与总体分布的关系 3. 了解点估计的概念和估计量的优良标准 4. 掌握总体均值、总体比例和总体方差的区
间估计 5. 掌握样本容量的确定
第一节 抽样推断基础
❖随机试验的每一个可能 结果称为随机事件.
• 决定性现象是指在一定条件下,结果能够
明确预见的现象。
概率的定义
❖概率就是指随机事件发生的可能性,或 称几率,是对随机事件发生可能性的度量。
❖从不同的角度概率有不同的定义,其主 要定义有:统计定义、古典定义、主观定 义。
概率的统计定义
❖概率的统计定义:进行n次重复试验,随 机事件A发生的次数是m次,发生的频率 是m/n,当试验的次数很大时,如果频率 在某一数值p附近摆动,而且随着试验次 数n的不断增加,频率的摆动幅度越来越 小,则称p为事件A发生的概率,记为:P (A)=p。
• 1、密度函数曲线下的面积等于1 2、分布函数是曲线下小于 x0 的面积
f(x)
F ( x0 )
x0
x
随机变量分布特征
• 描述随机变量分布特征的主要指ห้องสมุดไป่ตู้有数学期望 和方差。
• 期望是以概率为权数的加权算术平均数,常用 E(X)或X表示。
• 随机变量的方差是随机变量与其数学期望的离 差平方的数学期望,即标准差的平方,常用D (X)或表示。
合指标。
• 常用的样本统计量有:
n
1、样本平均数(均值): xi
x i1
n
2、样本方差 :
n
(xi x)2
S 2 i1
n 1
n
• 样本标准差 : (xi x)2
S i1 n 1
n
3、未修正样本方差 :
S*2
(xi x)2
i 1
n
未修正样本标准差:
n
(xi x)2
S* i1 n
✓研究的一般思路:
随机现象研究 规范化 随机实验 结果变量化 随机变量 概率整体研究 随机变量分布 分布特点研究 随机变量数字特征
3、正态分布
• 正态分布是最重要的一种连续型随机变量分布 。
• 正态分布的密度函数是
f (x)
1
1 x 2
e 2 2
, x
2
• 正态分布密度函数图形是以为中心的对称钟形曲线。
主观概率定义
1. 对一些无法重复的试验,确定其结果的概 率只能根据以往的经验人为确定
2. 概率是一个决策者对某事件是否发生,根 据个人掌握的信息对该事件发生可能性的 判断
随机变量
• 随机变量是一次试验的结果的数值性描述。它 是为便于数学方法来分析随机现象而对随机试 验的结果进行的量化处理。
• 根据取值情况的不同可以将随机变量分为离散 型随机变量和连续型随机变量。
• 离散型随机变量的概率分布一般用表格统一表 示出来:
X = xi P(X =xi)=pi
x1 ,x2 ,… ,xn p1 ,p2 ,… ,pn
连续型随机变量概率分布
• 连续型随机变量的概率分布用分布函数来表示, F(x)=p(X<x),通过它可以求概率。分布函数的导数 为密度函数p(x),对密度函数积分,可以得到随机变 量X在点x附近或在一个区间上的取值的概率。
• 一. 概率与概率分布 • 二. 抽样调查中的基本概念
1、 总体、个体和样本 2、统计量 3、抽样误差
一、概率与概率分布
• 1、随机事件与概率 • 2、随机变量 • 3、正态分布
1、随机事件与概率
• 随机现象的特点是:在基本条件不变的情况 下,一系列的试验或观测会得到不同的结果, 并且在试验或观测前不能预见何种结果将出 现。与随机现象相对应的是决定性现象。