抽样与参数估计.ppt

合集下载

抽样分布与参数估计

抽样分布与参数估计

三、t分布曲线下的面积分布规律
自由度为 的t分布曲线
t 分布曲线下 的整个面积为1, t 分布曲线下从a到b 的面积为t值分布 在此范围内的百分 比,即t值落在此 范围内的概率P。
双侧:由于t分布以0为中心对称,即 P(t≤- t, )= P(t≥ t, )= /2 于是有P(- t, ≤t≤ t, )=1-
sx
u X
X
t X =n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数, 即自由度 ,与标准差的自由度一致。
• 2. t分布曲线以0为中心,左右对称; 越小, t变量值的离散程度越大,曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些(高 峰低些,两尾部翘得高些), 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若 =,则t分布曲线和标准正态曲线完全吻 合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计:用样本统计量来估计总体参数。
点值估计:不计抽样误差,直接用样本均数来 估计μ。
区间估计:根据抽样误差的规律,按一定的概 率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节 均数的抽样误差 第二节 t分布 第三节 总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分 观察单位构成样本,用样本信息去 推断总体特征的研究方法。
统计推断的过程
总体

样本统计量

例如:样本均
值、比例
二、抽样误差:在抽样研究中,因抽样造 成的样本统计量与样本统计量、样本统计 量与总体参数的差值。

统计学 第 6 章 抽样与参数估计

统计学  第 6 章   抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计抽样和参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。

这个调查例子是估计总体参数(某种意见的比例)的壹个过程。

估计(estimation)是统计推断的重要内容之壹。

统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。

因此本节内容就是由样本数据对总体参数进行估计,即:学习目标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。

壹、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样和不重复抽样。

而且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)非概率抽样:不是完全按随机原则选取样本①、非随机抽样:由调查人员自由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。

抽样与参数估计

抽样与参数估计

第四章抽样与参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statistical inference)。

这个调查例子是估计总体参数(某种意见的比例)的一个过程。

估计(estimation) 是统计推断的重要内容之一。

统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesis testing) 。

因此本节内容就是由样本数据对总体参数进行估计,即:学习目标:了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样与抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Sample size):样本中所含个体的数量一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。

一、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样与不重复抽样。

而且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样③、整群抽样:将一组被调查者(群)作为一个抽样单位④、等距抽样:在样本框中每隔一定距离抽选一个被调查者(2)非概率抽样:不是完全按随机原则选取样本①、非随机抽样:由调查人员自由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者2、抽样分布一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。

统计学基础ppt课件

统计学基础ppt课件
➢ 调查失败的主要原因是抽样框出现了问题。在经济大萧条 时期由于电话和汽车并不普及,只是富裕阶层才会拥有, 调查有电话和汽车的人们,并不能够反映全体选民的观点
4-4
统计学 参数估计在统计方法中的地位
基础
统计方法
描述统计
推断统计
参数估计
假设检验
4-5
第 4 章 抽样与参数估计
4.1 抽样与抽样分布
4 - 14
统计学 基础
有关抽样的几个基本概念
4、抽样比 抽样比是指在抽选样本时,所抽取的样本
单位数n与总体单位数N之比。一般地讲, n≥30为大样本,n<30为小样本。研究社会 经济现象时,通常采用大样本进行抽样调查。
对于给定的研究对象,全及总体是唯一确定 的,而样本总体不是唯一的,它是随机的。
有关抽样的几个基本概念
2、抽样框
目标总体规定了理论上的抽样范围,但是进行抽样 的总体单位与目标总体有时是不一致的,因而, 在抽样之前,还必须明确实际进行抽样的总体范 围和抽样单位。
抽样框是指用以代表总体,并从中抽选样本的一个
框架。
目标总体与抽样框有时是一致的;多数情 况下,目标总体的范围要率大于抽样框。
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率
4 - 17
统计学 基础
抽样方法和样本可能数目
1、重复抽样
重复抽样也叫重置抽样,是指每次抽取一个元素 后又放回,重新参加下一次的抽选,直到抽取n个 元素为止。全及总体单位数始终保持不变,每个总 体单位都有被重复抽中的可能。 重复抽样通常要考虑单位排列顺序,如电话号 码中的“8651”和“1568”不同。
其样本可能数目为 m重 N n

第六章抽样与参数估计

第六章抽样与参数估计
5、假设4个人工资分别为:400、500、700、800元,现随机 抽选2人进行调查。
(1)验证 E(x) X
(2)计算重复抽样及不重复抽样的抽样平均误差。 24
第2节 参数估计的基本方法
参数估计——以实际观察的样本数据所计算的统计量作为未 知总体参数的估计值。
一、点估计(Point estimate) 点估计也称定值估计,就是直接以样本统计量作为总体参数
29
大样本(n≥30)下总体均值的区间估计
区间估计就是根据样本求出总体未知参数的估计区间,并使其 可靠程度达到预定要求。
(1) 总体方差σ 2已知时

由于 α ,有
z

x
/

n
N(0,1) ,所以对于给定的置信度1-
P {z 2
x/nz2}1


Px z/2
7
抽样法的特点:随机原则 部分估计总体 存在误差并可以控制
抽样法的应用:对某些不可能进行全面调查 而又需要了解其 全面情况的社会经济现象, 必须应用抽样法。(破坏性试验、总体过大、 单位过于分散,实际调查不可能的)
8
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(母体)(Population) 样本(子样)(Sample) 总体指标(总体参数)(Population parameter) 样本指标(样本统计量)(Sample statistic)
2、某工厂共生产新型聚光灯2000只,随机抽选400只进行耐 用时间调查,结果平均寿命为4800小时,标准差为300小时。 求抽样误差。
3、从某校学生中随机抽选400名,发现戴眼镜的有80人。计 算求抽样误差。

第6章抽样分布与参数估计

第6章抽样分布与参数估计

抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
6.1.4 样本均值的抽样分布 1.大样本场合下的样本均值抽样分布
总体(Population)是指所研究的事物及其现象的全体,由该事物及 其现象的全部个体组成。
个体(Item Unit)是指构成总体的元素。 总体容量(Population Size)是指构成总体的全部个体的数量。
样本(Sample)是指从总体抽取的若干个体构成的集合。 抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽 取若干个体的过程。 样本容量(Sample size)是指构成样本的全部个体的数量。
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的 概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大 样本场合,样本均值依据中心极限定理趋于正态分布。
所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限 总体中以放回方式,随机抽取的等概样本。
所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分 布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是 一个粗略的经验数值。

统计学课件05第5章抽样与参数估计

统计学课件05第5章抽样与参数估计

反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。

第五抽样分布与参数估计第一第二

第五抽样分布与参数估计第一第二

类型组的样本单位数。
3、等距抽样(系统抽样、机械抽 样)
概念:将总体各单位标志值按某一标志顺序排
队,然而按一定的间隔抽取样本单位。
排队的方法:①按无关标志 ②按有关标志
抽取样本单位的方法
◦ ①按相等的距离取样 ②对称等距取样
抽取第一个样本单位的方法
◦ ①随机抽取
②居中抽取
4、整群抽样
概念:把总体分为若干群,从总体群中抽取若干样 本群,对抽中的群进行全数登记调查。 如:某水泥厂一昼夜的产量为14400袋,现每隔 144分钟抽取1分钟的水泥(10袋)检查平均每袋 重量和一级品率
例子
根据古典概率定义可算出,抛一枚质地均匀的硬币, 出现正面与出现反面的概率都是0.5。历史上有很
多人都曾经做过抛硬币试验。
试验者
试验次数
正面出现的频率
蒲丰
4040
0.5069
K.皮尔逊
12000
0.5016
K.皮尔逊
24000
0.5005
罗曼诺夫斯基
80640
0.4979
第二节
抽样分布
一、三种分布含义
第五抽样分布与参数估计第一第二
第一节
抽样的基本概念
(二)样本容量与样本个数
1.样本容量
◦ 是一个样本中所包含的单位数。
2.样本个数
◦ 即样本可能数目。是指从一个总体中可能抽取多少个样本。 与抽样方法有关。
(三)抽样方法
1、重复抽样
◦ 从总体的N 个单位中要随机抽取一个容量为n的样本,每次 从总体中抽出一个单位后,经过调查又把它放回到总体中, 重新再参加下一次抽选。
类型组,然后从各类型组中采用简单随机抽样方式或 其它方式抽取样本单位。

第六章---参数估计ppt课件

第六章---参数估计ppt课件
50
1、条件分析:总体分布为正态,且总体方差已 知,用正态法进行估计。 2、计算标准误 3、确定置信水平为0.95,查表得
51
4、计算置信区间 D=0.95时 D=0.99时
52
解释:总体均数μ落在75.61-84.39之间的可 能性为95%,超出这一范围的可能只有5%。而 作出总体μ落在74.22-85.78之间结论时的正 确概率为99%,犯错误的可能性为1%。
38
( 二)、 分布法, 未知 1、前提条件: 总体正态分布, n不论大小,
2、使用 t分布统计量
D=0.95时 D=0.99时
39
例:总体正态, 未知,




平均数0.95的置信区间是多少?

,试问总体
40
解: 1、条件分析:总体正态, 未知,

于30,只能用 分布
2、计算标准误
3、计算自由度
9
一、点估计
(一)意义 含义:直接用样本统计量的值作为总体参数的估 计值 无偏估计量:恰好等于相应总体参数的统计量。
例8-1;假设某市六岁男童平均身高110.7cm,随机 抽取113人测得平均身高110.70cm.总体的平均数, 标准差是多少
10
(二)良好点估计的条件
无偏性: 一致性: 有效性: 无偏估计量的变异性问题。
47
1 、条件分析:总体分布为非正态, 未知, >30,只能用近似正态估计法。
2、计算标准误
3、确定置信水平为0.95,查表得
48
4、计算置信区间
5、结果解释:该校的平均成绩有95%的可能落 在50.2~54.0之间。
49
课堂练习
已知某总体为正态分布,其总体标准差为10。 现从这个总体中随机抽取n1=20的样本,其平 均数分别80。试问总体参数μ在0.95和0.99的 置信区间是多少。

应用统计学第6章 抽样分布与参数估计

应用统计学第6章 抽样分布与参数估计

μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3

.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π

π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4. 结果来自容量相同的所有可能样本
6 - 10
经济、管理类 基础课程
统计学
样本均值的抽样分布
(一个例子)
【例】设一个总体,含有4个元素(个体),即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下
均值和方差
总体分布
N
Xi
.3
i1 2.5
经济、管理类 基础课程
统计学
第六章 抽样与参数估计
6 -1
经济、管理类 基础课程
统计学
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
6 -2
经济、管理类 基础课程
统计学
统计推断的过程
总体
6 -3

样本统计量

例如:样本均
值、比例、方

经济、管理类 基础课程
统计学
第六章 抽样与参数估计
第一节 抽样与抽样分布 第二节 参数估计基本方法 第三节 总体均值和总体比例的区间估计 第四节 两个总体均值及两个总体比例之差的估计 第五节 正态总体方差及两正态总体方差比的区间估计
6 -4
经济、管理类 基础课程
统计学
学习目标
1. 了解抽样和抽样分布的基本概念 2. 理解抽样分布与总体分布的关系 3. 了解点估计的概念和估计量的优良标准
数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
=10
n= 4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
X
抽样分布
6 - 16
经济、管理类 基础课程
统计学
中心极限定理
(图示)
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的抽
3. 配额抽样:选择一群特定数目、满足特定条件的被调 6 - 8查者
经济、管理类 基础课程
统计学
样本均值的抽样分布
6 -9
经济、管理类 基础课程
统计学
抽样分布
(概念要点)
1. 所有样本指标(如均值、比例、方差等) 所形成的分布称为抽样分布
2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本比例等
2
经济、管理类 基础课程
统计学
均值的标准误
1. 所有可能的样本均值的标准差,测度所 有样本均值的离散程度
2. 小于总体标准差
N
.2
N
(Xi )2
.1 0
2 i1
1.25
1
6 - 11
N
234
经济、管理类 基础课程
统计学
样本均值的抽样分布
(一个例子)
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
总体、个体和样本
(概念要点)
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量
6 -7
经济、管理类 基础课程
统计学
抽样方法
(概念要点)
1. 概率抽样:根据已知的概率选取样本
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
6 - 12
4
4,1
4,2
4,3
4,4
经济、管理类 基础课程
统计学
样本均值的抽样分布
(一个例子)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均(x)
第一个
第二个观察值
观察值 1
2
3
4
1
1.0 1.5 2.0 2.5
4. 掌握总体均值、总体比例和总体方差的区 间估计
6 -5
经济、管理类 基础课程
统计学
第一节 抽样与抽样分布
一. 总体、个体和样本 二. 关于抽样方法 三. 样本均值的分布与中心极限定理 四. 样本方差的分布 五. 两个样本方差比的分布 六. T 统计量的分布
6 -6
经济、管理类 基础课程
统计学
(n 1)s2
2
~
2 (n 1)
将2(n – 1)称为自由度为(n-1)的卡方分布
6 - 19
经济、管理类 基础课程
统计学
总体
6 - 20
卡方 (2) 分布
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2.5
n
(xi x )2
2 x
i 1
M
(1.0 2.5)2 (4.0 2.5)2 0.625 2
16
n
式中:M为样本数目
比较及结论:1. 样本均值的均值(数学期望)等于总体均值
6 - 14
2. 样本均值的方差等于总体方差的1/n
经济、管理类
基础课程 样本均值的分布与总体分布的比较 统计学
样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分
x
n
布的总体
当样本容量足够
大时(n 30) ,
样本均值的抽样
分布逐渐趋于正
态分布
6 - 17
x
X
经济、管理类 基础课程
统计学
样本方差的抽样分布
6 - 18
经济、管理类 基础课程
统计学
样本方差的分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 s2 的分布为
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
6 - 15
.3 P ( x )
抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
x 2.5
2 x
0.625
经济、管理类 基础课程
统计学
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所 有容量为n的样本的均值X也服从正态分布,X 的
2 1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
6 - 13
经济、管理类
基础课程 所有样本均值的均值和方差
统计学
n
x
xi
i 1
M
1.0 1.5 4.0 16
简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽 样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者
2. 非概率抽样:不是完全按随机原则选取样本
非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者
相关文档
最新文档