统计量及其抽样分布(PPT 60页)
合集下载
统计量与抽样分布-PPT课件

抽取一小部分
x
样本
第6章 统计量与抽样分布
主要内容
• 总体和样本的统计分布 • 统计量 • 抽样分布
第一节 总体和样本的统计分布
• 一、统计推断中的总体及总体分布 • 总体的概念 总体是根据一定的目的确定的所要研究的事物 的全体,它是由客观存在的、具有某种共同性质 的众多个体构成。总体中的各个单位称为个体。 由引例:每批麦子 每批麦子的每单位出酒量的 数值 编制变量的分布数列 实物总体 数值总体 分布总体
引例
• 1899年,戈塞特进入都柏林A.吉尼斯父子酿酒公司担任酿 酒化学技师,从事统计和试验工作。他发现,供酿酒的每 批麦子质量相差很大,而同一批麦子仲能抽样供试验的麦 子又很少,每批样本在不同的温度下做式样其结果相差很 大,这决定了不同批次和温度的麦子样本是不同的,不能 进行样本合并,这样一来实际上取得的麦子样本不可能是 大样本,只能是小样本。小样本得出的结果和正态分布有 较大差异,特别是尾部比正态分布高…… • 大样本和小样本有什么差异?如何用样本推断总体?
• 统计方法
描述统计
推断统计
参数估计
假设检验
所谓统计推断,就是根据概率论所揭示的随机 变量的一般规律性,利用抽样调查所获得的样本信 息,对总体的某些性质或数量特征进行推断。
参数估计 统计推断
假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
1 f( x , ,x ) n 1 i 1 2
n
2 x ( ) i 2 e 2
( 2 2 i1
统计学抽样与抽样分布ppt课件

4. 在大规模的抽样调查中,经常被采用的方法
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
第6章统计量与抽样分布

x; n1, n2
1
B
, n1 n2 22
n n x n n x , n1 2
n2 2
n1 2
1
12
2
n1 n2 2
1
0,
其中B
a,
b
1
0
x
1
1
x b1
dxຫໍສະໝຸດ a a b b
.
x 0, x 0.
f x; n1, n2
F n1, n2 分布概率密度函数
第六章 统计量与抽样分布
随机样本与统计量 2分布 t分布 F分布 正态总体下的抽样分布
1
数理统计 是一门以数据为基础的学科, 可以定义为收
集数据, 分析数据和由数据得出结论的一组概念、 原
则和方法。
例如:若规定灯泡寿命低于1000小时者为次品,如何确定 次品率?由于灯泡寿命试验是破坏性试验,不可能把整批 灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验, 以样本的信息来推断总体的信息,这是数理统计研究的问 题。
关于调查数据和实验数据的收集可以根据数据 本身的特点有多种不同的方法和设计,有专门的课 程讲授,这里不作详细介绍。
6
总体的某个指标X, 对于不同的个 体来说有不同的取值, 这些取值构 成一个分布, 因此X可以看成一个 随机变量. 有时候就把X称为总体. 假设X的分布函数为F(x), 也称F(x) 为总体.
答:共有16个样本,分别为:
(88,88)(88,75)(88,70)(88,63) (75,88)(75,75)(75,70)(75,63) (70,88)(70,75)(70,70)(70,63) (63,88)(63,75)(63,70)(63,63)
第六章统计量及其抽样分布

的统计推断、问题分析,都称为小样本问题;而在样
本量n→∞的条件下进行的统计推断、问题分析则称为
大样本问题。一般统计学中的n≥30为大样本,n<30
为小样本只是一种经验说法。
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.4 】
•解 :
•解 :
PPT文档演模板
•例题讲解
第六章统计量及其抽样分布
•
值的离散程度。此统计量取消了均值不同对 不
•
同总体的离散程度的影响,常用来刻画均值 不
•
同时,不同总体的离散程度。在投资项目的 风.
• 险分析中、不同群体或行业的第六收章统计入量及差其抽距样分布描述
6.1.3 次序统计量
• 定义6.2
•是从总体X中抽取
设•容量为n的一个样本, •的称为第i个次序统计量,
•6.6.1 两个样本平均值之差的分布
•1 .
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.8 】
•两个样本均值之差的例题
•解 :
PPT文档演模板
第六章统计量及其抽样分布
•6.6.2 两个样本比例之差的分布
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.9 】
•两个样本比例之差的例题
• 1 • 分布由阿贝(Abbe)1863年首先提出,后来
.• 海尔由墨特(Hermert)和卡·皮尔逊(K.Pearson)分
• 别 于1875年和1900年推导出来的。
• 2. 定义6.3 设随机变
•相互独立
量•且 •服从标准正态分
• ,则,它们
• 平方布 • 服从自由度为 • 的分布
• •3 和 自由度是统计n学的中常用的一个概念。,可以解
统计量及其抽样分布概论(PPT 68张)

2
分布
2 2 ( n ) 的 p 分位数 )可从卡方分布表查得。 7. p (n
p( x)
(n)
2
2
根据 2(n ) 分布的右尾概率 计算相应的临界值。 即如果 P (2 x ) ,则可求出相应的 x 。
2 利用Excel提供的统计函数CHIINV可构建 分布的
的一个样本时,
n i 1
2 若 已知,则 ( X ) 是 的充分统计量 i 2
1n 若 已知,则 X X 的充分统计量 i是 ni 1
经管类 核心课程
统计学
§6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐近分布 6.2.3 随机模拟获得的近似分布
n X 2 2 N ( 0 , 1 ) 和 s
nX 的渐近分布为N(0,1) s
所以统计量 T
6.2.3 统计学
经管类 核心课程
随机模拟获得的近似分布
因为在实际应用中,有许多问题要寻求它的精确分 布和渐近分布都是非常困难的,而在计算机飞速 发展的今天,利用计算机进行随机模拟来获得某 种统计量的近似分布已十分容易。因此,随机模 拟方法寻求统计量的分布已被普遍使用。通常, 抽样分布很难求得,有时尽管求出了精确抽样分 布,但因为过于复杂而难以使用。
经管类 核心课程
统计学
6.1.1
统计量的概念
2. 统计量的定义:
, X , , X (1)定义6.1 设 X 是从总体X中抽取的 1 2 n
容量为n的一个样本,如果由此样本构造一个 ( X , X , , X ) 函数 T ,不依赖于任何未知 1 2 n ( X , X , , X ) 参数,则称函数 T 为一个 1 2 n 统计量(或样本统计量)。 后, , x , , x (2)当获得样本的一组具体观测值 x 1 2 n 代入T计算的数值称为一个具体的统计量值。
第6章-统计量及其抽样分布课件

设X1服从标准正态分布N(0,1),X2服从自由度
为n的 分2 布,且X1、X2相互独立,则称变
量tX Y n
所服从的分布为自由
度为n的tt分t布 n, 记为
n 2时,Et 0
n 3时,Dt n
n2
第十六页,共32页。
如 X N,2 果
X
1 n
n i 1
Xi
, n X
则
S
tn1
把样本中“成功”的次数所占比例定
义作样本比例
p
X n
。
第二十四页,共32页。
假定某统计人员在其填写的报表中有2%至少 会有一处错误,如果我们检查一个由600份报表
组成的随机样本,其中至少有一处错误的报表所
占的比例在0.025-0.070之间的概率有多大?
第二十五页,共32页。
设600份报表中国至少有一处错误的报表 所占比 Nhomakorabea为p ,则有
第二十七页,共32页。
甲乙两所高校录取新生时,甲校平均分为 655,且服从正态分布,标准差为20,乙的平均 分为625,标准差为25,也是正态分布。现从两 校各随机抽取8名新生,计算平均分数,出现甲 比已的平均分低的概率有多大?
第二十八页,共32页。
8个新生平均分应服从正态分布,
X1-X2
N1-2, n112
P9.9X10.1P9.90 .110X0 .11010.0 1. 110
211
第二十二页,共32页。
例6.5
• 某电瓶商声称其生产的电瓶具有均值为60个 月,标准差为6个月的寿命分布。现假设质 监部门决定检验该厂的说法是否正确,为此 随机抽取了50个该厂生产的电瓶进行寿命检 验。
• 1)假设厂商声称是正确的,试描述50个电瓶
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 6 章 统计量及其抽样分布
作者:中国人民大学统计学院 贾俊平
第 6 章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布
样本均值、样本比例、样本方差等都是统 计量
2. 统计量是样本的一个函数
3. 统计量是统计推断的基础
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
次序统计量
1. 一组样本观测值X1,X2,…,Xn由小到大的排序
X(1)≤X(2)≤…≤ X(i)≤…≤ X(n)
后,称X(1),X(2),…,X(n)为次序统计量
x
t 分布与标准正态分布的比较
t (df = 5)
z
t
不同自由度的t分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 的 图 形
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 的 使 用
X ~ N(, 2)
2. 设
,则
z X ~ N(0,1)
Y z2
3. 令
,则 Y 服从自由度为1的2分布,即
Y ~ 2 (1)
4.
X ~ N(, 2)
5. 当总体
n
(
xi
, x从)2 中抽取容量为n的样本,则
i 1
2
~ 2 (n 1)
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
2. 中位数、分位数、四分位数等都是次序统计量
作者:贾俊平,中国人民大学统计学院
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
统计学
STATISTICS (第五版)
抽样分布
(sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
F分布
(F distribution)
1. 由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的 第一个字母来命名
2. 设若U为服从自由度为n1的2分布,即U~2(n1),V 为服从自由度为n2的2分布,即V~2(n2),且U和V相
统计学
STATISTICS (第五版)
学习目标
1. 了解统计量及其分布的几个概念 2. 了解由正态分布导出的几个重要分布 3. 理解样本均值的分布与中心极限定理 4. 掌握单样本比例和样本方差的抽样分布
作者:贾俊平,中国人民大学统计学院
6.1 统计量
6.1.1 6.1.2 6.1.3 6.1.4
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
作者:贾俊平,中国人民大学统计学院
6.3 由正态分布导出的几个重要 分布
作者:贾俊平,中国人民大学统计学院
F 分布
统计学
STATISTICS (第五版)
F分布
两个都服从χ2 分布的变量之比的分布规律。
可以设想为两个方差之比
方差之比会接近1(因为前面已经假设各变量都服从标准 正态分布),似乎存在一个“两端少,中间多”的特征, 但不对称(除非其中存在一个无限总体,使样本数量 为无穷大,则样本方差有无穷多个)
互独立,则称FF为服U从n自1 由度n1和n2的F分布,记为 V n2
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
n=1
2分布
(图示)
n=4 n=10 n=20
不同容量样本的抽样分作布者:贾俊平,中国人民大学统计学院2
t 分布
统计学STຫໍສະໝຸດ TISTICS (第五版)t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 “Student”(学生)为笔名的论文中首次提出
2. t 分布是类似正态分布的一种对称分布, 它通常要比正态分布平坦和分散
3. 一个特定的分布依赖于称之为自由度的参 数。随着自由度的增大,分布也逐渐趋于 正态分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
t 分布图示
标准正态分布
标准正态分布
t (df = 13)
t 分布
2分布
(性质和特点)
1. 分布的变量值始终为正
2. 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋 于对称
3. 期望为:E(2)=n,方差为:D(2)=2n(n为自由度)
4. 可加性:若U和V为两个独立的2分布随机变量, U~2(n1) , V~2(n2), 则 U+V 这 一 随 机 变 量 服 从 自 由度为n1+n2的2分布
6.3.1 2分布
6.3.2 t 分布 6.3.3 F 分布
2 分布
统计学
STATISTICS (第五版)
χ2 分布的使用
如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从 χ2 分布
方差就可视为若干随机变量值的平方和
样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方 差之比,服从自由度为n-1的χ2 分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
2分布
(2 distribution)
1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特
(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和
1900年推导出来
统计量的概念 常用统计量 次序统计量 充分统计量
统计学
STATISTICS (第五版)
统计量
(statistic)
1. 设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如 果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未 知参数,则称函数T(X1,X2,…,Xn)是一个统计量
作者:中国人民大学统计学院 贾俊平
第 6 章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布
样本均值、样本比例、样本方差等都是统 计量
2. 统计量是样本的一个函数
3. 统计量是统计推断的基础
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
次序统计量
1. 一组样本观测值X1,X2,…,Xn由小到大的排序
X(1)≤X(2)≤…≤ X(i)≤…≤ X(n)
后,称X(1),X(2),…,X(n)为次序统计量
x
t 分布与标准正态分布的比较
t (df = 5)
z
t
不同自由度的t分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 的 图 形
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 的 使 用
X ~ N(, 2)
2. 设
,则
z X ~ N(0,1)
Y z2
3. 令
,则 Y 服从自由度为1的2分布,即
Y ~ 2 (1)
4.
X ~ N(, 2)
5. 当总体
n
(
xi
, x从)2 中抽取容量为n的样本,则
i 1
2
~ 2 (n 1)
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
2. 中位数、分位数、四分位数等都是次序统计量
作者:贾俊平,中国人民大学统计学院
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
统计学
STATISTICS (第五版)
抽样分布
(sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
F分布
(F distribution)
1. 由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的 第一个字母来命名
2. 设若U为服从自由度为n1的2分布,即U~2(n1),V 为服从自由度为n2的2分布,即V~2(n2),且U和V相
统计学
STATISTICS (第五版)
学习目标
1. 了解统计量及其分布的几个概念 2. 了解由正态分布导出的几个重要分布 3. 理解样本均值的分布与中心极限定理 4. 掌握单样本比例和样本方差的抽样分布
作者:贾俊平,中国人民大学统计学院
6.1 统计量
6.1.1 6.1.2 6.1.3 6.1.4
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
作者:贾俊平,中国人民大学统计学院
6.3 由正态分布导出的几个重要 分布
作者:贾俊平,中国人民大学统计学院
F 分布
统计学
STATISTICS (第五版)
F分布
两个都服从χ2 分布的变量之比的分布规律。
可以设想为两个方差之比
方差之比会接近1(因为前面已经假设各变量都服从标准 正态分布),似乎存在一个“两端少,中间多”的特征, 但不对称(除非其中存在一个无限总体,使样本数量 为无穷大,则样本方差有无穷多个)
互独立,则称FF为服U从n自1 由度n1和n2的F分布,记为 V n2
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
n=1
2分布
(图示)
n=4 n=10 n=20
不同容量样本的抽样分作布者:贾俊平,中国人民大学统计学院2
t 分布
统计学STຫໍສະໝຸດ TISTICS (第五版)t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 “Student”(学生)为笔名的论文中首次提出
2. t 分布是类似正态分布的一种对称分布, 它通常要比正态分布平坦和分散
3. 一个特定的分布依赖于称之为自由度的参 数。随着自由度的增大,分布也逐渐趋于 正态分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
t 分布图示
标准正态分布
标准正态分布
t (df = 13)
t 分布
2分布
(性质和特点)
1. 分布的变量值始终为正
2. 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋 于对称
3. 期望为:E(2)=n,方差为:D(2)=2n(n为自由度)
4. 可加性:若U和V为两个独立的2分布随机变量, U~2(n1) , V~2(n2), 则 U+V 这 一 随 机 变 量 服 从 自 由度为n1+n2的2分布
6.3.1 2分布
6.3.2 t 分布 6.3.3 F 分布
2 分布
统计学
STATISTICS (第五版)
χ2 分布的使用
如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从 χ2 分布
方差就可视为若干随机变量值的平方和
样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方 差之比,服从自由度为n-1的χ2 分布
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
2分布
(2 distribution)
1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特
(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和
1900年推导出来
统计量的概念 常用统计量 次序统计量 充分统计量
统计学
STATISTICS (第五版)
统计量
(statistic)
1. 设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如 果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未 知参数,则称函数T(X1,X2,…,Xn)是一个统计量