统计量及其抽样分布PPT优秀课件
合集下载
统计量与抽样分布-PPT课件
抽取一小部分
x
样本
第6章 统计量与抽样分布
主要内容
• 总体和样本的统计分布 • 统计量 • 抽样分布
第一节 总体和样本的统计分布
• 一、统计推断中的总体及总体分布 • 总体的概念 总体是根据一定的目的确定的所要研究的事物 的全体,它是由客观存在的、具有某种共同性质 的众多个体构成。总体中的各个单位称为个体。 由引例:每批麦子 每批麦子的每单位出酒量的 数值 编制变量的分布数列 实物总体 数值总体 分布总体
引例
• 1899年,戈塞特进入都柏林A.吉尼斯父子酿酒公司担任酿 酒化学技师,从事统计和试验工作。他发现,供酿酒的每 批麦子质量相差很大,而同一批麦子仲能抽样供试验的麦 子又很少,每批样本在不同的温度下做式样其结果相差很 大,这决定了不同批次和温度的麦子样本是不同的,不能 进行样本合并,这样一来实际上取得的麦子样本不可能是 大样本,只能是小样本。小样本得出的结果和正态分布有 较大差异,特别是尾部比正态分布高…… • 大样本和小样本有什么差异?如何用样本推断总体?
• 统计方法
描述统计
推断统计
参数估计
假设检验
所谓统计推断,就是根据概率论所揭示的随机 变量的一般规律性,利用抽样调查所获得的样本信 息,对总体的某些性质或数量特征进行推断。
参数估计 统计推断
假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
1 f( x , ,x ) n 1 i 1 2
n
2 x ( ) i 2 e 2
( 2 2 i1
第六章统计量及其抽样分布
的统计推断、问题分析,都称为小样本问题;而在样
本量n→∞的条件下进行的统计推断、问题分析则称为
大样本问题。一般统计学中的n≥30为大样本,n<30
为小样本只是一种经验说法。
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.4 】
•解 :
•解 :
PPT文档演模板
•例题讲解
第六章统计量及其抽样分布
•
值的离散程度。此统计量取消了均值不同对 不
•
同总体的离散程度的影响,常用来刻画均值 不
•
同时,不同总体的离散程度。在投资项目的 风.
• 险分析中、不同群体或行业的第六收章统计入量及差其抽距样分布描述
6.1.3 次序统计量
• 定义6.2
•是从总体X中抽取
设•容量为n的一个样本, •的称为第i个次序统计量,
•6.6.1 两个样本平均值之差的分布
•1 .
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.8 】
•两个样本均值之差的例题
•解 :
PPT文档演模板
第六章统计量及其抽样分布
•6.6.2 两个样本比例之差的分布
PPT文档演模板
第六章统计量及其抽样分布
•【 例 6.9 】
•两个样本比例之差的例题
• 1 • 分布由阿贝(Abbe)1863年首先提出,后来
.• 海尔由墨特(Hermert)和卡·皮尔逊(K.Pearson)分
• 别 于1875年和1900年推导出来的。
• 2. 定义6.3 设随机变
•相互独立
量•且 •服从标准正态分
• ,则,它们
• 平方布 • 服从自由度为 • 的分布
• •3 和 自由度是统计n学的中常用的一个概念。,可以解
统计量及其抽样分布概论(PPT 68张)
2
分布
2 2 ( n ) 的 p 分位数 )可从卡方分布表查得。 7. p (n
p( x)
(n)
2
2
根据 2(n ) 分布的右尾概率 计算相应的临界值。 即如果 P (2 x ) ,则可求出相应的 x 。
2 利用Excel提供的统计函数CHIINV可构建 分布的
的一个样本时,
n i 1
2 若 已知,则 ( X ) 是 的充分统计量 i 2
1n 若 已知,则 X X 的充分统计量 i是 ni 1
经管类 核心课程
统计学
§6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐近分布 6.2.3 随机模拟获得的近似分布
n X 2 2 N ( 0 , 1 ) 和 s
nX 的渐近分布为N(0,1) s
所以统计量 T
6.2.3 统计学
经管类 核心课程
随机模拟获得的近似分布
因为在实际应用中,有许多问题要寻求它的精确分 布和渐近分布都是非常困难的,而在计算机飞速 发展的今天,利用计算机进行随机模拟来获得某 种统计量的近似分布已十分容易。因此,随机模 拟方法寻求统计量的分布已被普遍使用。通常, 抽样分布很难求得,有时尽管求出了精确抽样分 布,但因为过于复杂而难以使用。
经管类 核心课程
统计学
6.1.1
统计量的概念
2. 统计量的定义:
, X , , X (1)定义6.1 设 X 是从总体X中抽取的 1 2 n
容量为n的一个样本,如果由此样本构造一个 ( X , X , , X ) 函数 T ,不依赖于任何未知 1 2 n ( X , X , , X ) 参数,则称函数 T 为一个 1 2 n 统计量(或样本统计量)。 后, , x , , x (2)当获得样本的一组具体观测值 x 1 2 n 代入T计算的数值称为一个具体的统计量值。
统计量与抽样分布培训课件
Y1 Y2 ~ 2 (n1 n2 ); —— 分2 布可加性
一般地,若Yi ~ 2 ni ,i 1, 2, m,Y1,Y2, Ym
相互独立,则
m
Yi
~
2
m
ni
.
i 1
i1
18
对给定的概率, 0
1, 称满足条件
2 n
fn
y dy
的点2
n为
2 n分布的上分位数,上分位数2 n的值可查 2分布表
E( X ) ,Var( X ) 2,E( X k ),E[( X )k ], 问:(1)X 与,(2)S 2与 2, (3)Ak与E( X k ),(4)Bk与E[( X )k ]
都相等吗?
答:不对。前者是随机变量,观察两次得到 的统计量的值可能不一样; 后者是数,可能已知也可能未知。
13
33
[思考题]:
设X1, X 2 , , X n是来自正态总体N (, 2 )
的简单随机样本,X 和S 2分别是样本均值
和样本方差。问:
n
(Xi X )2
(1)i1
2
服从什么分布?
n
(Xi )2
(2)i1 2
服从什么分布?
答:(1) 2(n 1),(2) 2(n).
34
定理 6.3.3 设 X1, X 2 , , X n 为来自正态总体
f
F n1 ,n2
x; n1, n2 dx
的点F n1, n2 为F n1, n2 分布的上分位数.
F n1, n2 的值可查F分布表.
F1 (n1, n2 ) [F (n2 , n1)]1
30
6.3 正态总体下的抽样分布 定理 6.3.1 设 X1, X 2 , , X n 为来自正态总体
一般地,若Yi ~ 2 ni ,i 1, 2, m,Y1,Y2, Ym
相互独立,则
m
Yi
~
2
m
ni
.
i 1
i1
18
对给定的概率, 0
1, 称满足条件
2 n
fn
y dy
的点2
n为
2 n分布的上分位数,上分位数2 n的值可查 2分布表
E( X ) ,Var( X ) 2,E( X k ),E[( X )k ], 问:(1)X 与,(2)S 2与 2, (3)Ak与E( X k ),(4)Bk与E[( X )k ]
都相等吗?
答:不对。前者是随机变量,观察两次得到 的统计量的值可能不一样; 后者是数,可能已知也可能未知。
13
33
[思考题]:
设X1, X 2 , , X n是来自正态总体N (, 2 )
的简单随机样本,X 和S 2分别是样本均值
和样本方差。问:
n
(Xi X )2
(1)i1
2
服从什么分布?
n
(Xi )2
(2)i1 2
服从什么分布?
答:(1) 2(n 1),(2) 2(n).
34
定理 6.3.3 设 X1, X 2 , , X n 为来自正态总体
f
F n1 ,n2
x; n1, n2 dx
的点F n1, n2 为F n1, n2 分布的上分位数.
F n1, n2 的值可查F分布表.
F1 (n1, n2 ) [F (n2 , n1)]1
30
6.3 正态总体下的抽样分布 定理 6.3.1 设 X1, X 2 , , X n 为来自正态总体
清华概率统计(第九章统计量和抽样分布)精品PPT课件
概
率 论
第九章 统计量和抽样分布
与
数
理
统
计
2020/10/9
1
说明
概 样本的分布虽然能够反映总体的特征,但样
率 本是一个多维随机变量,对其分布的研究当然也
论 与
非常麻烦。所以,在对总体的分布或某些特征进
数 行统计推断的时候,并不是直接利用样本的分布
理
统 ,而是通过建立样本的一个适当的函数,对总体
计 的某方面的特征进行统计推断。也就是建立一个
与
i1
i1
数 理 统
n
n
(xix)2n(xc)22 (xix)(xc)
i1
i1
由TH1知
计
n
n
= (xi x)2 n(xc)2 ( xi x)2
=0
i1
i1
2020/10/9
皖西学院 数理系
8
义:①
s2
1 n
n i1
(xi
x)2
率 论 与
②
s*2
1 n n1i1
若(x1, 察值,则g
x2,…,xn ) 是样本(X1 (x1, x2,…,xn )是g(X1
,X2 ,X2
, ,
…,Xn)的观 …,Xn)的观
理 察值。
统
计 如 (X1,X2)是来自总体X~N(1,2)的一个样本,则
X 1 X 2 1 ,mX i1 ,n X 2 )(都是统计量;
若 未知,则 X 1 就不是统计量。
(xi
x)2
数 注:②式比①式更常用,是D(X)的无偏估计;
理
统
计
n
( x i x ) 2为偏差平方和,
i1
率 论
第九章 统计量和抽样分布
与
数
理
统
计
2020/10/9
1
说明
概 样本的分布虽然能够反映总体的特征,但样
率 本是一个多维随机变量,对其分布的研究当然也
论 与
非常麻烦。所以,在对总体的分布或某些特征进
数 行统计推断的时候,并不是直接利用样本的分布
理
统 ,而是通过建立样本的一个适当的函数,对总体
计 的某方面的特征进行统计推断。也就是建立一个
与
i1
i1
数 理 统
n
n
(xix)2n(xc)22 (xix)(xc)
i1
i1
由TH1知
计
n
n
= (xi x)2 n(xc)2 ( xi x)2
=0
i1
i1
2020/10/9
皖西学院 数理系
8
义:①
s2
1 n
n i1
(xi
x)2
率 论 与
②
s*2
1 n n1i1
若(x1, 察值,则g
x2,…,xn ) 是样本(X1 (x1, x2,…,xn )是g(X1
,X2 ,X2
, ,
…,Xn)的观 …,Xn)的观
理 察值。
统
计 如 (X1,X2)是来自总体X~N(1,2)的一个样本,则
X 1 X 2 1 ,mX i1 ,n X 2 )(都是统计量;
若 未知,则 X 1 就不是统计量。
(xi
x)2
数 注:②式比①式更常用,是D(X)的无偏估计;
理
统
计
n
( x i x ) 2为偏差平方和,
i1
第5章 统计量、抽样分布、探索性数据分析ppt
2
X 1 ~ ( n1 ),则X 2 ~ ( n n1 ).
2 2
(3)若X ~ ( n), 则X 的数学期望与方差为 E( X ) n D ( X ) 2n
2
(4)(Cochran定理)设X 1 , X 2 , , X n 相互独立且都服 从N (0,1),若 Q1 Q2 Qk X i
数理统计研究问题的方式,不是对所研究对象的全体 ( 称 为总体)进行观察,而是抽取其中的部分(称为样本)进行观察 获得数据(抽样),并通过这些数据对总体进行推断。 数理统计方法具有“部分推断整体”的特征。
二、数理统计研究问题的一般流程 分析问 收集 题 确定总
体 数据 统计推断
参数估计 假设检验
试验设计 抽样
数据
整理
我们这门课所学的数理 统计实际上是统计推断 及其应用(方差分析与 回归分析)的一部分内 容。
为什么要用数理统计方法研究问题?随机现象有它的规律 性,随机现象的特点注定了进行足够多次观察,其规律性才 能清楚地呈现出来。但是,客观上只允许对随机现象进行有 限次观察试验,只能获得局部观察资料.
总体与总体特征数
i
n
i 1
总体、样本、样本实现的关系 总体 样本
推断 样本实现
例5.1 设 总 体 X 服 从 0 - 1分 布 , X 1 , X 2 , , X n 是 抽 自 总 体
X 的 iid 样 本 , 求 样 本 分 布 。
解 : 总 体 X 的 概 率 函 数 为 P X x p (1 p )
指标值全
随机变量
集
总体可以用随机变量及其分布来表示,研 究总体等价于研究表达总体的随机变量概 率分布;在理论上可以把总体与概率分布 等同起来,总体分布就是表达总体的随机 变量的分布。 例如:研究某批灯泡的寿命时,关心的指标是寿命,那么, 该总体就可以用随机变量X和其概率分布表示。
X 1 ~ ( n1 ),则X 2 ~ ( n n1 ).
2 2
(3)若X ~ ( n), 则X 的数学期望与方差为 E( X ) n D ( X ) 2n
2
(4)(Cochran定理)设X 1 , X 2 , , X n 相互独立且都服 从N (0,1),若 Q1 Q2 Qk X i
数理统计研究问题的方式,不是对所研究对象的全体 ( 称 为总体)进行观察,而是抽取其中的部分(称为样本)进行观察 获得数据(抽样),并通过这些数据对总体进行推断。 数理统计方法具有“部分推断整体”的特征。
二、数理统计研究问题的一般流程 分析问 收集 题 确定总
体 数据 统计推断
参数估计 假设检验
试验设计 抽样
数据
整理
我们这门课所学的数理 统计实际上是统计推断 及其应用(方差分析与 回归分析)的一部分内 容。
为什么要用数理统计方法研究问题?随机现象有它的规律 性,随机现象的特点注定了进行足够多次观察,其规律性才 能清楚地呈现出来。但是,客观上只允许对随机现象进行有 限次观察试验,只能获得局部观察资料.
总体与总体特征数
i
n
i 1
总体、样本、样本实现的关系 总体 样本
推断 样本实现
例5.1 设 总 体 X 服 从 0 - 1分 布 , X 1 , X 2 , , X n 是 抽 自 总 体
X 的 iid 样 本 , 求 样 本 分 布 。
解 : 总 体 X 的 概 率 函 数 为 P X x p (1 p )
指标值全
随机变量
集
总体可以用随机变量及其分布来表示,研 究总体等价于研究表达总体的随机变量概 率分布;在理论上可以把总体与概率分布 等同起来,总体分布就是表达总体的随机 变量的分布。 例如:研究某批灯泡的寿命时,关心的指标是寿命,那么, 该总体就可以用随机变量X和其概率分布表示。
第五章 统计量及其分布PPT资料93页
X
0
1
p
0.983
0.017
X
0
p
0.915
0.085
第五章 统计量及其分布
第12页
5.1.2 样本
样品、样本、样本量: 样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
第10页
例5.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则
总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
X01 P 1p p
第五章 统计量及其分布
第11页
比如:两个生产同类产品的工厂的产品的总体 分布:
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
第五章 统计量及其分布
第16页
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
随机性: 总体中每一个个体都有同等机会
类
找出所研究的对象的规律性
第五章 统计量及其分布
第8页
数参估计 (第六章)
推断 统计学
假设检验 (第七章) 方差分析 (第八章)
回归分析 (第八章)
第五章 统计量及其分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计量的概念 常用统计量 次序统计量 充分统计量
4
统计学
STATISTICS (第五版)
统计量
(statistic)
1. 设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如 果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未 知参数,则称函数T(X1,X2,…,Xn)是一个统计量
t 分布
x
t 分布与标准正态分布的比较
t (df = 5)
z
t
不同自由度的t分布
17
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 Βιβλιοθήκη 图 形18作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
T 分 布 的 使 用
X ~ N(, 2)
2. 设
,则
z X ~ N(0,1)
Y z2
3. 令
,则 Y 服从自由度为1的2分布,即
Y ~ 2 (1)
4.
X ~ N(, 2)
5. 当总体
n
(
xi
, x从)2 中抽取容量为n的样本,则
i 1
2
~ 2 (n 1)
12
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
第 6 章 统计量及其抽样分布
作者:中国人民大学统计学院 贾俊平
1
第 6 章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布
21
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
F分布
(F distribution)
1. 由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的 第一个字母来命名
2. 设若U为服从自由度为n1的2分布,即U~2(n1),V 为服从自由度为n2的2分布,即V~2(n2),且U和V相
2分布
(性质和特点)
1. 分布的变量值始终为正
2. 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋
于对称
3. 期望为:E(2)=n,方差为:D(2)=2n(n为自由度
)
4. 可加性:若U和V为两个独立的2分布随机变量 ,U~2(n1),V~2(n2),则U+V这一随机变量服从 自由度为n1+n2的2分布
13
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
n=1
2分布
(图示)
n=4 n=10 n=20
不同容量样1本4 的抽样分作布者:贾俊平,中国人民大学统计学院2
t 分布
15
统计学
STATISTICS (第五版)
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 “Student”(学生)为笔名的论文中首次提出
2
统计学
STATISTICS (第五版)
学习目标
1. 了解统计量及其分布的几个概念 2. 了解由正态分布导出的几个重要分布 3. 理解样本均值的分布与中心极限定理 4. 掌握单样本比例和样本方差的抽样分布
3
作者:贾俊平,中国人民大学统计学院
6.1 统计量
6.1.1 6.1.2 6.1.3 6.1.4
6.3 由正态分布导出的几个重要 分布
6.3.1 2分布
6.3.2 t 分布 6.3.3 F 分布
9
2 分布
10
统计学
STATISTICS (第五版)
χ2 分布的使用
如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从 χ2 分布
方差就可视为若干随机变量值的平方和
样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方 差之比,服从自由度为n-1的χ2 分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
8
作者:贾俊平,中国人民大学统计学院
19
作者:贾俊平,中国人民大学统计学院
F 分布
20
统计学
STATISTICS (第五版)
F分布
两个都服从χ2 分布的变量之比的分布规律。
可以设想为两个方差之比
方差之比会接近1(因为前面已经假设各变量都服从标准 正态分布),似乎存在一个“两端少,中间多”的特征, 但不对称(除非其中存在一个无限总体,使样本数量 为无穷大,则样本方差有无穷多个)
11
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
2分布
(2 distribution)
1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特
(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和
1900年推导出来
2. t 分布是类似正态分布的一种对称分布, 它通常要比正态分布平坦和分散
3. 一个特定的分布依赖于称之为自由度的参 数。随着自由度的增大,分布也逐渐趋于 正态分布
16
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
t 分布图示
标准正态分布
标准正态分布
t (df = 13)
2. 中位数、分位数、四分位数等都是次序统计量
6
作者:贾俊平,中国人民大学统计学院
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
7
统计学
STATISTICS (第五版)
抽样分布
(sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
样本均值、样本比例、样本方差等都是统 计量
2. 统计量是样本的一个函数
3. 统计量是统计推断的基础
5
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
次序统计量
1. 一组样本观测值X1,X2,…,Xn由小到大的排序
X(1)≤X(2)≤…≤ X(i)≤…≤ X(n)
后,称X(1),X(2),…,X(n)为次序统计量