最新6.3(统计量与抽样分布)

合集下载

统计量与抽样分布-PPT课件

统计量与抽样分布-PPT课件

抽取一小部分
x
样本
第6章 统计量与抽样分布
主要内容
• 总体和样本的统计分布 • 统计量 • 抽样分布
第一节 总体和样本的统计分布
• 一、统计推断中的总体及总体分布 • 总体的概念 总体是根据一定的目的确定的所要研究的事物 的全体,它是由客观存在的、具有某种共同性质 的众多个体构成。总体中的各个单位称为个体。 由引例:每批麦子 每批麦子的每单位出酒量的 数值 编制变量的分布数列 实物总体 数值总体 分布总体
引例
• 1899年,戈塞特进入都柏林A.吉尼斯父子酿酒公司担任酿 酒化学技师,从事统计和试验工作。他发现,供酿酒的每 批麦子质量相差很大,而同一批麦子仲能抽样供试验的麦 子又很少,每批样本在不同的温度下做式样其结果相差很 大,这决定了不同批次和温度的麦子样本是不同的,不能 进行样本合并,这样一来实际上取得的麦子样本不可能是 大样本,只能是小样本。小样本得出的结果和正态分布有 较大差异,特别是尾部比正态分布高…… • 大样本和小样本有什么差异?如何用样本推断总体?
• 统计方法
描述统计
推断统计
参数估计
假设检验
所谓统计推断,就是根据概率论所揭示的随机 变量的一般规律性,利用抽样调查所获得的样本信 息,对总体的某些性质或数量特征进行推断。
参数估计 统计推断
假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
1 f( x , ,x ) n 1 i 1 2

n
2 x ( ) i 2 e 2
( 2 2 i1

6.3抽样分布定理

6.3抽样分布定理

2. .
σ σ
2 1
2 S12 S2 2 2
~ F ( n1 − 1, n2 − 1) .
σ 12
2 σ2
N ( µ1 − µ 2 , + ) 3. X − Y ~ n1 n2
10
证明
1.因为 .
X ~ N ( µ1 ,
独立, 且 X 与Y 独立,则
σ
2
n1
) ,Y ~ N ( µ 2 ,
σ
2
n2
U V / ( n1 + n2 − 2)
( X −Y ) − (µ − µ ) ~ t (n + n =
1 2

1 1 + n1 n2
1
2
−2)
13
2.因为 .
( n1 −1) S
σ12
2 1
( n2 − 1) S ~ χ ( n1 − 1), 2
2
2 2
σ2
~ χ 2 ( n2 − 1),
且它们相互独立,按 F 分布的定义即得 且它们相互独立,
2
1 n 1 n E ( X ) = ∑ E ( Xi ) = ∑ µ = µ n i =1 n i =1
1 n 1 n 2 σ2 D( X ) = 2 ∑ D ( X i ) = 2 ∑σ = n i =1 n i =1 n
于是
X ~ N (µ ,
X −µ σ/ n
σ2
n
)
从而
~ N (0,1)
( n1 − 1) S12 / ( n2 − 1) S
σ
2 2
σ
2 1
( n1 − 1)
2 2
/ ( n2 − 1)
=

第六章 统计量及其抽样分布

第六章 统计量及其抽样分布

样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下

第 一
16个样本的均值(x)

第二个观察值
观 察值1 2
3
4
11
1.
20.

52. 0.
5
21
2.
25.

03. 5.
0
23
2.
30.

53. 0.
5
24
3.
35.

04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)

正态总体的抽样分布

正态总体的抽样分布
∞ 3x2e− 2 dx =
2π −∞

3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3

x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n

)

=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+

m n

第51讲 抽样分布(1) 卡方分布

第51讲 抽样分布(1) 卡方分布
令 Y ( X1 X 2 X3)2 (X4 X5 X6)2
求常数 C,使 CY 服从 χ 2 分布。
解 X1, …, X6 相互独立且都服从 N(0,1)。
令 U X1 X 2 X3 V X 4 X5 X 6
根据正态分布性质
U X1 X 2 X3 ~ N (0,3) V X 4 X 5自总体 N(0,1) 的样本, 即X1, …, Xn 相互独立且都服从标准正态分布,
则称统计量(它们的平方和)
服从自由度为 n 的 χ 2 分布 (卡方分布) ,
记为
chi-square distribution
自由度是指等式右端包含的独立变量的个数。
χ 2 ( n ) 分布的概率密度为
( n )
x2
e
2,
x 0
2
n2
四川大学 徐小湛
n 5 n 8n 11传课χ 2 分布的可加性:
设 且它们相互独立, 则有
χ 2 分布的数学期望和方差传课 X 2 ... X 2
1
n
X i ~ N (0,1)
E( Xi ) 0, D( Xi ) 1
E
(
X

X 3 )2
(X4

X5

X 6 )2 ]

1Y 3
~
2 (2)
得 C1
3四川大学 徐小湛传课例2 从总体 N(1,4) 中抽取一个容量为 n 的样本
X1, X2, …, Xn
n
记 Y ( Xi 1)2
i1
若要使 P{Y≤100}≥0.95,
问 n 至多能取多大?
从总体 N(1,4) 中抽取一个容量为 n 的样本

统计学6

统计学6

6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。

统计量和抽样分布

统计量和抽样分布

4

X
2 i
;
i 1

1 4
4 i1
Xi 2;
1 4
2

2 i 1
Xi X
.

由定义即知⑵不是统计量, 而⑴⑶是.
同济大学数学系&人民邮电出版社
一、样本均值和样本方差
第6章 统计量和抽样分布 22
设 X1, X 2 ,L , X n 为取自总体的一个样本,称
⑴样本均值
1n X n i1 Xi
由此可得:
M 2 1 n n i1
Xi X
2 =ˆ Sn2 ,
相应的观测值
Sn
1n n i1
Xi X
2
sn2
1 n
n i 1
xi x 2,sn
1n n i1
xi x
2
同济大学数学系&人民邮电出版社
一、样本均值和样本方差
第6章 统计量和抽样分布 25
注 S 2 , Sn2 在计算时的另一表达形式:
分别求 E
X
,D
X
,E
S2
,
E
1 n
n i 1
X
2 i
.
(1) X ~ B(1, p) ;(2) X ~ E() ;(3) X ~ U (0,2 ), 其中 0 .
解 由定理可得
E X E X ˆ , D X D X ˆ 2 , nn
E S 2 D X 2,
统计量的定义
第6章 统计量和抽样分布 20
不含有未知参数的样本的函数 g X1,L , Xn 称为统计量.
例1 假设总体 X ~ U 0, , X1, X 2,L , X n 为取自该 总体的一个样本,

统计量和抽样分布

统计量和抽样分布
n
( X i ) 2 当 为 已 知 时 ,是 统 计 量 ,未 知 时 不 是 统 计 量 .
i 1
二、常用的统 计量
样本均值
样本方差与标 准差
样本中位数, 分位数
样本相关系数
EX4 x4
1
x2
e 2dx3
2
D X 2 E X 4 (E X 2 )2 3 1 2 2
D2=Dn X2n DX22n i=1 i=1
Chapter 8 统计量和抽样
分布
• 概率统计: 概率论&数理统计? • Chapter 1~ Chapter 7.
• Chapter 8~ Chapter 12.
• 两个常见的统计分析软件
(1)SAS(Statistical Analysis System) (2)SPSS.
01
概率与统计在研究形式及研 究方法上的不同之处:
(数理)统计学就是使用有效方法收集并整理数据、分析 数据, 进而得出结论的一门学科.
统计学的主要内容: 抽样调查、试验设计、点估计、区 间估计和假设检验.
统计方法的特点
数据推理. “一切由数据说话”.
结果具有随机性.
研究和揭示现象之间在数量层面上的 相关关系,但不肯定有因果关系;
例:吸烟有害健康?
第一节 统计 与统计学
一、统计的研究对象
• 例1 某厂生产的元件是否合格. • 例2 总统选举之民意测验. • 统计的研究对象是(1)大量现象中(2)总
体的数量特征.

统计特征:1、大量的现象?
社会经济现象, 自然现象
2、数量特征
(二者都具有客观性,与纯粹的数 学相区别)
从一个层面看, 总体就是统计问题所要研究的对象全体, 其中每 个对象就是个体.

概率统计6.3三大分布

概率统计6.3三大分布

X Y

n
服从自由度为 n 的 t分布,记为 t ~ t(n).
(2)t 分布性质:①ht 的图形关于 t 0对称;
②由 t分布的下分位点的定义及ht图形的对称性知t n t1 n
3、(1)F 分布定义
设U ~ (2 n1),V ~ (2 n2) ,且U,V
独立,则称随机变量 F U / n1 V / n2
何值时,2 a X1 X2 2 b X3 2 服从自由度为多少的 2 分布?
2、设随机变量t ~ t(n) ,其概率密度为 ft(n)(x)
,若 ,则 P t t0.9(n) 0.2
t0.1 (n)
ft(n) (x)dx
有为多少?
3、设总体X ~ N(0, 2), X1, X2,.
0,
其他.
(y)的图形如下图所示:
对于给定的
,0
1, 称满足条件 PF

F (n1, n2 )
F (n ,n ) 1 2 x dx


F n1,n2 为 F n1,n2 分布的下α 分位点.
F 分布性质:
①F
(n1, n2 )

②当 n 充分大时其图形类似于标准正态变量概率密度的图形.但对
于较小 n,t 的分布与N 0,1分布相差很大.
③由 t分布的上 分位点的定义及ht 图形的对称性知 t1 n t n.
例2 设总体 X和 Y 相互独立且都服从N 0,32 分布,而样本 X1,..., X9 和 Y1,..., Y9分别
t2 U2
U2 1
~ F (1, n)
Vn Vn
VV
nn

统计量的分布——抽样分布及其性质

统计量的分布——抽样分布及其性质

$
$0
首先根据数学期望和方差的性质有4
(
+
=A
7
AB$
中国人民大学出版社!)%$6!1& '(( 蔡则元&三大抽样分布的理解与具体性质' :( &数
0
(
0
接下来对 学学习与研究 + + + 4
=A 7%E
=A 7E
=A 7()
AB3
AB$
AB3
曲天尧关于对统计推断中抽样分布的总结及判 (
,l%很显然该概率密度服从指数分布 因此) 分布为参 数7$ 的指数分布从而指数分布是作为一种特殊的)
)
根据函数的性质可得 槡 即自由
G/HF
-'
-
' 7
$
>8') )

)
度- 充分大时'-分布近似于正态分布
分布
对于'分布 给定常数 % jj$ 满足条件
科教论坛
!"#!$%&$'(') *+&,-./&$01$21(3$&)%)(%)%$3
科技风 年 月
统计量的分布
抽样分布及其性质
赵红妮
西安思源学院基础部!陕西西安!+#""""
摘4要数理统计是以概率论为基础的一个数学分支它从实际观测的数据出发研究随机现象的规律性 本文基于 正态分布的基础上研究三大抽样分布) 分布'分布和<分布的概念及性质图像结合例题对抽样分布做出更深一层的 理解与应用
关键词随机变量抽样分布正态分布
44概率论中假定随机变量的分布是在已知的基础上研 究随机变量的性质以及数字特征&而在现实生活中要研究

统计学之抽样与抽样分布

统计学之抽样与抽样分布
a. n/N > 30 b. N/n < 0.05 c. n/N < 0.05 d. n/N > 0.05
正确答案: d. n/N > 0.05
8. 从一个均匀分布的总体中抽取一个样本容量为45的样本, 从什么分布?
a. 指数分布 b. 正态分布 c. 均匀分布 d. 无法判断
正确答案: b. 正态分布
考察所有900个申请者
• 考试成绩
• 总体平均成绩
xi 990
900
• 总体标准差
(xi )2 80 900
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
p 648 .72 900
使用随机数表随机选择30个申请者作为样本进行研 究,从书上随机数表第三列开始
统计学之抽样与抽样分 布
2021年7月19日星期一
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布
样本平均值x 的抽样分布 样本比例 p 的抽样分布
抽样方法
n = 100
n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参 数进行很好的估计
点估计
• x 作为 的点估计值 x xi 29,910 997
30 30
• s 作为 的点估计值
s
(xi x )2 163,996 75.2
29
29
• p 作为p 的点估计值
p 20 30 .68
值得注意的是,不同的随机数会导致不同的抽样,也就会 数的不同的点估计值
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2分布概率密度
f2(x)
1
2n2(n2)
n1 x
x2 e 2,
0,
x0 x0
图6-1 2(n)分布的概率密度曲线
可以看出,随着n的增大,的图形趋于“平缓”, 其图形下区域的重心亦逐渐往右下移动.
6.3.3 统计中的常用分布
2分布具有下面性质:
(1) (可加性) 设 12, 是22 两个相互独立的随机变量,
6.3.2常用的统计量
设X1,X2,…,Xn为总体X的样本,x1,x2,...,
xn为样本观测值,(1) 样本均值1n X n i1 Xi
常用来作为总体期望(均值)的估计量,其观测
值为
x
1 n
n i1
xi
6.2.1 统计量
(2) 样本方差
S2n11i n1(Xi X)2
n11in1
Xi2 nX2
且 X1X2X3 与 X4X5X6 相互独
立,显然应有c>0, 且
c Y [c ( X 1 X 2 X 3 ) ] 2 [c ( X 4 X 5 X 6 ) ] 2
c(X 1X 2X 3)~N (0 ,3 c), c(X 4X 5X 6)~N (0 ,3 c)
于是当3c=1,即c=1/3时,cY是两个相互独立且服 从N(0,1)的随机变量的平方和,由定义得
(31) 2n
i1
【例】设总体X~N(0,1),X1,X2,…,X6是来 自总体X的样本。又假设
Y ( X 1 X 2 X 3 ) 2 ( X 4 X 5 X 6 ) 2
试确定c, 使得cY服从 2 分布。 解: 由已知条件及正态分布的独立可加性,有
X 1X2X 3~N (0,3) X 4X 5X 6~N (0,3)
6.3.3 统计中的常用分布
一. 2分布
定义6.3 设X1,X2,…,Xn为相互独立的随机变量,
它们都服从标准正态N(0,1)分布,则称随机变量
n
2
X
2 i
i1
服从自由度为n的2分布,记为2 ~ 2(n).
此处自由度指的是2中包含独立变量的个数.
2(n)的概率密度为 1
() x1exd,x0 0
cY ~ 2(2)
故当c=1/3时, cY服从 2 分布。
6.3.3 统计中的常用分布
二. t分布
定义6.4 设X ~ N(0,1),Y ~ 2(n),X与Y独立,
则称随机变量
T
X Yn
服从自由度为n的t分布,
又称为学生氏分布(Student distribution),
记为T ~ t(n). t(n)的概率密度为
(5) 样本k阶中心矩
显然
Bk
1n ni1(Xi
X)k
,(k = 2,3,…)
A1 X,
B2
1n ni1(Xi
X)2
Ak和Bk的观测值分别记为
ak
1 n
n i 1
xik ,
bk
1n ni1
(xi
x)k
6.3 统计量与抽样分布
6.3.3 统计中的常用分布
统计量的分布称为抽样分布.为了研究抽样分 布,先研究数理统计中三种重要的分布.
三. F分布
定义6.5 设X~2(n1),Y~2(n2),且X与Y独立,
称 记随为机F~变F量(n1F,nY2X).nn21服从自由度为(n1,n2)的F分布, 可以证明的概率密度函数为
n1
fF
(x)
n1 2
0,
n1 n2 2
n2 2
n1 n2
2
1
n1 n2
n1 1
x2
n1n2
2 x
,
x0 x0
f2(x)2n2(n2)
n1 x
x2 e 2
,
其中()称为伽马函数,
0,
x0 x0
(1/ 2) , ( n 1 / 2 ) ( n 1 / 2 ) ( n 3 / 2 ) 1 / 2 ( 1 / 2 ) ( 2 n 1 ) ! !/ 2 n
6.3.3 统计中的常用分布
6.3(统计量与抽样分布)
6.3.1 统计量
【例】设X1,X2,…,Xn是来自总体X的样本,X~
N(, 2),其中 、 2为未知参数,则
X1,
1 2
X1
1 3
X2
,
均为统计量,
min{ X1,X2,…,Xn }
但诸如
1
n
n i1
(Xi
)2,
X1
等均不是统计量,因它含有未知参数 或.
下面介绍几种常用的统计量

1 2 ~ 2 ( n 1 )2 2 ,~ 2 ( n 2 ) 则 ,1 2 2 2 ~ 2 ( n 1 n 2 )
(2) 设 2~2 (n )则 ,E ( 2 ) n ,D (2 ) 2 n .
证明 (1) 由2分布的定义易得证明.
(2) 因为 2 ~ 2(n ), 相互独立、同分布于
n
N(0,1)的随机变量X1,X2,…,Xn,使
2
X
2 i
i1

n
n
n
E(2)E( Xi2)
E
(
X
2 i
)
D(Xi) n
i1
i1
i1
6.3.3 统计中的常用分布
由于Xi独立,且注意到N(0,1)的四阶矩为3,可得
n
D(2) D(Xi2)
i1 n
{E(Xi4)[E(Xi2)]2}
i1
n
6.3.3 统计中的常用分布
图6-5 F分布的概率密度曲线
由F分布的定义
F
X Y
n1 n2
容易看出, 若F ~F(n1,n2),则1/F ~F(n2,n1).
【例】设总体 X ~ N(0,22),而X1,X2,…,X15是来自总体X
ft (x)
n1 2
n n
1
x2 n
n1
2 ,
2
x
图6-3 t分布的概率密度曲线
6.3.3 统计中的常用分布
ft (x)
n1 2
n n
1
x2 n
n1 2
,
2
x
图6-3 t分布的概率密度曲线
显然t分布的概率密度是x的偶函数,图6-3描绘了 n = 1,3,7时t(n)的概率密度曲线.作为比较,还 描绘了N(0,1)的概率密度曲线.
6.3.3 统计中的常用分布
可看出,随着n的增大,t(n)的概率密度曲线与
N(0,1)的概率密度曲线越来
越接近.
可以证明t分布具有下面性质:
ft(x)
1
x2
e2
2
,n
即当n趋向无穷时,t(n)近似于标准正态分布N(0,1). 一般地,若n > 45,就可认为t(n)基本与N(0,1)相
差无几了.
6.3.3 统计中的常用分布
(3) 样本标准差
S S2
样本方差和样本标准差刻画了样本数据的分散 程度,常用来作为总体方差和标准差的估计量. 观测值分别为
s2
1n n1i1(xi
x)2,
s s2
n11i n1(xi x)2
6.2.1 统计量
(4) 样本k阶原点矩(简称样本k阶矩)
Ak
1 n
n i1
Xik
,(k
=
1,2,…)
相关文档
最新文档