生物统计学抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平均数的抽样分布对总体正态性的要求不十分严 格。
(根据中心极限定理,从非正态分布的总体中抽取 的含量为n的样本,当n充分大时,样本平均数渐 近服从正态分布)
方差的抽样分布对总体正态性的要求十分严格。
6
§4·1 从一个正态总体分 布中抽取的样本统计量的
分布
7
一、样本平均数的抽样及其分布
如果从容量为N的有限总体抽样,若每次抽取容 量为n的样本,那么一共可以得到Nn个样本。
62
6
4
64
6
6
总和
66
∑(y)
4 6 8 6 8 10 8 10 12 72
_
y
s02
s2
s
2
0
0 0.0000
3
1
2 1.4142
4
4
8 2.8284
3
1
2 1.4142
4
0
0 0.0000
5
1
2 1.4142
4
4
8 2.8284
5
1
2 1.4142
6
0
0 0.0000
36
12
24 11.3136
每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
8
下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
第四章抽样分布
1
抽样分布
研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
生物统计学的最基本问题是研究总体和样本 间的关系。
总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
2
抽样分布
对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
10
从表中我们可以算出 样本平均数 的平均数:
_
_
y
N
y
n
36 9
4
以自由度为除数的样本方差的平均数:
s2
s2 Nn
24 9
8 3
2
以样本容量为除数的样本方差的平均数:
s02
s02 Nn
12 9
4 3
2
11
样本标准差s的平均数:
s
s Nn
11.3136 1.257
9
在统计上,如果所有可能样本的某一统计
f ( y)dy
2 ( n)
的点
2
(n)
为
2 (n)
分布的上
分位点.
对于不同的 , n,
可以通过查表求
得上 分位点的值.
如何查表,附表6.
20
§4·2 从两个正态总体分 布中抽取的样本统计量的
分布
21
一、标准差已知时,两个平均数的 和与差的分布
1 2 ( y1 y 2)
( y1 y 2)
统计推断是以总体分布和样本抽样分布的理论关 系为基础的。
3
总体
随机样本1
……
2
3
4
无穷多个样本
总体和样本的关系示意图
4
抽样分布
从样本
到总体
总体与 样本间 的关系
从总体 到样本
统计推
断(目的)
抽样分 布(基础)
本章研究的内容就是:从总体到样本(抽样分布)
5
抽样分布
抽样分布全部建立在正态分布的基础之上(在正 态分布的总体中抽样)。
数等于总体的相应参数,则称该统计数为
总体_ 相应参数的无偏估计值(unbiased estyimate)
12
1、 是μ的无偏估计值。
2、s2是σ2的无偏估计值。 3、以n为除数的样本方差
估计值。
4、s不是σ的无偏估计值。
不是σ2的无偏
13
标准差已知时的平均数分布
Y ~ N(, 2 )
n
u
y
n
变量是正态的或近似正态的,则标准化的变量服从或 近似服从N(0,1)分布。如果整体是非正态分布,当n 足够大的时,其样本平局数还是服从正态分布。
再 由函数的性质有
lim h(t) n
近似
即当n足够大时,t ~ N(0,1).
1 et2 2.
2
t 分布的概率密度曲线如图
17
二、方差的抽样及其分布
从方差为σ2 正态总体中,急速抽取含量为n的样本, 计算样本方差s2。在讨论样本方差的分布时,通常并 不直接谈论s2而是给他先标准化:
2 df
dfs 2
2
(n 1)s2
2
这个变量就是服从n-1个自由度的卡方分布(χ2 – distribution)。
18
其密度函数为:
f
( 2 )
df 2 2
1 ( df
)
df
y2
1 2
e2
,
2
y0
0
其他.
2 (n)分布的概率密度曲线如图.
19
对于给定的正数 , 0 1, 称满足条件
P{ 2 2 (n)}
首先计算出总体参数:
μ=(2+4+6)/3=4 σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3
所有可能的样本数=Nn=32=9
9
总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表
第一个 第二个 样本
观察值 观察值
2
2
22
2
4
24
2
6
26
4
2
42
4
4
44
4
6
46
6
2
( y1 y2) (1 2 )
df1s12 df2s22 ( 1 1 ) df1 df2 df1 11 df2 1
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
fdf (t)
df 1 2
df(πf df
1
t2 df
df 1
2 ,
2
t
16
1. 具有自由度为n的t分布t ~ t(df ), 其数学期望
与方差为:E(t) 0, D(t) df (df 2)
(n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
2 1
22
n1 n2
1 2 ( y1 y 2)
( y1 y 2)
2百度文库1
22
n1 n2
22
如果两个总体都是正态分布,则有
标准化
N (1
2
,
(12
n1
2 2
n2
))
u ( y1 y2) (1 2 )
2 1
2 2
n1
n2
23
二、标准差未知时,两个平均数的 和与差的分布
t (df1df2 ) t (n1 n2 2)
14
标准差未知时的平均数分布
未知时,可以用样本标准差代替总体标准差, 标准差变量为
u
y
s
n 这个变量不服从正态分布,而服从n -1的t分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
15
标准差未知时的平均数分布
自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。
(根据中心极限定理,从非正态分布的总体中抽取 的含量为n的样本,当n充分大时,样本平均数渐 近服从正态分布)
方差的抽样分布对总体正态性的要求十分严格。
6
§4·1 从一个正态总体分 布中抽取的样本统计量的
分布
7
一、样本平均数的抽样及其分布
如果从容量为N的有限总体抽样,若每次抽取容 量为n的样本,那么一共可以得到Nn个样本。
62
6
4
64
6
6
总和
66
∑(y)
4 6 8 6 8 10 8 10 12 72
_
y
s02
s2
s
2
0
0 0.0000
3
1
2 1.4142
4
4
8 2.8284
3
1
2 1.4142
4
0
0 0.0000
5
1
2 1.4142
4
4
8 2.8284
5
1
2 1.4142
6
0
0 0.0000
36
12
24 11.3136
每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
8
下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
第四章抽样分布
1
抽样分布
研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
生物统计学的最基本问题是研究总体和样本 间的关系。
总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
2
抽样分布
对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
10
从表中我们可以算出 样本平均数 的平均数:
_
_
y
N
y
n
36 9
4
以自由度为除数的样本方差的平均数:
s2
s2 Nn
24 9
8 3
2
以样本容量为除数的样本方差的平均数:
s02
s02 Nn
12 9
4 3
2
11
样本标准差s的平均数:
s
s Nn
11.3136 1.257
9
在统计上,如果所有可能样本的某一统计
f ( y)dy
2 ( n)
的点
2
(n)
为
2 (n)
分布的上
分位点.
对于不同的 , n,
可以通过查表求
得上 分位点的值.
如何查表,附表6.
20
§4·2 从两个正态总体分 布中抽取的样本统计量的
分布
21
一、标准差已知时,两个平均数的 和与差的分布
1 2 ( y1 y 2)
( y1 y 2)
统计推断是以总体分布和样本抽样分布的理论关 系为基础的。
3
总体
随机样本1
……
2
3
4
无穷多个样本
总体和样本的关系示意图
4
抽样分布
从样本
到总体
总体与 样本间 的关系
从总体 到样本
统计推
断(目的)
抽样分 布(基础)
本章研究的内容就是:从总体到样本(抽样分布)
5
抽样分布
抽样分布全部建立在正态分布的基础之上(在正 态分布的总体中抽样)。
数等于总体的相应参数,则称该统计数为
总体_ 相应参数的无偏估计值(unbiased estyimate)
12
1、 是μ的无偏估计值。
2、s2是σ2的无偏估计值。 3、以n为除数的样本方差
估计值。
4、s不是σ的无偏估计值。
不是σ2的无偏
13
标准差已知时的平均数分布
Y ~ N(, 2 )
n
u
y
n
变量是正态的或近似正态的,则标准化的变量服从或 近似服从N(0,1)分布。如果整体是非正态分布,当n 足够大的时,其样本平局数还是服从正态分布。
再 由函数的性质有
lim h(t) n
近似
即当n足够大时,t ~ N(0,1).
1 et2 2.
2
t 分布的概率密度曲线如图
17
二、方差的抽样及其分布
从方差为σ2 正态总体中,急速抽取含量为n的样本, 计算样本方差s2。在讨论样本方差的分布时,通常并 不直接谈论s2而是给他先标准化:
2 df
dfs 2
2
(n 1)s2
2
这个变量就是服从n-1个自由度的卡方分布(χ2 – distribution)。
18
其密度函数为:
f
( 2 )
df 2 2
1 ( df
)
df
y2
1 2
e2
,
2
y0
0
其他.
2 (n)分布的概率密度曲线如图.
19
对于给定的正数 , 0 1, 称满足条件
P{ 2 2 (n)}
首先计算出总体参数:
μ=(2+4+6)/3=4 σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3
所有可能的样本数=Nn=32=9
9
总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表
第一个 第二个 样本
观察值 观察值
2
2
22
2
4
24
2
6
26
4
2
42
4
4
44
4
6
46
6
2
( y1 y2) (1 2 )
df1s12 df2s22 ( 1 1 ) df1 df2 df1 11 df2 1
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
fdf (t)
df 1 2
df(πf df
1
t2 df
df 1
2 ,
2
t
16
1. 具有自由度为n的t分布t ~ t(df ), 其数学期望
与方差为:E(t) 0, D(t) df (df 2)
(n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
2 1
22
n1 n2
1 2 ( y1 y 2)
( y1 y 2)
2百度文库1
22
n1 n2
22
如果两个总体都是正态分布,则有
标准化
N (1
2
,
(12
n1
2 2
n2
))
u ( y1 y2) (1 2 )
2 1
2 2
n1
n2
23
二、标准差未知时,两个平均数的 和与差的分布
t (df1df2 ) t (n1 n2 2)
14
标准差未知时的平均数分布
未知时,可以用样本标准差代替总体标准差, 标准差变量为
u
y
s
n 这个变量不服从正态分布,而服从n -1的t分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
15
标准差未知时的平均数分布
自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。