生物统计学第四章抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 平均数的抽样分布对总体正态性的要求不十分严 格。
(根据中心极限定理,从非正态分布的总体中抽取 的含量为n的样本,当n充分大时,样本平均数渐 近服从正态分布)
• 方差的抽样分布对总体正态性的要求十分严格。 7
§4·1 从一个正态总体分 布中抽取的样本统计量的
分布
8
一、样本平均数的抽样及其分布
• 如果从容量为N的有限总体抽样,若每次抽取容 量为n的样本,那么一共可以得到Nn个样本。
15
标准差未知
时的平均数
分布
未知时,可以用样本标准差代替总体标准差, 标准差变量为
u
y
s
n 这个变量不服从正态分布,而服从n -1的t分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
16
标准差未知 时的平均数 分布 自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。
23
2 1
2 2
n1 n2
如果两个总体都是正态分布,则有
标准化
N(1
2,(n112
22))
n2
u ( y1 y2) (1 2 )
12
2 2
n1
n2
24
未知时,两
个平均数的
和与差的分
布
t (df1 df2 )
( y1 y2) (1 2 )
df1s12 df2s22 ( 1 1 ) df1 df2 df1 11 df2 1
• 每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
9
• 下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
• 假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
生物统计学
1
第四章抽样分布
2
抽样分布
• 研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
• 生物统计学的最基本问题是研究总体和样本 间的关系。
• 总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
3
抽样分布
• 对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
fdf(t) dfπd( 2ff1df1dt2fd2f1, t 2
17
1. 具有自 n的 t由 分t度 布 ~t(d为 )f其 , 数学期 与方E 差 (t)为 0,D (t): df(d f2) (n2)
2. t分布的密度函数t 关0对 于称.当n充分大,时 其图形近似于标准 分正 布态 概率密度的图形
11
从表中我们可以算出 样本平均数 的平均数:
_
_
y
y Nn
364
9
以自由度为除数的样本方差的平均数:
s2
s2 Nn
2482
93
以样本容量为除数的样本方差的平均数:
s0 2
ቤተ መጻሕፍቲ ባይዱ
s0 2 Nn
1242
93
12
样本标准差s的平均数:
s Nn s1.3 1 91 31.2 65 7
在统计上,如果所有可能样本的某一统计 数等于总体的相应参数,则称该统计数为 总体_相应参数的无偏估计值(unbiased estyimate)
• 首先计算出总体参数:
• μ=(2+4+6)/3=4 • σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3
• 所有可能的样本数=Nn=32=9
10
总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表
第一个 第二个 样本
观察值 观察值
2
2
22
2
4
24
2
6
26
4
2
42
4
4
44
4
这个变量就是服从n-1个自由度的卡方分布(χ2 – distribution)。
19
其密度函数为:
f
(2)
2d2f
1 (df)
df1 2
y2 e 2
,
y0
2
0
其他 .
2(n)分布的概率密度曲线图.如
20
对于给定的 , 0正 数 1, 称满足条件
P{2
2(n)}
2(n)
f(y)dy
的点 2(n)为2(n)分布的 分 上位. 点
• 统计推断是以总体分布和样本抽样分布的理论关 系为基础的。
4
总体
随机样本1
……
2
3
4
无穷多个样本
总体和样本的关系示意图
5
抽样分布
从样本
到总体
总体与 样本间 的关系
从总体 到样本
统计推
断(目的)
抽样分 布(基础
)
本章研究的内容就是:从总体到样本(抽样分布)
6
抽样分布
• 抽样分布全部建立在正态分布的基础之上(在正 态分布的总体中抽样)。
13
1、 是μ的无偏估计值。
2、s2是σ2的无偏估计值。 3、以n为除数的样本方差
估计值。
4、s不是σ的无偏估计值。
不是σ2的无偏
14
标准差已知
时的平均数
分布
Y ~ N(,2 )
n
u
y
n
变量是正态的或近似正态的,则标准化的变量服从或 近似服从N(0,1)分布。如果整体是非正态分布,当n 足够大的时,其样本平局数还是服从正态分布。
t (n1 n2 2)
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
6
46
6
2
62
6
4
64
6
6
总和
66
∑(y)
4 6 8 6 8 10 8 10 12 72
_
y
s
2 0
2
0
3
1
4
4
3
1
4
0
5
1
4
4
5
1
6
0
36
12
s2 s
0 0.0000 2 1.4142 8 2.8284 2 1.4142 0 0.0000 2 1.4142 8 2.8284 2 1.4142 0 0.0000 24 11.3136
再由函数的性质有limh(t) n
近似
即n当 足够大 t~时 N(0, ,1).
1 et2 2.
2
t 分布的概率密度曲线图如
18
二、方差的 抽样及其分
布
• 从方差为σ2 正态总体中,急速抽取含量为n的样本,
计算样本方差s2。在讨论样本方差的分布时,通常并
不直接谈论s2而是给他先标准化:
2 df
df22s(n12)s2
对于不同的 , n,
可以通过查表求
得上 分位点的值.
21
如何查表,附表6.
§4·2 从两个正态总体分 布中抽取的样本统计量的
分布
22
已知时,两
个平均数的
和与差的分
布
1 2
( y1 y 2)
( y1 y 2)
2 1
2 2
n1 n2
1 2 ( y1 y 2)
( y1 y 2)
(根据中心极限定理,从非正态分布的总体中抽取 的含量为n的样本,当n充分大时,样本平均数渐 近服从正态分布)
• 方差的抽样分布对总体正态性的要求十分严格。 7
§4·1 从一个正态总体分 布中抽取的样本统计量的
分布
8
一、样本平均数的抽样及其分布
• 如果从容量为N的有限总体抽样,若每次抽取容 量为n的样本,那么一共可以得到Nn个样本。
15
标准差未知
时的平均数
分布
未知时,可以用样本标准差代替总体标准差, 标准差变量为
u
y
s
n 这个变量不服从正态分布,而服从n -1的t分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
16
标准差未知 时的平均数 分布 自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。
23
2 1
2 2
n1 n2
如果两个总体都是正态分布,则有
标准化
N(1
2,(n112
22))
n2
u ( y1 y2) (1 2 )
12
2 2
n1
n2
24
未知时,两
个平均数的
和与差的分
布
t (df1 df2 )
( y1 y2) (1 2 )
df1s12 df2s22 ( 1 1 ) df1 df2 df1 11 df2 1
• 每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
9
• 下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
• 假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
生物统计学
1
第四章抽样分布
2
抽样分布
• 研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
• 生物统计学的最基本问题是研究总体和样本 间的关系。
• 总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
3
抽样分布
• 对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
fdf(t) dfπd( 2ff1df1dt2fd2f1, t 2
17
1. 具有自 n的 t由 分t度 布 ~t(d为 )f其 , 数学期 与方E 差 (t)为 0,D (t): df(d f2) (n2)
2. t分布的密度函数t 关0对 于称.当n充分大,时 其图形近似于标准 分正 布态 概率密度的图形
11
从表中我们可以算出 样本平均数 的平均数:
_
_
y
y Nn
364
9
以自由度为除数的样本方差的平均数:
s2
s2 Nn
2482
93
以样本容量为除数的样本方差的平均数:
s0 2
ቤተ መጻሕፍቲ ባይዱ
s0 2 Nn
1242
93
12
样本标准差s的平均数:
s Nn s1.3 1 91 31.2 65 7
在统计上,如果所有可能样本的某一统计 数等于总体的相应参数,则称该统计数为 总体_相应参数的无偏估计值(unbiased estyimate)
• 首先计算出总体参数:
• μ=(2+4+6)/3=4 • σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3
• 所有可能的样本数=Nn=32=9
10
总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表
第一个 第二个 样本
观察值 观察值
2
2
22
2
4
24
2
6
26
4
2
42
4
4
44
4
这个变量就是服从n-1个自由度的卡方分布(χ2 – distribution)。
19
其密度函数为:
f
(2)
2d2f
1 (df)
df1 2
y2 e 2
,
y0
2
0
其他 .
2(n)分布的概率密度曲线图.如
20
对于给定的 , 0正 数 1, 称满足条件
P{2
2(n)}
2(n)
f(y)dy
的点 2(n)为2(n)分布的 分 上位. 点
• 统计推断是以总体分布和样本抽样分布的理论关 系为基础的。
4
总体
随机样本1
……
2
3
4
无穷多个样本
总体和样本的关系示意图
5
抽样分布
从样本
到总体
总体与 样本间 的关系
从总体 到样本
统计推
断(目的)
抽样分 布(基础
)
本章研究的内容就是:从总体到样本(抽样分布)
6
抽样分布
• 抽样分布全部建立在正态分布的基础之上(在正 态分布的总体中抽样)。
13
1、 是μ的无偏估计值。
2、s2是σ2的无偏估计值。 3、以n为除数的样本方差
估计值。
4、s不是σ的无偏估计值。
不是σ2的无偏
14
标准差已知
时的平均数
分布
Y ~ N(,2 )
n
u
y
n
变量是正态的或近似正态的,则标准化的变量服从或 近似服从N(0,1)分布。如果整体是非正态分布,当n 足够大的时,其样本平局数还是服从正态分布。
t (n1 n2 2)
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
6
46
6
2
62
6
4
64
6
6
总和
66
∑(y)
4 6 8 6 8 10 8 10 12 72
_
y
s
2 0
2
0
3
1
4
4
3
1
4
0
5
1
4
4
5
1
6
0
36
12
s2 s
0 0.0000 2 1.4142 8 2.8284 2 1.4142 0 0.0000 2 1.4142 8 2.8284 2 1.4142 0 0.0000 24 11.3136
再由函数的性质有limh(t) n
近似
即n当 足够大 t~时 N(0, ,1).
1 et2 2.
2
t 分布的概率密度曲线图如
18
二、方差的 抽样及其分
布
• 从方差为σ2 正态总体中,急速抽取含量为n的样本,
计算样本方差s2。在讨论样本方差的分布时,通常并
不直接谈论s2而是给他先标准化:
2 df
df22s(n12)s2
对于不同的 , n,
可以通过查表求
得上 分位点的值.
21
如何查表,附表6.
§4·2 从两个正态总体分 布中抽取的样本统计量的
分布
22
已知时,两
个平均数的
和与差的分
布
1 2
( y1 y 2)
( y1 y 2)
2 1
2 2
n1 n2
1 2 ( y1 y 2)
( y1 y 2)