3.1 统计量 3.2 统计推断的常用分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 χ 2 = x1 + x 2 + ... + x n 2 2
服从χ ( n)分布 , 并记为 χ ~ χ 2 (n)
2
2
表示相互独立的标准正态变量的个数)。 (其中n 称为自由度 表示相互独立的标准正态变量的个数)。 其中 称为自由度,表示相互独立的标准正态变量的个数
对于服从 χ 2 ( n)分布的 χ 2 , 其均值和方差分别为 :
若总体 X 的均值 µ和方差 σ 2 有限 , 则当样本容量 n 充分大时 , 不管总体服从什么分布 , 其样本均值 x 近似服从均值是 µ、 方差为
σ2
n
的正态分布 , 即
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
在实际实用时,当总体分布未知时 对大样本情 在实际实用时 当总体分布未知时,对大样本情 当总体分布未知时 就可用中心极限定理. 形(n≥30),就可用中心极限定理 就可用中心极限定理
三、 t 统计量与 t 分布
定理3.4 定理
设 x1 , x2 ,..., xn是来自正态总体 N ( µ , σ 2 )的样本, x 与 s 2 分别是样本均值与样本方差, 则
x −µ ~t(n-1) s/ n
我们将所服从的t(n-1)分布称为自由度是 分布称为自由度是(n-1)的t分 我们将所服从的 分布称为自由度是 的分 布或学生分布,并记服从 分布的随机变量为 布或学生分布 并记服从t分布的随机变量为 。 并记服从 分布的随机变量为T。
(
)
= 0.9207
课堂练习:(2) (3) 课堂练习: (2) 0.0793 (3) 0.2557
二、样本方差的分布与 χ
定理3.3 定理
2
分布
设 x 1 , x 2 ,..., x n 是来自正态总体 N ( µ , σ 2 )的样本 , 则对于其样本方差 s 2 , 有
( n − 1) s
2
σ2
~χ
2
(n −1)
2 我们将服从的分布 χ2 (n −1) 称为自由度是(n-1)的 χ 称为自由度是 的 2 (卡方 分布 并记服从 χ 2 (卡方 的随机变量为 χ . 卡方)分布 卡方)的随机变量为 卡方 分布,并记服从 卡方
定义: 定义:
设随机变量 x1 , x 2 ,..., x n 相互独立 , 且都服从标准正态 分布N (0,1), 则称
E( χ 2 ) = n, D( χ 2 ) = 2n
.χ2—分布的密度函数 分布的密度函数 分布的密度函数f(y)曲线 曲线
分位点 : 设X ~ χ2(n),若对于α:0<α<1, α α , 存在χα (n) > 0 满足
2
P{χ ≥ χα (n)} = α , 或 ∫
2 2
2
+∞
2
为 χ 2 (n) 分布的上侧α分位数。 分布的上侧α分位数。 则称 χα (n)
lim f ( t ) = ϕ( t ) = 1 e n→ ∞ 2π
−t 2
2
, −∞ < x < ∞
3.分位点 3.分位点 设T~t(n) T t(n),若对 α:0<α<1,存在tα(n)>0 :0<α<1, t (n)>0, 满足P{T≥tα(n)}=α, P{T≥ (n)}=α P{T 则称tα(n) t (n)为 t(n)的上侧分位点 t(n)
2 λ = χ 0.025 (21) 解(1)由分位数的定义可知, )由分位数的定义可知, 查表P173可得 : λ = 35.479
χ 2 (21) < λ = 0.025,即P χ 2 (21) ≥ λ = 0.975 (2) P
∴ 查表P173 ,可得λ = 10.283
10药 2班 第5周 星期二 3,4节 10药学英语1&2班
第三章
一、统计量
参数估计
二、统计推断的常用分布 三、参数的点估计 四、参数的区间估计
§3.1
一、总体与样本
统计量
总体:对某一问题的研究对象全体称为总体 总体。 总体:对某一问题的研究对象全体称为总体 个体:组成总体的每个观察单元,称为个体 个体:组成总体的每个观察单元,称为个体。 总体的参数: 总体的参数:总体的数字特征即总体指标。 总体可以是具体事物的集合, 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合, 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体 总体可以包含有限个个体,也可以包含无限个个体。 有限个个体 无限个 总体中的个体,应当有共同的可观察的特征。 总体中的个体,应当有共同的可观察的特征。 该特征与研究目的有关。
主讲: 主讲:林沛玉
一、样本均值 x 分布与中心极限定理
定理3.1 若x1,L, x n 是来自正态总体 N ( µ , σ 2 )的样本, 则其样本均值x有:
σ
n
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
1 D( x) = 2 n
n
σ ( x) =
即样本均值的抽样分布仍为正态分布, 即样本均值的抽样分布仍为正态分布,且
例如 : x1, x2 ,...x10是来自N ( 5,1)的简单样本,x 是 容量为10的样本均值,则x 服从什么分布?并求: (1) E ( x );(2) D( x );(3) P( x > 5)
1 答 : x服从N (5, )的分布 10
(1) E ( x ) = µ = 5
σ2
1 ( 2 ) D( x ) = = n 10
χα ( n )
f ( x)dx = α
临界值
2 χα (n)
例:求卡方分布的临界值。 求卡方分布的临界值。
2 P本2 ≥ χα (表8 − ,3 {χ P139n)} = α Excel : 课
(1) P χ 2 (21) > λ = 0.025 (2) P χ 2 (21) < λ = 0.025
当泛指一次抽样结果时, 样本x1 , x2 ,..., xn是n个随机 变量, 则样本均值x 与样本方差s 2等也都是随机变量.
课堂练习 :
2 总体X 服从N ( µ , σ 2 ), 其中µ未知, σ 2 = σ 0 为已知参数, x1 , x2 ,..., xn
是从总体抽取的一组样本, 则下列各式中属于统计量的是 :
二、统计量
定义 : 我们将样本x1 , x2 , ..., xn的不含任何未知参数 的函数ϕ ( x1 , x2 , ..., xn )称为统计量.
注意:统计量完全依赖于样本, 注意:统计量完全依赖于样本,不应含有分布的任何参 由于样本是随机变量,故统计量也是随机变量。 数。由于样本是随机变量,故统计量也是随机变量 常用的统计量主要有: 常用的统计量主要有: 1 n 样本平均值 : x = ∑ x i n i =1 1 n 1 n 2 2 2 2 样本方差:S = ∑ (x i − x) = n − 1 ∑ x i − n(x) n − 1 i =1 i =1
临界值 tα (n)
注:
t1−α (n) = −tα (n)
Excel : 课本P附表 8 − 3 139表 附表6 查P175附表
p[t (4) > λ ] = 0.99 ⇒ λ = ? λ = −3.7469
Biblioteka Baidu
t1−α (n)
( 3 ) P ( x > 5) = 1 − P ( x < 5) = 1 − F ( 5)
= 1 − φ ( 0)
5−5 = 1−φ( ) 1/ 10
= 0.5
阅读: 阅读:P50例3-1. 例 练习: 习题三: 练习:P63习题三:1. 习题三
定理3.2(中心极限定理 中心极限定理) 定理 中心极限定理
t—分布 分布
1.构造 若X~N(0, 1), Y~χ2(n), X与Y独立,则 χ
X T= ~ t (n). Y /n
t(n)称为自由度为n的t—分布。
2.
t(n) 的概率密度曲线为 (n)
2.基本性质 2.基本性质: 基本性质 f(t)关于t=0 t=0(纵轴)对称。 (1) f(t) t=0 f(t)的极限为N(0,1) N(0, (2) f(t) N(0 1)的密度函数,即
例1:从某地区统计中得知,该地区郊区平均每一家 从某地区统计中得知, 庭年收入为3160元 标准差为800元 庭年收入为3160元,标准差为800元。从此郊区抽取 3160 800 50个家庭为一随机样本, 50个家庭为一随机样本,平均每年收入为以下数字 个家庭为一随机样本 的概率是多少? 的概率是多少? (1)多于3000元;(2)少于 多于3000元;(2 3000 3000元;(3 3000元;(3)在3200元到3300元之间。 3200元到3300元之间。 元到3300元之间 题中没有告知总体服从正态分布, 解:题中没有告知总体服从正态分布,但样本容量足够 题中没有告知总体服从正态分布 ),据中心极限定理 大(n=50),据中心极限定理, x 近似服从正态分布。 ),据中心极限定理, 即有: 即有
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
x
(1) µ
= µ = 3160
σ
x
=
σ
800 = = 113.14 n 50
P x〉3000 = 1 − P( x ≤ 3000)
= 1 − φ ( −1.41) = φ (1.41)
3000 − 3160 = 1 − F (3000) = 1 − φ 113.14
(1)∑ ( xi − σ ) ;
i =1
n
n
2 2 0
(2)∑ ( xi − µ );
i =1
n
(3)∑ ( xi − x ) 2 ;
i =1
1 (4) µ + ( x1 + x2 + x3 ) 3
2
§3.2 统计推断的常用分布
抽样分布:是指统计量作为随机变量所服从的概率分布。 抽样分布:是指统计量作为随机变量所服从的概率分布。 我们主要学习常用统计量样本均值与样本方差 我们主要学习常用统计量样本均值与 样本均值 相关的常用抽样分布。而在大多数情形, 相关的常用抽样分布。而在大多数情形,统计量服 从正态分布或以正态分布为渐近分布,所以正态分 从正态分布或以正态分布为渐近分布,所以正态分 布是最常用抽样分布。 布是最常用抽样分布。后面我们还要学习同样起着 分布、 分布 分布、 分布 分布。 重要作用的 χ 2 分布、t分布、F分布。
1 E ( x) = ∑ E ( xi ) = µ n i =1
n
∑ D( x ) =
i =1 i
σ2
n
标准化后,定理 样本均值 x 标准化后 定理 x−µ Z= ~ N (0, 1) 的结果可转化为: 的结果可转化为 σ/ n
练习: 自测思考题三: 练习:P63自测思考题三: 自测思考题三 1(第一、二空格), ,5 (第一、二空格),4, ),
例如: 总体 一批产品 一批灯泡 个体 每件产品 每个灯泡 特征 等级 寿命
一年的日平均气温
每天日平均气温 度数 坐标 号码
数轴上某一线段 线段中每一点 一批彩票 每张彩票
当总体数量很大时,只能从中抽取部分个体进行研究。 当总体数量很大时,只能从中抽取部分个体进行研究。 从总体中取出的若干个体,称为样本 从总体中取出的若干个体,称为样本。 样本中所含个体的个数,称为样本容量 样本中所含个体的个数,称为样本容量。 例如:在研究广州市民的年收入时 随机抽取广州 例如 在研究广州市民的年收入时,随机抽取广州 在研究广州市民的年收入时 市民100名来进行调查 这100名广州市民的年收 名来进行调查,这 市民 名来进行调查 名广州市民的年收 入就构成了一个样本,而样本容量就是 入就构成了一个样本 而样本容量就是100. 而样本容量就是 简单随机抽样:总体中每个个体被抽取的可能性 简单随机抽样 总体中每个个体被抽取的可能性 是均等的,而且每抽取一个个体时总体分布不变 是均等的 而且每抽取一个个体时总体分布不变. 而且每抽取一个个体时总体分布不变 在随机抽样中,样本 应具有: 在随机抽样中 样本 x1 , x 2 , x 3 ... x n 应具有 (1)独立性: x1 , x 2 , x 3 ... x n 相互独立 独立性 相互独立. (2)代表性 代表性: x1 , x 2 , x 3 ... x n 与总体 相同的概率分布。 与总体X相同的概率分布 代表性
服从χ ( n)分布 , 并记为 χ ~ χ 2 (n)
2
2
表示相互独立的标准正态变量的个数)。 (其中n 称为自由度 表示相互独立的标准正态变量的个数)。 其中 称为自由度,表示相互独立的标准正态变量的个数
对于服从 χ 2 ( n)分布的 χ 2 , 其均值和方差分别为 :
若总体 X 的均值 µ和方差 σ 2 有限 , 则当样本容量 n 充分大时 , 不管总体服从什么分布 , 其样本均值 x 近似服从均值是 µ、 方差为
σ2
n
的正态分布 , 即
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
在实际实用时,当总体分布未知时 对大样本情 在实际实用时 当总体分布未知时,对大样本情 当总体分布未知时 就可用中心极限定理. 形(n≥30),就可用中心极限定理 就可用中心极限定理
三、 t 统计量与 t 分布
定理3.4 定理
设 x1 , x2 ,..., xn是来自正态总体 N ( µ , σ 2 )的样本, x 与 s 2 分别是样本均值与样本方差, 则
x −µ ~t(n-1) s/ n
我们将所服从的t(n-1)分布称为自由度是 分布称为自由度是(n-1)的t分 我们将所服从的 分布称为自由度是 的分 布或学生分布,并记服从 分布的随机变量为 布或学生分布 并记服从t分布的随机变量为 。 并记服从 分布的随机变量为T。
(
)
= 0.9207
课堂练习:(2) (3) 课堂练习: (2) 0.0793 (3) 0.2557
二、样本方差的分布与 χ
定理3.3 定理
2
分布
设 x 1 , x 2 ,..., x n 是来自正态总体 N ( µ , σ 2 )的样本 , 则对于其样本方差 s 2 , 有
( n − 1) s
2
σ2
~χ
2
(n −1)
2 我们将服从的分布 χ2 (n −1) 称为自由度是(n-1)的 χ 称为自由度是 的 2 (卡方 分布 并记服从 χ 2 (卡方 的随机变量为 χ . 卡方)分布 卡方)的随机变量为 卡方 分布,并记服从 卡方
定义: 定义:
设随机变量 x1 , x 2 ,..., x n 相互独立 , 且都服从标准正态 分布N (0,1), 则称
E( χ 2 ) = n, D( χ 2 ) = 2n
.χ2—分布的密度函数 分布的密度函数 分布的密度函数f(y)曲线 曲线
分位点 : 设X ~ χ2(n),若对于α:0<α<1, α α , 存在χα (n) > 0 满足
2
P{χ ≥ χα (n)} = α , 或 ∫
2 2
2
+∞
2
为 χ 2 (n) 分布的上侧α分位数。 分布的上侧α分位数。 则称 χα (n)
lim f ( t ) = ϕ( t ) = 1 e n→ ∞ 2π
−t 2
2
, −∞ < x < ∞
3.分位点 3.分位点 设T~t(n) T t(n),若对 α:0<α<1,存在tα(n)>0 :0<α<1, t (n)>0, 满足P{T≥tα(n)}=α, P{T≥ (n)}=α P{T 则称tα(n) t (n)为 t(n)的上侧分位点 t(n)
2 λ = χ 0.025 (21) 解(1)由分位数的定义可知, )由分位数的定义可知, 查表P173可得 : λ = 35.479
χ 2 (21) < λ = 0.025,即P χ 2 (21) ≥ λ = 0.975 (2) P
∴ 查表P173 ,可得λ = 10.283
10药 2班 第5周 星期二 3,4节 10药学英语1&2班
第三章
一、统计量
参数估计
二、统计推断的常用分布 三、参数的点估计 四、参数的区间估计
§3.1
一、总体与样本
统计量
总体:对某一问题的研究对象全体称为总体 总体。 总体:对某一问题的研究对象全体称为总体 个体:组成总体的每个观察单元,称为个体 个体:组成总体的每个观察单元,称为个体。 总体的参数: 总体的参数:总体的数字特征即总体指标。 总体可以是具体事物的集合, 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合, 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体 总体可以包含有限个个体,也可以包含无限个个体。 有限个个体 无限个 总体中的个体,应当有共同的可观察的特征。 总体中的个体,应当有共同的可观察的特征。 该特征与研究目的有关。
主讲: 主讲:林沛玉
一、样本均值 x 分布与中心极限定理
定理3.1 若x1,L, x n 是来自正态总体 N ( µ , σ 2 )的样本, 则其样本均值x有:
σ
n
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
1 D( x) = 2 n
n
σ ( x) =
即样本均值的抽样分布仍为正态分布, 即样本均值的抽样分布仍为正态分布,且
例如 : x1, x2 ,...x10是来自N ( 5,1)的简单样本,x 是 容量为10的样本均值,则x 服从什么分布?并求: (1) E ( x );(2) D( x );(3) P( x > 5)
1 答 : x服从N (5, )的分布 10
(1) E ( x ) = µ = 5
σ2
1 ( 2 ) D( x ) = = n 10
χα ( n )
f ( x)dx = α
临界值
2 χα (n)
例:求卡方分布的临界值。 求卡方分布的临界值。
2 P本2 ≥ χα (表8 − ,3 {χ P139n)} = α Excel : 课
(1) P χ 2 (21) > λ = 0.025 (2) P χ 2 (21) < λ = 0.025
当泛指一次抽样结果时, 样本x1 , x2 ,..., xn是n个随机 变量, 则样本均值x 与样本方差s 2等也都是随机变量.
课堂练习 :
2 总体X 服从N ( µ , σ 2 ), 其中µ未知, σ 2 = σ 0 为已知参数, x1 , x2 ,..., xn
是从总体抽取的一组样本, 则下列各式中属于统计量的是 :
二、统计量
定义 : 我们将样本x1 , x2 , ..., xn的不含任何未知参数 的函数ϕ ( x1 , x2 , ..., xn )称为统计量.
注意:统计量完全依赖于样本, 注意:统计量完全依赖于样本,不应含有分布的任何参 由于样本是随机变量,故统计量也是随机变量。 数。由于样本是随机变量,故统计量也是随机变量 常用的统计量主要有: 常用的统计量主要有: 1 n 样本平均值 : x = ∑ x i n i =1 1 n 1 n 2 2 2 2 样本方差:S = ∑ (x i − x) = n − 1 ∑ x i − n(x) n − 1 i =1 i =1
临界值 tα (n)
注:
t1−α (n) = −tα (n)
Excel : 课本P附表 8 − 3 139表 附表6 查P175附表
p[t (4) > λ ] = 0.99 ⇒ λ = ? λ = −3.7469
Biblioteka Baidu
t1−α (n)
( 3 ) P ( x > 5) = 1 − P ( x < 5) = 1 − F ( 5)
= 1 − φ ( 0)
5−5 = 1−φ( ) 1/ 10
= 0.5
阅读: 阅读:P50例3-1. 例 练习: 习题三: 练习:P63习题三:1. 习题三
定理3.2(中心极限定理 中心极限定理) 定理 中心极限定理
t—分布 分布
1.构造 若X~N(0, 1), Y~χ2(n), X与Y独立,则 χ
X T= ~ t (n). Y /n
t(n)称为自由度为n的t—分布。
2.
t(n) 的概率密度曲线为 (n)
2.基本性质 2.基本性质: 基本性质 f(t)关于t=0 t=0(纵轴)对称。 (1) f(t) t=0 f(t)的极限为N(0,1) N(0, (2) f(t) N(0 1)的密度函数,即
例1:从某地区统计中得知,该地区郊区平均每一家 从某地区统计中得知, 庭年收入为3160元 标准差为800元 庭年收入为3160元,标准差为800元。从此郊区抽取 3160 800 50个家庭为一随机样本, 50个家庭为一随机样本,平均每年收入为以下数字 个家庭为一随机样本 的概率是多少? 的概率是多少? (1)多于3000元;(2)少于 多于3000元;(2 3000 3000元;(3 3000元;(3)在3200元到3300元之间。 3200元到3300元之间。 元到3300元之间 题中没有告知总体服从正态分布, 解:题中没有告知总体服从正态分布,但样本容量足够 题中没有告知总体服从正态分布 ),据中心极限定理 大(n=50),据中心极限定理, x 近似服从正态分布。 ),据中心极限定理, 即有: 即有
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
x
(1) µ
= µ = 3160
σ
x
=
σ
800 = = 113.14 n 50
P x〉3000 = 1 − P( x ≤ 3000)
= 1 − φ ( −1.41) = φ (1.41)
3000 − 3160 = 1 − F (3000) = 1 − φ 113.14
(1)∑ ( xi − σ ) ;
i =1
n
n
2 2 0
(2)∑ ( xi − µ );
i =1
n
(3)∑ ( xi − x ) 2 ;
i =1
1 (4) µ + ( x1 + x2 + x3 ) 3
2
§3.2 统计推断的常用分布
抽样分布:是指统计量作为随机变量所服从的概率分布。 抽样分布:是指统计量作为随机变量所服从的概率分布。 我们主要学习常用统计量样本均值与样本方差 我们主要学习常用统计量样本均值与 样本均值 相关的常用抽样分布。而在大多数情形, 相关的常用抽样分布。而在大多数情形,统计量服 从正态分布或以正态分布为渐近分布,所以正态分 从正态分布或以正态分布为渐近分布,所以正态分 布是最常用抽样分布。 布是最常用抽样分布。后面我们还要学习同样起着 分布、 分布 分布、 分布 分布。 重要作用的 χ 2 分布、t分布、F分布。
1 E ( x) = ∑ E ( xi ) = µ n i =1
n
∑ D( x ) =
i =1 i
σ2
n
标准化后,定理 样本均值 x 标准化后 定理 x−µ Z= ~ N (0, 1) 的结果可转化为: 的结果可转化为 σ/ n
练习: 自测思考题三: 练习:P63自测思考题三: 自测思考题三 1(第一、二空格), ,5 (第一、二空格),4, ),
例如: 总体 一批产品 一批灯泡 个体 每件产品 每个灯泡 特征 等级 寿命
一年的日平均气温
每天日平均气温 度数 坐标 号码
数轴上某一线段 线段中每一点 一批彩票 每张彩票
当总体数量很大时,只能从中抽取部分个体进行研究。 当总体数量很大时,只能从中抽取部分个体进行研究。 从总体中取出的若干个体,称为样本 从总体中取出的若干个体,称为样本。 样本中所含个体的个数,称为样本容量 样本中所含个体的个数,称为样本容量。 例如:在研究广州市民的年收入时 随机抽取广州 例如 在研究广州市民的年收入时,随机抽取广州 在研究广州市民的年收入时 市民100名来进行调查 这100名广州市民的年收 名来进行调查,这 市民 名来进行调查 名广州市民的年收 入就构成了一个样本,而样本容量就是 入就构成了一个样本 而样本容量就是100. 而样本容量就是 简单随机抽样:总体中每个个体被抽取的可能性 简单随机抽样 总体中每个个体被抽取的可能性 是均等的,而且每抽取一个个体时总体分布不变 是均等的 而且每抽取一个个体时总体分布不变. 而且每抽取一个个体时总体分布不变 在随机抽样中,样本 应具有: 在随机抽样中 样本 x1 , x 2 , x 3 ... x n 应具有 (1)独立性: x1 , x 2 , x 3 ... x n 相互独立 独立性 相互独立. (2)代表性 代表性: x1 , x 2 , x 3 ... x n 与总体 相同的概率分布。 与总体X相同的概率分布 代表性