4.三大统计分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在给定概率α的条件下, 在给定概率 的条件下,满足 的条件下
不同于正态分布中是 ”<”
或者说表达式
> X a2 (n) )
的概率为α 的概率为
统计变量
服从卡方分布,其本质含义是: 服从卡方分布,其本质含义是:
在给定概率α的条件下, 在给定概率 的条件下,满足 的条件下
不同于正态分布中是 ”<”
或者说表达式
读作:变量 服从第一自由度为 服从第一自由度为n 第二自由度为n 读作:变量F服从第一自由度为 1,第二自由度为 2的F分布 分布
• F分布的概率密度曲线的图形 分布的概率密度曲线的图形
• F分布概率表 分布概率表
P{ F >Fa(n1,n2)}=a =
• 查F 分布表
• 卡方分布、t分布和 分布常常被人们称为数理统 卡方分布、 分布和 分布和F分布常常被人们称为数理统 计学中的三大统计分布. 计学中的三大统计分布.
• 查t 分布表
• F分布 分布
由统计学家费希尔(R.A.Fisher) 提出的, 由统计学家费希尔(R.A.Fisher) 提出的, 以其姓氏的第一个字母来命名

设随机变量x, 相互独立 相互独立, 设随机变量 ,y相互独立, Y~ ~ 记
则随机变量F服从第一自由度为 1,第二自由度为 则随机变量 服从第一自由度为n 服从第一自由度为 n2的F分布. 分布. 分布 记作: 记作:F~F(n1,n2)
这个命题的意义何在? 这个命题的意义何在?
• 讨论:如何确定样本容量? 讨论:如何确定样本容量? 从何角度思考? 从何角度思考?
换个角度看: 换个角度看: • 设X~N(µ,4),欲使样本均值与总体数 样本均值与总体数 ,欲使样本均值 学期望的误差小于0.4的概率为 的概率为95%, 学期望的误差小于 的概率为 %, 问至少应抽取多大容量的样本? 问至少应抽取多大容量的样本
注意: 注意:与正态分布中原始变量的标准化的异同
抽样分布定理: 抽样分布定理:
X −µ 作统计量: 作统计量: U= σ n
则有统计量u服从标准正态分布, 则有统计量 服从标准正态分布,即: 服从标准正态分布
X − µ U= ~ N ( 0 ,1 ) σ n
• 当X的分布不明确时,增大样本容量后,统 的分布不明确时, 的分布不明确时 增大样本容量后, 计学中常用到的统计量平均数: 计学中常用到的统计量平均数:
统计分布及其应用
设:统计量X ~ N(µ, σ2 ), 统计量 ,
则:
X −µ
σ
~ N(0,1)
即为正态分布标准化。 即为正态分布标准化。
当X ~ N(µ, σ2), ,
• 统计学中常用到的统计量
平均数
1 X= ∑ X i n i=1
n
它的分布规律如何? 它的分布规律如何
X ~ N(µ, σ2), ,
据此可以讨论有关单个样本均值、总体均 据此可以讨论有关单个样本均值、 单个样本均值 值关系的问题。 值关系的问题。
抽样分布定理: 抽样分布定理:
抽样分布定理:
据此可以讨论有关单个样本方差、 据此可以讨论有关单个样本方差、总体方 单个样本方差 差关系的问题。 差关系的问题。
抽样分布定理:
据此可以讨论有关单个样本方差、 据此可以讨论有关单个样本方差、总体方 单个样本方差 差关系的问题。 差关系的问题。
据此可以讨论有关两个样本方差、 据此可以讨论有关两个样本方差、总体方 两个样本方差 差关系的问题。 差关系的问题。
• 定理:
据此可以讨论有关两个样本方差、 据此可以讨论有关两个样本方差、总体方 两个样本方差 差关系的问题。 差关系的问题。
据此可以讨论有关两个样本均值、总体均 据此可以讨论有关两个样本均值、 两个样本均值 值关系的问题。 值关系的问题。
• 三大统计分布的应用
讨论有关单个样本均值、 讨论有关单个样本均值、总体均值关系的 单个样本均值 问题。 问题。
• 案例: 案例: • 为检查某湖水受汞污染情况,从湖中随机取 为检查某湖水受汞污染情况,从湖中随机取 9条鱼龄相近的鱼,测得鱼胸肌中汞含量分 条鱼龄相近的鱼, 条鱼龄相近的鱼 别为( 别为(ppm): ): 1.87,2.13,2.05,1.92,1.95,1.99, , , , , , , 2.16,2.03,2.09 , , • 假设汞在鱼胸肌中的含量服从正态分布,试 假设汞在鱼胸肌中的含量服从正态分布, 该湖鱼胸肌中汞含量的 %置信区间。 求该湖鱼胸肌中汞含量的99%置信区间。
1 1 E ( X ) = E ( ∑ X i ) = E ( ∑ X i )=E ( X i )=µ n n
1 1 1 1 D ( X ) = D ( ∑ X i ) = 2 D ( ∑ X i )= D ( X i )= σ 2 n n n n
因此有: 因此有:
1 1 2 X = ∑ X i~ N ( µ, σ ) n n
• 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小 于0.4的概率为 %? 的概率为95% 的概率为 • 即求: 即求:
P{ X − µ < 0.4} = 95%
接下来如何处理? 接下来如何处理? 竭力地去想与之有关的并已经明确统计分布 的统计量并构筑这样的统计量
Q & A? Thanks!
变换为: 变换为:
− 0 .4 X − µ 0 .4 P{ < < } = 95 %
σ
n
σ
n
σ
n
− 0.4 X − µ 0.4 P{ < < } = 95%
σ
n
σ
n
σ
n
即:
2φ(
σ
0 .4 n
)- 1= 0 . 95
2φ(
σ
0 .4 n
)- 1= 0 . 95
即:
φ(
σ
0 .4 n
)= 0 . 975
> X a2 (n) )
的概率为α 的概率为
• 不同自由度的卡方分布 的概率密度曲线图形如 图所示. 图所示.
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
χ2
• 查卡方表

设随机变量x, 相互独立 相互独立, 设随机变量 ,y相互独立, X~N(0,1), , , 记 Y~
则随机变量T服从自由度为 的 分布 分布. 则随机变量 服从自由度为n的t分布. 服从自由度为
• 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小 于0.4的概率为 %? 的概率为95% 的概率为 • 即求: 即求:
P{ X − µ < 0.4} = 95%
接下来如何处理? 接下来如何处理? 竭力地去想与之有关的并已经明确统计分布 的统计量并构筑这样的统计量
课堂练习: 课堂练习: • 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小于 才能使样本均值与总体数学期望的误差小于 样本均值 0.4的概率为 %? 的概率为95% 的概率为
课堂练习: 课堂练习: • 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小于 才能使样本均值与总体数学期望的误差小于 样本均值 0.4的概率为 %? 的概率为95% 的概率为
据此可以讨论有关两个样本均值、总体均 据此可以讨论有关两个样本均值、 两个样本均值 值关系的问题。 值关系的问题。
案例:南农(均值 ,方差6) 案例:南农(均值85,方差 )与南理工英 均值83,方差4) 语(均值 ,方差 )六级成绩的差异
• 定理:
据此可以讨论有关两个样本均值、总体均 据此可以讨论有关两个样本均值、 两个样本均值 值关系的问题。 值关系的问题。
• t分布的概率密度曲线的图形 分布的概率密度曲线的图形
N>45,即为标准正态分布 ,
• t分布 分布
的数t 的数 a(n),称为 分布的上侧分位数 ,称为t分布的上侧分位数 对于较大的n( 对于较大的 (>45)可以用标准正态分布的 ) 上侧分位数u 作为t分布的上侧分位数 上侧分位数 a作为 分布的上侧分位数
1 1 2 X = ∑ X i~N ( µ, σ ) n n
如何将其标准化? 如何将其标准化?
1 1 2 X = ∑ X i~N ( µ, σ ) n n
如何将其标准化? 如何将其标准化?
X − µ ~ N ( 0 ,1 ) σ n
抽样分布定理: 抽样分布定理:
X −µ 作统计量: 作统计量: U= σ n
X − µ U= ~ N ( 0 ,1 ) σ n
构造一个统计量: 构造一个统计量:
X −µ U= σ n
据统计量: 据统计量:
X −µ U= ~N (0,1) σ n
P{ X − µ < 0.4} = 95%
欲使: 欲使:
即:
P{−0.4 < X − µ < 0.4} = 95%
P{−0.4 < X − µ < 0.4} = 95%
1 X= ∑ X i n i=1
可以近似认为服从
n
N( µ,
σ
n
2
)的正态分布
总体: 总体: 均值、 均值、方差等 抽 样 样本 均值、 均值、方差等
总体: 总体: 均值、 均值、方差等 抽 样 样本 均值、 均值、方差等 统 计 分 析
总体: 总体: 均值、 均值、方差等 抽 样 样本 均值、 均值、方差等 统计分布 统 计 分 析
查表可知: 查表可知:0.975=φ(1.96) = ( ) 结论:? 结论:?
N=96.04
• 三大统计分布介绍
三大统计分布: 三大统计分布: 是指卡方分布、 分布 分布、 分布 是指卡方分布、T分布、F分布
• 卡方分布
• 统计学中常用到的统计量
n

i= 1
X
2 i
记作: 记作:
χ =∑ X
• 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小 于0.4的概率为 %? 的概率为95% 的概率为 • 即求: 即求:
P{ X − µ < 0.4} = 95%
接下来如何处理? 接下来如何处理?
利用统计量: 利用统计量:
• 定理:设n个相互独立并且都服从正态 定理: 个相互独立并且都服从正态N(0,1)分 个相互独立并且都服从正态 , 分 布的随机变量X 布的随机变量 1,X2,….Xn,记 .
χ =∑ X
2 i=1
ห้องสมุดไป่ตู้
n
2 i
自由度: 自由度:
随机变量所包含的独立变量的个数
统计变量
服从卡方分布,其本质含义是: 服从卡方分布,其本质含义是:
2 i=1
n
2 i
等于…… 读作 :卡方 等于
• 卡方分布( ) 卡方分布(
由阿贝(Abbe) 由阿贝(Abbe) 于1863年首先给出。 1863年首先给出 年首先给出。 后来由海尔墨特(Hermert)和卡· 后来由海尔墨特(Hermert)和卡·皮尔逊 (Hermert)和卡 分别于1875年和1900 1875年和1900年推 (K·Pearson) 分别于1875年和1900年推 导出来。 导出来。
相关文档
最新文档