3.1 统计量 3.2 统计推断的常用分布

合集下载

常用统计分布

常用统计分布
= 120 + 240 × 1.64 = 145.5.
4
F分布的上侧分位数 Fα ( n1 , n2 )
对于给定的 α, 0 < α < 1, 称满足条件 P { F > Fα ( n1 , n2 )} = α
的点 Fα ( n1 , n2 ) 为 F ( n1 , n2 ) 分布的上 α 分位数 .
− uα
2.t分布的上侧分位数 t α ( n )
对于给定的 α, 0 < α < 1, 称满足条件 P{t > t α ( n)} = α 的点 t α ( n) 为 t ( n) 分布的上 α 分位数(或分位点).
可以通过查表求 得上α分位数的值 .
由分布的对称性知 t1−α ( n) = − tα ( n).
F分布的概率密度曲线如 图
F分布有以下性质
(1) 若F ~ F ( n1 , n2 ),
1 则 ~ F ( n2 , n1 ). F n2 E(F) = , (n2 > 2), n2 − 2
(2)
演示
2 2n2 (n1 + n2 − 2) D(F) = , (n2 > 4) 2 n1(n2 − 2) (n2 − 4)
2 2
自由度 : 指χ
2 2 2 = X 12 + X 2 + L + X n 中右端包含独立
变量的个数 .
5 定理 .4 χ (n)分布的概率密度为
2
n x −1 − 1 x2 e 2 x>0 n 2 n p( x ) = 2 Γ( ) 2 0 其它 χ 2 (n)分布的概率密度曲线如图 .
α
对于不同的 α , n, 可以通过查表求 得上α 分位点的值 .

第三节 常用的重要统计量及其分布

第三节  常用的重要统计量及其分布

第三节 常用的重要统计量及其分布在使用统计量进行统计推断时常需要知道它的分布。

当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般是比较困难的。

本节介绍三个常用的重要统计量,它们是以标准正态变量为基石而构造的,加上正态分布本身它们就构成了数理统计中的“四大抽样分布”,这四大分布在实际中有着广泛的应用,这是因为这四个统计量不仅有明确背景,而且其抽样分布的密度函数有明显表达式。

一. 2χ分布(卡方分布)定义1 设是来自正态总体的样本,则称统计量12,,,n X X X L (0,1)N 22212n X X X χ=+++L 2 为服从自由度为的n 2χ分布,记为:22()n χχ∼定义1中的自由度指的是2χ中所包含的独立变量的个数。

2χ分布的概率密度函数为:122210(;)2(2)00n x n x e x f x n n x −−⎧≥⎪=Γ⎨⎪<⎩其中伽玛函数,10(),0t x x e t dt x Γ+∞−−=∫>2χ分布的密度函数的图形是一个只取非负值的偏态分布,如图1所示。

图12χ分布的密度函数在第三章第五节的例2中我们已经知道,2χ分布是伽玛分布的特例,于是由伽玛分布的可加性得出2χ分布的可加性: 若,并且2222112(),()n n χχχχ∼∼22212,χχ相互独立,则有: 222121()n n χχχ+∼+22χ分布的数学期望与方差:x若则有:22(),n χχ∼22(),()2E n D χχ==n事实上,因为 (0,1),i X N ∼ 所以:,2()()i i E X D X ==12422()()[()]312,1,2,i i i D X E X E X i =−=−==L于是 22211()()()n ni i i i E E X E X χ=====∑∑n ,22211()()()2nnii i i D D XD X χ=====∑∑n类似于正态分布的分位点,我们可以得出2χ分布的分位点:()222()(())n 对于给定的(01)αα<<,称满足条件:P n f x dx αχχχα∞>==∫点为2()n αχ2χ分布的上α分位点。

3.1 统计量 3.2 统计推断的常用分布

3.1 统计量  3.2 统计推断的常用分布
t 2
2
, x
3.分位点
设T~t(n),若对 :0<<1,存在t(n)>0, 满足P{Tt(n)}=, 则称t(n)为
t(n)的上侧分位点
临界值
t (n)
注:
t1 (n) t (n) NhomakorabeaExcel : 课本P139表8 3 查P175附表6
pt (4) 0.99 ? 3.7469
t—分布
1.构造 若X~N(0, 1), Y~2(n), X与Y独立,则
X T ~ t (n). Y /n
t(n)称为自由度为n的t—分布。
2.
t(n) 的概率密度曲线为
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。 (2) f(t)的极限为N(0,1)的密度函数,即
limf ( t ) ( t ) 1 e n 2
当泛指一次抽样结果时, 样本x1, x2 ,..., xn是n个随机 变量, 则样本均值x与样本方差s 2等也都是随机变量.
课堂练习:
2 总体X 服从N ( , 2 ), 其中未知, 2 0 为已知参数, x1 , x2 ,..., xn
是从总体抽取的一组样本, 则下列各式中属于统计量的是 :
例如: 总体 个体 特征
一批产品 一批灯泡
每件产品 每个灯泡
等级 寿命
一年的日平均气温
每天日平均气温 度数
坐标 号码
数轴上某一线段 线段中每一点 一批彩票 每张彩票
当总体数量很大时,只能从中抽取部分个体进行研究。 从总体中取出的若干个体,称为样本。 样本中所含个体的个数,称为样本容量。
例如:在研究广州市民的年收入时,随机抽取广州

医学统计学方法

医学统计学方法

医学统计学方法1. 引言医学统计学是医学研究中不可或缺的一门学科,它通过应用统计学的原理和方法,对医学数据进行收集、整理、分析和解释,从而为医学研究提供可靠的依据。

本文将介绍医学统计学的基本概念、常用方法以及在医学研究中的应用。

2. 医学统计学的基本概念2.1 总体与样本在医学研究中,我们通常关注的是一个特定人群或物体的某种特征。

这个人群或物体称为总体,而从总体中选取出来的一部分个体则称为样本。

通过对样本进行观察和测量,我们可以对总体进行推断。

2.2 参数与统计量参数是描述总体特征的数值,例如总体均值、方差等。

由于很难获得总体所有个体的数据,我们通常通过样本来估计参数。

样本所得到的数值称为统计量,例如样本均值、样本方差等。

2.3 假设检验与置信区间在医学研究中,我们经常需要判断某种治疗方法是否有效、某种因素是否与疾病有关等。

假设检验是一种常用的统计方法,它通过对样本数据进行分析,判断总体参数是否符合某种假设。

置信区间则是对总体参数的估计范围。

3. 常用的医学统计学方法3.1 描述统计学描述统计学是对数据进行整理、总结和展示的方法。

常用的描述统计学方法包括:频数分布表、直方图、散点图等。

这些方法可以帮助我们了解数据的分布特征、集中趋势和离散程度。

3.2 推断统计学推断统计学是根据样本数据对总体进行推断的方法。

常用的推断统计学方法包括:参数估计和假设检验。

参数估计可以帮助我们估计总体参数,并给出其置信区间;假设检验可以帮助我们判断某个假设是否成立。

3.3 生存分析生存分析是研究个体发生某个事件(如死亡、复发)所需时间的方法。

常用的生存分析方法包括:生存函数曲线、危险比(hazard ratio)等。

生存分析可以帮助我们评估治疗效果、预测疾病进展等。

3.4 回归分析回归分析是研究因变量与自变量之间关系的方法。

常用的回归分析方法包括:线性回归、 logistic回归等。

回归分析可以帮助我们探索影响因素、预测结果等。

统计学常用分布及其分位数

统计学常用分布及其分位数

§1.4 常用的分布及其分位数1. 卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。

当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z=∑ii X 2 的等于n 的t 分布,记作Z ~ t (n ),它的分布密度P(z)=)()(221n nn ΓΓ+2121+-⎪⎪⎭⎫ ⎝⎛+n n z 。

请注意:t 分布的分布密度也是偶函数,且当n>30时,t分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。

这时, t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。

3. F 分布 若X 与Y 相互独立,且X ~2χ(n ),Y ~2χ(m ), 则Z=mY n X的分布称为第一自由度等于n 、第二自由度等于y -0 Y=X 2的分布密度p Y (y )=21)(121221212n y n y n n n n ++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ,与第一自由度等于1、第二自由度等于n的F分布的分布密度相同,因此Y=X2~F(1,n)。

为应用方便起见,以上三个分布的分布函数值都可以从各自的函数值表中查出。

但是,解应用问题时,通常是查分位数表。

有关分位数的概念如下:当X~N(0,1)时,P{X< u}=(u)=α,故根据标准正态分布密度曲线的对称性,uα=-u1-α。

例如,u 0.10=-u 0.90=-1.282,u 0.05=-u 0.95=-1.645,u 0.01=-u 0.99=-2.326,u 0.025=-u 0.975=-1.960,u 0.005=-u 0.995=-2.576。

又因为P{|X|< u1-0.5α}=1-α,所以标准正态分布的双侧α分位数分别是u1-0.5α和-u1-0.5α。

标准正态分布常用的上侧α分位数有:α=0.10,u 0.90=1.282;uα作为tα(n)的近似值。

第3讲_统计量及其性质

第3讲_统计量及其性质
的一致性,定义如下的标准差:
Sd = D(X)
变异系数
不同的随机变量有不同的特性, 例如量纲不同,这时仅由量值来 比较其性质就很不合理。因此, 这里定义如下的变异系数:
D(X) CV = E(X)
例如,中国正常青年男子,其身高 的均数为 170cm,标准差为6cm。 体重的均数为60kg ,标准差为 7kg。 经过计算,可得到关于身高 H 和体 重 W 的变异系数分别为:
2 2 2 2 1
2 2
分别为它们的样本方差,则有:
S σ F= ~ F(n1 − 1,n2 − 1) S σ
2 1 2 2 2 1 2 2
未知总体统计量的分布
现假设某种药物A经过试验其有效 率约为0.6,请问,是否同意审批 该药物上市?如果要完成审批, 申请者还需要怎样的数据支持?
注意到该药品的真实有效率未知, 从而依据观测样本计算得到的有效 率必然存在不确定性。为了正确的 决策需要度量观测数据(有效率) 波动的范围,即统计量的分布。
离散型的数学期望
设离散型随机变量 X 的分布律为:
P{ X = x k } = pk k = 1,2,...
如果级数
∑x p
k =1 k

k
是一个有限值,则

称该级数为 X 的数学期望,记作:
EX = ∑ xkpk
k =1
连续型的数学期望
设连续型随机变量 X 的概率密度 为f(x),则当积分
EX = ∫ x ⋅ f(x)dx
的一组样本,则按照样本观测值 的大小排序可定义顺序统计量:
பைடு நூலகம்
t X = (x (1) , x (2),L, x (n) )
正确理解统计量

13种常见的统计分布ppt课件

13种常见的统计分布ppt课件

属性
✓ 连续型分布 ✓ 用于描述以方向、位置、周期性(环形)时间、角度等为测度
单位的数字特征
应用
✓ 医学领域内一些现象是以方向或时间度量,具有周期性特点, 如某疾病在一年内各月份的发生数、胎儿在一昼夜间各时点 分娩的频度
✓ 有些数据本身就是以角度来表示:如脑电阴图的上升角,气 象环境的风向玫瑰图
✓ 这些数据不能用通常的均数、标准差描述
1 二项分布 Binomial Distribution
应用 条件
✓ 各观察单位只能具有相互对立的一种结果,如阳性或阴 性,生存或死亡等,属于两分类资料
✓ 已知发生某一结果(阳性)的概率为π,其对立结果的概 率为1-π,实际工作中要求π是从大量观察中获得比较稳 定的数值。
✓ n次试验在相同条件下进行,且各个观察单位的观察结果 相互独立,即每个观察单位的观察结果不会影响到其他观 察单位的结果。如要求疾病无传染性、无家族性等。
9 F分布 F Distribution
属性
✓ 连续型分布 ✓ 用于方差Γ分布 Γ Distribution or Gamma Distribution
属性
✓ 连续型分布 ✓ 正偏态分布,常用于正偏态分布的拟合
11 圆形分布 Circular Distribution
5 均匀分布 Uniform Distribution
属性
✓ 连续型分布 ✓ 数值计算的误差分析 ✓ 任意分布的随机数
理解
✓ 均匀分布在自然情况下极为罕见,而人工栽培的有一定株 行距的植物群落即是均匀分布
✓ 均匀,表示可能性相等的含义
6 正态分布 Normal Distribution
属性
✓ 连续型分布 ✓ 自然界、人类社会、心理和教育中大量现象均按正态形式分布,

常见统计分布及其特点

常见统计分布及其特点

附录一常见分布汇总一、二项分布二项分布Binomial Distribution,即重复n次的伯努利试验Bernoulli Experiment,用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是;二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np;通常当n≧10,p≦时,就可以用泊松公式近似得计算;2、特点——期望和方差均为λ;3、应用固定速率出现的事物;——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ或称密度随机且独立地出现时,那么这个事件在单位时间面积或体积内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数Fx=x-a/b-a,a≤x≤b则称随机变量X服从a,b上的均匀分布,记为X~Ua,b;四、指数分布Exponential Distribution1、概念2、特点——无记忆性1这种分布表现为均值越小,分布偏斜的越厉害;2无记忆性当s,t≥0时有PT>s+t|T>t=PT>s 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等;3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布说明了正态分布的广泛存在,是统计分析的基础中心极限定理:设从均值为μ、方差为σ^2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布;3、特点——在总体的随机抽样中广泛存在;4、应用——正态分布是假设检验以及极大似然估计法ML的理论基础定理一:设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n——总体方差常常未知,用t分布较多六、χ2卡方分布与方差有关chi-square distribution1、概念若n个相互独立的随机变量ξ、ξ、……、ξn ,均服从标准正态分布也称独立同分布于标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布chi-squaredistribution,其中参数n称为注意假设随机干扰项呈正态分布;因此,卡方分布可以和RSS残差平方和联系起来;用RSS/δ2,所得的变量就是标准正态分布,就服从卡方分布;2、卡方分布的特点1分布的为自由度 n,记为 E = n;这个容易证明2分布的为2倍的自由度2n,记为 D = 2n;3如果互相独立,则:独立可加减服从分布,自由度;服从分布,自由度为3、图形特点4、应用定理二,设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n1正态分布以及卡方分布是F检验的基础;大量的检验用到了F检验:F检验、三大检验;七、t学生分布用样本方差s来标准化——Student'st-distribution1、概念适用于δ2未知理解把样本标准正态化的U变换前提是方差已知,但总体方差是未知的,所以用样本方差来代替总体方差;根据中心极限定理,抽样服从方差为总体方差除以n 的正态分布;由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布u变换指把变量转换为标准正态分布思考为什么样本方差比总体方差要小因为一个是总体方差,一个是样本均值的方差;不同2、特点1与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线;定理三:设X1,X2,X3.;;Xn 是来自正态总体N μ,δ2的样本,则有样本均值X~N μ,δ2/n,S 为样本方差 )(μ1-n t ~n /S X 注意S 是样本方差;中心极限定理说的是样本均值的方差;八、F 分布F-distribution1、概念F 分布定义为:设X 、Y 为两个独立的随机变量,X 服从自由度为k1的卡方分布,Y 服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布2、特点1它是一种非对称分布;2它有两个自由度,即n1 -1和n2-1,相应的分布记为F n1 –1, n2-1, n1 –1通常称为分子自由度, n2-1通常称为分母自由度;3F 分布是一个以自由度和为参数的分布族,不同的自由度决定了F 分布的形状;4F 分布的性质:5残差平方和之比通常与F分布有关;九、逻辑分布logistic分类评定模型——最早应用最广的离散选择模型1、概念2、特点用作增长曲线并为二进制响应建模;在生物统计和经济领域使用;Logistic 分布由尺度和位置参数描述;Logistic 分布没有形状参数,也就是说其概率密度函数只有一个形状;下列图形显示了不同参数值对 Logistic 分布的效应;尺度参数的效应位置参数的效应Logistic 分布的形状与正态分布的形状相似,但 Logistic 分布的尾部更长;十、伽马分布1、概念——伽玛分布Gamma Distribution是统计学的一种连续概率函数;Gamma分布中的参数α称为形状参数shape parameter,β称为scale parameter;假设随机变量X为等到第α件事发生所需之等候时间, 密度函数为特征函数为伽马分布的可加性当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma数学表达式若随机变量X具有概率密度其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作Gα,β.九、extreme value distribution 极值分布十、DF分布与ADF分布——用于时间序列平稳性的单位根检验;八、pareto分布十、weibull分布。

概率统计 第二节 统计推断中常用的三个分布

概率统计 第二节  统计推断中常用的三个分布

1 n 1 n 2 2 2 2 2 E( S ) E X i nX n 1 E( X i ) nE( X ) , n 1 i 1 i 1

E( X ) D( X i ) (EX i ) 2 2 ,
2
1. 统计量的定义
设 X 1 , X 2 ,, X n 是来自总体 X 的一个样本, g( X 1 , X 2 ,, X n )是 X 1 , X 2 ,, X n 的函数, 若 g中 不含未知参数, 则称 g( X 1 , X 2 ,, X n ) 是一个统 计量.
设 x1 , x2 ,, xn 是相应于样本X 1 , X 2 ,, X n 的样本值, 则称 g( x1 , x2 ,, xn )是 g( X 1 , X 2 ,, X n ) 的观察值.
2
z 例如, 0.05 1.645 ,
2 0.05
2 0.05 (50) 67.505 . 精确,
1 (50) (1.645 99) 67.221 . 2
17
( x)
标准正态分布 的分位数:
查表,
z0.05 1.645,
z0.025 1.96 .

O
z
x
设 Z ~ N (0, 1) , 对于给定的 , 0 1 , 称满足条件
P{ ( n)} 2 2 的点 (n) 为 (n) 分布的 上侧分位数。
2 2
16
f ( x)
例如,

O

2 0.05
(25) 37.652 ,
(n)
2
x

2 0.025
(20) 34.170 .

统计学中的数学知识点总结

统计学中的数学知识点总结

统计学中的数学知识点总结1. 概率概率是统计学中非常重要的一个概念,它用来描述事件发生的可能性。

概率论是数学的一个分支,它主要研究随机事件的发生规律以及这些规律的数量程度。

概率的基本概念包括样本空间、事件、随机变量、概率分布等。

而在实际应用中,概率经常被用来描述事件的发生概率,比如在掷骰子的实验中,1到6出现的概率均为1/6。

在统计学中,概率还常常用来描述随机变量的分布,比如正态分布、泊松分布等。

这些分布函数的特性对于统计推断和回归分析等问题都有重要意义。

2. 统计推断统计推断是统计学的一个重要分支,它用来从样本数据中做出总体的推断。

统计推断的核心是利用样本数据来估计总体参数,并据此对总体做出推断。

统计推断的方法包括点估计、区间估计和假设检验。

点估计是用来估计总体参数的具体数值,比如平均值、方差等。

区间估计则是用来估计总体参数的区间范围,以反映估计的不确定性。

假设检验则是用来检验总体参数的假设,以确定总体参数是否符合某种分布或者是否满足某种假设。

在统计推断中,常用的分布包括正态分布、t分布、F分布和卡方分布等。

这些分布函数对于统计推断方法的选择和应用都有重要意义。

3. 回归分析回归分析是统计学的一个重要方法,它用来研究变量之间的关系。

回归分析主要包括线性回归、非线性回归、多元回归等方法,它们用来描述和预测变量之间的函数关系。

在回归分析中,常用的模型包括简单线性回归模型和多元线性回归模型。

简单线性回归模型主要用来描述一个因变量和一个自变量之间的线性关系,而多元线性回归模型则用来描述多个自变量和一个因变量之间的关系。

回归分析的核心是对模型的参数进行估计和检验,从而得到对变量之间关系的描述和预测。

4. 时间序列分析时间序列分析是统计学的一个重要领域,它用来研究时间序列数据的规律和特性。

时间序列数据是按时间顺序排列的一系列数据,比如股票价格、气温、指数等。

时间序列分析的方法包括时间序列建模、时间序列平稳性检验、时间序列预测等。

关于对统计推断中抽样分布的总结及判别

关于对统计推断中抽样分布的总结及判别

关于对统计推断中抽样分布的总结及判别统计推断是基于抽样数据对总体特征进行推断的过程。

在统计推断中,抽样分布是一个非常重要的概念,下面对抽样分布的总结及判别进行简要概述。

一、抽样分布的概念所谓抽样分布,实际上就是指在总体中随机抽取多个样本后,所得到的各个样本的某一统计量(如平均值、标准差等)的分布概率。

抽样分布的性质是在概率统计学中非常重要的内容,它是统计推断的基础。

二、常见抽样分布的判别常见的抽样分布有正态分布、t分布、卡方分布、F分布等。

通过样本数据计算得到的统计量如样本均值、样本标准差等,只有符合特定条件时才能使用对应的抽样分布进行推断。

下面简单介绍四种常见的抽样分布及其判别方法:1、正态分布正态分布是一种重要的连续概率分布,也称为高斯分布。

它的特点是均值与方差能够完全刻画,其概率密度函数有一个峰值,两侧相同。

当样本量较大时,样本均值的抽样分布可以近似地看作正态分布。

当我们对样本的均值进行推断时,需要考虑样本数据是否满足正态分布的特征,如果符合正态分布,则可以使用正态分布的取值表进行推断。

2、t分布t分布是在样本量较小,总体方差未知时,用样本标准差代替总体标准差来估计总体均值差异的概率分布。

与正态分布相比,t分布会更加散布在较大的取值区间上。

当样本量较小时,样本均值的抽样分布可近似看作t分布。

在进行样本均值推断前,我们需要根据样本数据来判断样本量和总体方差是否未知,如果是,则可以使用t分布进行推断。

3、卡方分布卡方分布是一种特殊的χ2概率分布。

它的随机变量为卡方变量(χ2变量),卡方变量是多个服从标准正态分布的随机变量的平方和。

在统计推断中,卡方分布常用于估计总体方差等。

在使用卡方分布进行推断前,需要判断样本数据是否符合某种分布规律(如正态分布),以及总体方差是否已知或未知。

若总体方差未知,且样本数据符合某种分布规律,则可使用卡方分布进行推断。

4、F分布F分布是在针对两个总体方差的假设检验时,用于检验两个总体方差是否具有显著差异的分布。

常用统计分布

常用统计分布


X5

X6
~
N (0,4), 则
X3
X4
X5 4

X6
~
N (0,1)
且 X1 X 2 与 X3 X 4 X5 X6 相互独立
2
4
所以( X1 X 2 )2 ( X 3 X 4 X 5 X 6 )2 ~ 2 (2)
2
4
则C1 1 2 ,C2 1 4 .
F0.05 (30,14) 2.31 . 附表5-2
F分布的上分位点具有如下性质 :
证明
F1
( n1 ,
n2 )

F
1 (n2 ,
. n1 )
因为F ~ F (n1, n2 ),
所以 1 P{F F1 (n1 , n2 )}

P
1 F

F1
1 ( n1 ,
则1 F
~
F (n2 , n1 ).
(2)
E(F ) n2 , n2 2
(n2 2),
演示
D(F
)

2n22(n1 n2 2) n1(n2 2)2(n2 4)
,
(n2 4)
(3) 设F ~ F (n1, n2 ),则 当n2 4时, 对 任 意x有
F E(F )
设 X 服从标准正态分布N (0,1), N (0,1) 的上
分位点 u 满足 P{ X u }
1
x2
e 2 dx
2π u
1 P{ X u } 1 (u )

(u ) 1 给定 ,由附表2可查得u的值.
u0.05 1.645,

5-2统计推断中常用的三个分布

5-2统计推断中常用的三个分布

满足条件
的点
称为
分布的上 分位点.
分布的上 分位点具有以下的性质:
返回 上页 下页 结束
例1 查表求下列概率表达式的临界值
(1) (2) (3) 解 (1)
(2) (3)
返回 上页 下页 结束
§5.2 统计推断中常用的三个分布
一. 分2 布 二. t 分布 三. F 分布
返回 上页 下页 结束
引言
取得总体 的样本
后,通常是借助
样本的统计量对未知的总体分布进行推断,为此
须进一步确定相应的统计量所服从的分布,除在
概率论中的所提到的常用分布外,本节还要介绍
几个在统计学中常用的统计分布:
分布
分布
返回 上页 下页 结束
当 充分大时, 分布近似于标准正态分布,
即有
lim t(x, n)
1
x2
e 2.
n
2
t 分布的上 分位点: 对于给定的正数
满足条件
的点
称为 分布的上 分位点.
由 t(x, n) 的对称性及定义有
返回 上页 下页 结束
三. F 分布
定义 设 独立,则称
且 与 相互
服从自由度为
相互独立, 均服从
返回 上页 下页 结束
2分布的称为
分布上的 分位点.
对不同的 与 分位点的值已经编制成
表供查用(参见附表3).
例如,查表得:
返回 上页 下页 结束
二.t 分布
定义 设
则称
且 与 相互独立,
服从自由度为 的t分布,记为
分布的概率密度:
的图形关于 轴对称, 且 越大峰值越高.
的 F分布,记为
分布的概率密度:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临界值 tα (n)
注:
t1−α (n) = −tα (n)
Excel : 课本P附表 8 − 3 139表 附表6 查P175附表
p[t (4) > λ ] = 0.99 ⇒ λ = ? λ = −3.7469
t1−α (n)
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
x
(1) µ
= µ = 3160
σ
x
=
σ
800 = = 113.14 n 50
P x〉3000 = 1 − P( x ≤ 3000)
= 1 − φ ( −1.41) = φ (1.41)
3000 − 3160 = 1 − F (3000) = 1 − φ 113.14
σ2
~χ
2
(n −1)
2 我们将服从的分布 χ2 (n −1) 称为自由度是(n-1)的 χ 称为自由度是 的 2 (卡方 分布 并记服从 χ 2 (卡方 的随机变量为 χ . 卡方)分布 卡方)的随机变量为 卡方 分布,并记服从 卡方
定义: 定义:
设随机变量 x1 , x 2 ,..., x n 相互独立 , 且都服从标准正态 分布N (0,1), 则称
E( χ 2 ) = n, D( χ 2 ) = 2n
.χ2—分布的密度函数 分布的密度函数 分布的密度函数f(y)曲线 曲线
分位点 : 设X ~ χ2(n),若对于α:0<α<1, α α , 存在χα (n) > 0 满足
2
P{χ ≥ χα (n)} = α , 或 ∫
2 2
2
+∞
2
为 χ 2 (n) 分布的上侧α分位数。 分布的上侧α分位数。 则称 χα (n)
2 χ 2 = x1 + x 2 + ... + x n 2 2
服从χ ( n)分布 , 并记为 χ ~ χ 2 (n)
2
2
表示相互独立的标准正态变量的个数)。 (其中n 称为自由度 表示相互独立的标准正态变量的个数)。 其中 称为自由度,表示相互独立的标准正态变量的个数
对于服从 χ 2 ( n)分布的 χ 2 , 其均值和方差分别为 :
三、 t 统计量与 t 分布
定理3.4 定理
设 x1 , x2 ,..., xn是来自正态总体 N ( µ , σ 2 )的样本, x 与 s 2 分别是样本均值与样本方差, 则
x −µ ~t(n-1) s/ n
我们将所服从的t(n-1)分布称为自由度是 分布称为自由度是(n-1)的t分 我们将所服从的 分布称为自由度是 的分 布或学生分布,并记服从 分布的随机变量为 布或学生分布 并记服从t分布的随机变量为 。 并记服从 分布的随机变量为T。
若总体 X 的均值 µ和方差 σ 2 有限 , 则当样本容量 n 充分大时 , 不管总体服从什么分布 , 其样本均值 x 近似服从均值是 µ、 方差为
σ2
n
的正态分布 , 即
1 n σ2 x = ∑ xi ~ N ( µ , ) n i =1 n
在实际实用时,当总体分布未知时 对大样本情 在实际实用时 当总体分布未知时,对大样本情 当总体分布未知时 就可用中心极限定理. 形(n≥30),就可用中心极限定理 就可用中心极限定理
t—分布 分布
1.构造 若X~N(0, 1), Y~χ2(n), X与Y独立,则 χ
X T= ~ t (n). Y /n
t(n)称为自由度为n的t—分布。
2.
t(n) 的概率密度曲线为 (n)
2.基本性质 2.基本性质: 基本性质 f(t)关于t=0 t=0(纵轴)对称。 (1) f(t) t=0 f(t)的极限为N(0,1) N(0, (2) f(t) N(0 1)的密度函数,即
( 3 ) P ( x > 5) = 1 − P ( x < 5) = 1 − F ( 5)
= 1 − φ ( 0)
5−5 = 1−φ( ) 1/ 10
= 0.5
阅读: 阅读:P50例3-1. 例 练习: 习题三: 练习:P63习题三:1. 习题三
定理3.2(中心极限定理 中心极限定理) 定理 中心极限定理
2 λ = χ 0.025 (21) 解(1)由分位数的定义可知, )由分位数的定义可知, 查表P173可得 : λ = 35.479
χ 2 (21) < λ = 0.025,即P χ 2 (21) ≥ λ = 0.975 (2) P
∴ 查表P173 ,可得λ = 10.283
1 E ( x) = ∑ E ( xi ) = µ n i =1
n
∑ D( x ) =
i =1 i
σ2
n
标准化后,定理 样本均值 x 标准化后 定理 x−µ Z= ~ N (0, 1) 的结果可转化为: 的结果可转化为 σ/ n
练习: 自测思考题三: 练习:P63自测思考题三: 自测思考题三 1(第一、二空格), ,5 (第一、二空格),4, ),
二、统计量
定义 : 我们将样本x1 , x2 , ..., xn的不含任何未知参数 的函数ϕ ( x1 , x2 , ..., xn )称为统计量.
注意:统计量完全依赖于样本, 注意:统计量完全依赖于样本,不应含有分布的任何参 由于样本是随机变量,故统计量也是随机变量。 数。由于样本是随机变量,故统计量也是随机变量 常用的统计量主要有: 常用的统计量主要有: 1 n 样本平均值 : x = ∑ x i n i =1 1 n 1 n 2 2 2 2 样本方差:S = ∑ (x i − x) = n − 1 ∑ x i − n(x) n − 1 i =1 i =1
(1)∑ ( xi − σ ) ;
i =1
n
n
2 2 0
(2)∑ ( xi − µ );
i =1
n
(3)∑ ( xi − x ) 2 ;
i =1
1 (4) µ + ( x1 + x2 + x3 ) 3
2
§3.2 统计推断的常用分布
抽样分布:是指统计量作为随机变量所服从的概率分布。 抽样分布:是指统计量作为随机变量所服从的概率分布。 我们主要学习常用统计量样本均值与样本方差 我们主要学习常用统计量样本均值与 样本均值 相关的常用抽样分布。而在大多数情形, 相关的常用抽样分布。而在大多数情形,统计量服 从正态分布或以正态分布为渐近分布,所以正态分 从正态分布或以正态分布为渐近分布,所以正态分 布是最常用抽样分布。 布是最常用抽样分布。后面我们还要学习同样起着 分布、 分布 分布、 分布 分布。 重要作用的 χ 2 分布、t分布、F分布。
10药 2班 第5周 星期二 3,4节 10药学英语1&2班
第三章
一、统计量
参数估计
二、统计推断的常用分布 三、参数的点估计 四、参数的区间估计
§3.1
一、总体与样本
统计量
总体:对某一问题的研究对象全体称为总体 总体。 总体:对某一问题的研究对象全体称为总体 个体:组成总体的每个观察单元,称为个体 个体:组成总体的每个观察单元,称为个体。 总体的参数: 总体的参数:总体的数字特征即总体指标。 总体可以是具体事物的集合, 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合, 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体 总体可以包含有限个个体,也可以包含无限个个体。 有限个个体 无限个 总体中的个体,应当有共同的可观察的特征。 总体中的个体,应当有共同的可观察的特征。 该特征与研究目的有关。
lim f ( t ) = ϕ( t ) = 1 e n→ ∞ 2π
−t 2
2
, −∞ < x < ∞
3.分位点 3.分位点 设T~t(n) T t(n),若对 α:0<α<1,存在tα(n)>0 :0<α<1, t (n)>0, 满足P{T≥tα(n)}=α, P{T≥ (n)}=α P{T 则称tα(n) t (n)为 t(n)的上侧分位点 t(n)
例如: 总体 一批产品 一批灯泡 个体 每件产品 每个灯泡 特征 等级 寿命
一年的日平均气温
每天日平均气温 度数 坐标 号码
数轴上某一线段 线段中每一点 一批彩票 每张彩票
当总体数量很大时,只能从中抽取部分个体进行研究。 当总体数量很大时,只能从中抽取部分个体进行研究。 从总体中取出的若干个体,称为样本 从总体中取出的若干个体,称为样本。 样本中所含个体的个数,称为样本容量 样本中所含个体的个数,称为样本容量。 例如:在研究广州市民的年收入时 随机抽取广州 例如 在研究广州市民的年收入时,随机抽取广州 在研究广州市民的年收入时 市民100名来进行调查 这100名广州市民的年收 名来进行调查,这 市民 名来进行调查 名广州市民的年收 入就构成了一个样本,而样本容量就是 入就构成了一个样本 而样本容量就是100. 而样本容量就是 简单随机抽样:总体中每个个体被抽取的可能性 简单随机抽样 总体中每个个体被抽取的可能性 是均等的,而且每抽取一个个体时总体分布不变 是均等的 而且每抽取一个个体时总体分布不变. 而且每抽取一个个体时总体分布不变 在随机抽样中,样本 应具有: 在随机抽样中 样本 x1 , x 2 , x 3 ... x n 应具有 (1)独立性: x1 , x 2 , x 3 ... x n 相互独立 独立性 相互独立. (2)代表性 代表性: x1 , x 2 , x 3 ... x n 与总体 相同的概率分布。 与总体X相同的概率分布 代表性
当泛指一次抽样结果时, 样本x1 , x2 ,..., xn是n个随机 变量, 则样本均值x 与样本方差s 2等也都是随机变量.
相关文档
最新文档