数理统计第六章
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
样本方差的性质
1 Xi X ( 1) n i 1
( 2) 记
n
2
2 1 n 2 Xi X n i 1
S
2 n 1
1 Xi X n 1 i 1
n
2
则
S
2 n 1
n 2 S n 1
(3) 若总体X的方差存在,则
n 1 E S DX n
2
显然 χ 分布的概率密度图形随自由度的不同而
有所改变.
χ 分布的性质:
性质1. 设 χ ~ χ ( n), 则 E( χ ) n, D( χ ) 2n
2 2 2 2 2 χ 性质2. 设 χ ~ χ (n1 ), χ ~ χ (n2 ), 且 1 与 2 1 2 2 2 2
2
χ 相互独立,则
体.
二、样本
简单随机样本
1)抽样和样本
为推断总体分布及各种特征,按一定规则从总 体中抽取若干个体进行观察试验,以获得有关总体 的信息,这一抽取过程称为 “抽样”,所抽取的部 分个体称为样本. 样本中所包含的个体数目称为
样本容量.
样本的抽取是随机的,每个个体是一个随机 变量.容量为n的样本可以看作n维随机变量,用 X1,X2,…,Xn表示. 而一旦取定一组样本,得到的是n个具体的 数 (x1,x2,…,xn),称其为样本的一个观察值,简 称样本值 .
{X≤x}在n次观察中出现的次数为vn(x),于是事
件{X≤x}发生的频率为:
vn ( x ) Fn ( x ) n
x
称 Fn(x) 为样本分布函数或经验分布函数.
定理(格列汶科)当n→∞时,经验分布函数 Fn(x) 依概率1关于x一致收敛与总体分布函数,即
P{lim sup | Fn ( x ) F ( x ) | 0} 1
f ( x ; n1 , n2 )
n1 20
n2
n2 25
n2 10
o
x
二、上α分位点
定义:设随机变量X的概率密度为 f(x),对于
3、F分布
2 2 X ~ χ ( n ), Y ~ χ ( n2 ), X 与 Y 相互独立, 定义: 设 1
则称统计量
X n1 F Y n2
服从自由度为n1及 n2 的F分布,n1称为第一自由度, n2称为第二自由度,记作 F~F(n1,n2) .
1 Y n2 ~F(n2,n1) 由定义可见, F X n1
F u
n
(2)最小项统计量 X 的分布函数记为 F1 v ,则
* 1
F1 v P X v 1 P X v
* 1 * 1
1 P X1 v, X 2 v,, X n v
1 P X v
例如: X ~ N(a, σ), a, σ 是未知参数,
X 1 , X 2 ,, X n 是X 的一个样本, 则
2 X i, i=1 n
5X3 4X5 3
1 n 2 X - a 不是统计量. 2 i σ i=1 1 n 2 X - a 也是统计量. 2 i σ i=1
1 k Ak X i n i 1 n 1 k Bk ( X i X ) n i 1
k=1,2,…
n
它们的观察值分别为:
1 n x xi n i 1 1 k ak xi n i 1
由大数定律可知:
n
1 2 s ( xi x) n i 1
2
n
1 bk ( x i x ) k n i 1
总体:
所研究的对象的某个(或某些)数量指标的全体称为 总体,它是一个随机变量(或多维随机变量),记为X . X 的分布函数和数字特征称为总体分布函数 和总体数字特征.
例如:研究某批灯泡的寿命时,总体X是这批 灯泡的寿命,而其中每个灯泡的寿命就是个体。
总体
个体
每个 灯泡的寿命
又如:研究某批国产轿车每公里的耗油量时,总
2)简单随机样本
由于抽样的目的是为了对总体进行统计推断,
为了使抽取的样本能很好地反映总体的信息,必须
考虑抽样方法.最常用的一种抽样方法叫作“简单
随机抽样”,它要求抽取的样本满足下面两点:
1. 样本X1,X2,…,Xn中每一个Xi与所考察的总体X
有相同的分布. 2.X1,X2,…,Xn相互独立.
由简单随机抽样得到的样本称为简单随机样 本,它可以用与总体独立同分布的n个相互独立 的随机变量X1,X2,…,Xn表示. 简单随机样本是应用中最常见的情形,今后,
2 2 χ1 χ2 ~ χ 2 (n1 n2 )
2 这个性质称为 分布的可加性.
2 2
2、t 分布
定义: 设X~N( 0 , 1 ) , Y~ χ (n) ,且 X 与 Y 相互 X 独立,则称变量 t Y n
2
所服从的分布为自由度为 n 的 t 分布.记为t~t (n).
t 的概率密度为:
记
样本的协方差 样本的相关系数
1 n S12 X i X Yi Y n i 1
S12 R S1 S 2
第二节
样本的数字特征及其分布
一、经验分布与格列汶科定理
二、样本均值和方差的性质
三、极值的分布
一、经验分布函数
设X1,X2,…,Xn为取自总体X的样本,
x1,x2,…,xn为其观察值.对于每个固定的x,设事件
三、统计量
由样本值去推断总体情况,需要对样本
值进行“加工”,这就要构造一些样本的函
数,它把样本中所含的(某一方面)信息集
中起来.
定义 如果样本X1,X2,…,Xn的函数g(X1,X2,…,Xn)
中不含有任何的未知参数,则称函数g(X1,X2,…,Xn)
为统计量. 若x1,x2,…,xn是相应的样本值,则称函数值 g(x1,x2,…,xn)为统计量g(X1,X2,…,Xn)的一个 观察值.
组成总体的每个元素称为个体.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标
在总体中的分布情况.
量指标的全体就是总体. 某批 灯泡的寿命
这时,每个个体具有的数
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
国产轿车每公里耗油量 的全体就是总体
x 1 t
e dt 称为函数,具有性质
( x 1) x( x), (1) 1, (1/ 2) (n 1) n ! (n N )
2分布的概率密度图形如下:
f(y)
0.5 0.4 0.3 0.2 0.1
n=1
n=4 n=10 x
0 1 3 5 7 9 11 13 15 17
一、统计学中的三大分布
二、上α 分位点
三、抽样分布定理
一、统计学中三大分布
抽样分布 统计量是样本的函数,而样本是随机 变量,故统计量也是随机变量,因而就有 一定的分布,它的分布称为“抽样分 布” . 下面介绍三个来自正态总体的抽样分布.
1、 χ
2
分布
定义: 设 X 1 , X 2 , , X n相互独立,都服从标准正态分布
体X是这批轿车每公里的耗油量,而其中每辆轿车
的耗油量就是个体。
国产轿车每公里 的耗油量
国产轿车每公里耗油 量的全体就是总体
类似地,在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重,我们用X和Y分
别表示身高和体重,那么此总体就可用二维随机变
量(X,Y) 来表示,而每个学生的身高和体重就是个
n
1 n k Ak X i 依概率收敛于 E( X k ) n i 1
例1. 从一批相同的电子元件中随机地抽出8个,测得使用
寿命(单位:小时)分别为:2300,2430,2580,2400,
2280,1960,2460,2000,试计算样本均值、样本方差及
样本二阶矩.
n 1 解: x x i 2301 .25 (小时) n i 1
3)总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、
确定的值. 如我们从某班大学生中抽取10人测量
身高,得到10个数,它们是样本取到的值而不是
样本. 我们只能观察到随机变量取的值而见不到
随机变量.
统计是从手中已有的资料 — 样本值,去推断 总体的情况 — 总体分布F(x)的性质. 样本是联系二者的桥梁 总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
是统计量,而 若 a , 2 已知, 则
几个常用的统计量
样本均值
它反映了总体方差 的信息
它反映了总体均值 的信息
1 X Xi n i 1
n 1 2 2 S (Xi X ) n i 1
n
样本方差
它反映了总体 k 阶矩 的信息
样本k阶原点矩 样本k阶中心矩
它反映了总体 k 阶 中心矩的信息
n 1 s 2 = (xi - xຫໍສະໝຸດ Baidu)2 42110.9375(小时2) n i=1
1 n 2 2 a 2 x i 5337862 .(小时 5 ) n i 1
顺序统计量 设X1, X2 ,…, Xn为总体X的样本,由样本 可建立n个函数:
X X
* k
* k
* k
X1, X 2 X n , k 1,2n
当说到“X1,X2,…,Xn是取自某总体的样本”时,
若不特别说明,就指简单随机样本.
设X1,X2,…,Xn 是总体X的一个简单随机样本,
1)若X为离散型总体,其分布律是p(x),则X1,X2,…,Xn的
联合分布律为 p(x1) p (x2) … p (xn) 2)若X为连续型总体,其概率密度是f(x),则X1,X2,…,Xn 的联合分布律为 f (x1) f (x2) … f (xn)
* , k
其中 X 为这样的统计量,它的观察值为 x
* k
x 为样本X1, X2 ,…, Xn的观察值x1, x2, …xn中
* * * x x x 由小至大排列(即 1 k n )后的
第k位数值,则称 X , X ,, X
* 1
* 2
* n 为顺序统计量
协方差与相关系数
第一节
数 理 统 计 的 分 类
基本概念
描述统计学
对随机现象进行观测、试验,以取得 有代表性的观测值
推断统计学
对已取得的观测值进行整理、分析, 作出推断、决策,从而找出所研究的对象 的规律性
一、总体和个体
二、样本 二、统计量 简单随机样本
一、总体和个体
一个统计问题总有它明确的研究对象. 研究对象的全体称为总体(母体),
N(0,1), 则称随机变量:
χ X1 X 2 X n
2
2
2
2
2
所服从的分布为自由度为 n 的 χ 分布,记为
χ ~ χ (n)
2
2
χ 分布的概率密度为
n y 1 1 n2 y2 e 2 f ( y ) 2 Γ( n 2) 0
2
y0 其它
其中, ( x) 0 t
n
1 1 F v
n
* 特别地,若X 有密度函数f(x) ,则X n 和 X 1*
的密度函数分别为
f n u nf u F u
n 1
f1 v nf v 1 F v
n 1
第三节
抽样分布
2
E S
2 n 1
DX
三、极值的分布
设总体X的分布函数为F(x), X1 , X 2 ,, X n为其样本
* X (1)最大项统计量 n 的分布函数记为 Fn u ,则
* Fn u P X n u
P X1 u, X 2 u,, X n u
t2 h( t ) (1 ) n Γ ( n 2 ) nπ Γ [( n 1 ) 2 ]
n 1 2
t(x;n)
n=10 n=4 n=1
o
x
t分布的概率密度函数关于t=0对称,且
当n充分大时(n≥30),其图形与标准正态分布的
概率密度函数的图形非常接近.但对于较小的n,
t 分布与N (0,1)分布相差很大.
n x
定理表明:当样本容量n充分大时,经验分布函数
Fn(x) 几乎一定会充分趋近总体分布函数F(x),这是
用样本来推断总体的理论依据.
二、样本均值和方差的性质
1 样本均值的性质
( 1) ( 2)
X
n i 1
i
X 0
若总体X的均值和方差存在,且
则
1 2 E X a, D X n