数理统计第六章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
样本方差的性质
1 Xi X ( 1) n i 1
( 2) 记
n


2
2 1 n 2 Xi X n i 1
S
2 n 1
1 Xi X n 1 i 1
n


2

S
2 n 1
n 2 S n 1
(3) 若总体X的方差存在,则
n 1 E S DX n
2
显然 χ 分布的概率密度图形随自由度的不同而
有所改变.
χ 分布的性质:
性质1. 设 χ ~ χ ( n), 则 E( χ ) n, D( χ ) 2n
2 2 2 2 2 χ 性质2. 设 χ ~ χ (n1 ), χ ~ χ (n2 ), 且 1 与 2 1 2 2 2 2
2
χ 相互独立,则
体.
二、样本
简单随机样本
1)抽样和样本
为推断总体分布及各种特征,按一定规则从总 体中抽取若干个体进行观察试验,以获得有关总体 的信息,这一抽取过程称为 “抽样”,所抽取的部 分个体称为样本. 样本中所包含的个体数目称为
样本容量.
样本的抽取是随机的,每个个体是一个随机 变量.容量为n的样本可以看作n维随机变量,用 X1,X2,…,Xn表示. 而一旦取定一组样本,得到的是n个具体的 数 (x1,x2,…,xn),称其为样本的一个观察值,简 称样本值 .
{X≤x}在n次观察中出现的次数为vn(x),于是事
件{X≤x}发生的频率为:
vn ( x ) Fn ( x ) n
x
称 Fn(x) 为样本分布函数或经验分布函数.
定理(格列汶科)当n→∞时,经验分布函数 Fn(x) 依概率1关于x一致收敛与总体分布函数,即
P{lim sup | Fn ( x ) F ( x ) | 0} 1
f ( x ; n1 , n2 )
n1 20
n2
n2 25
n2 10
o
x
二、上α分位点
定义:设随机变量X的概率密度为 f(x),对于
3、F分布
2 2 X ~ χ ( n ), Y ~ χ ( n2 ), X 与 Y 相互独立, 定义: 设 1
则称统计量
X n1 F Y n2
服从自由度为n1及 n2 的F分布,n1称为第一自由度, n2称为第二自由度,记作 F~F(n1,n2) .
1 Y n2 ~F(n2,n1) 由定义可见, F X n1
F u
n
(2)最小项统计量 X 的分布函数记为 F1 v ,则
* 1
F1 v P X v 1 P X v
* 1 * 1
1 P X1 v, X 2 v,, X n v
1 P X v
例如: X ~ N(a, σ), a, σ 是未知参数,
X 1 , X 2 ,, X n 是X 的一个样本, 则
2 X i, i=1 n
5X3 4X5 3
1 n 2 X - a 不是统计量. 2 i σ i=1 1 n 2 X - a 也是统计量. 2 i σ i=1
1 k Ak X i n i 1 n 1 k Bk ( X i X ) n i 1
k=1,2,…
n
它们的观察值分别为:
1 n x xi n i 1 1 k ak xi n i 1
由大数定律可知:
n
1 2 s ( xi x) n i 1
2
n
1 bk ( x i x ) k n i 1
总体:
所研究的对象的某个(或某些)数量指标的全体称为 总体,它是一个随机变量(或多维随机变量),记为X . X 的分布函数和数字特征称为总体分布函数 和总体数字特征.
例如:研究某批灯泡的寿命时,总体X是这批 灯泡的寿命,而其中每个灯泡的寿命就是个体。
总体
个体
每个 灯泡的寿命
又如:研究某批国产轿车每公里的耗油量时,总
2)简单随机样本
由于抽样的目的是为了对总体进行统计推断,
为了使抽取的样本能很好地反映总体的信息,必须
考虑抽样方法.最常用的一种抽样方法叫作“简单
随机抽样”,它要求抽取的样本满足下面两点:
1. 样本X1,X2,…,Xn中每一个Xi与所考察的总体X
有相同的分布. 2.X1,X2,…,Xn相互独立.
由简单随机抽样得到的样本称为简单随机样 本,它可以用与总体独立同分布的n个相互独立 的随机变量X1,X2,…,Xn表示. 简单随机样本是应用中最常见的情形,今后,
2 2 χ1 χ2 ~ χ 2 (n1 n2 )
2 这个性质称为 分布的可加性.
2 2
2、t 分布
定义: 设X~N( 0 , 1 ) , Y~ χ (n) ,且 X 与 Y 相互 X 独立,则称变量 t Y n
2
所服从的分布为自由度为 n 的 t 分布.记为t~t (n).
t 的概率密度为:

样本的协方差 样本的相关系数
1 n S12 X i X Yi Y n i 1



S12 R S1 S 2
第二节
样本的数字特征及其分布
一、经验分布与格列汶科定理
二、样本均值和方差的性质
三、极值的分布
一、经验分布函数
设X1,X2,…,Xn为取自总体X的样本,
x1,x2,…,xn为其观察值.对于每个固定的x,设事件
三、统计量
由样本值去推断总体情况,需要对样本
值进行“加工”,这就要构造一些样本的函
数,它把样本中所含的(某一方面)信息集
中起来.
定义 如果样本X1,X2,…,Xn的函数g(X1,X2,…,Xn)
中不含有任何的未知参数,则称函数g(X1,X2,…,Xn)
为统计量. 若x1,x2,…,xn是相应的样本值,则称函数值 g(x1,x2,…,xn)为统计量g(X1,X2,…,Xn)的一个 观察值.
组成总体的每个元素称为个体.
总体

研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标
在总体中的分布情况.
量指标的全体就是总体. 某批 灯泡的寿命
这时,每个个体具有的数
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
国产轿车每公里耗油量 的全体就是总体
x 1 t
e dt 称为函数,具有性质
( x 1) x( x), (1) 1, (1/ 2) (n 1) n ! (n N )
2分布的概率密度图形如下:
f(y)
0.5 0.4 0.3 0.2 0.1
n=1
n=4 n=10 x
0 1 3 5 7 9 11 13 15 17
一、统计学中的三大分布
二、上α 分位点
三、抽样分布定理
一、统计学中三大分布
抽样分布 统计量是样本的函数,而样本是随机 变量,故统计量也是随机变量,因而就有 一定的分布,它的分布称为“抽样分 布” . 下面介绍三个来自正态总体的抽样分布.
1、 χ
2
分布
定义: 设 X 1 , X 2 , , X n相互独立,都服从标准正态分布
体X是这批轿车每公里的耗油量,而其中每辆轿车
的耗油量就是个体。
国产轿车每公里 的耗油量
国产轿车每公里耗油 量的全体就是总体
类似地,在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重,我们用X和Y分
别表示身高和体重,那么此总体就可用二维随机变
量(X,Y) 来表示,而每个学生的身高和体重就是个
n
1 n k Ak X i 依概率收敛于 E( X k ) n i 1
例1. 从一批相同的电子元件中随机地抽出8个,测得使用
寿命(单位:小时)分别为:2300,2430,2580,2400,
2280,1960,2460,2000,试计算样本均值、样本方差及
样本二阶矩.
n 1 解: x x i 2301 .25 (小时) n i 1
3)总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、
确定的值. 如我们从某班大学生中抽取10人测量
身高,得到10个数,它们是样本取到的值而不是
样本. 我们只能观察到随机变量取的值而见不到
随机变量.
统计是从手中已有的资料 — 样本值,去推断 总体的情况 — 总体分布F(x)的性质. 样本是联系二者的桥梁 总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
是统计量,而 若 a , 2 已知, 则
几个常用的统计量
样本均值
它反映了总体方差 的信息
它反映了总体均值 的信息
1 X Xi n i 1
n 1 2 2 S (Xi X ) n i 1
n
样本方差
它反映了总体 k 阶矩 的信息
样本k阶原点矩 样本k阶中心矩
它反映了总体 k 阶 中心矩的信息
n 1 s 2 = (xi - xຫໍສະໝຸດ Baidu)2 42110.9375(小时2) n i=1
1 n 2 2 a 2 x i 5337862 .(小时 5 ) n i 1
顺序统计量 设X1, X2 ,…, Xn为总体X的样本,由样本 可建立n个函数:
X X
* k
* k
* k
X1, X 2 X n , k 1,2n
当说到“X1,X2,…,Xn是取自某总体的样本”时,
若不特别说明,就指简单随机样本.
设X1,X2,…,Xn 是总体X的一个简单随机样本,
1)若X为离散型总体,其分布律是p(x),则X1,X2,…,Xn的
联合分布律为 p(x1) p (x2) … p (xn) 2)若X为连续型总体,其概率密度是f(x),则X1,X2,…,Xn 的联合分布律为 f (x1) f (x2) … f (xn)
* , k
其中 X 为这样的统计量,它的观察值为 x
* k
x 为样本X1, X2 ,…, Xn的观察值x1, x2, …xn中
* * * x x x 由小至大排列(即 1 k n )后的
第k位数值,则称 X , X ,, X
* 1
* 2
* n 为顺序统计量
协方差与相关系数
第一节
数 理 统 计 的 分 类
基本概念
描述统计学
对随机现象进行观测、试验,以取得 有代表性的观测值
推断统计学
对已取得的观测值进行整理、分析, 作出推断、决策,从而找出所研究的对象 的规律性
一、总体和个体
二、样本 二、统计量 简单随机样本
一、总体和个体
一个统计问题总有它明确的研究对象. 研究对象的全体称为总体(母体),
N(0,1), 则称随机变量:
χ X1 X 2 X n
2
2
2
2
2
所服从的分布为自由度为 n 的 χ 分布,记为
χ ~ χ (n)
2
2
χ 分布的概率密度为
n y 1 1 n2 y2 e 2 f ( y ) 2 Γ( n 2) 0
2
y0 其它
其中, ( x) 0 t
n
1 1 F v
n
* 特别地,若X 有密度函数f(x) ,则X n 和 X 1*
的密度函数分别为
f n u nf u F u
n 1
f1 v nf v 1 F v
n 1
第三节
抽样分布
2
E S
2 n 1
DX
三、极值的分布
设总体X的分布函数为F(x), X1 , X 2 ,, X n为其样本
* X (1)最大项统计量 n 的分布函数记为 Fn u ,则
* Fn u P X n u
P X1 u, X 2 u,, X n u
t2 h( t ) (1 ) n Γ ( n 2 ) nπ Γ [( n 1 ) 2 ]
n 1 2
t(x;n)
n=10 n=4 n=1
o
x
t分布的概率密度函数关于t=0对称,且
当n充分大时(n≥30),其图形与标准正态分布的
概率密度函数的图形非常接近.但对于较小的n,
t 分布与N (0,1)分布相差很大.
n x
定理表明:当样本容量n充分大时,经验分布函数
Fn(x) 几乎一定会充分趋近总体分布函数F(x),这是
用样本来推断总体的理论依据.
二、样本均值和方差的性质
1 样本均值的性质
( 1) ( 2)
X
n i 1
i
X 0

若总体X的均值和方差存在,且

1 2 E X a, D X n
相关文档
最新文档