第六章样本及抽样分布

合集下载

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

统计学第6章统计量及其抽样分布

统计学第6章统计量及其抽样分布

整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布

X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

概率论6-1,2,3

概率论6-1,2,3

例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

《概率论与数理统计》第六章

《概率论与数理统计》第六章
所以,X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .

第六章样本及抽样分布

第六章样本及抽样分布

n
(
Xi
)2
,
i 1
max{ X i }
1i n
为什么要求统计量不含任何未知参数
试验前 g(X1, X2 ,是, 随Xn机) 变量 试验后 g(X1, X2 ,是, 具Xn体) 的数值
与均值和方差 有什么不同?
X
1
n
n
i 1
Xi
为什么不是
1 n
(下章说明)
S2
1
n1
n
(Xi
i 1
X
)2
S
S2
6, 故Q0.75
Q3
1 2
(123
132)
127.5
Min 102, Max 150,作出箱线图如图所示
102 113.5 120
120 150
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
箱线图适合比较两个或两个以上数据集的性质
一 直方图
为了研究总体分布的性质,人们通过实验得到许 多观测值,一般来说这些数据实杂乱无章的,为了利 用它们进行统计分析,将这些数据加以整理,还借助 于表格或图形对它们加以描述。
例1:下面列出了84个伊特拉斯坎(Etruscan)人男子的 头颅的最大宽度(mm),现在来画这些数据的“频率直 方图”
1 2 3 4 5 6 7 8 9 10 11
76 90 97 71 70 93 86 83 78 85 81 65 95 51 74 78 63 91 82 75 71 55 93 81 76 88 66 79 83 92 78 86 78 74 87 85 69 90 80 77 84 91 74 70 68 75 70 84 73 60 76 81 88 68 75 70 73 92 65 78 87 90 70 66 79 68 55 91 68 73 84 81 70 69 94 62 71 85 78 81 95 70 67 82 72 80 81 77

概率论第六章样本及抽样分布

概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12

2 1

2 (n2 1) S2

2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2

2
~ (n 1)
2
X n1 X n
故 Y

(n 1) S 2
n n 1 ~ t (n 1) /(n 1)

2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1

管理统计学第06章 抽样与抽样分布

管理统计学第06章 抽样与抽样分布

抽样的基础概念
样本(sample)从总体中抽取的一部分元素的集合,构成样本的元素数目称为
样本容量,用n表示。
=<30
小样本
>30
大样本
抽样的基础概念
例:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估 计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所有容量为n的样本的均值X也服从 正态分布,X 的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
σ2 =10
n=2 σ2 =5
n =4 σ2 =2.5
= 50
X
总体分布
x 50
X
抽样分布
中心极限定理
中心极限定理(central limit theorem)设从均值为,方差为 2的一个任意总体中
均值和方差
N
Xi
i1 2.5
Nቤተ መጻሕፍቲ ባይዱ
N
(Xi )2
2 i1
1.25
N
.3
.2
.1 0
1
总体分布
2
3
4
样本均值的分布
例:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样 本。所有样本的结果如下表
所有可能的n = 2 的样本(共16个)
第二个观察值
中心极限定理
样本均值的分布趋于正态分布的过程
正态分布 总体分布
样本均值分布
(n=2)
样本均值分布
(n=10)
样本均值分布
(n=30)
指数分布
均匀分布

样本及抽样分布范文

样本及抽样分布范文

样本及抽样分布范文样本是从总体中抽取的一部分个体或观测值。

样本是对总体的一种估计,通过对样本进行分析和统计推断,可以得出关于总体的结论。

抽样是从总体中选择样本的过程。

抽样方法应该是随机的,以避免选择偏见和结果的错误推断。

抽样方法有很多种,常用的有简单随机抽样、系统抽样、分层抽样、群组抽样等。

抽样分布是样本统计量的分布。

当我们从总体中抽取不同的样本并计算出样本统计量时,这些统计量构成了抽样分布。

常见的样本统计量有样本均值、样本方差、样本比例等。

在统计推断中,我们通常使用样本统计量来估计总体参数。

样本统计量的抽样分布是用来描述这些统计量的变异情况的。

抽样分布的性质决定了我们对总体参数的估计的置信度。

中心极限定理是关于抽样分布的重要定理之一、中心极限定理指出,当样本容量足够大时,无论总体的形态如何,样本均值的抽样分布都近似服从正态分布。

这意味着当我们拥有一个具有较大样本容量的随机样本时,我们可以使用正态分布的性质来进行统计推断。

在使用抽样分布进行统计推断时,我们通常考虑置信区间和假设检验两个方面。

置信区间是对总体参数估计的一种方法。

通过计算样本统计量的抽样分布,我们可以构造一个区间,这个区间包含了总体参数的真实值的估计范围。

置信区间的计算通常使用样本统计量、抽样分布的分位数和置信水平来确定。

假设检验是用来检验总体参数的一些特定假设是否成立的方法。

在假设检验中,我们首先建立原假设和备择假设,然后根据样本统计量的抽样分布来计算一个检验统计量,并以此来判断原假设的可信性。

假设检验通常有三种结论:接受原假设、拒绝原假设或无法做出结论。

总之,样本及抽样分布是统计学中非常重要的概念。

通过对样本进行抽样分布的分析和推断,我们可以对总体的特征和参数进行估计,并进行统计推断。

中心极限定理、置信区间和假设检验是样本及抽样分布的重要理论和方法,为我们的研究和决策提供了有力的依据。

样本均值的抽样分布

样本均值的抽样分布
应用统计
第六章:抽样与抽样分布
第 6 章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布
6.1 统计量
6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量 6.1.4 充分统计量
1.25
N
样本均值的抽样分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值 1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
P(x) 0.3
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
总体分布
.3
.2
.1 0
1
234
均值和方差
N
xi
i1 2.5
N
N
(xi )2
2 i1
– 样本均值、样本比例、样本方差等都是统 计量
2. 统计量是样本的一个函数 3. 统计量是统计推断的基础
常用统计量
• 样本统计量
– 样本平均值 X
Xi
n
– 样本方差
S2 1 n n 1 i1

第6章-样本及抽样分布

第6章-样本及抽样分布

X
k i
样本 k 阶中心矩
Bk
1 n
n i 1
(Xi
X )k,
§2 抽样分布
统计量旳分布称为抽样分布。数理统计中 常用到如下三个分布:
2分布、 t 分布和F分布。
一、 2分布
iid
n
1. 构造 设 X1,, X n ~ N (0,1), 则 2
X
2 i
~
2 (n).
i 1
称为自由度为n的 2 分布.
h(
y)
(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1
0,
n2
n1 n2
) y n1 / 2
n1 1 2
,
y)(n1 n2 ) / 2
y0
y0
2. F分布旳分位点
对于:0<<1,
若存在F(n1, n2)>0 ,满足
P{FF(n1, n2)}=,
则称F(n1, n2)为
F(n1, n2)旳上侧分
位点;
P447附表5
F (n1, n2 )
注:
F1
(n1, n2 )
F
1 (n2 , n1)
证明:
设F~F(n1,n2), 则
1 F
~
F (n2 , n1)
P{F F1 (n1, n2 )} 1
P{ 1 1 } 1
F F1 (n1, n2 )
P{ 1 1 }
F F1 (n1, n2 )
4.性质:
(1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ),X,Y 独立,则X + Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则

概率论与数理统计6.第六章:样本及抽样分布

概率论与数理统计6.第六章:样本及抽样分布

),
,
,
,
是来
Z=
(

证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X t= Y /n
服从自由度为n的t分布 记为 t ~ t(n). 分布.记为 服从自由度为 的 分布 T的密度函数为: 的密度函数为: 的密度函数为
x Γ[( n + 1) 2] f ( x , n) = (1 + ) n Γ ( n 2 ) nπ
2

n+1 2
t分布的密度函数关于 分布的密度函数关于x=0对称,且 对称, 分布的密度函数关于 对称 1 − x2 2 Lim f ( x , n) = e n→ ∞ 2π 充分大时, 当n充分大时,其图形类似于标准正态分布密度 充分大时 函数的图形. 函数的图形. 充分大时, 分布近似N 分布. 当n充分大时,t 分布近似 (0,1)分布 但 充分大时 分布 对于较小的n, 分布与 分布与N 分布相差很大. 对于较小的 ,t分布与 (0,1)分布相差很大 分布相差很大
对一切实数x, 当n → ∞时Fn ( x )以概率1 F 一致收敛与分布函数 ( x ), 即
P { lim sup Fn ( x ) − F ( x ) = 0} = 1
n→ ∞ − ∞ < x < +∞
统计量是样本的函数,它是一个随机变量, 统计量是样本的函数,它是一个随机变量,统计 量的分布称为抽样分布 抽样分布。 量的分布称为抽样分布。
1 n s= ( xi − x )2 ∑ n − 1 i =1
样本标准差
1 n k ak = ∑ xi , k = 1,2⋯ n i =1 样本k阶矩 样本 阶矩 1 n bk = ∑ ( xi − x )k , k = 1,2⋯ n i =1 样本k阶中心矩 样本 阶中心矩
3. 经验分布函数 与总体分布函数F(x)相对应的统计量 相对应的统计量 与总体分布函数
( X i ) 2 ~ χ 2 (10), ∑ 0. 3 i =1
2 ( ∑ ( X i ) > 1. 44 ) P 0. 3 2 i =1 0. 3 n
⇒ P(∑
n
i =1
X i2 > 1.44 ) =
= P ( χ 2 (10) > 16) = 0. 1 .
(二) t分布 二 分布 1. 定义及概率密度 相互独立,称统计量 设 X ~ N(0,1), Y ~ χ2(n), 且X,Y相互独立 称统计量 相互独立

的一个样本, 为 的一个样本 X ~ N ( µ , σ 2 ) (X1,X2,X3)为X的一个样本,求
2( X1 − µ) (X 2 − µ) + (X 3 − µ)
2 2
的分布
X i ~ N (µ ,σ 2 )
Xi − µ
X1 − µ
σ
~ N (0,1)
i=1,2,3
2 2
σ
~ N (0,1)
设X 1 , X 2 , ⋯ , X n 是总体 X的一个样本
用s( x ),−∞ < x < +∞ 表示X 1 , X 2 ,⋯, X n中不大于 x的随机变量的个数
定义经验分布函数为
1 Fn ( x ) = s( x ),−∞ < x < +∞ n
23 设总体 F 具有一个样本值 1,,, 经验分布函数 F3 ( x ) 0, 若x < 1, 的观察值 1 , 若1 ≤ x < 2 3 F3 ( x) = 2 3 , 若2 ≤ x < 3 1, 若x ≥ 3
二.来自正态总体的几个常用统计量的分布
(一) χ2分布 一 1. 定义及概率密度 X1,X2,…Xn 是来自总体N(0,1)的样本,则称统计量 的样本, 是来自总体 的样本
2 2 χ 2 = X 12 + X 2 + ⋯ + X n
服从自由度为n的 分布. 记为χ 服从自由度为 的χ2分布 记为χ2 ~ χ2(n).
2
χ2 =
1
σ
2 ( X i − µ )2 ~ χ n 2∑ i =1
n
2 2 X 1 ~ χ n1 , X 2 ~ χ n2 , (2) 设
且X1,X2相互
2 独立, 独立,则 X 1 + X 2 ~ χ n + n 1 2
例 求
X ~ N (µ ,σ 2 )
2
(X1,X2,X3)为X的一个样本 为 的一个样本
X1 + X n X1 + ⋯ + X n ; −µ ; 2 n 2 ( X 1 + X n ) ( X 1 + ⋯ + X n ) − nµ . ; . 2 σ nσ
2. 常用统计量
它反映了总体均值 的信息
1 n 样本均值 X = ∑ Xi n i =1 1 n 2 样本方差 S 2 = ∑( Xi − X ) n − 1 i =1
例2
n i =1
设 X1, …, X10 是来自正态总体 X~N(0, 0.32 )的一 ~ (
个样本, 个样本 求 P ( ∑ X i2 > 1.44 ) . 解 ∵ X i ~N(0, ( 0. 32 ),
n
∴ X i ~ N (0, 1), 0. 3
i = 1, 2, …, 10 .
又由于它们相互独立, 又由于它们相互独立 ∴
2 2
X1 − µ X 2 − µ X 3 − µ + + σ σ σ
的分布。 的分布。
解 因为 1,X2,X3)为X的一个样本 Xi~N(0,1),i=1,2,3 因为(X 为 的一个样本 , 则 X i − µ ~ N (0,1) i=1,2,3
注:统计量是随机变量。
x1,x2,…, xn是相应于样本X1,X2,…, Xn的样本值, 是相应于样本 的样本值 则称g(x 的观察值。 则称 1,x2,…, xn)是g(X1,X2,…, Xn)的观察值。 是 的观察值
思考? 思考? 的一个样本, 设 X 1 ,⋯ X n 为来自总体 X ~ N ( µ ,σ 2 ) 的一个样本, 已知, 其中µ未知 ,σ 2已知, 问下列随机变量中那些是统计量
1, 设总体 F具有一个样本值 1, 2, 经验分布函数 F3 ( x ) 0, 若x < 1, 的观察值 2 F3 ( x ) = , 若1 ≤ x < 2 3 1, 若x ≥ 2
一般, 一般,设 x1 , x 2 ,⋯ , x n 是总体 F 的一个样本值
先将 x1 , x 2 ,⋯ , x n按自小到大的次序排 , 并重新编号
1 n Bk = ∑ ( X i − X )k n i =1
n
k=1,2,…
它们的观察值分别为: 它们的观察值分别为: 1 n 样本均值 x = ∑ xi n i =1
样本方差
n 1 n 1 2 2 2 s = ( xi − x ) = [ ∑ x i − nx 2 ] ∑ n − 1 i =1 n − 1 i =1
X1 − µ
X2 − µ X3 − µ ~ χ 2 ( 2) + σ σ
2
σ
X 2 − µ X 3 − µ + σ σ
2
2
~ t (2)
2( X1 − µ) (X 2 − µ) + (X 3 − µ)
σ
X1 − µ X 2 − µ X 3 − µ ~ χ 2 (3) + + σ σ σ
2 2 2
3. 期望和方差
E ( χ 2 ) = n,
D( χ 2 ) = 2n
2 2 E ( χ 2 ) = E ( X 12 + X 2 + ⋯ + X n ) 2 2 = E ( X 12 ) + E ( X 2 ) + ⋯ + E ( X n )
样本标准差
S它反映了总体方差 1 n 的信息 2 (X − X )
i
它反映了总体k 它反映了总体 阶矩 的信息
样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
它反映了总体k 它反映了总体 阶 中心矩的信息
1 k Ak = ∑ X i n i =1
χ 2 分布是由正态分布派生出来的一种分布. 分布是由正态分布派生出来的一种分布.
χ 2分布的密度函数为
n x −1 − 1 n2 x2 e 2 f ( x , n) = 2 Γ ( n 2) 0 其中伽玛函数 Γ( x ) 通过积分
x≥0 x<0
Γ( x ) = ∫ e − t t x −1dt ,
(三) F分布 三 分布 1.定义 定义 相互独立, 设 U ~ χ2(n1), V ~ χ2(n2), 且U,V相互独立 相互独立
U / n1 称统计量 F = V / n2
服从自由度为(n 分布.记为 服从自由度为 1,n2)的F分布 记为 F ~ F (n1,n2). 的 分布
1 V n2 =U n 1 F
2 2
~ t (2)
2. 上分位点
称满足条件: 对于给定的 α (0 < α < 1),称满足条件: P {t > tα ( n)} = α 的点tα ( n)为t分布的上α分位点。
α
t1−α ( n) tα (n) 由概率密度的对称性知 :t1−α ( n) = − tα ( n)
当n > 45时,tα ( n) ≈ zα .
~ F ( n2 , n1 )
若 F ~ F ( n1 , n2 ), 则 1 / F ~ F ( n2 , n1 ).
为取自正态总体X~(0,σ2)的样本, 的样本, 例 (X1,X2,…,X5)为取自正态总体 为取自正态总体 的样本
相关文档
最新文档