第二章数理统计的基本概念

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

统计量的值 1186.66 1080.00 156450.00 395.54 1250.00
频数/频率直方图
例2 某地区30名2000年某专业毕业实习生实习期满后的月薪数据如下： 909 1091 967 1232 1096 1164 1086 1071 1572 950 808 971 1120 1081 825 775 1224 950 999 1130 914 1203 1044 866 1320 1336 992 1025 871 738
容量为n的样本可以看作n维随机变量 (X1,X2,…,Xn)
一旦取定一组样本，得到的是n个数 (x1,x2,…,xn)，称为样本的一次观察值，简称样本观测值 .
总体分布决定了样本取值的概率规律，也就是样本取到样本值的规律，因而可以由样本值去推断总体.
简单随机样本
设X1,X2, …,Xn为总体X的一个容量为n的样本。若它满足
0,
Fn
(
x)
k n
1,
x x(1) , x(k) x x(k1) , k 1, 2 n 1, x(n) x.
例3 从总体X中抽取容量为8的样本，其观测值为
33，45，25，33，35，65，30，27。试求X的经验分布函数。
解：将样本观测值由小到大排序得 25<27<30<33=33<35<45<65
第二章数理统计的基本概念
§2.1
一、总体
一个统计问题总有它明确的研究对象.
将研究对象的全体称为总体，总体中每个具体对象称为个体.
总体
…
研究某批灯泡的寿命
总体的特点：大量性、同质性、变异性
总体可看成一个随机变量，用X、Y表示。
如果总体X服从正态分布，就称它是正态总体。
二、样本
为推断总体分布及各种特征，随机地从总体中抽取若干个体进行观察试验，这一抽取过程称为 “抽样”，所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.
常用统计量
样本均值
X
1 n
n i 1
Xi
样本方差
它反映了总体均值的信息
它反映了总体方差的信息
S 2
1 n 1
n i 1
(Xi
X
)2
注: 样本方差的算术平方根S称为样本标准差
样本k阶原点矩
它反映了总体k 阶矩的信息
Ak
1 n
n i 1
X
k i
样本k阶中心矩
Bk
1 n
n i 1
(Xi
ቤተ መጻሕፍቲ ባይዱ
X )k
n为奇数 n为偶数
它反映了总体取值中间程度的信息
例1 在某城市中随机抽取9个家庭，调查得到每个家庭的人均月收入数据如下（单位：元）
1080， 750，1080，1080，850，960， 2000， 1250，1630
计算出这组数据的统计量结果见下表：
统计量样本均值样本中位数样本方差样本标准差样本极差
A. 构造该数据的频率分布表(组数为6) B. 画出直方图
Max=1572, Min=738, 组数=6 组距=(Max-Min)/6=139140 取a0=735, 则分组区间及相关数据如下
组序分区区间频数频率累计频率
1 (735,875] 6 0.2
0.2
2 (875,1015] 8 0.27 0.47
■数理统计中常用分布
1.标准正态分布
0, 1 的正态分布称为标准正态分布.
记成 N（0，1）
其密度函数和分布函数常用( x)和( x)表示：
( x)
(x)
1
x2
e2
,
（
x
）
2
( x)
(x) 1
x t2
e 2 dt,
（
x
）
2
正态分布与标准正态分布的关系
标准正态分布的重要性在于，任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
0,
1
,
8
2
,
8
3
Fn
(
x)
8 5
, ,
8
6
,
8
7
，
8
1,
x 25, 25 x 27, 27 x 30, 30 x 33, 33 x 35, 35 x 45, 45 x 65, 65 x.
注：当n充分大时，有
Fn (x) F (x)
二、抽样分布
统计量既然是依赖于样本的，而后者又是随机变量，故统计量也是随机变量，它的分布叫做抽样分布 .
(1)独立性，即X1,X2, …,Xn 相互独立； (2)代表性，即每个Xi都与总体X服从相同的分布. 则称这样的样本为简单随机样本，简称为样本。
§2.2
一、统计量
设X1,X2, …,Xn是总体X的样本，g(X1,X2, …,Xn) 是样本的实值函数，且不包含任何未知参数，则称g(X1,X2, …,Xn)为统计量。
3 (1015,1155] 9 0.3
0.77
4 (1155,1295] 4 0.13
0.9
5 (1295,1435] 2 0.07 0.97
6 (1435,1575] 1 0.03
1.0
合计
30 1
经验分布函数
设X1,X2, …,Xn是取自总体X的样本，对应的次序统计量为X(1) X(2) … X(n) ，当给定次序统计量的观测值x(1) x(2) … x(n)时，对任意实数x，称下面函数为总体X的经验分布函数。
,
X
(
n
为次序统计量。
)
X (n) max{X1, , X n}为最大次序统计量 X (1) min{X1, , X n}为最小次序统计量
样本极差
它反映了总体取值悬殊程度的信息
样本中位数
R X (n) X (1)
Mc
X ((n1) / 2) ,
1 2
(X
(n / 2)
X (n / 21) ),
若 X ~ N (, 2 ) ，则
U X ~ N(0, 1)
2. 卡方分布
定义: 设 X1, X 2,, X n 相互独立, 都服从正态
分布N(0,1)，则称随机变量：
2
X
2 1
X 22
X n2
所服从的分布为自由度为 n 的 2 分布.
记为 2 ~ 2 (n)
例4 设X 1, X 2 , X 3 , X 4是总体 X ~ N (0,22 ) 的
它反映了总体k 阶中心矩的信息
次序统计量
设X1, X 2 , , X n为总体X的样本,函数
X (k) X (k) ( X1, X 2 , , X n ), k 1, , n,
其中X (k)的观察值是样本X1, X 2 ,
,
X
的观察值
n
x1, x2, , xn中由小到大排列后的第k个数值,
则称X (1) ,

第二章 数理统计的基本概念

第二章数理统计的基本概念