第二章 数理统计的基本概念

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计量的值 1186.66 1080.00 156450.00 395.54 1250.00
频数/频率直方图
例2 某地区30名2000年某专业毕业实习生实习期满 后的月薪数据如下: 909 1091 967 1232 1096 1164 1086 1071 1572 950 808 971 1120 1081 825 775 1224 950 999 1130 914 1203 1044 866 1320 1336 992 1025 871 738
容量为n的样本可以看作n维随机变量 (X1,X2,…,Xn)
一旦取定一组样本,得到的是n个数 (x1,x2,…,xn), 称为样本的一次观察值,简称样本观测值 .
总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
简单随机样本
设X1,X2, …,Xn为总体X的一个容量为n的样本。 若它满足
0,
Fn
(
x)
k n
1,
x x(1) , x(k) x x(k1) , k 1, 2 n 1, x(n) x.
例3 从总体X中抽取容量为8的样本,其观测 值为
33,45,25,33,35,65,30,27。 试求X的经验分布函数。
解:将样本观测值由小到大排序得 25<27<30<33=33<35<45<65
第二章 数理统计的 基本概念
§2.1
一、总体
一个统计问题总有它明确的研究对象.
将研究对象的全体称为总体, 总体中每个具体对象称为个体.
总体

研究某批灯泡的寿命
总体的特点: 大量性、同质性、变异性
总体可看成一个随机变量,用X、Y表示。
如果总体X服从正态分布,就称它是正 态总体。
二、样本
为推断总体分布及各种特征,随机地从总体 中抽取若干个体进行观察试验,这一抽取过程称 为 “抽样”,所抽取的部分个体称为样本. 样本 中所包含的个体数目称为样本容量.
常用统计量
样本均值
X
1 n
n i 1
Xi
样本方差
它反映了总体均值 的信息
它反映了总体方差 的信息
S 2
1 n 1
n i 1
(Xi
X
)2
注: 样本方差的算术平方根S称为样本标准差
样本k阶原点矩
它反映了总体k 阶矩 的信息
Ak
1 n
n i 1
X
k i
样本k阶中心矩
Bk
1 n
n i 1
(Xi
ቤተ መጻሕፍቲ ባይዱ
X )k
n为奇数 n为偶数
它反映了总体取值 中间程度的信息
例1 在某城市中随机抽取9个家庭,调查得到 每个家庭的人均月收入数据如下(单位:元)
1080, 750,1080,1080,850,960, 2000, 1250,1630
计算出这组数据的统计量结果见下表:
统计量 样本均值 样本中位数 样本方差 样本标准差 样本极差
A. 构造该数据的频率分布表(组数为6) B. 画出直方图
Max=1572, Min=738, 组数=6 组距=(Max-Min)/6=139140 取a0=735, 则分组区间及相关数据如下
组序 分区区间 频数 频率 累计频率
1 (735,875] 6 0.2
0.2
2 (875,1015] 8 0.27 0.47
■数理统计中常用分布
1.标准正态分布
0, 1 的正态分布称为标准正态分布.
记成 N(0,1)
其密度函数和分布函数常用( x)和( x)表示:
( x)
(x)
1
x2
e2
,

x

2
( x)
(x) 1
x t2
e 2 dt,

x

2
正态分布与标准正态分布的关系
标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布.
0,
1
,
8
2
,
8
3
Fn
(
x)
8 5
, ,
8
6
,
8
7

8
1,
x 25, 25 x 27, 27 x 30, 30 x 33, 33 x 35, 35 x 45, 45 x 65, 65 x.
注:当n充分大时,有
Fn (x) F (x)
二、抽样分布
统计量既然是依赖于样本的,而后者又 是随机变量,故统计量也是随机变量,它的 分布叫做 抽样分布 .
(1)独立性,即X1,X2, …,Xn 相互独立; (2)代表性,即每个Xi都与总体X服从相同的分布. 则称这样的样本为简单随机样本,简称为样本。
§2.2
一、统计量
设X1,X2, …,Xn是总体X的样本,g(X1,X2, …,Xn) 是样本的实值函数,且不包含任何未知参数, 则称g(X1,X2, …,Xn)为统计量。
3 (1015,1155] 9 0.3
0.77
4 (1155,1295] 4 0.13
0.9
5 (1295,1435] 2 0.07 0.97
6 (1435,1575] 1 0.03
1.0
合计
30 1
经验分布函数
设X1,X2, …,Xn是取自总体X的样本,对应的次 序统计量为X(1) X(2) … X(n) ,当给定次序 统计量的观测值x(1) x(2) … x(n)时,对任意 实数x,称下面函数为总体X的经验分布函数。
,
X
(
n
为次序统计量。
)
X (n) max{X1, , X n}为最大次序统计量 X (1) min{X1, , X n}为最小次序统计量
样本极差
它反映了总体取值 悬殊程度的信息
样本中位数
R X (n) X (1)
Mc
X ((n1) / 2) ,
1 2
(X
(n / 2)
X (n / 21) ),
若 X ~ N (, 2 ) ,则
U X ~ N(0, 1)
2. 卡方分布
定义: 设 X1, X 2,, X n 相互独立, 都服从正态
分布N(0,1), 则称随机变量:
2
X
2 1
X 22
X n2
所服从的分布为自由度为 n 的 2 分布.
记为 2 ~ 2 (n)
例4 设X 1, X 2 , X 3 , X 4是总体 X ~ N (0,22 ) 的
它反映了总体k 阶 中心矩的信息
次序统计量
设X1, X 2 , , X n为总体X的样本,函数
X (k) X (k) ( X1, X 2 , , X n ), k 1, , n,
其中X (k)的观察值是样本X1, X 2 ,
,
X
的观察值
n
x1, x2, , xn中由小到大排列后的第k个数值,
则称X (1) ,
相关文档
最新文档