概率论与数理统计第六章样本及抽样分布}第二节:样讲义本分布函数直方图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计
样本分布函数Fn(x)的图形
数理统计
对于任意的实数 x总体分布函数 F(x)是事件X ≤ x 的概率; 样本分布函数 Fn(x)是事件 X ≤ x发生的频率. 根据伯努利大数定理可知, 当 n→∞时, 对于任意的正数 ε, 有:
ln i m PF nxF x1
格利文科(Glivenko) 进一步证明了, 当n→∞时, 样本分布函数 Fn(x)与总体分布函数 F(x)之间存在着更密切的 近似关系的结论. 这些结论就是我们在数理统计中可以依据样本来推断总体的
理 论基础.
例 1:设 总 体 F 具 有 一 个 样 本 值 1, 1, 2,数理统计
则 经 验 分 布 函 数 F 3(x)的 观 察 值 为 :
0, 若x 1
F3 ( x)
2 3
,
若1
x
Fra Baidu bibliotek
2
1, 若 x 2
二、直方图(histogram)
作样本的频率直方图(简称直方图), 步骤如下:
并以各子区间为底, 以 fi /(ti - ti-1)为高作小矩形,
各个小矩形的面积 ∆Si 就等于样本观测值落在该子区间内的频率,
即:
S ititi 1 ti fiti 1fi,l
i1 ,2, ,l.
l
所有小矩形的面积的和: Si fi 1.
i1
i1
这样作出的所有小矩形就构成了直方图。
数理统计
总计
100
1.00
直方图如图所示:
THANK YOU
写出零件质量的频率分布表并作直方图。
解: 因为样本观测中最小值为 237, 最大值为 265, 所以我们把数据的分布区间确定为: (236.5, 266.5)
并把这个区间等分为 10个子区间:
(236.5, 239.5), (239.5, 242.5), …, (263.5, 266.5)
数理统计
由此得到零件质量的频率分布表:
太多则由于频率的随机摆动而使分布显得杂乱,
太少则难于显示分布的特征。
此外, 为了方便起见, 分点 ti 应比样本观测值 xi多取一位小数.
3. 把所有样本观测值逐个分到各子区间内,
并计算样本观测值落在各子区间内的频数 ni及频率:
fi
ni ,i
n
1,2,
,l.
数理统计
4. 在 Ox轴上截取各子区间,
其中和式
xi
是对小于或等于
x
x
的一切
x(i)
的频率
fi
求和,
则称 Fn(x)为样本分布函数,经验分布函数。
2. 样本分布函数Fn(x)具有下列性质:
(1) 0 ≤ Fn(x) ≤1 (2) Fn(x)是非减函数
(3 )F n 0 , F n 1
(4) Fn(x)在每个观测值 x(i)处是右连续的, 点 x(i)是 Fn(x)的跳跃间断点, Fn(x)在该点的跃度就等于频率fi
观测值 x 1
频数
n1
频率
f1
x 2
…
n2
…
f2
…
数理统计
x l
总计
nl
n
fl
1
其中 x1x2 xl
fi
ni n
i1,2,
,l
l n
l
ni n
i1
l
fi 1
i1
1. 定义: 设函数:
0,
x x1
Fn
x
fi , xi x xi1
xi x
1,
x xl
数理统计
i1,2, ,l1
把区间 (a, b)分成 l个子区间:
(a, t1), (t1, t2), …, (ti-1, ti), …, (tl-1, b) 第 i个子区间的长度为: ti ti ti 1 ,(i 1 ,2 , ,l)
各子区间的长度可以相等, 也可以不等;
若使各子区间的长度相等,
则有:
ti
b
l
a
子区间的个数一般取为 8至 15个,
精品
概率论与数理统计第六章样本 及抽样分布}第二节:样本分布
函数直方图
一、样本分布函数(sample distribution function) 数理统计
我们把总体的分布函数 F(x)=P(X ≤ x) 称为总体分布函数. 从总体中抽取容量为 n 的样本得到 n 个样本观测值, 若样本容量 n 较大,则相同的观测值可能重复出现若干次, 为此,应当把这些观测值整理,并写出下面的样本频率分布表:
数理统计
1. 找出样本观测值 x1, x2, …, xn中的最小值与最大值, 分别记作 x1* 与 xn*, 即: x1* =min(x1, x2, …, xn), xn* =max(x1, x2, …, xn)
2. 适当选取略小于 x1*的数 a与略大于 xn*的数 b, 并用分点: a=t0 < t1 < t2 < … < tl-1 < tl=b
因为样本容量 n充分大时, 随机变量 X的取值落在 各个子区间 (ti-1 - ti)内的频率近似等于其概率, 即:
f i P t i 1 X t i,i 1 ,2 , ,l
所以直方图大致地描述了总体X的概率分布。
例2: 测量100个某种机械零件的质量, 得到样本观测值如下(单位:g):
246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244