样本与抽样分布--基本概念.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
T ( X1, X 2 ,, X n () 是随机变量)
为一个统计量. 若 x1, x2 , …, xn 为样本观测值, 则称
t ( x1, x2 ,, xn )是统计量T 的一个观测值.
例1 当总体期望已知时,有下述统计量:
S 2
1 n
n
(Xi
i 1
)2
常用的统计量
定义 可知
样本最小值统计量为
样本中值统计量为
X min X (1) Me X ([n/ 2]1)
样本级差为
R X(n) X(1)
取次序统计量的一组观测值 x(1) , x(2) ,, x(n) 则对任意的实数 x, 事件{X ≤x} 发生的频率为
0 , x x(1)
若总体X是连续型的. 为了获取密度函数f(x),
可选取包含样本观测值的区间(a1,al],并填表绘图:
分布密度估计表
频数 频率 密度估
区间划分 ni ni / n 计值 yi
(a0 , a1]
n1
n1 / n
n1 / n a1 a0
(a1 , a2 ]
n2
n2 / n
n2 / n a2 a1
总区间划分要求6~17个, 每区间至少含1个观测值.
频 率 ni P 概 率 ai f ( x)d x
n
ai1
f (x) yi
(al1,al ]
nl
nl / n
nl / n al al1
O
a0 a1 a2 a3 … al-1 al x 频率直方图
例2 从某校升学考卷中随机抽取150份, 其成绩
《数理统计》研究的问题:怎样选择有效的 抽样方法采集数据(抽样), 并利用抽样获得的有 限数据, 对被研究的随机现象的规律性作出尽可能 精确而可靠的结论(推断).
7.1 基本概念
一、总体与样本 二、统计量与样本矩 三、经验分布函数与直方图
一、总体与样本
总体(母体):研究对象(取实值)的全体. 个体:组成总体的每个元素.
Fn(x) 1
Fn
(
x)
k n
,
x(k ) x x(k1)
1 , x x(n)
(k=1,2,···,n-1)
O x(1) x(2) … x(n) x
显然, Fn(x)具有分布函数的特征, 且根据大数定律, Fn ( x) P F ( x) (n ), 所以当n较大时, F ( x) Fn ( x). 故通常称 Fn(x)为X 的 经验分布函数.
(70,80] 43
(70,80] 43 43/150 43/1500
(80,90] 39
(80,90] 39 39/150 39/1500
(90,100] 20
(90,100] 20 20/150 20/1500
根据分布密度估计表即可画出频率直方图.
样本均值 样本方差
1 n
X n i1 Xi
S 2
1 n1
n
(Xi
i 1
X )2
样本标准差
S
1 n1
n i 1
(Xi
X )2
样本k阶原点矩
Mk
1 n
n i 1
X
k i
(k 1, 2, ...)
样本k阶中心矩
M
k
1 n
n
(Xi
i 1
X )k
(k 1, 2,...)
如:某厂 生产灯泡 的寿命的 全体就是 一个总体
灯泡的寿命
如:每个灯 泡的寿命就 是一个个体
每个个体的出现带有随机性,因此代表总体取 值的变量都是一个随机变量,通常用X(或Y,Z)表示. 总体的概率分布就是随机变量X的概率分布.故今 后将不区分总体与相应的随机变量.常称作总体X. 《数理统计》研究的宗旨:
寻找总体X 的概率分布及其各种特征
F(x) 1
寻求:
EX , DX ,Cov( X ,Y )
E(X kY l )
O
ห้องสมุดไป่ตู้
x
E[( X EX )k (Y EY )l ]
从总体X 中抽取一个个体, 就是对总体X 进行 一次试验 (观测), 从总体X 中随机的抽取n个个体:
X1, X2,, Xn 就是对总体X进行了一组试验. 通常把由这n个试 验组成的试验组称为总体X的一个样本(或子样), 样本中个体的数目n称为样本容量,其中的Xi叫样本 的第 i 个分量. 对Xi的一次观测值,记之为xi ,并称
x1 , x2 ,, xn 为X1, X2, … , Xn 的一个观测值, 简称 样本观测值
抽样(抽取样本)目的:
通过获取样本(X1, X2, … , Xn)的有限信息 对总体X的概率分布及其各种特征进行推断
抽样要求:
1o 代表性: X1, X2, … , Xn 与总体X 有相同的分布 2o 独立性: X1, X2, … , Xn 是相互独立的随机变量
满足上述要求的样本称为简单随机样本, 获取 简单随机样本的方法称为简单随机抽样。
今后,凡提到的样本都是指简单随机样本。
二、统计量与样本矩
对总体X 推断前需要对样本进行加工或提炼
定义 设 X1, X2, … , Xn 是来自总体X 的样本, 如果函数φ(x1, x2, …, xn)为x1, x2 , …, xn 的一个实 值函数, 且φ 中不包含任何未知参数, 那么称
统计量间的关系: M1
X
,
M
2
M2
X2
n1 n
S2
三、经验分布函数与直方图
为了获得总体X 的分布, 先引入一个定义 定义1 设X1, X2, …, Xn是来自总体X 的一个容 量为n的样本, 把它们依大小顺序排列为
X(1) , X(2) ,, X(n) 则称其为样本次序统计量。
由此 样本最大值统计量为 X max X (n)
节目录
第七章 样本与抽样分布
7.1 基本概念 7.2 基本分布 7.3 正态总体的抽样分布
从本章开始, 我们将讲述数理统计的基本内容. 与概率论一样,数理统计是研究随机现象统计规 律性的一门数学学科. 它是以概率论为基础, 由实 际观测资料出发, 研究如何合理地采集或收集资料 并根据观测得到的资料对随机变量的分布数字特 征等作出科学的推断.
分布如下表, 试依据这些资料作出成绩频率直方图.
成绩分布表
分布密度估计表
得分范围
得分 人数
频数 频率 密度估
区间划分 ni ni / n 计值 yi
(40,50]
2
(40,50] 2 2/150 2/1500
(50,60] 14
(50,60] 14 14/150 14/1500
(60,70] 32
(60,70] 32 32/150 32/1500