《概率论与数理统计》第六章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章
样本及统计量
第六章 样本及抽样分布 ‹#›
学习的基本内容
第六章主要介绍数理统计的一些基本术语、 基本概念、重要的统计量及其分布,它们是 后面各章的基础。
目录/Contents
第1章 随机事件与 3 概率
§ 1 随机样本
§3
抽样分布
第六章 样本及抽样分布 ‹#›
数理统计
由于大量随机现象必然呈现出其规律性,因而 从理论上讲,只要对随机现象进行足够多次的观察, 随机现象的规律性就一定能够清楚地呈现出来。
第六章 样本及抽样分布 ‹#›
例 5 假设某大城市居民的收入 X 服从正态分布
N(,2), 概率密度为
f (x) 1
e ,
(
x ) 2 2
2
2
x R.
现从总体 X 中随机抽取样本 X1,…,Xn ,因其独 立同分布于总体 X,即:
Xi ∼ N(,2), i=1,2,…,n.
于是,样本X1,X2,…,Xn 的联合概率密度为
如果测量过程没有系统性误差,则X取大于 和小 于 的概率也会相等。
在这种情况下,人们往往认为X 服从均值为,方 差为2 的正态分布。2反映了测量的精度。于是, 总体X的分布为 N(,2)。
第六章 样本及抽样分布 ‹#›
说明:这里有一个问题,即物体长度的测量值总是在
其真值 的附近,它不可能取负值。
第六章 样本及抽样分布 ‹#›
● 如果总体所包含的个体数量是有限的, 则称该总体 为有限总体。
有限总体的分布显然是离散型的。 ● 如果总体所包含的个体数量是无限的,则 称该总 体为无限总体。 无限总体的分布可以是连续型的,也可是离散型的。
说明:在数理统计中,研究有限总体比较困难。因 为其分布是离散型的,且分布律与总体中所含个体数量 有关系。
第六章 样本及抽样分布 ‹#›
例如:假定物体长度 =10厘米,测量误差为0.01厘
米,则2=0.012
这时,(-3,+3)=(9.97,10.03)。于是,测量值落在
这个区间之外的概率最多只有0.003,可忽略不计。
可见,用正态分布 N(10,0.012)去描述测量值X是适当 的。完全可认为:X 根本就不可能取到负值;
f * (x1, x2 ,
, xn )
1
(2 )n/2
n
e .
1 2
2
n i1
( xi )2
第六章 样本及抽样分布 ‹#›
五、总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值(称作为“观察值 ”),这10个数并不是样本. 我们只能观察到随机变 量取的值而见不到随机变量.
然而,为便于处理问题,我们将有限总体近似地看 成一个无限总体,并用正态分布来逼近这个总体的分布。
当城市比较大,儿童数量比较多时,这种逼近所带来 的误差,从应用观点来看,可以忽略不计。
第六章 样本及抽样分布 ‹#›
三、样本的二重性
● 假设 X1, X2, …, Xn 是总体X中的样本,在一次 具体的观测或试验中,它们是一批测量值,是已经取到 的一组数。这就是说,
第六章 样本及抽样分布 ‹#›
(2). 另外,正态分布取值范围是(-∞,∞),这样还
可以解决规定测量值取值范围上的困难。
如若不然, 就需要用一个定义在有限区间(a,b) 取值的随机变量来描述测量值X。那么, a和b到底取 什么值呢?测量者事先很难确定。
再退一步,即使能够确定出a和b,却仍很难找出 一个定义在 (a,b) 上的非均匀分布用来恰当地描述 测量值。与其这样,还不如干脆就把取值区间放大到 (-∞,∞),并用正态分布来描述测量值。这样,既简 化了问题,又不致引起较大的误差。
样本具有数的属性。.
● 由于在具体试验或观测中,受各种随机因素的 影响,在不同试验或观测中,样本取值可能不同。 因此,当脱离特定的具体试验或观测时,我们并不 知道样本 X1,X2,…,Xn 的具体取值到底是多少。因 此,可将样本看成随机变量。
样本又具有随机变量的属性。.
第六章 样本及抽样分布 ‹#›
n 为样本大小或样本容量。
第六章 样本及抽样分布 ‹#›
四、 样本分布
既然样本 X1,X2,…,Xn 被看作随机向量,自然 需要研究其联合分布。
假设总体 X 具有概率密度函数 f (x),因样 本X1,X2,…,Xn独立同分布于 X,于是,样本的联 合概率密度函数为
n
f * (x1, x2 , , xn ) f (xi ). i 1
通常在总体所含个体数量比较大时,将其近似地视 为无限总体,并用连续型分布逼近总体的分布,这样便于 进一步地做统计分析。
第六章 样本及抽样分布 ‹#›
例 3 研究某大城市年龄在1岁到10岁之间儿童的身高。
显然,不管城市规模多大,这个年龄段的儿童数 量总是有限的。因此,该总体X只能是有限总体。总 体分布只能是离散型分布。
而正态分布取值在(-∞,∞)上。那么,怎么可以认为测 量值X服从正态分布呢?
回答这个问题,有如下两方面的理由。
(1).在前面讲过,对于X∼N(,2), P{-3<X<+3}=0.9974.
即 X 落在区间(-3,+3)之外的概率不超过 0.003, 这 个概率非常小。X 落在(-4,+4)之外的概率就更小了。
第六章 样本及抽样分布 ‹#›
几个常见统计量
样本平均值
X
1 n
n i 1
Xi
它反映了 总体均值 的信息
样本方差
S 2
1 n 1
n i 1
(Xi
X )2
它反映了总体 方差的信息
n
1
1
n
X
2 i
i 1
nX
2
样本标准差
S
1 n
n
1
(
i 1
X
i
X 来自百度文库2
样本k阶(原点)矩
Ak
1 n
n i 1
X
k i
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
是什么呢?
事实上,这里没有一个现实存在的个体的集合 可以作为上述问题的总体。可是,我们可以这样考
虑,既然 n 个测量值 X1,X2,…,Xn 是样本,那么,总
体就应该理解为一切所有可能的测量值的全体。
第六章 样本及抽样分布 ‹#›
二、总体分布 对一个总体,如果用X表示其数量指标,那么,
X的值对不同的个体就取不同的值。因此,如果我们 随机地抽取个体,则X的值也就随着抽取个体的不同 而不同。
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
那么,我们就认为:这些样本相互独立,且有相同的分布;
;
ak
1 n
n i1
xik
k 1, 2,
bk
1 n 1
n i1
(xi
x)k
k 1,2,
第六章 样本及抽样分布 ‹#›
请注意 : 若总体X的k阶矩E(X k ) k存在,则当n 时,
Ak
26
目录/Contents
第1章 随机事件与 27 概率
§3
抽样分布
统计量与经验分布函数 统计三大抽样分布 几个重要的抽样分布定理
第六章 样本及抽样分布 ‹#›
引子: 由样本值去推断总体情况,需要对样本值进
行“加工”,这就要构造一些样本值的函数,它 把样本中所含的(某一方面)的信息集中起来.
如何对样本进行加工? ——统计量及其分布
X1 )2 都是统计量,但
X5 2 p不是统计量(因为 p是未知数).
请注意 :
第六章 样本及抽样分布 ‹#›
(1) 统计量是随机变量。
(2) 设X1, X 2 , X n是来自总体X的一个样本, x1, x2, xn是一个样本的观察值 , 则g(x1, x2 , xn )也是统 计量 g(X1, X 2 , X n )的观察值.
但是,客观上只允许我们对随机现象进行次数不 多的观察或试验,也就是说:我们获得的只能是局部 的或有限的观察资料。
第六章 样本及抽样分布 ‹#›
引言
数理统计的任务就是研究怎样有效地收集、整 理和分析所获得的有限资料,并对所研究的问题尽 可能地给出精确而可靠的推断。
现实世界中存在着形形色色的数据,分析这些 数据需要多种多样的方法。
第六章 样本及抽样分布 ‹#›
例 1 设总体X服从两点分布b(1, p),其中p是未知参
数,X1, , X5是来自X的简单随机样本.试指出
X1 X2 ,
max Xi , X5 2 p,
1i5
(X5 X1)2
之中哪些是统计量,哪些不是统计量,为什么?
解:
X1
X
2
,
max
1 i 5
Xi ,( X5
总体(理论分布) ?
第六章 样本及抽样分布 ‹#›
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
第六章 样本及抽样分布 ‹#›
小结:几个关键词:
测),统计学上称这些样品为一个样本。
同样,我们也将样本的数量指标称为样本。因 此,今后当我们说到总体及样本时,既指研究对象又 指它们的某项数量指标。
第六章 样本及抽样分布 ‹#›
例 1 用一把尺子测量一件物体的长度。
假定 n 次测量值分别为X1,X2 ,…,Xn。显然,在该 问题中,我们把测量值X1,X2 ,…,Xn看成样本。但总体
所以,X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
个分支。
目录/Contents
第1章 随机事件与 7 概率
§1
随机样本
总体 个体 样本 容量 简单随机样本
(并不简单)
§1 随机样本
第六章 样本及抽样分布 ‹#›
一、总体、个体与样本
在数理统计中,称研究问题所涉及对象的全体
为总体,总体中的每个成员为个体。
例如: 研究某工厂生产的某种产品的废品率,则 这种产品的全体就是总体,而每件产品都是一个个 体。
第六章 样本及抽样分布 ‹#›
数理统计中的方法和支持这些方法的相应理论 是相当丰富的。概括起来可以归纳成两大类。
参数估计: 根据数据,对分布中的未知参数
进行估计;
假设检验: 根据数据,对分布的未知参数的
某种假设进行检验。
参数估计与假设检验构成了统计推断的 两种基本形式,这两种推断渗透到了数理统计的每
其分布与总体分布 N(, 2)相同。
第六章 样本及抽样分布 ‹#›
将上述结论推广到一般的分布:如果在相同条件 下对总体 X 进行 n 次重复、独立观测,就可以认 为所获得的样本X1,X2,…,Xn是 n 个独立且与总体 X 有同样分布的随机变量。
通常称相互独立且有相同分布的样本为随机样本 或简单随机样本;
总体 研究对象的全体称为总体, 总体是某个指标的一个随机变量X
个体 样本
个体的某个指标的一个随机变量 Xi 抽样而来一组个体,多个随机变量 X1, X2, …Xn
容量 样本或总体中个体数量 n
简单随机样本
(1)与总体同分布的n个随机变量X1,X2,…,Xn (2)随机变量X1,X2,…,Xn相互独立
第六章 样本及抽样分布 ‹#›
前面不好考:一、统计量与经
1. 统计量
验分布函数
定义 不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.
设X1, X 2 ,, X n是来自总体X的一个样本, g( X1, X 2 ,, X n )是X1, X 2 ,, X n的函数,若g 中不含未知参数,则 g( X1, X 2 ,, X n )称是一 个统计量 .
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
相关文档
最新文档