(抽样检验)统计量与抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 统计量及抽样分布

概率论和数理统计都是研究随机现象规律性的数学分支。

(1) 概率论特点:先提出随机现象的数学模型,然后研究其特性和规律 (2) 数理统计:

(3) I )以概率论为理论前提,从实际观测或试验出发; II) 研究如何有效的收集、整理和分析受到随机因素影响的数据,并为之建立适当的

数学模型;

III)对其进行检验,在此基础上对所研究的问题作出推断和预测,为采取行动和决策

提供依据和建议。

§1总体、样本与统计量

一、总体与样本

在实际问题中,我们往往只能通过观察和试验来获取研究对象的信息,但是,如果要把 全体研究对象逐个一一检查,常常是不必要或不可能的. 如:(1)对自动生产线上高速生产的零件逐个检查,要耗费很多的人力、物力、财力及时间,且非必要;

(2)为考察某些产品如灯泡的寿命,横梁的耐冲击强度等而进行的破坏性试验,逐个检查将使生产失去意义 所以,实际问题中,只能也只需通过测试部分对象的数据,由此来推断全体研究对象的性质,由部分推断总体。这是数理统计面对的基本问题。 1、 总体:研究对象的全体,如一批灯泡的寿命

具体:研究对象的某个或某几个特性的数量指标,所有的可能取值所构成的集合。

如,研究对象:一个城市的居民家庭;X :人均收入;Y :人均支出;Z :人均居住面积,

则三个总体:{}

()()(){}

()()(){}

121

1

2

2

1

1

1

2

2

2

,,...,,,,,,,,,,,,,n X X X X X Y X Y X Y X Y Z X Y Z X Y Z ==

=L L L 通常我们学习研究对象的一个特性的数量指标,所有可能取值所构成的集合。如,X :灯泡寿命,总体{}12,,X x x =L ,其中灯泡是研究对象,寿命是数量指标。

2、 个体:组成总体的每一个基本单元(集合中的元素)

3、 样本:从总体中随机地抽取几个个体所组成地集合,称为总体地一个样本:

()12,,n X X X L ,通常看为n 维随机变量

(1) 样本容量:样本中所含个体地个数n ,()1,2,n =≤L 总体中个体元素个数

(2) 样本值:12,,n X X X L 的一个观测,记为:12,,n x x x L

4、 抽样:从总体中抽取样本的过程。这里指随机抽样。目的:通过样本得到总体的相应情

况。

(1)简单随机抽样:数理统计最常用的抽样方法。

满足特点:代表性:总体中每个个体被抽入样本的机会均等,即每个i X (个体)与总体X

具有相同分布;

独立性:样本中每个个体取什么值并不影响其它个体取什么值,即12,,n X X X L 相互独立。

(2)简单随机样本:简称样本(指用简单抽样方法获得的样本)。 即:12,,n X X X L 为简单随机样本()1212,,,,n n X X X X X X ⎧⎪⇔⎨

⎪⎩

L L 相互独立;

与X具有相同的分布

如,一批灯泡5万只,随机抽取1000只检查其寿命i X ,()1,2,1000i =L ,其中4只寿命低于规律值,为次品,总体{}1250000,,X X X X =L ,一个样本121000,,,X X X ∴L 样本的次品率为0.4%。可推断,总体的次品率为0.4%。

(4) 这里可得到简单随机样本的方式:通常采用

有放回地重复随机抽样:通常针对有限总体,尤其总体容量较小时;

无放回…………………:指无限总体或样本容量相对较少,如小于等于总体的5%时。 5、 样本12,,n X X X L 的联合密度函数()()()()1212,,n n p x x x p x p x p x =L L ,其中:总体X 是

连续型随机变量,其密度函数为()p x 。 二、统计量

1、统计量:设12,,n X X X L 为取自总体X 的一个样本,()12,,n g x x x L 为一个连续函数,且不含未知参数,则称()12,,n g x x x L 为统计量。

如:总体()2~,X N μσ,12,,n X X X L 为取自总体X 的一个样本, (1)μ未知,σ已知,则含μ的不是;

(2)σ未知,μ未知,则含μ或含σ的不是;

简单地讲:统计量满足a )是样本12,,n X X X L 的实值函数;b )样本观测值()12,,n x x x L ?,就可求出统计量的具体值。 2、常用统计量

设12,,n X X X L 为取自总体X 的一个样本,

(1)样本均值:1

1n

i i X X n ==∑

(2)样本方差:()

()

2

22

2

1

1

1111n

n i i

i i S X X X nX n n ===-=---∑∑ 证明:(略)

(3)样本均方差(标准差):

S =

样本方差2

S 与均方差S 都反映了总体波动的大小,即反映总体()

D X

例1、从一批袋装食品中随机抽取6袋,测得其重量(单位:克),如下:462,465,451,472,459,448。求样本均值X 和样本方差2

S 。

解:总体X :指这批食品的重量(各袋重量构成的集合); 样本()126,,X X X L 是抽取6袋食品的重量

样本值:(462,465,451,472,459,448)为这次抽取6袋食品测得的重量

(1)6

1

2611462465448459.5666

i i X X X X X =++++++====∑L L (2)()

6222

2222

12611166615i i S X X X X X X =⎡⎤=-=++-⎢⎥⎣

⎦-∑L ()22221

4624654486459.579.55

=+++-⨯=L 或2

S ()()()222

1462459.5465459.5448459.579.55⎡⎤=

-+-++-=⎣

⎦L §2样本分布函数

设12,,n x x x L 为取自总体X 的一组样本值,可用频率分布表和直方图粗略地描述总体

X 地分布。

一、频率分布表

1、设总体X 是离散型随机变量,12,,n x x x L 是样本12,,n X X X L 地一组样本值。

12,,n X X X L 取到的值为12,,m a a a L ,且取到12,,m a a a L 的个数分别为12,,m v v v L ,

(1)频数:i a 出现的次数i ν; (2)频率:i i f n

ν=

,其中,12m n v v v =+++L ,即n 个数据中,取到i a 值的频率、比例;

(3)频率分布表:可近似地反映(代替)总体X 的分布律

二、直方图

当总体X 是连续型随机变量时,可采用直方图来处理样本值。 1、 方法:

(1)将样本值12,,n x x x L 从小到大排列,***

12,,n x x x ⇒L 样本值落入区间

相关文档
最新文档