第6章 样本及抽样分布121126

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章 样本与抽样分布

第6章的教学要求:

1.理解总体、个体、简单随机样本及其分布的概念.

2.了解直方图和条形图、经验分布函数.会求经验分布函数.

3.了解样本均值、样本方差与样本标准差、样本原点矩、众数和中位数等数字特征,并会根据数据计算这些数字特征的方法.

4.了解2χ分布、t 分布、F 分布.会查表计算上α分位数.

5.理解统计量的概念,掌握来自正态总体的抽样分布.

在概率论中,一切的分析和运算都是基于分布已知这个假设进行的.但在实际问题中,情况往往并非如此,常常是我们对所要研究的随机变量知道不多或知之甚少.这时需要经试验或观测,获得反映随机变量信息的数据,并以概率论为理论基础,对数据进行整理、分析,从而对研究对象的性质和统计规律做出合理、科学的估计和推断.这就是数理统计基本的和主要的任务.

数理统计研究统计的一般原理与方法.

本章主要介绍数理统计中的基本概念、基本分布和正态抽样分布及性质.

§6.1 总体与样本

6.1.1 总体和个体

在数理统计中,概括性地说,把研究对象的全体称为总体,把总体中的每个元素称为个体. 例如,研究……学生,……总体,……个体.

但在实际中,我们说研究……学生,一般是带有“目的性”的.如:我们想研究学生的……,根据这种“目的性”,我们研究对象的全体就具体为“……”、个体则为“……”.

因此,也说——总体是研究对象的某数量指标.

记数量指标为X ,则X 是随机变量.

例如,若X 是表示学生的……数量指标,则每个个体的指标值即为X 的取值.注意到,在进行研究时,个体的指标值事先是不知道的,我们一般是通过“随机抽样”的方式来获得个体的指标值及有关情况——即总体X 的取值及其分布的.因此,数量指标X 是一个随机变量.

总体中所包含的个体的数量称为总体容量.根据总体容量的有限或无限,分为有限总体和无限总体.

6.1.2 样本和简单随机样本

通常人们以随机抽样的方式了解总体分布.

把从总体中抽取出的一部分个体称为总体的一个样本,样本中的个体称为样品,样本中所包含的个体的数目称为样本容量.

由于是通过样本来了解总体,所以样本应该具有代表性. 如何获得具有代表性的样本?

获得具有代表性的样本最常采用的方法是:在相同条件下对总体X 进行n 次重复且独立的随机观测,把n 次观测的结果按试验的次序记为12,,,n X X X .采用这种有放回抽取得到的样本12,,,n X X X 是相互独立的随机变量,且均与总体X 有相同的分布,因此它具有代表性,这个样本称为简单随机样本.样本的一次观测值记为12,,,n x x x ,称为样本的一个样本值,这里n 即是样本容量.

如果没有特别说明,在今后的讨论中所提到的样本都指简单随机样本,并简称为样本.

怎样才能获得简单随机样本呢?

对有限总体来说,采用有放回抽取方式就可以得到简单随机样本.但是有放回抽取在实际中有时使用起来不太方便.采用不放回抽取方式取得的样本则不是简单随机样本,但是当总体容量比样本容量大很多时,可以把它当作简单随机样本.对无限总体来说,抽走少量样本后不影响总体的构成或影响很小,因此常采用不放回抽取.

6.1.3 样本的联合分布

设12,,,n X X X 是来自总体X 的样本.

如果总体X 的分布函数为()X F x ,那么样本12,,,n X X X 的联合分布函数为

121(,,

,)()n

n X i i F x x x F x ==∏. (6.1)

当X 为连续型随机变量且概率密度函数为()X f x 时,样本12,,,n X X X 的联合概率密度函数为

121

(,,

,)()n n X i i f x x x f x ==∏. (6.2)

当X 为离散型随机变量且概率分布为(){}X f x P X x ==(x 取遍X 的所有可能的取值)时,样本12,,,n X X X 的联合概率分布为

1211221(,,

,){,,

,}()n

n n n X i i f x x x P X x X x X x f x ======∏. (6.3)

例6.1 设总体X 服从参数为p 的0-1分布,则X 的概率分布为

1(){}(1),0,1x x X f x P X x p p x -===-=.

于是样本12,,,n X X X 的联合概率分布为

121(,,

,)()(1)n n n

s n s n X k k f x x x f x p p -==∏=-,

其中(1,2,

,)=k x k n 取1或0,而1

==∑n

n k k s x .

例6.2 设总体2

~(,)X N μσ,则样本12,,

,n X X X 的联合概率密度函数为

222

1

121

1

()()22 (,,,)()e n

i i i n

n X i i n

x x n

i f x x x f x μμσσ

==--

--==∏∑==.

6.1.4 直方图与条形图

1.直方图

在实际统计工作中,首先接触到的是一系列数据,样本数据的整理是统计研究的基础.整理数据最常用的方法之一是给出数据的频数分布表或频率分布表.在研究连续性随机变量总体的分布时,通常用由一组矩形组成的图形直观地表示频数、频率分布表,这个图形就称为样本的频率直方图,简称直方图.

绘制直方图的一般步骤见书P 135或新书P 165. 例6.3(P 136(新书P 166)) 2.条形图

如果样本数据很少,以及在研究离散型随机变量总体的分布时,一般用条形图来直观地反映频数、频率分布表.

条形图的制作方法:(1)统计出样本观测值12,,,n x x x 的频数与频率表;(2)在x 轴上的每个i x 处画出以样本数据中出现i x 的频数或频率为高度的一条线段.

例6.4(P 167) 6.1.5 经验分布函数

根据总体X 的样本值12,,,n x x x ,按如下方法可以得到一个函数.

将总体X 的样本观测值12,,,n x x x 由小到大重新排序为

1

2

(1)(1)(2)(2)()(),

,,,

,,,,

,,m

m m n n n x x x x x x

其中(1)(2)()m x x x <<<,12+++=m n n n n .定义函数

(1)()(1)1()0,,1

(),(1,2,

,1),1,.k n i k k i m x x F x n x x x k m n x x +=⎧<⎪⎪=≤<=-⎨⎪⎪≥⎩

∑ (6.4)

()n F x 称为总体X (关于样本观测值12,,

,n x x x )的经验分布函数或样本分布函数.

对于给定的样本值12,,,n x x x ,经验分布函数()n F x 与总体分布函数()F x 有类似的性质.

相关文档
最新文档