2基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、统计量和抽样分布
1. 统计量(statistic)
由样本去推断总体情况,需要对样本进行“ 加工”,这就要构造一些样本的函数,它把样本 中所含的(某一方面)的信息集中起来. 这种不含任何未知参数的样本的函数称为统 计量. 它是完全由样本决定的量.
1. 统计量(statistic)
定义6.1.2 (统计量) 设X 1 , 本空间中点( x1 , T T ( X1 , T ( X1 , T 或T ( X 1 , , X n为总体X的样本,T 为样 , xn )。若
1、总体与个体
•我们研究总体时,所关心的往往是总体某方面的特性
,这些特性又常常可以用一个或多个数量指标来反映.
•例如,在研究某高校学生生活消费状况时,关心的可
能是学生们每月的生活消费额,在研究某厂生产的灯泡 的质量时,关心的可能是这些灯泡的寿命和光亮度等. •这时总体指一个或多个数量指标,这些数量指标对我 们来说是不了解或者说是未知的,我们可以用一个或多
解:计算结果见下表: X(1) X(2) 1 3 X(3) 5 X(4) X(5) 6 10
x
s2 9.2
Dn* 9
5
2
3
2
5
6
8
7
9
8
10
5
7
6.4
6.8
6
7
2. 抽样分布(sampling distribution)
统计量是样本的函数,是随机变量,统计量的 分布称为抽样分布。 抽样分布是我们对总体X的分布函数或数字特 征进行估计与推断的最重要的工具。因此求出统计 量T(X1 , … , Xn)的分布函数是数理统计学的基本问 题之一。
2
2 1 2
1
2 1 2
2
1 1 2
1
1 1 2
2
2 1 2
2
2 1 2
1. 统计量(statistic)
由此可得 X(1) , X (2) , X (3) 的分布列如下:
X(1)
0
19/27
1
7/27
2
1/27
X(2)
0
7/27
1
13/27
2
7/27
p
X(3)
p
0
1/27
1
7/27
2
19/27
p
进而可得 X(1)与 X (2) 的联合分布如下:
X(2) 0 X(1) 0 7/27 9/27 3/27 1 2
1
2
0
0
4/27
0
3/27
1/27
P ( x(1) 0) P ( x(2)
19 7 7 0) ,而P ( x(1) 0, x(2) 0) 27 27 27
X (1)与X (2)并不独立
, xn )的实值函数,作样本函数
, X n ),T的取值记为t T ( x1 , , X n )为统计量。
, X n )也是一随机变量,且不带未知参数,则称
注:若无特别说明,本课程中所涉及到的样本的各种函 数T ( X 1 , 故T ( X 1 , , X n )一般均为多维连续函数, , X n )也是随机变量。
x1
0 0 0 1 0
x2 x3 x(1) x(2) x(3)
0 0 1 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 0 0 1 1 1 2
x1 x2 x3 x(1) x(2) x(3)
1 0 0 1 2 1 1 2 0 0 0 2 1 2 1 0 0 0 0 0 1 1 1 1 1 1 2 2 2 2
个随机变量来表示它们.
也就是说,总体可以用一个随机变量及其分布来描述.
1、总体与个体
例如,研究某批灯泡的寿命时,这批灯泡中每个 灯泡的寿命是我们所关心的指标. 用X表示这个指标 后,此总体就可以用随机变量X或其分布函数F(x)表 示. 类似地,在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重,我们用X和Y分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数F(x,y)来表示.
2、样本(sample)
抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体,必须考 虑抽样方法. 最自然的想法是,从总体中抽取的样本应 该是随机的,即每个个体都有同等概率被抽取 ,且具有代表性。
2、样本(sample)
最常用的一种抽样方法叫作“简单随机抽样”,
它要求抽取的样本满足下面两点:
第六章 抽样分布
内容提要
1.总体、个体、简单随机样本的概念 2.统计量的概念 3.经验分布与格列汶科定理 4.样本数字特征的分布 5.抽样分布定理
一、总体、个体和简单随机样本 1.总体和个体 总体(母体):某个问题研究对象的全体构成的集合。 个体:组成总体的每个基本单元。 例如,在研究某高校学生生活消费状况时,该校全体 学生就是一个总体,其中每一个学生是一个个体;在 人口普查中,总体是某地区的全体人口,个体就是该 地区的每一个人.
总体的要旨:总体就是一个 概率分布.
1、总体与个体
当总体分布为指数分布时,称为指数分布总体; 当总体分布为正态分布时,称为正态分布总体或简称 正态总体等等. 两个总体即使其所含个体的性质根本
不同,只要有同一的概率分布,则在统计学中就视为
是同类总体.
1、总体与个体
根据总体中包含个体的数量,可以将总体分为
1. 统计量(statistic)
例6.1.2 设X 1 , 观察值。
X x 1 2 3 3 2 8 1 6 3 10 7 9 5 2 10 6 8 5 X1 X2 X3 X4 X5
, X n为总体X的容量为5的样本,现对这
个样本作了三次观察,其值如下表,求 X , S 2 及Dn 的
1. 统计量(statistic)
抽到哪5辆是随机的
但是,一旦取定一组样本,得到的是5个具体 的数 (x1,x2,…,x5),称为样本的一次观察值,简称 样本值 .
2、样本(sample)
我们抽样后得到的资料都是具体的、确定的 值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变 量.
1. 统计量(statistic)
【例】设X1,X2,…,Xn是来自总体X的样本,X~
N(,
2),其中
1 2 、 为未知参数,则X1,
X1
min{ X1,X2,…,Xn }均为统计量,
1 n 但诸如 ( X i ) 2 , n i 1
1 X1 X 2 2 3
等均不是统计量。
1. 统计量(statistic)
定义6.1.4 (极差)设X 1 ,
n
, X n为总体X的样本,则称统计
量D X ( n ) X (1)为样本的极差。
注(1)极差是样本中最大值与最小值之差,反映 了样本观察值的波动幅度。
(2)极差同方差一样是反映观察值离散程度的数 量指标,且计算方便。 思考:“方差”与“极差”的优劣?
1. 统计量(statistic)
注: X (1) min( X 1 , X ( n ) max( X 1 , , X n ), 称为最小项统计量 , X n ), 称为最大项统计量
n 1 ( ) 2 n ( 1) 2
若n为奇数,则称X 若n为偶数,则称X
为样本的中值, 为样本的中值。
2、样本(sample)
(2)若总体的分布函数为F(x),则其简单随机 样本的联合分布函数为
F ( x1 , , xn ) F x1 F x2 F xn
3. 总体、样本、样本值的关系
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质. 样本是联系二者的桥梁 总体分布决定了样本取值的概率分布,因而可 以由样本值去推断总体.
其分布 各不相同
x1 0
x2 x3 x(1) x(2) x(3) 0 0 0 0 0
x1 x2 x3 x(1) x(2) x(3) 1 1 0 0 1 1
x1 x2 x3 x(1) x(2) x(3) 2 2 0 0 2 2
0
0 1
0
1 0
1
0 0
0
0 0
0
0 0
1Βιβλιοθήκη Baidu
1 1
0
0 1
1
2 0
2
1 2
0
0 0
1
1 1
2
2 2
1
1 2
1
2 1
2
1 1
1
1 1
1
1 1
2
2 2
0
0 2 0
0
2 0 1
2
0 0 1
0
0 0 0
0
0 0 1
2
2 2 1
2
1 2
0
2 1
1
0 0
0
0 0
1
1 1
2
2 2
1
2 2
2
1 2
2
2 1
1
1 1
2
2 2
2
2 2
0
2
2
0
2
2
0
0
2
2
2
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
1
0
1
1
1. 统计量(statistic)
有限总体和无限总体,当总体中包含个体的数量很大
时,我们可以把有限总体看成是无限总体.
例如,将一个啤酒厂某天生产的啤酒视为一个 总体,它是有限的. 而将一枚硬币连续不断地抛掷下去得到的所 有结果(正面、反面)视为一个总体,那么它是无 限的.
2、样本(sample)
在实际问题中,要考察整个总体往往是不可能 的,因为它需要耗费太多的资源和太多的时间. 有 些破坏性的试验更是不允许对整个总体进行考察.
样本,若X1,X2,…,Xn相互独立且每一个都是与总
体X有相同分布的随机变量,则称X1,X2,…,Xn为
总体X的容量为n的简单随机样本。
简单随机样本是应用中最常见的情形,今后,
当说到“X1,X2,…,Xn是取自某总体的样本”时,若
不特别说明,就指简单随机样本.
2、样本(sample)
注: (1)样本X1,X2, …,Xn也可用n维随机向量 (X1,X2,…,Xn )表示。记xi为Xi的一次观察值,并称 (x1 ,x2 , …,xn )为样本的一次观察值。 样本( X1,X2,…,Xn )的所有可能取值的全体称为 样本空间,它是n维空间,记作Ω。样本的一次观测 值(x1 ,x2 , …,xn )就是样本空间Ω 中的一个点,即 (x1 ,x2 , …,xn )∈ Ω
1. 统计量(statistic)
例6.1.1 设X 1 , , X n为总体X的样本,其容量为n,记
n 1 n 1 2 2 X X i ,S ( X i X ) n i 1 n i 1
则 X 及S 2都是统计量,
称 X 及S 分别为样本X1 ,
样本的观察值为x1 ,
2
, X n的平均值及方差,
x1 x2 x3 x(1) x(2) x(3)
2 1 1 2 1 2 1 2 1 2 0 2 1 1 2 0 1 1 1 1 2 1 1 1 2 2 2 2 2 2
0 2
0 1
2 0
1 0
0 0
1 1
0 0
0 0
0 0
1 1
2 2
1 1
1
2 0 2
2
1 2 0
0
0 2 2
0
0 0 0
1
1 2 2
2
2 2 2
1. 代表性: X1,X2,…,Xn中每一个与所考察的总体 有相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
2、样本(sample)
由简单随机抽样得到的样本称为简单随机样
本,它可以用与总体独立同分布的n个相互独立
的随机变量X1,X2,…,Xn表示. 定义6.1.1 设X1,X2,…,Xn为来自总体X的容量为n的
一个可行的办法是从该总体中,按一定的规则 抽取若干个个体进行观察和试验,以获得有关总体 的信息. 这一抽取过程称为 “抽样”,所抽取的部 分个体称为样本. 样本中所包含的个体数目称为样 本容量.
2、样本(sample)
从国产轿车中抽5辆进行油耗试验,样 本容量为5.
2、样本(sample)
注意: 样本是随机变量.
, xn, X 及S 2的观察值分别记作
n 1 n 1 2 2 x xi , s ( xi x ) n i 1 n i 1
1. 统计量(statistic)
注:一般,大写的S 2表示统计量,小写的s 2表示统计 量S 2的观察值。
1. 统计量(statistic)
定义6.1.3 (顺序统计量)设X 1 , 由样本建立n个函数 X (k ) X (k ) ( X1 , , X n ), k 1, 2, ,n 其中X ( k )为这样的统计量,它的观察值为x( k ) , x( k )为样本 X 1, ,X n的观察值x1, ,xn中由小至大排列 (即x(1) x( k ) x( n ) )后的第k 位数值,则称X (1), X (2), ,X ( n )为顺序统计量 , X n为总体X的样本,现
1. 统计量(statistic)
思考:
若X1 , X 2 , , X n是来自总体X的样本,那么X (1) , X (2) , , X ( n)
是否相互独立呢?
1. 统计量(statistic)
例 设总体 X 的分布如下:
X p 0 1/3 1 1/3 2 1/3
现抽取容量为 3 的样本, 共有 27 种可能取值, 列表如下