4-1统计量和抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[t i , t i t ), t b a ( i 1,, m ); m
ni (3) 求组频数 ni , 组频率 f i , 及 n fi hi , ( i 1,2,, n); t (4) 在 [t i , t i t ]上以 hi 为高, t 为宽作小矩形,
n
1 体的实数值, 用小写字母,如: x
x n
i 1
n
i
等.
2. 几个常见统计量
它反映了总体均值 的信息
1 n 样本均值 X X i n i 1 n 2 样本方差 S 2 1 ( Xi X ) n 1 i 1
样本标准差:
1 n 2 S (Xk X ) n 1 k 1 1 n 2 修正样本方差: S 2 (Xk X ) 0 n k 1
2. 样本的数学描述 为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数目称为样本容量.
从国产轿车中抽5辆 进行耗油量试验
样本容量为5
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机向量. 但是,一旦取定一组样本,得到的是n个具体的 数 x1 , x2 ,, xn ,称为样本的一次观察值,简称样 本观测值 . 样本的双重含义:泛指一次抽样结果 X 1 , X 2 ,, X n n维随机向量;指某次具体抽样结果 x1 , x 2 ,, x n 是一个n维向量,称为样本的一个观测值。
i i i i
fi t
201.5 ~ 204.5 204.5 ~ 207.5 207.5 ~ 210.5 210.5 ~ 213.5 213.5 ~ 216.5 216.5 ~ 219.5 219.5 ~ 222.5
14 20 23 22 14 8 6 120
14 / 120 20 / 120 23 / 120 22 / 120 14 / 120 8 / 120 6 / 120 1
第四章、抽样分布
从本章起转入课程的第二部分 数理统计
数理统计的特点是应用面广,分支较 多. 社会的发展不断向统计提出新的问题.
引言 从本章节开始,我们将讲述数理统计的基本内容. 数 理统计作为一门学科诞生于19世纪末20世纪初, 是具 有广泛应用的一个数学分支, 它以概率论为基础,根 据试验划观察得到的数据, 来研究随机现象,以便对 研究对象的客观规律性作出合理的估计和判断. 由于 大量随机现象必然呈现出它们的规律性, 故理论上只 要对随机现象进行足够多次观察, 则研究对象的规律 必就一定能清楚地呈现出来, 但实际上人们常常无法 对所研究的对象的全体(或总体) 进行观察,而只能抽
X 1 , X 2 , X n 为简单的随机样本,简称样本。
简单随机样本是应用中最常见的情形, 今后,当说到“X1,X2,…,Xn是取自某总体的样 本”时,若不特别说明,就指简单随机样本. 3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、 确定的值. 如我们从某班大学生中抽取10人测 量身高,得到10个数,它们是样本取到的值而 不是样本. 我们只能观察到随机变量取的值而 见不到随机变量.
b 222.5,
将区间
206 217 214 201 212 213 211 212 216 206 210 216 204 221 208 209 214 214 199 204 211 201 216 211 209 208 209 202 211 207 220 205 206 216 213 206 206 207 200 198
确定 值的随机性而使分布显得杂乱. 因此, 分组时, 分组数(或组距)应以突出分布的特征并冲淡样本的 随机波动性为原则. 区间所含的样本值个数称为该
区间的组频数. 组频数与总的样本容量之比称为组
频率. 2. 频率直方图:频率直方图能直观地表示出组频 率的分布. 其步骤如下: 设 x1 , x2 ,, xn 是样本 的 n 个观察值. (1) 求出 x1 , x2 ,, xn 中 的最小者 x(1) 和最 大者 x(n ) ; 和 (略大于 x( n )), 并 (略小于 x(1) ) b (2) 选取常数 a 将区间 [a , b] 等分成 m 个小区间 (一般取 m 使 m / n 在 1 / 10左右, 且小区间不包含右端点):

不是该样本的统计量, 因其含有总体分布中的未知 参数 .
注: 样本 X 1 , X ,, X n 是 n 维随机向量,统计量是 这个随机向量的函数,用大写字母, 如: X 1
体取定一组观察值 x1 ,, xn 时,统计量就是一个具
n i 1
X i 等;但是,当样本 X 1 , X ,, X n 具
最常用的一种抽样方法叫作“简单随机抽 样”,它要求抽取的样本满足下面两点: 1.代表性: X1,X2,…,Xn中每一个与所考察的总 体有相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量. 定义1 设总体X具有分布函数 F ( x ), X 1 , X 2 , X n 是来自总体X的样本,若 X 1 , X 2 , X n 相互 独立,且每一个 X k与X有相同的分布,则称
[189.5, 222.5]
等分成11个小区间, 组距 t 3.
例1 从某厂生产的某种零件中随机抽取120个, 测得 其质量(单位:g)如下表所示, 列出分组表, 并作频率 区间 组频数n 组频率f 高h f / t 直方图. 189.5 ~ 192.5 1 1 / 120 1 / 360 解 得到分组表及频 192.5 ~ 195.5 2 2 / 120 2 / 360 195.5 ~ 198.5 3 3 / 120 3 / 360 率直方图. 198.5 ~ 201.5 7 7 / 120 7 / 360
14 / 360 20 / 360 23 / 360 22 / 360 14 / 360 8 / 360 6 / 360
质量 t
合计
从直方图的形状, 可以粗略地认为该种零件的质量 服从正态分布, 其数学期望在209附近.
经验分布函数
定义2 设总体 X 的一个容量为 n 的样本的样本值 x1 , x2 ,, xn 可按大小次序排列成
与事件 { X x } 在 n 独立重复试验中的频率相同的, 称 Fn ( x ) 为经验分布函数.
注:样本的频率直方图可以形象地描述总体的概率 分布的大致形态,而经验分布函数则可以用来描述 总体分布函数的大致形状. 对于上述经验分布函数 有下列结论(格里汶科, 1933):
P{lim supБайду номын сангаасFn ( x ) F ( x ) 0} 1. n
x(1) x( 2 ) x( n ) .
若 x( k ) x x( k 1) , 则不大于 x 的样本值的频率为
k / n.
因而函数
x x(1) 0, Fn ( x ) k / n, x( k ) x x( k 1) , 1, x x(n )
例如:研究某批灯泡的寿命时,关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,或用其分布函数F(x)表示.
F(x)
总体
寿命X可用一概 率分布来刻划
某批 灯泡的寿命
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状 况时,若关心的数量指标是身高和体重,我 们用X和Y分别表示身高和体重,那么此总体 就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示. 统计中,总体这个概念 的要旨是:总体就是一个 概率分布.
某批 灯泡的寿命 国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
国产轿车每公里耗油 量的全体就是总体
由于每个个体的出现是随机的,所以相 应的数量指标的出现也带有随机性. 从而可 以把这种数量指标看作一个随机变量,因此 随机变量的分布就是该数量指标在总体中的 分布. 这样,总体就可以用一个随机变量及 其分布来描述.
x
由此结果,对于任一实数 x , 当 n充分大时, 经验分布函数的任一个观察值 F( n ) ( x ) 与总体分布
函数 F ( x ) 只有微小的差别, 从而在实际中可当作
F ( x ) 来使用. 这就是由样本推断总体其可行性
的最基本的理论依据.
二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本值 进行“加工”,这就要构造一些样本的函数 ,它把样本中所含的(某一方面)的信息集 中起来. 定义2 X 1 , X 2 ,, X n 设是来自总体X的一个样 本, ( X 1 , X 2 ,, X n ) 是一个连续函数,如果g g 中不包含任何未知参数,则称 g( X 1 , X 2 ,, X n ) 是 X 1 , X 2 ,, X n 的一个统计量。
§4.1 统计量
一、总体与样本 1.总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅 是关心其每个个体的一项(或几项)数量指标 和该数量指标在总体中的分布情况. 这时, 每个个体具有的数量指标的全体就是总体.
例如,设总体 X 服从正态分布, ( X ) 5, E
D( X ) , 未知. X 1 , X ,, X n 为总体的一个样
2 2
Sn Sn X 1 X 2 X n , X , n n( X 5) 则 Sn 与 X 均为该样本的统计量, U 但
本, 令
其面积恰为 f i , 所有小矩形合在一起就构成了频率 直方图.
例1 从某厂生产的某种零件中随机抽取120个, 测得 其质量(单位:g)如下表所示, 列出分组表, 并作频率 直方图. 200 202 203 208 216 206 222 213 209 219 216 203 197 208 206 209 206 208 202 203 解 先从这120个样 206 213 218 207 208 202 194 203 213 211 本值中找出最小值 193 213 208 208 204 206 204 206 208 209 213 203 206 207 196 201 208 207 213 208 190, 最大值 222, 210 208 211 211 214 220 211 203 216 221 211 209 218 214 219 211 208 221 211 218 取 a 189.5, 218 190 219 211 208 199 214 207 207 214
取其中的部分(或样本) 进行观察或试验以获得有限的 整理有 怎样有效地收集、 数据. 数理统计的任务包括: 研 限的数据资料; 怎样对所得的数据资料进行分析、
作出合理的推断, 究, 从而对研究对象的性质、特点,
此即所谓的统计推断问题, 本课程主要讲述统计推断 的基本内容.
由于学时有限,课程的的这部分内容我 们只介绍理论部分,即抽样分布。至于具体 的方法,学生可以自己推导并学会处理问题。
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去 推断总体的情况---总体分布F(x)的性质. 样本是联系二者的桥梁 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
分组数据统计表和频率直方图 通过观察或试验得到的样本值,一般是杂乱无章的, 需要进行整理才能从总体上呈现其统计规律性,分 组数据统计表或频率直方图是两种常用的整理方法. 1. 分组数据表:若样本值较多时, 可将其分成若干 则 组, 分组的组数应与样本容量相适应. 分组太少, 难以反映出分布的特征, 分组太多,则由于样本取
相关文档
最新文档