6.1 总体、样本与统计量
概率论与数理统计(06)第6章 统计量及其抽样分布
![概率论与数理统计(06)第6章 统计量及其抽样分布](https://img.taocdn.com/s3/m/03e46414f18583d0496459dd.png)
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第6章(公共数学版)
![概率论与数理统计第6章(公共数学版)](https://img.taocdn.com/s3/m/2687e6693868011ca300a6c30c2259010302f343.png)
Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2
自考概率论统计量及其分布
![自考概率论统计量及其分布](https://img.taocdn.com/s3/m/b18e39840408763231126edb6f1aff00bed570d2.png)
在有限总体中要得到简单样本, 必须进行重复抽样.但当总体中个体数相对于 注 样本容量充分大时,不重复抽样得到的样本也可近似看作简单样本.
第5页/共28页
三、样本的分布
设总体X的分布函数为F(x),(X1, X2, … , Xn)是来自总体的样本, 则(X1, X2, … , Xn)的分布函数为
F( x1, x2, … , xn ) = F(x1) F(x2) … F( xn) 离散型:X~P(X=xi)=pi i=1,2,…则样本(X1 ,X2 ,…,Xn)的分布为:
P(X1=x1,X2=x2,…Xn=xn)=P(X=x1)P(X=x2)…P(X=xn)
连续型: X ~f(x),则样本 (X1, X2, … , Xn) 的密度函数为: f (x1,x2, … , xn) = f(x1) f(x2) … f( xn)
样本从总体带出的信息
统计推断:分析样本数据
是分散的、零乱的 统计量 对总体的分布作出结论
样本二重性: 容量为n 的样本 (X1, X2, … , Xn)
试验后 ( x1, x2, …xn )
由于试验的随机性,样本是 n维随机变量
数据=样本观测值n维常 数向量
简单随机样本:设取自总体X的样本(X1, X2, … , Xn)满足: (1) 每个Xi 与总体X同分布(代表性); (2) X1, X2, … , Xn相互独立(独立性). 则称 样本(X1, X2, … , Xn) 为简单随机样本,简称为样本.
1 n1
n i1
(Xi
X
)2
样本标准差 : S
S2
1 n 1
n i1
(Xi
X
)2
样本k阶原点矩:
Ak
样本及抽样分布
![样本及抽样分布](https://img.taocdn.com/s3/m/eb79b9c10740be1e640e9a39.png)
样本及抽样分布§6.1 基本概念一、总体:在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。
我们只研究感兴趣的某个或者几个指标(记为X),因此把这些指标的分布称为总体的分布,记为X~F(x)。
二、样本:设总体X具有分布函数F(x),若X1, X2,…,Xn是具有分布函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本,它们的观察值x1,x2, …, xn称为样本观察值, 又称为X 的n 个独立的观察值。
三、统计量:设X 1, X 2, …, X n 是来自总体X 的一个样本, g (X 1, X 2, …, X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,…,X n )为统计量。
统计量是样本的函数,它是一个随机变量,如果x 1, x 2, …, x n 是样本观察值, 则g (x 1, x 2, …, x n )是统计量g (X 1, X 2, …, X n )的一个观察值.四、 常用的统计量:, ,)(x 11s ,,x 1x 1. n12i2n1i 称为样本方差均值仍称为样本它们的观察值为∑∑==--==i i x n n .B ,,1,2,X A ,1k 2.22221S S nn B k ≈-====当样本容量很大时时当时当3.kkkk若总体X 的k 阶矩E(X )存在,则当n时, A .P注:ni i 111. X X ;n ==∑样本均值2n 2i i 112. S (X );n-1X ==-∑样本方差n kk i 113. k A X , k 1, 2,;n i ===∑样本阶原点矩nk i i 114. k B (X ) , k 2, 3,.n k X ==-=∑样本阶中心矩4.样本的联合分布:2) 若总体X 是离散型随机变量,其分布律为 p x =P (X=x ) , x=x 1,x 2,… 则样本X 1, X 2, …, X n 的联合分布:11112(,,)(),,;(1,2,,)nn n i i i i P X y X y P X y y x x i n =======∏其中12n *12i 13)(), ,X , (, ,)()n n i X f x X X f x x x f x ==∏若具有概率密度则的联合概率密度为12121211)(),,,,, ,,,:()()n n n*n i i X ~F x X X X F X X X F x , x ,x F x ==∏若为的一个样本则的联合分布函数为例1:X~U (0,θ),X 1, X 2, …, X n 是来自X 的样本,求(X 1, X 2, …, X n )的联合密度函数。
总体、样本、统计量
![总体、样本、统计量](https://img.taocdn.com/s3/m/34cdc9bed5d8d15abe23482fb4daa58da1111c5c.png)
图5-2所示。
图5-2
3. χ统2 计量
定义7 设 X ∼N ( , 2 ) ,( X1 ,X 2 , ,X n ) 是X的一个样本,则
称
(n 1)s2
2
为
χ2
统计量,且
χ2
(n 1)s2
2
∼ χ2 (n
1)
。
类似于标准正态分布,对给定的 (0 1),称满足条件
P{[ χ 2 χ12 (n 1)]
称 X 为 t 统计量,且 t X ∼t(n 1) 。
s/ n
s/ n
类似于标准正态分布,对给定的 (0 1),称满足条件
P{| t | t (n 1)}
2
的点 t (n 1) 为t分布的双侧 a 分位点或 2
双侧临界值,自由度为 n 1。
同样可以查t分布临界值表(附表
Ⅲ),得临界值 t (n 1) ,其几何意义如
例如,若 X ∼N ( n 是总体X
的一个样本,则
1 n
n i 1
n
Xi ,
i 1
n
X
2 i
,
i 1
(Xi
4)2, 1 n 1
n i 1
(Xi
X )2 ,等
均为统计量;而
n
(Xi
i 1
n
),
i 1
Xi
2
均不是统计量。这是因为
若样本 X1 ,X 2 , ,X n相互独立,且与总体X同分布,则称 此样本为简单随机样本,简称样本。
1.2 统计量
定义4 设 ( X1 ,X 2 , ,X n ) 是总体X的一个样本,f ( X1 ,X 2 , ,X n )是一个 连续函数,如果 f ( X1 ,X 2 , ,X n )中不包含任何未知参数,则称 f ( X1 ,X 2 , ,X n )为一个统计量。当 ( X1 ,X 2 , ,X n ) 取完一组观测值 (x1 ,x2 , ,xn ) 时,f ( X1 ,X 2 , ,X n ) 就是统计量的一个观测值。
统计量和抽样分布
![统计量和抽样分布](https://img.taocdn.com/s3/m/20428394866fb84ae45c8dbf.png)
4
⑴
X
2 i
;
i 1
⑵
1 4
4 i1
Xi 2;
1 4
2
⑶
2 i 1
Xi X
.
解
由定义即知⑵不是统计量, 而⑴⑶是.
同济大学数学系&人民邮电出版社
一、样本均值和样本方差
第6章 统计量和抽样分布 22
设 X1, X 2 ,L , X n 为取自总体的一个样本,称
⑴样本均值
1n X n i1 Xi
由此可得:
M 2 1 n n i1
Xi X
2 =ˆ Sn2 ,
相应的观测值
Sn
1n n i1
Xi X
2
sn2
1 n
n i 1
xi x 2,sn
1n n i1
xi x
2
同济大学数学系&人民邮电出版社
一、样本均值和样本方差
第6章 统计量和抽样分布 25
注 S 2 , Sn2 在计算时的另一表达形式:
分别求 E
X
,D
X
,E
S2
,
E
1 n
n i 1
X
2 i
.
(1) X ~ B(1, p) ;(2) X ~ E() ;(3) X ~ U (0,2 ), 其中 0 .
解 由定理可得
E X E X ˆ , D X D X ˆ 2 , nn
E S 2 D X 2,
统计量的定义
第6章 统计量和抽样分布 20
不含有未知参数的样本的函数 g X1,L , Xn 称为统计量.
例1 假设总体 X ~ U 0, , X1, X 2,L , X n 为取自该 总体的一个样本,
总体和样本抽样,统计量
![总体和样本抽样,统计量](https://img.taocdn.com/s3/m/8a78c440fe4733687e21aa73.png)
数理统计以概率论为基础,通过试验数据分 析推断随机现象的统计规律性
例1
某企业要了解生产的电视机显象管平
均使用寿命. 使用寿命是一个随机变量,设为 X .
为求 E(X) , 从产品中抽取一部分,进行寿命测试,
根据测试数据对所有显象管寿命的均值作出推断. 例2 某城市要了解居民的日常生活消费水
样本容量 —— 样本中分量的个数(即样品的个数).
抽样 —— 从总体中取出个体. 简单随机抽样 —— 满足以下条件的抽样方法: (1) 总体中每个个体被抽到的机会是均等的;
(2) 在抽取一个个体后, 不影响其它观察结果.
简单随机抽样就是独立地重复地做一系列随机
试验 .
简单随机样本 (简称样本)—— 简单随机抽样得到的样本.
第二节:统计量
定义4.3
设 ( X1 , X 2 , , Xn ) 是总体 X 的一
个 样本,f ( X1 , X 2 , , Xn ) 是不含参数的n 元连 续函数,则称f ( X1 , X 2 , , Xn ) 为一个 统计量.
统计量是随机变量,若X1 , X 2 , , Xn 是样 本的一组观测值,则 f ( X1 , X 2 , , Xn ) 是统计 量的一个观测值 .
则称为容量为n 的简单随机样本,简称样本。 记为x1,„ , xn
样本 —— 若干个样品组成的集合.
样本值 —— 抽取 n 个样品得到的一组观测值,
用 ( X1 , X 2 , , Xn ) 表示 .
需要注意:样本 ( X1 , X 2 , , X n ) 具有双重含义, 有时泛指任一次抽测结果,是一组随机变量, 也有时表示某次具体抽测结果,即样本值, 是一组实数.
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/05c4af2666ec102de2bd960590c69ec3d5bbdbfd.png)
数理统计的基本概念第6章数理统计的基本概念6.1 内容框图6.2 基本要求(1)理解总体、样本及统计量的概念,并熟练掌握常⽤统计量的公式.(2)掌握矩法估计和极⼤似然估计的求法,以及估计⽆偏性、有效性的判断. (3)掌握三⼤抽样分布定义,并记住其概率密度的形状.(4)理解并掌握有关正态总体统计量分布的⼏个结论,如定理6.4~6.9及定理6.11.6.3 内容概要1) 总体与样本在数理统计中,我们把作为统计研究对象的随机变量称为总体,记为ξ,η,… 。
对总体进⾏ n 次试验后所得到的结果,称为样本,记为(n X X X ,,,21 ),(n Y Y Y ,,,21 ),……,其中,试验次数 n 称为样本容量。
样本(n X X X ,,,21 )中的每⼀个 i X 都是随机变量。
样本所取的⼀组具体的数值,称为样本观测值,记为总体与样本统计量点估计矩阵估计常⽤统计量定义统计量的分布正态总体统计量的分布极⼤似然估计点估计的评价三⼤抽样分布(n x x x ,,,21 )。
具有性质:(1)独⽴性,即 n X X X ,,,21 相互独⽴。
(2)同分布性,即每⼀个 i X 都与总体ξ服从相同的分布。
称为简单随机样本。
如果总体ξ是离散型随机变量,概率分布为 }{k P =ξ,那么样本(n X X X ,,,21 )的联合概率分布为∏∏=========ni i ni i in n x P x XP x X x X x X P 112211}{}{},,,{ξ。
如果总体ξ是连续型随机变量,概率密度为 )(x ?,那么样本(n X X X ,,,21 )的联合概率密度为∏∏====ni i ni i X n x x x x x i1121)()(),,,(*??。
如果总体ξ的分布函数为 )(x F ,那么样本(n X X X ,,,21 )的联合分布函数为∏∏====ni i n i i X n x F x F x x x F i 1121)()(),,,(* 。
总体,样本与统计量
![总体,样本与统计量](https://img.taocdn.com/s3/m/466f088bddccda38366baf32.png)
这是由于
n
(Xi X) 0
i1
在 X 确定后, n 个偏差 X 1X ,X 2X , ,X nX中 只有n-1个可以自由变动.
定理 2 设 X1 , X 2……, Xn 是取自某总体 X 的样本,且 X 具 有二阶矩,即
EX ,D X2,
由简单随机抽样得到的样本称为简单随机样本它可以看成是n个相互独立且与总体同分布的随机变量x2简单随机抽样简单随机样本是应用中最常见的情形今后当说到是取自某总体的样本时若不特别说明就指简单随机样本
第二章 统计概念
第一节 总体、样本与统计量 第二节 顺序统计量、经验分布函数
第三节 抽样分布 第四节 应用案例
样本
样本值
统计是从手中已有的资料—— 样本值,去推断 总体的情况——总体分布 F(x) 的性质.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是样本 取到样本值的规律,因而可以由样本值去推断总体.
3. 常用统计量
3.1 定义
定义 设 X1 ,…, Xn 是来自总体 X 的一个样本,若样 本函数 T = T( X1,…, Xn ) 不含任何未知参数,则称 T 是一个统计量。 统计量的分布称为抽样分布。
就指简单随机样本.
若总体 X 的分布函数为 F(x) , 则其简单随机样本 ( X1, X2, …, Xn ) 的联合分布函数为
n
F(x,x2, ,xn) F(xi) =F(x1) F(x2) … F(xn) i1
若总体 X 为离散型, 分布列为
P ( X x k ; ) p ( x k ; ) , k 1 , 2 , . . . . ,为 分 布 中 的 未 知 参 数 ,
概率论与数理统计第六章
![概率论与数理统计第六章](https://img.taocdn.com/s3/m/57e6911b43323968011c923f.png)
Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。
数理统计第六章
![数理统计第六章](https://img.taocdn.com/s3/m/e53aac70f242336c1eb95e13.png)
称为自由度为n的χ 2 − 分布.
2.χ 分布的密度函数f(y)曲线 分布的密度函数f(y) 2.χ2—分布的密度函数f(y)曲线
n −1 − y 1 n/2 y2 e 2, y > 0 f ( y ) = 2 Γ(n / 2) 0, y≤0
3. 分位点 设X ~ χ2(n),若对于α:0<α<1, α α , 存在
不是
1 2 2 2 T6 = 2 ( X 1 + X 2 + X 3 ). σ
2. 几个常用统计量的定义
设 X 1 , X 2 ,L, X n 是来自总体的一个样本 , x1 , x2 ,L, xn 是这一样本的观察值 . 1 n (1)样本平均值 样本平均值 X = ∑ Xi; n i =1 1 n 其观察值 x = ∑ x i . n i =1
设 x1 , x2 ,L, xn 是相应于样本 X 1 , X 2 ,L, X n 的样本值 , 则称 g ( x1 , x2 ,L, xn ) 是 g ( X 1 , X 2 ,L, X n ) 的观察值 .
实例1 实例 设 X 1 , X 2 , X 3是来自总体 N ( µ ,σ 2 )的一个
2.基本性质 2.基本性质: 基本性质 f(t)关于t=0(纵轴 对称。 关于t=0(纵轴) (1) f(t)关于t=0(纵轴)对称 f(t)的极限为N(0,1)的密度函数 的极限为N(0 的密度函数, (2) f(t)的极限为N(0,1)的密度函数,即
lim f ( t ) = ϕ ( t ) =
f * ( x1 , x 2 , L , x n ) =
例1 设总体 X 服从参数为 λ (λ > 0) 的指数分
第六章样本与统计量
![第六章样本与统计量](https://img.taocdn.com/s3/m/6e5a1f225727a5e9856a6136.png)
因此,数理统计中的方法和支持这些方法的相应理论 是相当丰富的。概括起来可以归纳成两大类。 参数估计: 根据数据,对分布中的未知参数进行估计; 假设检验: 根据数据,对分布的未知参数的某种假设进 行检验。 参数估计与假设检验构ቤተ መጻሕፍቲ ባይዱ了统计推断的两种基本形式, 这两种推断渗透到了数理统计的每个分支。
§6.2 总体与样本
例2:用一把尺子测量一件物体的长度。 假定 n 次测量值分别为X1,X2 ,…,Xn.显然,在该问题中, 我们把测量值X1,X2,…,Xn看成样本。但总体是什么呢? 事实上,这里没有一个现实存在的个体的集合可以 作为上述问题的总体。可是,我们可以这样考虑,既然 n 个测量值 X1,X2,…,Xn 是样本,那么,总体就应该理 解为一切所有可能的测量值的全体。 又如:为研究某种安眠药的药效,让 n 个病人同时服用这 种药,记录服药者各自服药后的睡眠时间比未服药时增加 睡眠的小时数: X1,X2,…,Xn, 则这些数字就是样本。 那么,什么是总体呢? 设想让某个地区(或某国家,甚至全世界)所有患失眠 症的病人都服用此药,则他们所增加睡眠的小时数之全体 就是研究问题的总体。
1
1.2
n4 N
1.5
n5 N
例4 ( 例2续 ):在例2中,假定物体真实长度为 (未知)。一般说来,测量值X就是总体,取 附近值的概率要大一些,而离 越远的值被取 到的概率就越小。 如果测量过程没有系统性误差,则X取大 于 和小于 的概率也会相等。 在这种情况下,人们往往认为X 服从均值 为,方差为2 的正态分布。2反映了测量的 精度。于是,总体X的分布为 N(,2)。
说明:这里有一个问题,即物体长度的测 量值总是在其真值 的附近,它不可能取负值。 而正态分布取值在(-∞,∞)上。那么,怎 么可以认为测量值X服从正态分布呢? 回答这个问题,有如下两方面的理由。 (1).在前面讲过,对于X∼N(,2), P{-3<X<+3}=0.9974. 即 X 落在区间(-3,+3)之外的概率不超过 0.003, 这个概率非常小。X 落在(-4,+4) 之外的概率就更小了。
§6.1 总体、样本和统计量
![§6.1 总体、样本和统计量](https://img.taocdn.com/s3/m/eca72d225901020207409c61.png)
总体(母体 总体 母体): 具有某一特征的研究对象的全体所构成的集合 母体 总体可以是动物,植物,岩石,股票,商品,试验数据, 书本,人口等等. 个体: 个体 组成总体的各个成员 总体容量: 总体容量 总体中包含的个体总数目
总体的数学描述: 我们可以注意到,总体的每个个体都会相联系着一个或几个数字或具体特征 总体的每个个体都会相联系着一个或几个数字或具体特征. 总体的每个个体都会相联系着一个或几个数字或具体特征 我们感兴趣的也正是这些数字或特征.有时候我们把不同特征也用不同的数字表示. 所以我们用一个字母来表示总体.例如用 表示袁隆平新水稻品种的亩产量.如果 例如用X表示袁隆平新水稻品种的亩产量 例如用 表示袁隆平新水稻品种的亩产量.如果X 的取值是一个定值,那么我们只要种一块试验田,就可以得出全部信息, 的取值是一个定值,那么我们只要种一块试验田,就可以得出全部信息,不需要归 纳推理,也就不需要数理统计了. 纳推理,也就不需要数理统计了.事实上,只要总体不只有一个个体,X的取值就不 只一个.任意作一次实验,观测或测量,可以看到X可能取这样的值,也可能取那样 的值.所以我们应该把 看作是一个随机变量 所以我们应该把X看作是一个随机变量 所以我们应该把 看作是一个随机变量.当然,如果我们知道这个随机变量的 分布,也不需要用再去种实验田,调查数据,研究袁隆平新水稻品种的亩产量了, 因为其特性我们已经完全了解了. 所以,在数理统计中,我们把研究对象全体叫做总体,并且抽象地将总体看 在数理统计中,我们把研究对象全体叫做总体, 在数理统计中 作是一个随机变量或随机向量,用大些英文字母X, , 等表示 等表示. 作是一个随机变量或随机向量,用大些英文字母 ,Y,Z等表示.数理统计的 一个基本前提是:总体分布未知.
今后,我们把观测到的有关事实叫做数据.用传统的语言说,数理 统计学就是关于数量信息的收集,整理和分析的学科. 严格地说,数理统计学就是应用概率论的理论, 从实际观察资料出发, 严格地说,数理统计学就是应用概率论的理论 从实际观察资料出发 对随机现象所蕴含的内部规律进行分析及推断的一门学科 基本任务:研究如何有效地收集, 基本任务:研究如何有效地收集,整理和分析受随机因素影 响的数据, 并对所考察的问题做出推断和预测,直至 响的数据 并对所考察的问题做出推断和预测 直至 为采取决策和行为提供建议和依据 在今天高度复杂的世界里,数理统计变得越来越重要了.即使作 为一个普通公民,在很多方面,从经济状况到判断一种牙膏的好 坏,都会受到大量数字的困扰,如果不具有一定的统计学知识, 很难做出明智的决定.如果你在接受高的教育,学习政治,经济, 商业,保险,金融,广告,或者是物理,化学,医学,卫生,等 等,你会发现统计学是多么重要.
6.1.数理统计的基本概念
![6.1.数理统计的基本概念](https://img.taocdn.com/s3/m/59abbd610166f5335a8102d276a20029bd646390.png)
对容量较小的样本可分为5-6组,容量100左右的可分7-10组,
容量200左右的可分9-13组,容量300左右及以上的可分12-20 组,目的是使用足够的组来表示数据的变异。本例中只有20个 数据,我们将之分为5组,即k=5。
(2) 确定每组组距:每组区间长度可以相同也可以不同,实用中 常选用长度相同的区间以便于进行比较,此时各组区间的长度 称为组距,其近似公式为:
频数fi
3
4
8
3
2
试写出此分组样本的经验分布函数。
解:由经验分布函数的定义得到
0
0.15
Fn
(
x)
0.35 0.75
0.9
1
x 37.5 37.5 x47.5 47.5 x57.5 57.5 x67.5 67.5 x77.5 x 77.5
例6 以下是一组来自标准正态分布总体的样本的观测值: -1.4462 , -0.7012 , 1.2460 , -0.6390 , 0.5774 , -0.3600 , -0.1356, -1.3493 , -1.2704 , 0.9846
13
100—110
105
16
110—120
从总体X中抽取一个个体,就是对总体X进行一次观察并记 录其结果。取样是随机的,且观察前无法预知起结果,故每 个观察结果都是随机变量,且与总体同分布。
定义 1 在相同的条件下,对总体X进行n次重复的、独立的 观察,得到n个结果 X1, X 2 , , X n ,称随机变量X1, X 2 , , X n 为来自总体X的容量n的简单随机样本,简称样本。其观测值
641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值,对应的总体为该厂生产 的瓶装啤酒的净含量。
总体、样本和统计量的含义
![总体、样本和统计量的含义](https://img.taocdn.com/s3/m/fdf818cff80f76c66137ee06eff9aef8941e4838.png)
总体、样本和统计量的含义总体、样本和统计量是统计学中的基本概念,它们在研究数据时起着至关重要的作用。
本文将深入论述这三个概念的含义,并列出相应的公式,最后通过举例进行说明。
一、总体总体是指研究对象的全体,也可以理解为我们想要了解的整个现象。
例如,我们要研究全国100个城市的平均工资水平,那么总体就是这100个城市的所有居民的工资。
总体的计算公式为:总体容量=城市数量×每个城市的人口数量二、样本样本是从总体中抽取的一部分个体,用于对总体进行研究和分析。
样本的大小取决于我们的研究目的和资源限制。
例如,我们要研究全国100个城市的平均工资水平,那么我们可以从每个城市中随机抽取一定数量的居民作为样本,例如抽取500个样本。
样本的计算公式为:样本容量=样本数量三、统计量统计量是用来描述样本特征的数值指标,它可以帮助我们了解样本的总体特征。
例如,我们可以计算每个城市的平均工资、平均工资的标准差等统计量。
四、总体、样本和统计量的关系1. 总体容量与样本容量的关系:总体容量=样本容量×(总体中每个个体被抽到的概率)2. 样本均值与总体均值的关系:样本均值=总体均值×(总体中每个个体被抽到的概率)/样本容量3. 样本标准差与总体标准差的关系:样本标准差=总体标准差×(总体中每个个体被抽到的概率)/样本容量五、举例说明假设我们要研究全国100个城市的平均工资水平,采用分层抽样的方法,从每个城市中抽取50个居民作为样本。
现在我们来计算各个统计量。
1. 总体容量:总体容量=100×(1-(1-0.5)^50)=100×(1-0.957423)=26.38≈26(单位:万元)2. 样本容量:样本容量=50×100=5000(单位:人)3. 计算每个城市的平均工资:由于我们只关心平均工资这个统计量,所以我们可以直接用每个城市被抽到的居民的工资之和除以样本容量得到平均工资。
概率论与数理统计6.第六章:样本及抽样分布
![概率论与数理统计6.第六章:样本及抽样分布](https://img.taocdn.com/s3/m/9693305dc850ad02de80414c.png)
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计基本概念
两类工作有密切联系. 两类工作有密切联系. 将主要介绍统计推断方面的内容. 将主要介绍统计推断方面的内容. 二、总体 总体:研究对象的单位元素所组成的集合. 总体:研究对象的单位元素所组成的集合. 个体:组成总体的每个单位元素. 个体:组成总体的每个单位元素. 要考察本校男生的身体情况, 例1 要考察本校男生的身体情况,则将本校 的所有男生视为一个总体, 的所有男生视为一个总体,而每一位男生就是 一个个体. 一个个体.
数理统计基本概念
第六章 数理统计的基本概念
总体、 §6.1 总体、样本与统计量 §6.2 常用统计分布
电子科技大学
数理统计基本概念
总体、 §6.1 总体、样本与统计量 一、引言 数理统计以概率论为理论基础 以概率论为理论基础, 数理统计以概率论为理论基础,研究 1)研究如何以有效的方式收集和整理随 )研究如何以有效的方式收集和整理随 收集和整理 机数据; 机数据; 2) 研究如何合理地分析随机数据从而作出 研究如何合理地分析随机数据从而作出 分析随机数据 科学的推断 称为统计推断 统计推断). 科学的推断 (称为统计推断).
电子科技大学
数理统计基本概念
为使样本具有代表性, 为使样本具有代表性,抽样应满足什么条件 从民意测验看抽样 (1)Xi 与总体同分布; ) 与总体同分布; 相互独立. (2) X1 , X2 , ···, Xn 相互独立 ) 定义6.1.1 设X1 , X2 , ···, Xn是来自总体 是来自总体X 定义
电子科技大学
数理统计基本概念
由于上述数量指标往往是随机变量, 由于上述数量指标往往是随机变量,具有 随机变量 一定的分布. 一定的分布. 以后将(实际)总体和数量指标 等同起来. 等同起来 以后将(实际)总体和数量指标X等同起来. 总体分布是指 是指数量指标 的分布 的分布. 总体分布是指数量指标 X的分布.
电子科技大学
#
数理统计基本概念
例 6.1.1 设总体 X ~ B( 1 , p ),其中 p 是未 , 知参数, 知参数, ( X1 , X2 , … , X5 ) 是来自 X 的简单 随机样本, 随机样本, 1) 指出以下变量哪些是统计量,为什么? 指出以下变量哪些是统计量,为什么?
X1 + X2 , max Xi , X5 + 2 p , ( X5 − X1)2
总 体
是
随
机
变
量
三、样本 一般,从总体中抽取一部分( 一般,从总体中抽取一部分(取 n 个)进 行观测, 个个体的试验( 行观测,再依据这 n个个体的试验(或观察) 个个体的试验 或观察) 的结果去推断总体的性质. 的结果去推断总体的性质.
电子科技大学
数理统计基本概念
样本: 按照一定的规则 一定的规则从总体中抽取的 样本: 按照一定的规则从总体中抽取的 一部分个体. 一部分个体. 抽样:抽取样本的过程. 抽样:抽取样本的过程. 样本容量: 样本容量:样本中个体的数目 n . 将第 i 个个体的对应指标记为 Xi,i=1,2, …, n, 构成的随机向量 (X1 , X2 , ···, Xn )称为样本 称为样本. 称为样本 样本是一组随机变量,其具体试验 观察 观察) 样本是一组随机变量,其具体试验(观察 是一组随机变量 样本观测值, 数值记为: 称为样本观测值 数值记为:x1 , x2 , ···, xn ,称为样本观测值, 简称样本值 简称样本值. 样本值
= ∏ P{Xi = xi } = ∏ p (1 − p)
i=1 i=155来自xi1− xi
=
5 5 5− ∑ xi ∑ xi pi=1 (1 − p) i=1
xi = 0, 1, (i = 1,2,⋯,5).
#
电子科技大学
F( x1 , x2 ,⋯, xn ) = P{X1 ≤ x1 , X2 ≤ x2 ,⋯, Xn ≤ xn }
= ∏FXk ( xk )
k=1 n
四、统计量 定义6.1.2 设X1 , X2 , ···, Xn是总体 的样本, 是总体X的样本 的样本, 定义 T为n元实值函数,若样本的函数 为 元实值函数 元实值函数, T=T(X1 , X2 , ···, Xn)
?
的样本,如果相互独立且每个分量与总体同 的样本,如果相互独立且每个分量与总体同 相互独立且每个分量与总体 分布,称其为简单随机样本,简称样本 分布,称其为简单随机样本,简称样本. 简单随机样本
电子科技大学
数理统计基本概念
若总体X的分布函数为 则样本X 若总体 的分布函数为 F(x), 则样本 1 , X2 , ···, Xn的联合分布函数为
X, S2, Ak, Mk 统计量
x, s2, ak, mk 统计值
电子科技大学
数理统计基本概念
思考 样本矩与总体矩 (即第四章中定义
的矩) 的概念有什么区别? 的矩) 的概念有什么区别?
样本矩 是 随机变量! 随机变量! 数值! 总体矩 是 数值!
电子科技大学
数理统计基本概念
从民意测验看抽样 1936年,Franklin Delano Rosevelt(罗斯福 罗斯福) 年 罗斯福 州州长Alfred 与共和党的候选人 − Kansas州州长 州州长 Landon(兰登 竞选总统 绝大多数观测家认为 兰登)竞选总统 兰登 竞选总统. 罗斯福会是获胜者, 文学摘要》 罗斯福会是获胜者,但《文学摘要》却预测兰 的优势获胜. 登会以 57% : 43% 的优势获胜 摘要》 《摘要》自1916年以来的历届总统选举中都 年以来的历届总统选举中都 正确地预测出获胜的一方, 正确地预测出获胜的一方 但这次罗斯福以 62% : 38% 的压倒优势取胜! (不久《文学摘 的压倒优势取胜! 不久 不久《 就垮了) 要》就垮了
1≤ i ≤ 5
2) 确定 X1 , X2 , … , X5 ) 的联合概率分布? 确定( 的联合概率分布? 不是统计量,因 是未知参数. 解 1) 只有 X5 + 2 p 不是统计量 因 p 是未知参数
P{X = x} = px(1− p)1−x, 2) 因
电子科技大学
数理统计基本概念
故 ( X1 , X2 , … , X5 ) 的联合分布律为 P( X1=x1 , X2 =x2, … , X5 =x5)
数理统计基本概念
总 样
体 本
是 是
随 随
机 机
变 向
量 量
统计量
随机变量(或向量) 是 随机变量(或向量)
电子科技大学
数理统计基本概念
常见统计量: 常见统计量: 样本均值: 样本均值:
1 n X = ∑ Xi n i=1
样本方差: 样本方差: 1 n 2 2 S = ∑( Xi − X) n − 1 i =1 样本k阶中心矩: 样本 阶中心矩: 阶中心矩
电子科技大学
数理统计基本概念
考察某厂生产的电子元器件的质量, 例2 考察某厂生产的电子元器件的质量,将全 部产品视为总体,每一个元器件即为一个个体. 部产品视为总体,每一个元器件即为一个个体. 通常需要对总体的一项或几项数量指标进 通常需要对总体的一项或几项数量指标进 数量指标 行研究. 如仅考虑男生的身高和体重(X, 如仅考虑男生的身高和体重 Y) ,不考虑 男生的视力、胸围等. 男生的视力、胸围等. 关心电子元件的寿命, 如,关心电子元件的寿命,则寿命 X 为其 一个数量指标, 一个数量指标,且 X 是服从指数分布的随机 变量. 变量.
阶原点矩: 样本 k 阶原点矩:
1 n k A = ∑ Xi k n i =1
1n k Mk = ∑( Xi − X ) n i =1
电子科技大学
统称样本矩 统称样本矩
数理统计基本概念
几个重要关系式:
A =X 1
2 n −1 2 1 n 2 2 M2 = S = ∑ Xi − X = A2 − A 1 n n i =1 i=
电子科技大学
数理统计基本概念
摘要》 《摘要》调查的过程是将问卷寄给一千万 人, 这些人的名字和地址摘自电话簿或俱 乐部会员名册, 乐部会员名册,这筛掉了不属俱乐部或未装 电话的穷人. 电话的穷人. 这在1936年前影响不大 因为穷人富翁以类 年前影响不大, 这在 年前影响不大 似的思考投票; 似的思考投票;但1936年经济正在从大萧条 年经济正在从大萧条 中恢复,故穷人选罗斯福,而富翁们选兰登. 中恢复,故穷人选罗斯福,而富翁们选兰登
电子科技大学
数理统计基本概念
是随机变量且不含未知参数, 是随机变量且不含未知参数,称 T为统计量 为统计量. 对相应的样本值( 对相应的样本值 x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn ) 为统计量的统计值. 为统计量的统计值. 统计值
判断统计量
电子科技大学