数理统计的概念
数理统计基本概念
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )
理
统
计
的
引
入
数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品
率
3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。
数
理
统
计
的
引
入
数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;
数理统计的基本概念
n 1 2
, x .
t 分布的概率密度图形
图形关于 x 0 对称, lim f ( x; n) 0 , 且 x 当 n 充分大时,f (x; n) 趋近于标准正态 分布的概率密度。
定理 4: X 1, 2, , n 是抽自正态总体 设 X X
若总体 X 是离散型的,其分布律为:
则样本的联合分布为
§6.2 抽样分布
6.2.1 统计量的概念 由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。 这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。 定义2:设 X 1 , X 2 , , X n 是来自总体X的样本, g( X 1 , X 2 , , X n ) 是样本 X 1 , X 2 , , X n 的函数,如果 g( X 1 , X 2 , , X n ) 中不包含任何未知参数,则称它 是一个统计量。
1 (0.82)
1 0.7939 0.2061
X ~ N (0, 22 ), X1 , X 2 , X3 , X 4 为其样本,求a,b 例2:总体
(2). (n 1)S / ~ (n 1)
2
X (1). X ~ N ( , / n), 或 ~ N (0,) ; 1 / n 2 2 2
2
X (3). X 与 S 相互独立; (4). ~ t(n 1). S/ n
定理5:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自总体 2 两样本独立, X ~ N ( 1 , 12 )和Y ~ N ( 2 , 2 )的样本, 2 S12 / S2 则有 F 2 ~ F ( m 1, n 1). 2 1 / 2 定理6*:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自
概率论与数理统计考研复习题6
概率论与数理统计考研复习题(6)数理统计的基本概念1.X 与Y 相互独立且都服从)3,0(2N ,而9191,Y Y X X ,和分别是来自总体X 和Y 的简单随机样本,求统计量 292191Y Y X X U ++++= 服从的分布.2.求总体)3,20(N 的容量分别为10,15的两独立样本均值差的绝对值大于0.3的概率.3.设n X X X ,,,21 是来自具有)(2n χ分布的总体样本。
求样本均值X 的数学期望和方差.4.设总体X ~N (0,1),从此总体中取一个容量为6的样本(621,,,X X X ),设Y =(26542321)()X X X X X X +++++,试决定常数C ,使得随机变量CY 服从2χ分布.5.从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间 (1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大?6.从装有一个白球,两个黑球的罐子里有放回地取球,令X =0表示取到白球,X =1表示取到黑球,求容量为5的样本(521,,,X X X )的和的分布,并求样本的均值X 和样本的方差2S 的期望值.7.设总体X ~),0(2σN ,(21,X X )为取自这总体的一个样本,求: (1)221221)()(X X X X Y -+=的概率密度;(2)P {Y <4}. 8.设总体服从参数为λ的指数分布,分布密度为⎩⎨⎧≤>=-0,00,);(x x e x F xλλλ,求E (X ),D (X ),E )(2S .9.从正态总体)5.0,(2μN 中抽取样本1021,,,X X X .(1)已知0=μ,求概率P {}41012≥∑=i i X; (2)未知μ,求概率P {85.2)(2101≥-∑=i i X X}.。
数理统计的基本概念
样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
河南理工大学精品课程
1 Ak = n 1 Bk = n
∑ ∑
n
n
i =1
X ik ( k = 1, 2 , L )
i =1
( X i − X ) k ( k = 1, 2 , L )
概率论与数理统计
说明 (修正 样本方差还可表示为 修正)样本方差还可表示为 修正
n 1 S2 = [ ∑ X i2 − n X 2 ] n − 1 i =1
1 n 推导】 【推导】 S 2 = ( X i − X )2 ∑ n − 1 i =1 = = = =
河南理工大学精品课程
1 n ( X i2 − 2 X i X + X 2 ) ∑ n − 1 i =1 n n n 1 [ ∑ X i2 − 2 X ∑ X i + ∑ X 2 ] n − 1 i =1 i =1 i =1 n 1 [ ∑ X i2 − 2 n X 2 + n X 2 ] n − 1 i =1 n 1 [ ∑ X i2 −n X 2 ] n − 1 i =1
河南理工大学精品课程 概率论与数理统计
做法
从总体中随机地抽取若干个体(灯泡、 从总体中随机地抽取若干个体(灯泡、工大男
生),测试其所需数据(寿命、身高),最后对所得数据通过 ),测试其所需数据 寿命、身高), 测试其所需数据( ),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况. 的分布情况,从而了解整体情况. 一般,我们所研究的总体的某项数量指标X 一般,我们所研究的总体的某项数量指标X是一个随 机变量,其取值在客观上有一定的分布.因此, 机变量,其取值在客观上有一定的分布.因此,对总体的研 究,就是对相应的随机变量X的研究。 就是对相应的随机变量X的研究。 今后,我们称X 今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征, 分布函数和数字特征,并不再区分总体与相应的随机变量 X.对总体的称呼 总体,总体X 总体F X.对总体的称呼:总体,总体X与总体F. 对总体的称呼:
数理统计基本概念
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体样本方差比的分布)
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X n1是取自X的样本, Y1,Y2,…, Yn2 是
样本是联系二者的桥梁 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本 值进行“加工”,这就要构造一些样本的 函数,它把样本中所含的(某一方面)的 信息集中起来.
这种不含任何未知参数的样本的函数 称为统计量. 它是完全由样本决定的量.
2. 独立性: X1,X2,…,Xn是相互独立的随机 变量.
由简单随机抽样得到的样本称为简单 随机样本,它可以用与总体独立同分布的 n个相互独立的随机变量X1,X2,…,Xn表示.
若总体的分布函数为F(x),则其简单随机 样本的联合分布函数为 F(x1) F(x2) … F(xn) 简单随机样本是应用中最常见的情 形,今后,当说到“X1,X2,…,Xn是取自某 总体的样本”时,若不特别说明,就指简 单随机样本.
数理统计的基本概 念
一、总体和样本
1.总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅 是关心其每个个体的一项(或几项)数量指标 和该数量指标在总体中的分布情况. 这时, 每个个体具有的数量指标的全体就是总体.
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.
概率论和数理统计(第三学期)第7章数理统计的基本概念
n i1
i
1 n
n
Ei
i1
D
D 1 n
n i 1
i
1 n2
n
Di
i 1
2
n
2
S~ 1 n
n i 1
i
2
1 n
n i 1
i2 2i
2
1 n
n
i2
i 1
2
n
i
i 1
n
2
1 n
n
i2
i 1
2
2
2
1 n
n
i2
i 1
2
E S~2
E
1 n
n
i2
i 1
23
.209
2
2 0.95
20
10
.851
当自由度n 45时,可用下面近似公式去求2 n:
x2 n
1 2
u
2
2n 1
例3
求
2 0.05
60 .
解
2 0.05
60
1 2
u0.05
2
2 60 1
1 1.645
2
119 78.798
2
3、t分布的上侧分位点
对于给定的α(0<α<1),使
2
e
xi 2 2
2
(2
) e 2
n 2
1
2 2
n i1
xi 2
在数理统计中,总体的分布往往是未知的,需 要通过样本找到一个分布来近似代替总体分布。
§7.3 分布的估计
频率分布 例 某炼钢厂生产的钢由于各种因素的影响,各炉
钢的含硅量可以看作是一个随机变量,现记录了 120炉钢的含硅量百分数,求出这个样本的频数分 布与频率分布。
第五章 数理统计的基本概念
线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)E
最小方差线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)对 的一切线性无偏估计量 0,D D 0
定理 (R-C不等式)
设总体X具有分布密度f ( x; )。抽取样本( x1 ,..., xn ), 设g ( )为 的一个可估函数,T T ( x1 ,..., xn )为g ( ) 的一个无偏估计量,且 满足正则条件
• 若12, 22已知
(X Y) ( 1 2 ) U ~ N (0,1)
2 1
n
2 2
m
• 若12, 22未知,但是12= 22
T (X Y) ( 1 2 ) ~ t (m n 2)
12
m
2 2
n
mS12
12
2 nS2 2 2
T
(X Y) (1 2 ) 1 1 2 mS12 nS2 /(m n 2) m n
~ t (m n 2)
推论:设( X 1 ,..., X n )和(Y1 ,..., Ym )分别为来自
2 2 正态总体N ( 1 , 1 )和N ( 2 , 2 )的两个相互
独立的样本,则随机变量
F
2 若 1 2 2
2 2 Sm / 1 2 Sn 2 / 2
~ F (m 1, n 1)
F
2 Sm 2 Sn
~ F (m 1, n 1)
第六章 参数估计
第一节 点估计
• 定义:设为总体分布中的未知参数,从X 中抽取样本 (x1,…,xn) ,构造适当的统计量 (x1,…,xn), 估计 (以的值作为的近似), 这种方法称为参数的点估计。 • 统计量称为的点估计量; • 对于一组样本观测值 (x1,…,xn) ,该统计量 相应的值(x1,…,xn)称为的点估计值 • 的点估计量和点估计值简称为的点估计。
数理统计的基本概念
概率论与数理统计的区别: 在概率论中,假设随机变量的分布列或者分布函数已知,然 后描述随机变量的统计规律. 数理统计首先解决,如何知道 随机变量的分布规律,如何知道分布中所含的参数.
数理统计研究问题:它研究怎样有效地收集整理和分析带有随 机性的数据,以对所考察的问题作出推断或预测,直至为采取一 定的决策和行动提供依据和建议.
概率统计的基本问题:依据有限个观测或试验如何对整体所作 出推论的问题.这种伴随有一定概率的推断称为统计推断.
母体与子样、经验分布函数
1、母体:把研究对象的全体所构成的一个集合称为母体或总体; 组成母体的每一个成员称为个体. 注:10、实际应用中总体往往指研究对象的某项数值指标的全体。 20、总体的某个数值指标是一个具有分布函数F(x)随机变量,称 总体为具有分布函数F(x)的总体。 30、也可能是一个随机向量,相应的分布函数就为多元函数.
(i
n! 1)!(n
i)![F (
y)]i1[1
F(
y )] n1
f
(
y),
0 ,
a yb 其它
证明 第 i个次序统计量(i)落入无穷小区间 [ y , y y)
内这一事件等价于”容量为n的子样1 ,2 , n 中有(i 1)
个分量落入区间[a , y)内,1个分量落入区间[ y , y y)内,
n
F ( x1 ,, xn ) F ( xi ) i 1
例1 设总体 X 服从参数为 ( 0)的指数分布, ( X1, X2 ,, Xn )
是来自总体的样本, 求样本( X1, X2 ,, Xn )的概率密度.
解
总体 X 的概率密度为
ex ,
f (x)
第五章数理统计的基础知识
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0—1)分布,但其中的参数p 未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数.数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数.数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料.二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量. 容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系。
在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X .例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体.但在实际问题中,我们仅仅关心灯泡的使用寿命(记X 表示该批灯泡的寿命)。
数理统计的基本概念
另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
我们主要讨论有关推断统计学中几个最基本的 问题。
在数理统计中总体X的分布永远是未知的,即使 有足够的理由可以认为总体X服从某种类型的分布, 但这个分布的参数还是未知的。
例如本市家庭的月收入X是个随机变量,X服从什么
分布事先是不清楚的,根据资料可确信 X ~ N , 2 .
但 , 2 究竟取什么值还是未知的,
由于总体X的分布是未知的,因此X的数字特征如 均值、方差等往往也是一个未知的值。对于这些未知
不过在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布
情况. 这时,每个个体具有的数量指标的全体就是总体.
称总体中所含个体的数目为总体容量, 总体容量有限的称为有 限总体, 总体容量无限的称为无限总体.
当个体个数很大时通常把有限总体看作无限总体。
从另一方面看: 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重, 灯泡的寿命,汽车的耗油量…), 所谓总体的性质,无非就是这 些指标值集体的性质. 概率分布是刻划这种集体性质最适当的工具. 因此在理论上可 以把总体与概率分布等同起来. 如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此 总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.
一个统计量.
ex1.设 X1, X 2, X3 是取自正态总体 X ~( , 2) 的一个样本,
数理统计的基本概念
数理统计的基本概念第6章数理统计的基本概念6.1 内容框图6.2 基本要求(1)理解总体、样本及统计量的概念,并熟练掌握常⽤统计量的公式.(2)掌握矩法估计和极⼤似然估计的求法,以及估计⽆偏性、有效性的判断. (3)掌握三⼤抽样分布定义,并记住其概率密度的形状.(4)理解并掌握有关正态总体统计量分布的⼏个结论,如定理6.4~6.9及定理6.11.6.3 内容概要1) 总体与样本在数理统计中,我们把作为统计研究对象的随机变量称为总体,记为ξ,η,… 。
对总体进⾏ n 次试验后所得到的结果,称为样本,记为(n X X X ,,,21 ),(n Y Y Y ,,,21 ),……,其中,试验次数 n 称为样本容量。
样本(n X X X ,,,21 )中的每⼀个 i X 都是随机变量。
样本所取的⼀组具体的数值,称为样本观测值,记为总体与样本统计量点估计矩阵估计常⽤统计量定义统计量的分布正态总体统计量的分布极⼤似然估计点估计的评价三⼤抽样分布(n x x x ,,,21 )。
具有性质:(1)独⽴性,即 n X X X ,,,21 相互独⽴。
(2)同分布性,即每⼀个 i X 都与总体ξ服从相同的分布。
称为简单随机样本。
如果总体ξ是离散型随机变量,概率分布为 }{k P =ξ,那么样本(n X X X ,,,21 )的联合概率分布为∏∏=========ni i ni i in n x P x XP x X x X x X P 112211}{}{},,,{ξ。
如果总体ξ是连续型随机变量,概率密度为 )(x ?,那么样本(n X X X ,,,21 )的联合概率密度为∏∏====ni i ni i X n x x x x x i1121)()(),,,(*??。
如果总体ξ的分布函数为 )(x F ,那么样本(n X X X ,,,21 )的联合分布函数为∏∏====ni i n i i X n x F x F x x x F i 1121)()(),,,(* 。
数理统计第二章学生
定理2. (样本方差的分布)
设 X1 , X2 , … , Xn 是取自正态总体 样本 , 则有 的 分别为样本均值和修正样本方差
的样本, 则有
和 证明:设
相互独立。
而
定理3(与样本均值和样本方差有关的一个分布)
, X n )T 的次序统计量,样本的中位数定义为
X n 1 , ( 2) X 1 [ X n X n 1 ], ( ) 2 (2) 2 n为奇数, n为偶数,
其观测值为
x n 1 , ( ) 2 x 1 [ x n x n 1 ], ( ) 2 (2) 2
性质2:设
,则
0
y
(二)
t分布 设X~N(0, 1), 则称随机变量 , 并且X, Y独立,
t分布的概率密度为
h(t)
n=∞(正态) n=10
服从自由度为n的t分布. 记为t ~ t(n).
0
n=1
t
t 分布的特点: 1、其概率密度函数是偶函数。当n>30时, t 分 布与标准正态分布非常接近;当n 趋于无穷大 时,t 分布趋于标准正态分布。 2、t 分布的尾重比正态分布大。 3、t 分布只存在k<n阶矩。
抽样分布 —— 统计量的分布. 几种常用的统计统计分布 (一) 分布 设X1, …, Xn是来自总体N(0, 1)的样 本, 则称统计量 服从自由度为n的 分布.
§2.3 次序统计量与经验分布函数 §2.4 描述性统计分析
17
记为
.
分布的概率密度为
分布的性质: 性质1:设 ,则
f (x)
数理统计的基本概念
数理统计的基本概念
1. 总体和样本:总体是研究对象的全体,样本是从总体中选取的一部分。
2. 参数和统计量:参数是总体的性质,统计量是样本的函数,用来估计总体的参数。
3. 随机变量和概率分布:随机变量是取值不确定的变量,概率分布是描述随机变量取值可能性的函数。
4. 分布特征:包括均值、方差、标准差、偏度和峰度等。
5. 假设检验:用样本的统计量推断总体参数的方法。
6. 置信区间:用来估计总体参数的区间,表示参数真值有一定概率落在该区间之内。
7. 方差分析:用来比较多组数据的差异来源和大小的方法。
8. 回归分析:用来研究自变量和因变量之间关系的方法。
数理 统计
3.线性表的顺序存储结构
• 线性表可以采用顺序存储和链式存储两种结构。 • 顺序存储结构是将线性表中的数据元素依次存放在一个连
续的存储空间中。这种顺序表示的线性表又称顺序表。
• 顺序存储结构的特点:是随机存取的存储结构,只要确定 了存储线性表的起始位置,线 性表中的任一数据元素可随 机存取。
1460 1430)1460 ,
S
1 n 1
n i1
(xi
x )2
1[(1450 1460)2 (1360 1460)2 (1430 1460)2 63.6 9
因此这批灯泡寿命均值为 1460 小时,标准差为 63.6 小时.
7/20
例 6.1.3 设总体 X ~ P() ,现从该总体中抽出 4 个样本 X1, X2, X3, X4 ,判断下面哪些函 数是统计量
t X Yn
(6.2.6)
服从自由度为 n 的 t 分布,记为 t ~ t(n) .
对于给定的(0 1) 和自由度 n ,称满足下式 P{t ≥ t (n)}
的数 t (n) 是自由度为 n 的 t 分布的上侧 临界值
(6.2.8)
11/20
F 分布
定义 6.2.3 设随机变量 X ~ 2 (n1) , Y ~ 2 (n2) ,且 X 与 Y 独立,则称随机变量
定义 6.2.1 设随机变量 X1, X2, , Xn 相互独立且都服从标准正态分布 N(0,1) ,则称随机 变量
n
2
X
2 i
i1
(6.2.1)
服从自由度为 n 的 2 分布,记为 2 ~ 2 (n) .
对于给定的(0 1) 和自由度 n ,称满足下式 P{ 2 ≥ 2 (n)}
概率论与数理统计-第五章
【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.
概率论与数理统计 第6章
6.1 基本概念 6.2 抽样分布 习题 6
数理统计是具有广泛应用的一个数学分支,它以概率论 为基础,根据试验或观察得到的数据来研究随机现象,对研 究对象的客观规律性作出种种合理的估计和判断。数理统计 的内容包括:如何收集、整理数据资料;如何对所得的数据
资料进行分析、研究,从而对所研究的对象的性质、特点作
设总体 X 的分布律为 P ( X = x ) = p ( x ), X 1 , X
2
,…, X n为来自总体 X 的一个样本,则 X 1 , X 2 ,…, , X 2 ,…, X n)的联合分布律为
X n的分布律都是 P ( X i = x ) = p ( x ),从而 n 维随机变量(X
1
设总体 X 的概率密度为 f ( x ), X 1 , X 2 ,…, X n为 来自总体 X 的一个样本,则 X 1 , X 2 ,…, X n的概率密度 都是 f ( x ),从而 n 维随机变量(X 1 , X 2 ,…, X n)的联合 概率密度为
( n ) ,则称函数
为总体 X 的经验分布函数。
需要指出的是,若在 F n (x )的定义中将样本值换成对 应的样本,则当 n 固定时,它是一个随机变量,此时仍称之 为总体 X 的经验分布函数。所以用样本值定义的 F n (x )其 实是经验分布函数的观察值,在不致混淆的情况下统称为总 体 X 的经验分布函数。
出推断。数理统计的重要分支有统计推断、试验设计、多元 分析等,其具体方法甚多,应用相当广泛,已成为各学科从
事科学研究及生产、经济等部门进行有效工作的必不可少的
数学工具。
本章从数理统计的基本概念开始,讨论抽样分布及其重 要定理,这些抽样分布及其重要定理在概率论中尚未提到,
第七章 数理统计的基本概念
, 例:设 X1, X2,L X6 是来自正态总体 Ν 0,32 的一个简单随机样
2 求常数 a, b, c , Q = aX1 +b( X2 + X3 ) + c( X4 + X5 + X6 ) 本, 使 2 2
( )
服从 χ2 分布,并求自由度 n。 分布, 。
解:由 Xi ~ Ν 0,32 ,且 Xi 之间相互独立,解: f (x1, x2,L Nhomakorabeaxn , ,
µ,σ2 )
∑(xi −µ)2 − 1 2σ2 = e , − ∞ < xi < +∞ n 2 2 (2πσ )
• 例:171页第24题及200页第5题。分别写 出从该总体中取出的样本的联合分布。
(三)经验分布函数
( X1, X2,L Xn )为取自某总体 f (x,θ) 的一个样本, , 的一个样本,
f (x,p) = p (1−p) , x = 0,1
x 1−x
例:设总体 X ~ P(λ) ,写出总体分布 f (x, λ) 写出总体 设总体 写出总体分布
f (x, λ ) =
λ
x
x!
e , x = 0,1,2,K
−λ
写出总体 总体分布 例:设总体 X ~ R(0,θ) ,写出总体分布 f (x,θ) 设总体
X(i) 称为第 i 个次序统计量, i =1L n , , 个次序统计量,
n 个次序统计量 X(1) ,…, X(n) 总是满足 …
X(1) ≤ X(2) ≤ … ≤ X(n−1) ≤ X(n)
(五)三大常用分布
(1)卡方分布 (2)T分布 (3)F分布
要求:1、定义 、 2、性质 、 3、分位数 、
6.1.数理统计的基本概念
对容量较小的样本可分为5-6组,容量100左右的可分7-10组,
容量200左右的可分9-13组,容量300左右及以上的可分12-20 组,目的是使用足够的组来表示数据的变异。本例中只有20个 数据,我们将之分为5组,即k=5。
(2) 确定每组组距:每组区间长度可以相同也可以不同,实用中 常选用长度相同的区间以便于进行比较,此时各组区间的长度 称为组距,其近似公式为:
频数fi
3
4
8
3
2
试写出此分组样本的经验分布函数。
解:由经验分布函数的定义得到
0
0.15
Fn
(
x)
0.35 0.75
0.9
1
x 37.5 37.5 x47.5 47.5 x57.5 57.5 x67.5 67.5 x77.5 x 77.5
例6 以下是一组来自标准正态分布总体的样本的观测值: -1.4462 , -0.7012 , 1.2460 , -0.6390 , 0.5774 , -0.3600 , -0.1356, -1.3493 , -1.2704 , 0.9846
13
100—110
105
16
110—120
从总体X中抽取一个个体,就是对总体X进行一次观察并记 录其结果。取样是随机的,且观察前无法预知起结果,故每 个观察结果都是随机变量,且与总体同分布。
定义 1 在相同的条件下,对总体X进行n次重复的、独立的 观察,得到n个结果 X1, X 2 , , X n ,称随机变量X1, X 2 , , X n 为来自总体X的容量n的简单随机样本,简称样本。其观测值
641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值,对应的总体为该厂生产 的瓶装啤酒的净含量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体、样本、样本实现的关系 总体 样本
推断 样本实现
解:总体X 的概率函数为P { X = x} = p x (1 − p )1− x x = 0,1
所以P { X i = xi } = p xi (1 − p )1− xi xi = 0,1 i = 1, 2,⋯ , n
例5.1 设总体X 服从0 -1分布,X 1 , X 2 ,⋯ , X n是抽自总体 X 的iid 样本,求样本分布。 设样本任意一组实现为x1 , x2 ,⋯, xn,由于样本为iid 于是,样本分布的概率函数为 P {( X 1 , X 2 ,⋯, X n ) = ( x1 , x2 ,⋯ , xn )}
f ( x; n )
α
2 χα ( n )
上侧分位数表求得。例如:自由度 2 为12的χ 2分布关于0.05的上侧分位数 χα (n) = 21.026。
χ 分布上侧分位数χα (n)的概率意义 2 如图所示,χα (n)可以通过查χ 2分布
2 2
x
t分布(学生氏t分布)
1.Def 设 机 量 ~ N(0,1), ~ χ2 (n), 与 相 随 变 X Y X Y 互 独 , 随 变 T = X / Y / n所 从 分 称 自 立 则 机 量 服 的 布 为 由 为 的分 , 为 ~ t(n). 度 n t 布 记 T
χ 分布
2
统计三大分布
1.Def 设 机 量 1, X2,⋯, Xn 相 独 , 都 从 随 变 X 互 立 且 服 N(0,1), 随 变 X = ∑Xi2所 从 分 称 自 则 机 量 服 的 布 为 由 为 的 2分 , 为 ~ χ2 (n). 度 n χ 布 记 X
这个分布是由Helmet于1875年提出,K.Pearson于 1900年重新提出。理论推导可得概率密度函数为
数理统计
第五章 数理统计的概念
• 数理统计 f ( y x)
E(Y x)
• 总体与总体特征数 y 样本与统计量 • • 统计三大分布与抽样分布
x1 x2
回归关系图
x3
x
数理统计
一、数理统计及其任务 数理统计是一门以概率论为基础的应用学科。 它是研究 数理统计 如何有效地收集、 整理、分析带有随机性的数据,以便对所 考察的问题作出推断和预测,从而为决策提供依据。 数理统计的任务就是研究有效地收集数据,科学地整理 与分析所获得的有限的资料,对所研究的问题, 尽可能地作 出精确而可靠的结论。 数理统计研究问题的方式,不是对所研究对象的全体 ( 称 为总体)进行观察,而是抽取其中的部分(称为样本)进行观察 获得数据(抽样),并通过这些数据对总体进行推断。 数理统计方法具有“部分推断整体”的特征。 数理统计方法具有“部分推断整体”的特征。
1 N µ = E ( X ) = ∑ xi N i =1 1 N σ 2 = D( X ) = ∑ ( xi − µ ) 2 N i =1 如 总 容 为 , 有 特 总 单 数 M, 果 体 量 N 具 某 点 体 元 为 则 M p= N 称 总 频 或 体 数 为 体 率 总 重 。 µ ,σ 2 , p统称为总体特征数。显然,它们是由总体唯一 决定的常数。实践中,由于它们的值未知又称为参数。
它反映了总体 均值的信息 它反映了总体 方差的信息
1 n 样本方差 S2 = ( Xi − X )2 ∑ n −1 i=1
1 n 2 = Xi − nX 2 ∑ n −1 i=1
它反映了总体k 1 n 2 它反映了总体 样本标准差 S = ∑(Xi − X) 阶矩的信息 n −1 i=1 1 n k 样本k阶原点矩 k 样本 阶原点矩 A = ∑Xi k =1 ⋯ ,2, n i=1 1 n 样本k阶中心矩 样本 阶中心矩 Bk = ∑( Xi − X )k k =1 ⋯ ,2, n i=1
X1 +σ X2 + X32 解:由统计量的定义知X1 + X 2 + 3µ X 3,X12 + 3µ X 2 X 3 是统计量;X1 + σ X 2 + X 32则不是统计量。
X1 + X2 + 3µ X3 X12 + 3µ X 2 X3
几个常用的统计量 1 n 样本平均值 X = ∑Xi n i=1
P {( X 1 , X 2 ,⋯ , X n ) = ( x1 , x2 ,⋯ , xn )} = ∏ pxi
i =1
如 总 X的 率 度 数 fX (x), 1, X2,⋯, Xn为 果 体 概 密 函 为 X 抽 总 X的 样 , 样 分 的 率 度 自 体 iid 本 则 本 布 概 密 为 f (x1, x2,⋯, xn ) = ∏fXi (xi )
二、统计量 统计量(Statistic) Def 设 1, X2 ,⋯ Xn是 自 体 的 个 本 X , 来 总 X 一 样 , T( X1, X2 ,⋯ Xn )是 1, X2 ,⋯ Xn的 数 且 含 , X , 函 , 不 未 参 , 称 ( X1, X2 ,⋯ Xn )是 个 计 。 知 数 则 T 一 统 量 , 注 : X1, X2,⋯, Xn是 自 体 的 个 本 而 意 设 来 总 X 一 样 , x1, x2 ,⋯, xn是 本 一 实 , T(x1, x2,⋯, xn )也 样 的 个 现 则 是 统 量 (X1, X2 ,⋯, Xn )的 个 现 计 T 一 实 . 例5.3 设是 X 1 , X 2 , X 3 从正态总体 N ( µ , σ 2 ) 中抽取的 一个样本,其中µ 为已知参数, 为未知参数,确定 σ 下列那些量是统计量
二、数理统计研究问题的一般流程 分析问 收集 题 确定总 体 数据 整理 数据
试验设计 抽样
统计推断
参数估计 假设检验
我们这门课所学的数理 统计实际上是统计推断 及其应用( 及其应用(方差分析与 回归分析) 回归分析)的一部分内 容。
为什么要用数理统计方法研究问题?随机现象有它的规律 性,随机现象的特点注定了进行足够多次观察,其规律性才 能清楚地呈现出来。但是,客观上只允许对随机现象进行有 限次观察试验,只能获得局部观察资料.
(2)设X =X 1 +X 2且已知X 1与X 2相互独立,X ~ χ 2 (n) X 1 ~ χ 2 (n1 ),则X 2 ~ χ 2 (n − n1 ).
(3)若X ~ χ 2 (n), 则X 的数学期望与方差为 E( X ) = n D ( X ) = 2n
X − n n→+∞ (4)若 ~ χ (n), X 则 ~ N(0,1). 2n
= ∏ P { X i = xi }
i =1 n i =1 n
= ∏ p xi (1 − p )1− xi
= p i =1 (1 − p )
∑ xi
n
n−
∑ xi
i =1
n
例5.2 设总体X ~ e(λ ),X 1 , X 2 ,⋯ , X n是抽自总体X 的iid 样本,求样本分布。 λe-λx x > 0 解:总体 X ~ e(λ),即有 f X (x)= x≤0 0 设样本任意一组实现为x1 , x2 ,⋯, xn,由于样本为iid λ e- λ xi xi > 0 所以 f X i ( xi )= i = 1, 2,⋯ , n xi ≤ 0 0 于是,样本分布的概率密度为 n -λ x n ∏ λ e i min { x1 , x2 ,⋯, xn } > 0 1≤i ≤n f ( x1 , x2 ,⋯, xn ) = ∏ f X i ( xi ) = i =1 i =1 0 其他 n − λ ∑ xi n = λ e i =1 min { x1 , x2 ,⋯, xn } > 0 1≤i ≤n 0 其他
如果总体为有限总体,指标值的全体为x1 , x2 ,⋯ , xN,则
样本与统计量
一、样本 样本(Sample) 样本 Def 按一定规则从总体中抽取一部分总体单元进行观 测或试验,这一抽取过程称为“抽样”,所抽取的部 分总体单元的整体称为总体的一个样本(子样)。 样本 中所包含的总体单元称为样本单元,样本中样本单元 的数目称为样本容量。
样本 X 1 , X 2 ,⋯ , X n
抽定
样本实现 x1 , x2 ,⋯ , xn
样本应满足的性质 样本 (1) 代表性;(2) 随机性。 简单随机样本( 简单随机样本(Independence identical distribution) distribution) X 总 X 一 样 , 果 Def 设 1, X2,⋯, Xn为 体 的 个 本 如 X1, X2,⋯, Xn 相 独 , 均 总 X具 相 的 布 则 X1, X2 ,⋯, 互 立 且 与 体 有 同 分 , 称 Xn为 单 机 本 简 iid样 。 简 随 样 , 称 本 例如: 例如:要通过随机抽样了解一批产品的次品率,如果每 次抽取一件产品观测后放回原来的总量中再抽第二件产 品,则这样获得一个简单随机抽样。 实际抽样中,往往是不再放回产品,则这不是一个 简单随机抽样。但当总量N很大时,可近似看成 可近似看成是简单 可近似看成 随机抽样。 样本分布 样本 X 总 X 一 样 , ( Def 设 1, X2,⋯, Xn为 体 的 个 本 则 X1, X2,⋯, Xn ) 的 布 为 本 布 分 称 样 分 。
总体与总体特征数
一、总体与总体标志 总体(Population) Def 在数理统计中,把研究对象的全体称为总体或母 体,而把组成总体的每个单元称为总体单元。 个体 … 总 … 体
研究某批灯泡的质量 描述总体单元在某方面特性的名称称为总体指标; 每个总体单元对总体指标的响应称为指标值。 总体中所包含的个体的个数称为总体的容量。
n x −1 − 1 x2 e 2 n2 f (x; n) = 2 Γ(n 2) 0