第六章数理统计学的基本概念
概率与统计学课件-第六章-数理统计的基本概念2-1
�总体与样本
基本概念: 总体:研究的问题所涉及的对象的全体 个体:总体中的每个成员 样本:从总体中抽取部分个体 样本容量:样本所包含的个体数量 样本观测值:
数的属性 样本的二重性 随机变量的属性
设X1,X2, …,Xn为总体X的一个容量为 n的 样本。若它满足 独立性,即X1,X2, …,Xn 相互独立; 同分布性,即每个 Xi都与总体X服从相 同的分布. 则称这样的样本为简单随机样本,简称为 样本。
�统计量
设是总体X的样本,g(X1,X2, …,Xn)是样本 的实值函数,且不包含任何未知参数,则 称g(X1,X2, …,Xn)为统计量。
例2.若X1,X2, X3是来自总体X~N(μ, σ 2)的 其中参数μ未知, σ2已知,则
X 1 X 3 − 3µ , X12 + 4 X 22 + 5µ 都不是统计量
�定理
若X1,X2, …,Xn是来自总体X的样本,设X 的分布函数为 F(x),则样本X1,X2, …,Xn的 联合分布函数为
n
∏ F (x )
i i =1
例1.若X1,X2, …,Xn是来自总体X的样本,设 X的分布函数为 F(x),则样本 X1,X2, …,Xn的联合分布函数为
⎧ n − λ xi (1 − e ), xi > 0(i = 1, 2,⋯ , n) ⎪∏ F ( x1 , x2 ,⋯ , xn ) = ⎨ i =1 ⎪ 0 , 其他 ⎩
1/8, 25 ≤ x<27 2/8, 27 ≤ x<30 3/8, 30 ≤ x<33 Fn(x)= 5/8, 33 ≤ x<35 6/8, 35 ≤ x<45 7/8, 45 ≤ x<65 1, 65 ≤ x
第六章 数理统计的基本概念pdf_(一)基本要求
.第六章 数理统计基本概念
一、基本要求、重点与难点
(一)基本要求
1.理解总体、个体、简单随机样本和统计量的概念。掌握样本均值和样本 方差的计算。
(2)设 X ~ χ 2 (n) ,则 E(X)=n,D(X)=2n .
若 X ~ χ 2 (n) ,对于α (0 < α < 1) ,称满足 P( X > χα2 (n)) = α的点χα2 (n) 为 χ 2 (n) 分布的
上侧α 分位点。当 n>45 时,R.A.Fisher 证明了下面的近似公式
( ) χα2
(n)
≈
1 2
uα +
2
2n −1 ,
其中 uα 为标准正态分布的上侧α 分位点。
2、 自由度为 n 的 t 分布:
定义设 X1, X2 独立,X1~N(0,1), X2~ χ 2 (n) ,则称
T (n) = X1 X 2 n
的分布是自由度为 n 的 t 分布,简记为 t(n) ,亦称为学生(student)分布。这种分布是英国人 w.s.Gosset 在 1908 年以笔名”student”发表的,它是数理统计中最重要的分布之一。 命题 设 T(n)是自由度为 n 的 t 分布,则它的概率密度函数为:
2.会列出分组数据统计表。 3.了解X2-分布、t-分布和F-分布的定义及性质。了解分位数的概念并会查
表计算。 4.掌握正态总体的抽样分布规律。
(二)重点
1.样本均值和样本方差的计算。 2.分组数据统计表。 3.正态总体的抽样分布规律。
概率论与数理统计-6
一、统计量
定义1 设X1, X2, …, Xn是总体X的样本,样本函数g(X1, X2, …, Xn)是样 本的实体函数,且不含有任何未知参数,则称这类样本函数g(X1, X2, …, Xn)为统计量。
由于样本具有二重性,统计量作为样本的函数也具有二重性,即对 一次具体的观测或试验,它们都是具体的数值,但当脱离开具体的某 次观测或试验,样本是随机变量,因此统计量也是随机变量。
n i 1
( xi
x )2
1n (
n 1 i1
xi2
nx 2 )
。
(3)样本标准差
S
S2
1 n 1
n i 1
(Xi
X
)2
它的观测值记为 s
s2
1 n 1
n i 1
( xi
x )2
。
(6-5)
(4)样本k阶原点矩
Ak
1 n
n i 1
X
k i
(k
1,2 ,3,
)
它的观测值记为 ak
解 将样本的观察值由小到大排列为 1 2 3 3 4 4 4 5 6 8
所以样本的频率分布如表所示
X
1
2
3
4
5
6
8
fn
0.1
0.1
0.2
0.3
0.1
0.1
0.1
例1 设总体服从泊松分布,容量为10的样本观察值如下:
214 3 5 6 4 8 4 3 试构造样本的分布函数F10(x)。
例1 设随机变量 X ~ (0 ,1) 分布,求D(X)。
解 因为 X ~ (0 ,1)
所以 又
E(X ) p E( X 2 ) 0 (1 p) 12 p p
数理统计基本概念
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )
理
统
计
的
引
入
数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品
率
3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。
数
理
统
计
的
引
入
数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;
概率论与数理统计 第六章--数理统计的基本概念
F分布性质2 若X ~t(n),则X2~F(1,n)
例4.设X1,X2, …,Xn是来自正态总体N(0,1) 的样本,试问c=( )统计量
c
2 X i 3 i 1 n
X
i 4
2 i
服从F分布?
抽样分布的分位点
设α为给定的常数,且0<α<1.若存在χα2(n)使
P ( n)
分位点的性质
(1) u1 u (2)
t1 (n) t (n)
1 (3) F (m, n) F1 (n, m)
回顾1. 设X1 ,X2 ,X3, X4是来自总体N(0,4)的简单 随机样本,X=a(X1-2 X2)2+b(3X3 -4X4)2,问当 a,b为何值时,统计量X服从 2分布 .
Max=1572, Min=738, 组数=6 组距=(Max-Min)/6=139140 取a0=735, 则分组区间及相关数据如下
组序 1 2 分区区间 (735,875] (875,1015] 频数 6 8 频率 0.2 0.27 累计频率 0.2 0.47
3
4 5 6 合计
(1015,1155]
2
所服从的分布为自由度为 n 的 分布 记为
2
~ (n)
2 2
分布的密度函数为
2
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
其中伽玛函数 ( x )通过积分
( x ) e t dt, x 0 0 来定义.
(1155,1295] (1295,1435] (1435,1575]
9
4 2 1 30
0.3
第六章 数理统计的基本概念
1 n 2 S S ( X X ) i n 1 i 1
2
(4) 样本k阶(原点)矩
1 n k Ak X i n i 1
k 1, 2,
k 2,3,
(5) 样本k阶中心矩
1 n Bk ( X i X )k n i 1
§2
常用统计量的分布
统计量的分布称为抽样分布.下面介绍三种由 正态总体演化而来的统计量的分布:
• 从二战后到现在,是统计学发展的第三个时期,这是一个在 前一段发展的基础上,随着生产和科技的普遍进步,而使这 个学科得到飞速发展的一个时期,同时,也出现了不少有待 解决的大问题.
学科奠基者
数理统计作为一个进一步完善的数学学科的奠基者是英国人费歇尔。他1909 年入剑桥大学,攻读数学物理专业,三年后毕业。毕业后,他曾去投资办工 厂,又到加拿大农场管过杂务,也当过中学教员。1919年,他开始对生物统 计学产生了浓厚的兴趣,参加罗萨姆斯泰德试验站的工作,致力于数理统计 在农业科学和遗传学中(费歇尔1890—1962)的应用研究。 年轻的费歇尔主要的研究工作是用数学将样本的分布给以严格的确定。 在一般人看来枯燥乏味的数学,常能带给研究者极大的慰藉,费歇尔热衷于 数理统计的研究工作,后来的理论研究成果有:数据信息的测量、压缩数据 而不减少信息、对一个模型的参数估计等。 最使科学家称赞的工作则是试验设计,它将一切科学试验从某一个侧面 “科学化”了,不知节省了多少人力和物力,提高了若干倍的工效。 费歇尔培养了一个学派,其中有专长纯数学的,有专长应用数学的。在30- 50年代费歇尔是统计学的中心人物。1959年费歇尔退休后在澳大利亚度过了 最后三年。
若 x1 , x2 , , xn 是样本的观察值, 则 g ( x1 , x2 , xn ) 是 g ( X 1 , X 2 , X n )
第六章 数理统计的基本概念
第六章 数理统计的基本概念§6.1基本概念 §6.2样本数字特征一、填空题1. 若12,,n X X X ,为来自总体X 的容量为n 的样本,则样本均值X = ,样本方差2S = ; 2.设总体(4,40)X N , 1210,,X X X ,是X 的简单随机样本,则X 的概率密度()f x = ; .3.某种灯泡的寿命X 服从参数为(0)λλ>的指数分布,12,,n X X X ,是取自总体X 的简单随机样本,则12(,,)n X X X ,的联合密度函数为 ;4.设总体2(,2)X N μ ,12,,n X X X ,为取自总体的一个样本,X 为样本均值,要使2()0.1E X μ-≤成立,则样本容量n 至少应取多大 ;.5.设n X X X ,,21 ,是来自总体2(,)N μσ的随机样本,,a b 为常数,且0a b <<,则随机区间222211()(),n n i i i i X X b a μμ==⎛⎫-- ⎪⎝⎭∑∑的长度的数学期望为 。
.二、选择题1. 设(1,4)X N ,12,,n X X X ,为X 的样本,则(C )(A )1~(01)2X N -,; (B )1~(01)4X N -,; (C~(01)N ,; (D~(01)N ,. 2.设12,,n X X X ,是总体X 的样本,则有(D )(A )()X E X =; (B )()X E X ≈; (C )1()X E X n=; (D )以上三种都不对. 3.设总体(2,9)X N , 1210,,X X X ,是X 的样本,则(B )(A )(20,90)X N ; (B )(2,0.9)X N ; (C )(2,9)X N; (D )(20,9)X N .4.设总体2(,)X N μσ , 其中μ已知, 1234,,X X X X ,是X 的样本,则不是统计量的是(C ) (A )145X X +; (B )41i i X μ=-∑; (C )1X σ-; (D )421i i X =∑.5.设随机变量X 服从正态分布(0,1)N ,对给定的(01)αα<<,数a u 满足{}a P X u α>=,若{||}P X x α<=,则x 等于(C )(A )2a u ; (B )12a u-;(C )12a u -; (D )1a u -.6.设12,,n X X X ,是来自正态总体2(,)N μσ的简单随机样本,X 与2S 分别是样本均值与样本方差,则(C )(A )2222()E X S μσ-=-; (B )2222()D X S μσ+=+; (C )22()E X S μσ-=-; (D )22()D X S μσ+=+.三、 计算题5. 设1234,,,X X X X 是取自正态总体2(,)N μσ中的一个大小为4的样本,其中μ已知,但2σ未知,指出下面随机变量中哪些是统计量? (1)1234X X X X +++;(2)42211()ii Xμσ=-∑; (3)12max{,}X X ;(4)4X μ+; (5)141()2X X +; (6X . 其中4114i i X X ==∑.6. 12,,n X X X ,是取自正态总体2(,)N μσ中的一个样本,12, m U X X X =+++12 m m n V X X X ++=+++ ( )n m >.求,U V 的联合密度函数。
第六章 数理统计的基本概念(1)
XK
1 n
n i 1
X
k i
(4)样本k阶中心矩:
1 n
n i 1
(Xi
X )k
(5)顺序统计量: X(1) X(2) X(n) . 其中 X(k) 为将 X1, X2 , , Xn 从小到大排列第 k 位值.
18 September 2020
概率论与数理统计
理学院数学系
2、离散型 设总体X的分布律为 P{ X x} p( x)
则样本X1, X2 ,的, 联Xn合分布律为 P{ X1 x1, X2 x2 ,, Xn xn } p( x1 ) p{ x2 ) p( xn )
18 September 2020
概率论与数理统计
理学院数学系
样本分布
第六章 数理统计的基本概念
(1)样本均值:
X
1 n
n i 1
Xi
(2)样本方差:
Sn2
1 n
n
(Xi
i 1
X )2
修正样本方差:
Sn*2
1 n1
n i 1
(Xi
X )2
nSn2 (n 1)Sn*2
18 September 2020
概率论与数理统计
理学院数学系
第六章 数理统计的基本概念
第22页
(3)样本k阶原点矩:
第13页
1、样本的联合分布函数 设总体 X 的分布函数为 FX (., ), (X1, X2 ,
则样本的联合分布函数为
, Xn ) 为样本.
FX1,X2 , ,Xn ( x1, x2 , , xn ; ) FX ( x1, )FX ( x2 , ) FX ( xn , )
第6章数理统计的基本概念习题及答案
第六章 数理统计的基本概念一.填空题1.若n ξξξ,,,21Λ是取自正态总体),(2σμN 的样本,则∑==ni i n 11ξξ服从分布)n,(N 2σμ.2.样本),,,(n X X X Λ21来自总体),(~2σμN X 则~)(221n S n σ-)(1χ2-n ; ~)(nS n X μ- _)(1-n t __。
其中X 为样本均值,∑=--=n i n X X n S 12211)(。
3.设4321X X X X ,,,是来自正态总体).(220N 的简单随机样本,+-=221)2(X X a X 243)43(X X b -,则当=a 201=a 时,=b 1001=b时,统计量X 服从2X 分布,其自由度为 2.4. 设随机变量ξ与η相互独立, 且都服从正态分布(0,9)N , 而129(,,,)x x x L 和 129(,,,)y y y L 是分别来自总体ξ和η的简单随机样本, 则统计量~U =(9)t .5. 设~(0,16),~(0,9),,X N Y N X Y 相互独立, 129,,,X X X L 与1216,,,Y Y Y L 分别为X 与Y 的一个简单随机样本,则2221292221216X X X Y Y Y ++++++L L 服从的分布为(9,16).F6. 设随机变量~(0,1)X N , 随机变量2~()Y n χ, 且随机变量X 与Y 相互独立,令T =, 则2~T F (1,n )分布.解:由T =, 得22X T Y n =. 因为随机变量~(0,1)X N , 所以22~(1).X χ再由随机变量X 与Y 相互独立, 根据F 分布的构造, 得22~(1,).X T F n Y n= 7. 设12,,,n X X X L 是总体(0,1)N 的样本, 则统计量222111n k k X n X =-∑服从的分布为(1,1)F n -(需写出分布的自由度).解:由~(0,1),1,2,,i X N i n =L 知222212~(1),~(1)nk k X X n χχ=-∑, 于是22122211(1)1~(1,1)./11nkn k k k Xn X F n X n X ==-=--∑∑8. 总体21234~(1,2),,,,X N X X X X 为总体X 的一个样本, 设212234()()X X Z X X -=-服从F (1,1)分布(说明自由度)解:由212~(0,2)X X N σ+,有22~(1)χ, 又 234~(0,2)X X N σ-,故22~(1),χ因为2与2独立,所以21234~(1,1).X X F X X ⎛⎫+ ⎪-⎝⎭9.判断下列命题的正确性:( 在圆括号内填上“ 错” 或“ 对”)(1) 若总体的平均值μ与总体方差σ2 都存在,则样本平均值x 是μ 的一致估计。
I数理统计基本概念及参数估计
点估计有两种方法: 矩估计法和最大似然估计法
18
(一 )
矩估计法:
则有:E ( X v ) = µv (θ1 , θ 2 ,L , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
x>0 x≤0
10
对于给定的α , 0 < α < 1, 称满足条件 ∫
∞
Fα ( n1 , n2 )
f ( x; n1 , n2 ) dx = α的点Fα ( n1 , n2 )
为F ( n1 , n2 ) 分布的上α 分位数。Fα ( n1 , n2 )的值可查F 分布表
F1−α (n1 , n2 ) = [ Fα (n2 , n1 )]−1
为t ( n ) 分布的上α 分位数。t分布的上α 分位数可查t分布表
n = 10 n=4
f ( x)
t1−α ( n ) = −tα ( n )
α
n =1
−3 −2 −1 0 1 2 t分布的密度函数
3
x
0
tα ( n )
x
9
t分布的上α 分位数
F分布
定义:设X ∼ χ 2 ( n1 ) , Y ∼ χ 2 ( n2 ) , 且X , Y 独立, 则称随机变量F = X / n1 服从自由度 ( n1 , n2 )的F 分布,记为F ~ F ( n1 , n2 ) Y / n2
n+1
+ Γ ( n2 1 ) t 2 − 2 定理6.2:t ( n ) 分布的概率密度为:f ( t , n ) = 1 + n , −∞ < t < +∞ n nπ Γ ( 2 )
∞
对给定的α , 0 < α < 1, 称满足条件 ∫
数学的数理统计学
数学的数理统计学数理统计学是一门应用数学的分支学科,旨在研究数据的收集、分析和解释。
它是现代科学、工程和社会科学中必不可少的工具之一。
本文将从数学的角度出发,介绍数理统计学的基本概念、方法和应用。
一、基本概念数理统计学的基本概念包括总体、样本、随机变量和概率分布等。
总体是指研究对象的全体,样本则是从总体中选取的一部分个体。
随机变量是描述随机现象的数值特征,概率分布则描述了随机变量的取值规律。
二、数据的收集与描述在数理统计学中,收集和描述数据是关键的一步。
常见的数据收集方法包括抽样调查、实验和观测等。
而对数据进行描述的手段主要有集中趋势度量和离散程度度量。
集中趋势度量包括均值、中位数和众数等,用于反映数据的中心位置;离散程度度量包括方差、标准差和变异系数等,用于反映数据的离散程度。
三、概率与概率分布概率是数理统计学的重要概念之一,用来描述随机现象发生的可能性。
概率分布则用于描述随机变量的取值规律。
常见的概率分布包括正态分布、二项分布和泊松分布等。
正态分布是一种重要的连续型概率分布,其以钟形曲线为特征,广泛应用于自然科学和社会科学领域。
二项分布和泊松分布则常用于描述离散型随机变量的概率分布。
四、参数估计与假设检验参数估计与假设检验是数理统计学中的核心内容。
参数估计是根据样本数据对总体参数进行估计,常用的方法包括点估计和区间估计。
假设检验则是用于判断总体参数是否满足某个假设,常用的方法包括单样本假设检验、双样本假设检验和方差分析等。
五、回归与相关分析回归分析是研究两个或多个变量之间关系的统计方法。
简单线性回归分析用于描述两个变量之间的线性关系,多元线性回归分析则考虑多个自变量对因变量的影响。
相关分析则用于描述两个变量之间的相关程度,常用的是皮尔逊相关系数。
六、应用领域数理统计学在各个领域都有广泛的应用。
在自然科学方面,数理统计学可以帮助分析实验数据,验证理论模型。
在工程领域,数理统计学可以应用于质量控制、可靠性分析等。
概率论与数理统计第六章 数理统计的基本概念精品教案
第六章数理统计的基本概念一、内容提要数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。
它的主要内容是由样本来推断总体。
(一)基本概率1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。
组成总体的每个元素称为个体或单元。
从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,X n表示。
一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。
抽得的这些个体构成一个样本,用(X1,X2,…,X n)表示,n为样本容量,X1,X2,…,X n应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,X n)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,12(X 1,X 2,…,X n )又是n 个具体的数据x 1,x 2…,x n ,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X 1,X 2,…,X n )表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X 1,X 2,…,X n )的观测值按由小到大次序排列后为:**2*1n x x x ≤≤≤Λ定义()()*1**1*0,,,,1,2,,11,.n k k n x x kF x x x x k n n x x +⎧⎪⎪=≤<=-⎨⎪⎪≥⎩p L ,为样本分布函数对于样本的不同观测值(x 1,x 2…,x n ),我们将得到不同的F n (x ),所以F n (x )是一个随机变量。
数理统计学的基本概念
但还应注意到,如上文所指出的:因 X 估计接受的准则定为 X ≥ l1 , l1 是某选定的数,可以大于、等于或 小于 l , l1 定得大些,表示我们的检验更严格,这在对元件质量要求很高且供货渠道较 多时可能是适当的.反之, l1 定得小些,表示检验更宽,这在对元件质量要求不很高, 或急需这些元件而供货渠道很少时,也可能采取.从统计上说,无论你怎么定 l1 ,理论 上你都可能犯两种错误之一:一是元件平均寿命达到要求而你拒收,一是元件平均寿命
数理统计学是一门应用性很强的学科,有其方法、应用和理论基础.在西方,“数 理统计学”一词是专指统计方法的数学基础理论那部分而言.在我国则有较广的含义, 即包括方法、应用及理论基础都在内,而这在西方是称为“统计学”.在我国,因为还 有一门被认为是社会科学的统计学存在,这两个名词的区别使用,有时是必要的.
达不到要求而你接受了,这两种错误各有一定的规律,它们在很大程度上决定了接受准
则 X ≥ l1 中的 l1 选择.
153
第二个问题与第一个问题不同:它不是要求对分布中的未知参数作出估计,而是
要在两个决定(就本问题而言就是接受或拒收该批产品)中选择一个.这类问题称为假
设检验问题,也是数理统计的重要内容之一.
本例提出的第一个问题称为参数估计问题,因为 λ 是元件寿命分布中的一个未知
参数,而我们的问题是要估计具有决定性的一个量,即1/ λ .也可以把问题提为要求估
概率论与数理统计6-8
无关的样本的连续函数,则称g(X1,X2,…,Xn)为
统计量。 统计量是样本的函数,它是一个随机变量, 如果x1, x2, …, xn是样本观察值, 则g(x1, x2, …, xn)是统计量g(X1, X2, …, Xn)的一个观察值.X i ; n i 1 2 n 1 2 2. 样本方差 S (X i X ) ; n - 1 i 1 1 n k 3. 样本k阶原点矩 A k X i , k 1, 2, ; n i 1 1 n 4. 样本k阶中心矩 Bk (X i X ) k , k 2, 3, . n i 1
§7.1 点估计 一. 问题的提法:
设总体X的分布函数F ( x; θ )的形式为已知 ,
是待估参数, 1 , X 2 , , X n 是X的一个样本, X
x1, x2 , , xn 是相应的一个样本值。
点估计问题就是要构造 一个适当的统计量 ˆ ( X , X , X ),用它的观察值 ˆ( x , x , , x )
2
分布具有可加性,定义 X 1 ,X 2 , ,X n 独立 中 n 1 同服从N (0,1),所以 = X ~ ( , ) 2 2 i 1
2 2 i n
β α α-1 -x x e , x 0, 分布的概率密度为 f ( x) Γ (α ) : 0 , 其它. n 1 2 2 比较 (n)的密度可知: (n) 分布就是 , 2 2 2 的分布, 即 (n) (n / 2, 1/2).
N (0, 2 ) ,X1,X2,X3 为取自总体的一个样本, 2.设总体 X~
试求:(1)3X1-2X2+X3 的分布;(2)
2 X1 X 22 X 32
的分布。
概率论与数理统计第六章
Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。
《概率论》 第六章 数理统计的基本概念.
2. 抽样原则 为使抽取的样本能很好地反映总体的特征,
一般要求抽取样本时遵循以下两点原则:
(1) 代表性 要求样本中的每个样品都是从总体 中 完全随机地抽出的,即每个样品与总体 具有相同
的分布;
(2) 独立性 要求每个样品的抽出相互之间是互不 影响的,即要求每个样品之间相互独立.
满足以上两点要求的样本称为简单随机样本.
1n
n 1 i1
i
2
(4) 样本 k 阶原点矩
Mk
1 n
n
i 1
k i
,
k
1,
2, ;
(5)样本 k 阶中心矩
M
k
1 n
n
(i
i 1
)k
, k 2, 3, ;
注 1. 上述几个统计量统称为样本矩;
2.
X
M1 ,
S2
M
2
.
三、样本矩的性质
2. 2分布的性质
性质1 ( 2 分布的可加性)
设 ~ 2(n1 ), ~ 2(n2 ), 并且 , 独立, 则 ~ 2(n1 n2 )
推广: 设 i ~ 2(ni ), 并且 i (i 1, 2,, m) 相互
独立,
则
m
i
~
2 (n1
2π
标准正态分布的上侧分位点
定义 设 U ~ N (0,1) ,对给定的正数(0 1),
若实数u 满足
P{U u }
则称点 u为标准正态分布U的 上侧分位点(或称 上 分位数或 临界值).
第6章 数理统计的基本概念
(
n1 2
n1
)
+ n2 2
(
)
n2 2
)
(
n1 n2
)(
n1 n2
n1 −1
x) 2 (1 +
n1 n2
−
x)
n1 + n2 2
,x
0
0,
x0
24
f (x) =
(
(
n1 2
0
n1 + n2 2
) ( ,
)
n2 2
)
(
n1 n2
)(
n1 n2
n1 −1
x) 2 (1 +
n1 n2
− n1 + n2
n−2 23
3、F 分布
定义 设 X ~ 2 (n1 ) , Y ~ 2 (n2 ) ,且 X 与 Y 相互
独立,则称随机变量
F = X / n1 Y / n2
服从自由度为 (n1, n2 )的 F 分布,记为 F ~ F (n1, n2 ) .
F(n1,n2)的概率密度为
f (x) =
(
实际上,每一次测量所得结果是一个个体, 而总体是由“一切可能的测量值”组成。这只是 一个想象中存在的集合,因为不可能去进行无限 次测量。它的个体是通过试验“制造”出来的。
这种情况在实际应用中非常之多。给这种总 体同样可规定分布,例如上述例子中说“测量结 果服从正态分布”是容易理解的。
8
二、样本
一般情况下,对总体的每一个个体都进行观察或试 验是不可能的,这是因为经济上、时间上不允许(如个体 的数量很大),或观察试验是带破坏性的(如灯泡的寿命、 炮弹的射程).因此,必须对总体进行抽样观察.
概率论与数理统计 第六章
F-分布的概率密度为
n1 n1 1 2 2 [(n1 n2 ) / 2](n1 / n2 ) x , x 0, n1 n2 f ( x) (n1 / 2)(n2 / 2)[1 (n1 x / n2 )] 2 0, 其它.
河南理工大学精品课程
概率论与数理统计
河南理工大学精品课程
n 1 2
( x )
概率论与数理统计
f (x)
n
n 10
n 1
O
x
t-分布的概率密度性质
t-分布的概率密度为偶函数,且以标准正态概率 密度为其极限(n→∞)。
河南理工大学精品课程 概率论与数理统计 上α分位点(双侧 Nhomakorabea/2分位点)
定义 点 t (n) 为 t (n) 分布的上α 分位点
究,就是对相应的随机变量X的研究。
今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征,并不再区分总体与相应的随机变量
X.对总体的称呼:总体,总体X与总体F.
河南理工大学精品课程 概率论与数理统计
例如,当X~N(μ,σ2)时,称总体X为正态总体.正态 总体有以下三种类型: ①μ未知,但σ2已知; ②σ2未知,但μ已知; ③μ,σ2均未知.
P{t t (n)} (0 1).
查附表4[P.298]:
t0.025 (8) 2.3060, t0.005 (4) 4.6041.
河南理工大学精品课程
概率论与数理统计
双侧α/2分位点:
t1 / 2 (n), t / 2 (n)
f (x)
/2
t1 / 2 (n) O
河南理工大学精品课程
概率论与数理统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章数理统计的基本概念一、教学要求1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。
2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。
3.掌握正态总体的某些常用统计量的分布。
4.了解最大次序统计量和最小次序统计量的分布。
本章重点:统计量的概念及其分布。
二、主要内容1.总体与个体我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。
在实际问题中,通常研究对象的GAGGAGAGGAFFFFAFAF某个或某几个数值指标,因而常把总体的数值指标称为总体。
设x为总体的某个数值指标,常称这个总体为总体X。
X 的分布函数称为总体分布函数。
当X 为离散型随机变量时,称X的概率函数为总体概率函数。
当X为连续型随机变量时,称X 的密度函数为总体密度函数。
当 X服从正态分布时,称总体X 为正态总体。
正态总体有以下三种类型:(1)未知,但已知;(2)未知,但已知;(3)和均未知。
2.简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。
要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行GAGGAGAGGAFFFFAFAF测试或观察得到一组数据,这一过程称为抽样。
由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。
n称为样本容量。
()称为样本观测值。
如果样本()满足(1)相互独立;(2) 服从相同的分布,即总体分布;则称()为简单随机样本。
简称样本。
设总体X的概率函数(密度函数)为,则样本( )的联合概率函数(联合密度函数为)GAGGAGAGGAFFFFAFAF3. 统计量完全由样本确定的量,是样本的函数。
即:设是来自总体X 的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。
4. 常用统计量(1)样本均值:(2)样本方差:(3)样本标准差:它们的观察值分别为:GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF这些观察值仍分别称为样本均值、样本方差和样本标准差。
(4)样本(k 阶)原点矩11,1,2,n k k i i A X k n ===∑(5)样本(k 阶)中心矩11(),2,3,n k k i i B X X k n ==-=∑ 其中样本二阶中心矩211(),n k i i B X X n ==-∑又称为未修正样本方差。
(6)顺序统计量将样本中的各个分量由小到大的重排成(1)(2)()n X X X ≤≤≤则称(1)(2)(),,n X X X 为样本顺序统计量,()(1)n X X -为样本的极差。
(7)样本相关系数:GAGGAGAGGAFFFFAFAF1()()()()n n i i i i i xy x y x x y y x x y y r S S =----==∑∑ 其中:,x y 分别为数据{}{},i i x y 的样本均值,,x y S S 分别为样本a 标准差。
GAGGAGAGGAFFFFAFAF5、直方图与箱线图(1)直方图先将所有采集的数据进行整理,得到顺序统计量,找出其中的最小值(1)x ,最大值()n x ,即所有的数据都落在区间(1)(),n x x ⎡⎤⎣⎦上,现取区间(1)(),n x k x k ⎡⎤-+⎣⎦(其中k 可取0.5,1.5等),该区间能覆盖区间(1)(),n x x ⎡⎤⎣⎦,将区间(1)(),n x k x k ⎡⎤-+⎣⎦等分为m 个小区间(先取一个区间,其下限比最小的数据稍小,其上限比最大的数据稍大,然后将这一区间等分为m 个小区间,通常n 较大时m 取1020,当50n <时则m 取56。
若m 取得过大,则会出现某些区间内频数为零,分点通常取比数据精度高一位,以避免数据落在分点上),小区间的长度记为∆,(1)()()()n x k x k l m +--∆==,∆称为组距,小区间的端点称为组限,数出数据落在每个小区间内的数据的频数i f ,算出频率GAGGAGAGGAFFFFAFAF(1,2,)i f i l n =,然后自左至右依次在各个小区间上做以(1,2,)if n i l =∆为高的小矩形,这样的图形就称其为频率直方图。
显然这种小矩形的面积就等于数据落在该小区间的频率(1,2,)i f i l n =,直方图的外廓曲线接近于总体X 的概率密度曲线。
(2)p 分位数定义 设有容量为n 的样本观察值12,,,n x x x ,样本(01)p p <<分为数记为p x ,它具有以下性质:(1)至少有np 个观察值小于或等于p x ;(2)至少有(1)n p -个观察值大于或等于p x 样本p 分位数可按以下法则求得:将12,,,n x x x 按从小到大的顺序排成(1)(2)()n x x x ≤≤≤ 01,若np 不是整数,则只有一个数据满足定义中的两点要GAGGAGAGGAFFFFAFAF求,这一数据位于大于np 的最小整数处,即为位于[]1np +处的数。
02,若np 是整数,则1,np np x x +都符合性质要求,故p x 取1,np np x x +的平均值。
综上可得:[](1)()(1)12np p np np x x x x ++⎧⎪=⎨⎡⎤+⎪⎣⎦⎩ np np 不是整是整 特别的:1()20.51()()2212n n n x x med x x ++⎧⎪⎪==⎨⎡⎤⎪+⎢⎥⎪⎣⎦⎩ n n 奇偶 0.25分位数又称为第一四分位数,又记为1Q ;0.75分位数又称为第三四分位数,又记为3Q(3)箱线图:数据集的箱线图是由箱子和直线组成的图形,它是在基于以下5个数据的图形概括:最小值GAGGAGAGGAFFFFAFAF 13,,,,Min Q M Q 最大值Max ,做法如下:(1)画一水平数轴,在轴上标记最小值13,,,,Min Q M Q 最大值Max ,在数轴上方画一个上下侧平行于数轴的矩形箱子,箱子的左右两侧分别位于13,Q Q 的上方,在M 点的上方画一条垂直线段,线段位于箱子的内部;(2)自箱子的左侧中点引一条水平线直至最小值上方;在同一水平高度自箱子右侧引一条水平线直至最大值上方。
箱线图完成。
在数据集中某一个观察值不寻常的大于或小于该数集中的其他数据,称为疑似异常值。
第一四分位数1Q 与第三四分位数3Q 之间的距离:31IQR Q Q =-称为四分位数间距,若数据小于131.5 1.5Q IQR Q IQR -+或大于,就认为他是疑似异常值。
GAGGAGAGGAFFFFAFAF将上述箱线图的做法修改如下: (1’)同(1) (2’)计算31IQR Q Q =-,若一个数据小于131.5 1.5Q IQR Q IQR -+或大于,则认为它是一个异常值,并以*表示;(3’) 自箱子的左侧中点引一条水平线直至数据中除去疑似异常值之后的最小值上方,再自箱子的右侧中点引一条水平线直至数据中除去疑似异常值之后的最大值上方; 这样做出的箱线图称为修正箱线图。
6关于Γ分布(1)Γ(Gamma )函数10(),(0)x x e dx s αΓα+∞--=>⎰它具有以下运算性质:(1)();()(1)!,;n n n N ΓααΓαΓ+==-∈特别地:(1)1Γ=GAGGAGAGGAFFFFAFAF1()2Γ= 1201()2x x e dx Γ+∞--=⎰2,2t x t dx tdt =⇒==2221200011()222xt t t x e dx e tdt e dt e dt t Γ+∞+∞+∞+∞------∞====⎰⎰⎰⎰ 令222222()()()t t s t I edt I e dt eds e dt +∞+∞+∞+∞-----∞-∞-∞-∞=⇒==⎰⎰⎰⎰220r d e rdr I πθπ+∞-==⇒=⎰⎰ 所以1()2Γ=(2)设随机变量X 服从Γ分布,即:(,)X Γαθ,其密度函数为:GAGGAGAGGAFFFFAFAF11()()0x x e f x αθαθΓα--⎧⎪=⎨⎪⎩0x qita > 0,0αθ>>定理:设随机变量X ,Y 都服从Γ分布且相互独立,即:(,)XΓαθ,(,)X Γβθ其密度函数分别为:11()()0x X x e f x αθαθΓα--⎧⎪=⎨⎪⎩0x qita > 0,0αθ>>11()()0y Y y e f y αθαθΓα--⎧⎪=⎨⎪⎩0y qita > 0,0βθ>>则Z X Y =+服从参数为,αβθΓ+的分布,即:(,)X Y Γαβθ++7、经验分布函数 设12,,n X X X 是总体F 的一个样本,用(),()S x x -∞<<+∞表示12,,n X X X 中不大于x 的随机变量的个数,定义经验分布函数为:1()(),()n F x S x x n=-∞<<+∞ 例题1:设总体F 有一个样本值1,2,3,则经验分布函数为:GAGGAGAGGAFFFFAFAF30,11,123()2,2331,3x x F x x x <⎧⎪≤<⎪=⎨≤<⎪⎪≥⎩例题2:设总体F 有一个样本值1,1,2,则经验分布函数为:30,12(),1231,2x F x x x <⎧⎪=≤<⎨⎪≥⎩格里汶科定理:(1933年)对于任意一实数x ,当n →∞时,()n F x 以概率1收敛于分布函数()F x{}lim sup ()()01n n x P F x F x →∞-∞<<+∞-==8. 三个重要分布 (1)分布 设为独立标准正态变量,称随机变量的分布为自由度为n 的分布,记为。
其密度函数为:GAGGAGAGGAFFFFAFAF11221()2()20n x n x e n f x Γ--⎧⎪⎪=⎨⎪⎪⎩00x x >≤性质:(1)若22(),n χχ则22(),()2E n D n χχ==因为(0,1)iX N所以:()0,()1i i E X D X ==2()()1i i E X D X == 221()()ni i E E X n χ===∑又 24224()()(())()1312,(1,2,)i i i i D X E X E X E X i n =-=-=-==其中:22224433222()()222t t ti t E X t e dt t e d t de ππ+∞+∞+∞----∞-∞-∞==--=-⎰⎰222233322222()2t t t t tde t de e dt t edt π+∞+∞+∞----+∞-∞-∞-∞-∞⎡⎤=-==⎢⎥⎢⎥⎣⎦⎰⎰22222222()3t t t t tde te e dt edt +∞+∞+∞----+∞-∞-∞-∞-∞⎡⎤==-==⎥⎥⎦⎰⎰⎰(2)2χ分布的可加性 设22221122(),()n n χχχχ,并且相互独立,则有:2221212()n n χχχ++(3)2χ分布的分位点GAGGAGAGGAFFFFAFAF对于给定的正数(01)αα<<,称满足条件222()(())()n P n f x dx ααχχχα+∞>==⎰的点2()n αχ为2()n χ分布的上α分位点。