概率论与数理统计 第六章--数理统计的基本概念
概率与统计学课件-第六章-数理统计的基本概念2-1

�总体与样本
基本概念: 总体:研究的问题所涉及的对象的全体 个体:总体中的每个成员 样本:从总体中抽取部分个体 样本容量:样本所包含的个体数量 样本观测值:
数的属性 样本的二重性 随机变量的属性
设X1,X2, …,Xn为总体X的一个容量为 n的 样本。若它满足 独立性,即X1,X2, …,Xn 相互独立; 同分布性,即每个 Xi都与总体X服从相 同的分布. 则称这样的样本为简单随机样本,简称为 样本。
�统计量
设是总体X的样本,g(X1,X2, …,Xn)是样本 的实值函数,且不包含任何未知参数,则 称g(X1,X2, …,Xn)为统计量。
例2.若X1,X2, X3是来自总体X~N(μ, σ 2)的 其中参数μ未知, σ2已知,则
X 1 X 3 − 3µ , X12 + 4 X 22 + 5µ 都不是统计量
�定理
若X1,X2, …,Xn是来自总体X的样本,设X 的分布函数为 F(x),则样本X1,X2, …,Xn的 联合分布函数为
n
∏ F (x )
i i =1
例1.若X1,X2, …,Xn是来自总体X的样本,设 X的分布函数为 F(x),则样本 X1,X2, …,Xn的联合分布函数为
⎧ n − λ xi (1 − e ), xi > 0(i = 1, 2,⋯ , n) ⎪∏ F ( x1 , x2 ,⋯ , xn ) = ⎨ i =1 ⎪ 0 , 其他 ⎩
1/8, 25 ≤ x<27 2/8, 27 ≤ x<30 3/8, 30 ≤ x<33 Fn(x)= 5/8, 33 ≤ x<35 6/8, 35 ≤ x<45 7/8, 45 ≤ x<65 1, 65 ≤ x
概率论与数理统计第2版教学课件第6章

极值的分布
定理2 设总体X的分布函数为F(x),X1,X2,…,Xn为其样本,则
(1) X(n)的密度函数f(n)(u)=nf(u)[F(u)]n-1;
(6-11)
(2) X(1)的密度函数f(1)(v)=nf(v)[1-F(v)]n-1;
(6-12)
其中f(x)为总体X的密度函数。
证明略。
6.2
同的分布。
(2) 要有独立性。每次抽取是独立的,即每个观测结果既不影响其他观测结果,也不受其他观测
结果的影响。
满足上述两条要求的抽取个体的办法称为简单随机抽样法。换句话说,简单随机抽样法就是独立
地、重复地做随机试验。今后,凡是提到随机抽样,都是指简单随机抽样。
6.1
随机样本与统计量
6.1.1
总体、个体与样本
6.1.2
样本统计量
(4) 样本k阶原点矩
(5) 样本k阶中心矩
—
n−1 2
应当注意的是:M1= X ,υ2=
S。
n
6.1
随机样本与统计量
6.1.2
样本统计量
定义3 (顺序统计量) 设x1,x2,…,xn为样本X1,X2,…,Xn的一个观察值,将x1,x2,…,xn由小到大重新
排列为
x(1)≤x(2)≤…≤x(k)≤…≤x(n),
由定义知,对于x的每个数值而言,经验分布函数Fn∗(x)为样本X1,X2,…,Xn的函数,它是一个统计
12
k
nn
n
量,即为一个随机变量,其可能取值为0, , ,…,1。事件“Fn∗(x)= ”发生的概率为
P Fn∗ (x) =
其中F(x)=P{X<x}是总体X的分布函数。
k
概率论与数理统计-6

一、统计量
定义1 设X1, X2, …, Xn是总体X的样本,样本函数g(X1, X2, …, Xn)是样 本的实体函数,且不含有任何未知参数,则称这类样本函数g(X1, X2, …, Xn)为统计量。
由于样本具有二重性,统计量作为样本的函数也具有二重性,即对 一次具体的观测或试验,它们都是具体的数值,但当脱离开具体的某 次观测或试验,样本是随机变量,因此统计量也是随机变量。
n i 1
( xi
x )2
1n (
n 1 i1
xi2
nx 2 )
。
(3)样本标准差
S
S2
1 n 1
n i 1
(Xi
X
)2
它的观测值记为 s
s2
1 n 1
n i 1
( xi
x )2
。
(6-5)
(4)样本k阶原点矩
Ak
1 n
n i 1
X
k i
(k
1,2 ,3,
)
它的观测值记为 ak
解 将样本的观察值由小到大排列为 1 2 3 3 4 4 4 5 6 8
所以样本的频率分布如表所示
X
1
2
3
4
5
6
8
fn
0.1
0.1
0.2
0.3
0.1
0.1
0.1
例1 设总体服从泊松分布,容量为10的样本观察值如下:
214 3 5 6 4 8 4 3 试构造样本的分布函数F10(x)。
例1 设随机变量 X ~ (0 ,1) 分布,求D(X)。
解 因为 X ~ (0 ,1)
所以 又
E(X ) p E( X 2 ) 0 (1 p) 12 p p
【2024版】概率论与数理统计(数理统计的基本概念)

X
2 n
)
D(
X
2 1
)
D(
X
2 2
)
D(
X
2 n
)
nD (
X
2 i
)
n{ E (
X
4 i
)
[E(
X
2 i
)]2
}
n
x4
1
2
e
x2 2
dx
12
n3
1
2n
23
若 2 ~ 2(n) 分布函数为F ( x)
,0 1 若F ( x) P{ 2 x}
则其解称为 2 分布 的 分位数(临界值)
0.15 00.1.155
000.1..11
N(0,1)
n=10 n=10 nn==33
n增大
000.0..00555
nnn===111
000
-5--55
-4--44
-3-3
-2-2
-1-1
00
11
22
33
444
555
t 分布的密度曲线关于y轴对称 随着n的增大, t 分布的密度曲线越陡
n 时,t 分布趋于标准正态分布N (0,1)
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
引入统计量的概念
12
定义 设( X1, X 2 ,, X n )为来自总体X的一个样本,
若n元函数f ( X1, X 2 ,, X n )不含任何未知参数,
则
称f
(
X
1
,
X
2
,,
X
n
)为X
1
,
X
2
概率论与数理统计 数理统计的基本概念

6
定义 3 设 X1, X 2 ,, X n 为总体 X 的一个 样本,若 X1, X 2 ,, X n 相互独立且与总体 X 同分布,则称 X1, X 2 ,, X n 为来自总体 X 的 一个简单随机样本,简称样本.
8
常见统计量
设 X1, X 2,, X n 是来自总体 X 的样本, x1 , x2 ,, xn 是 样本的观察值,定义
样本均值 样本方差 样本标准差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X )2
1n (
n 1 i1
X
2 i
nX
2)
S
S2
今后不作特殊说明,本书所指的样本 均为简单随机样本.
7
定义 4 设 X1, X 2 ,, X n 是来自总体 X 的样本, x1 , x2 ,, xn 为样本观察值,T (X1, X 2 ,, X n ) 是关于 X1, X 2 ,, X n 的样本函数.若T 中不含任何未知参 数,则称T (X1, X 2 ,, X n ) 是统计量,称T (x1, x2 ,, xn ) 是 统计量的观察值.
第六章 数理统计的基本概念
1
什ห้องสมุดไป่ตู้是数理统计学?
数理统计学是这样一门数学分支,它运用概率论 与数学的方法,研究如何有效地收集、整理和分析带 有随机性影响的数据,并由此对所研究的问题作出尽 可能合理的推断和预测,从而为相关决策提供参考和 建议.
2
数理统计和概率论的关系
●数理统计学和概率论是随机数学的姊妹篇 ●有密切的联系却又不是同一学科 ●概率论是数理统计学的理论基础 ●数理统计学是概率论的重要应用.
概率论与数理统计基本概念

概率论与数理统计基本概念
概率论与数理统计是研究事件发生的可能性,以及由此衍生的结果
的一门学科。
它可以帮助人们提高分析和预测能力。
可以帮助我们了
解自然界及其客观原理,以及把握当代社会经济实体及其活动。
一、概率概念:
1. 随机事件:指事件发生以来,在所有结果中,用概率值去衡量其发
生的可能性,及其各个单一结果的概率分布情况;
2. 概率:是用来衡量某一随机事件发生的可能性的数值,可以给出这
个事件发生的可能性大小;
3. 概率分布:是某一随机变量及其可能取值之间发生关系的一种描述;
二、数理统计概念:
1、统计:是指对数据进行定量描述,尝试从数据中获得解释性的统计
特征;
2、变量:是指以数值形式表示的某类事物,是研究目标内容分析的一
种实际基础;
3、统计分布:是给定一组数据,通过统计手段,计算出变量的概率分
布情况,及其可能的变化规律;
4、极限定理:是一种概率论的定理,旨在探讨一个系统在重复抽样下,抽样结果的收敛情况;
5、数据描述:是指对数据的描述,可以让人简单明了地理解数据,及
其特征和趋势;
6、统计推断:是指根据统计样本信息,以概率结果作为有效依据,做
出关于总体参数情况的推断;
7、回归分析:是指建立一条回归函数模型,以描述解释变量对被解释
变量的影响;
8、判别分析:是指构建一个准确的模型,能够根据输入的观测值来准
确地判断属于哪一类人或物;
9、聚类分析:是指将一组数据进行分类,从而揭示内部数据间的关系,辅助决策;
10、卡方检验:是指判断某一种统计判断是否证实对某一总体分布结
果的检验,从而决定是否接受或拒绝假设。
第六章 数理统计的基本概念

1 n 2 S S ( X X ) i n 1 i 1
2
(4) 样本k阶(原点)矩
1 n k Ak X i n i 1
k 1, 2,
k 2,3,
(5) 样本k阶中心矩
1 n Bk ( X i X )k n i 1
§2
常用统计量的分布
统计量的分布称为抽样分布.下面介绍三种由 正态总体演化而来的统计量的分布:
• 从二战后到现在,是统计学发展的第三个时期,这是一个在 前一段发展的基础上,随着生产和科技的普遍进步,而使这 个学科得到飞速发展的一个时期,同时,也出现了不少有待 解决的大问题.
学科奠基者
数理统计作为一个进一步完善的数学学科的奠基者是英国人费歇尔。他1909 年入剑桥大学,攻读数学物理专业,三年后毕业。毕业后,他曾去投资办工 厂,又到加拿大农场管过杂务,也当过中学教员。1919年,他开始对生物统 计学产生了浓厚的兴趣,参加罗萨姆斯泰德试验站的工作,致力于数理统计 在农业科学和遗传学中(费歇尔1890—1962)的应用研究。 年轻的费歇尔主要的研究工作是用数学将样本的分布给以严格的确定。 在一般人看来枯燥乏味的数学,常能带给研究者极大的慰藉,费歇尔热衷于 数理统计的研究工作,后来的理论研究成果有:数据信息的测量、压缩数据 而不减少信息、对一个模型的参数估计等。 最使科学家称赞的工作则是试验设计,它将一切科学试验从某一个侧面 “科学化”了,不知节省了多少人力和物力,提高了若干倍的工效。 费歇尔培养了一个学派,其中有专长纯数学的,有专长应用数学的。在30- 50年代费歇尔是统计学的中心人物。1959年费歇尔退休后在澳大利亚度过了 最后三年。
若 x1 , x2 , , xn 是样本的观察值, 则 g ( x1 , x2 , xn ) 是 g ( X 1 , X 2 , X n )
第六章 数理统计的基本概念(1)

XK
1 n
n i 1
X
k i
(4)样本k阶中心矩:
1 n
n i 1
(Xi
X )k
(5)顺序统计量: X(1) X(2) X(n) . 其中 X(k) 为将 X1, X2 , , Xn 从小到大排列第 k 位值.
18 September 2020
概率论与数理统计
理学院数学系
2、离散型 设总体X的分布律为 P{ X x} p( x)
则样本X1, X2 ,的, 联Xn合分布律为 P{ X1 x1, X2 x2 ,, Xn xn } p( x1 ) p{ x2 ) p( xn )
18 September 2020
概率论与数理统计
理学院数学系
样本分布
第六章 数理统计的基本概念
(1)样本均值:
X
1 n
n i 1
Xi
(2)样本方差:
Sn2
1 n
n
(Xi
i 1
X )2
修正样本方差:
Sn*2
1 n1
n i 1
(Xi
X )2
nSn2 (n 1)Sn*2
18 September 2020
概率论与数理统计
理学院数学系
第六章 数理统计的基本概念
第22页
(3)样本k阶原点矩:
第13页
1、样本的联合分布函数 设总体 X 的分布函数为 FX (., ), (X1, X2 ,
则样本的联合分布函数为
, Xn ) 为样本.
FX1,X2 , ,Xn ( x1, x2 , , xn ; ) FX ( x1, )FX ( x2 , ) FX ( xn , )
《概率论与数理统计》第六章

既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计第六章 数理统计的基本概念精品教案

第六章数理统计的基本概念一、内容提要数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。
它的主要内容是由样本来推断总体。
(一)基本概率1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。
组成总体的每个元素称为个体或单元。
从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,X n表示。
一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。
抽得的这些个体构成一个样本,用(X1,X2,…,X n)表示,n为样本容量,X1,X2,…,X n应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,X n)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,12(X 1,X 2,…,X n )又是n 个具体的数据x 1,x 2…,x n ,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X 1,X 2,…,X n )表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X 1,X 2,…,X n )的观测值按由小到大次序排列后为:**2*1n x x x ≤≤≤Λ定义()()*1**1*0,,,,1,2,,11,.n k k n x x kF x x x x k n n x x +⎧⎪⎪=≤<=-⎨⎪⎪≥⎩p L ,为样本分布函数对于样本的不同观测值(x 1,x 2…,x n ),我们将得到不同的F n (x ),所以F n (x )是一个随机变量。
概率论与数理统计6-8

无关的样本的连续函数,则称g(X1,X2,…,Xn)为
统计量。 统计量是样本的函数,它是一个随机变量, 如果x1, x2, …, xn是样本观察值, 则g(x1, x2, …, xn)是统计量g(X1, X2, …, Xn)的一个观察值.X i ; n i 1 2 n 1 2 2. 样本方差 S (X i X ) ; n - 1 i 1 1 n k 3. 样本k阶原点矩 A k X i , k 1, 2, ; n i 1 1 n 4. 样本k阶中心矩 Bk (X i X ) k , k 2, 3, . n i 1
§7.1 点估计 一. 问题的提法:
设总体X的分布函数F ( x; θ )的形式为已知 ,
是待估参数, 1 , X 2 , , X n 是X的一个样本, X
x1, x2 , , xn 是相应的一个样本值。
点估计问题就是要构造 一个适当的统计量 ˆ ( X , X , X ),用它的观察值 ˆ( x , x , , x )
2
分布具有可加性,定义 X 1 ,X 2 , ,X n 独立 中 n 1 同服从N (0,1),所以 = X ~ ( , ) 2 2 i 1
2 2 i n
β α α-1 -x x e , x 0, 分布的概率密度为 f ( x) Γ (α ) : 0 , 其它. n 1 2 2 比较 (n)的密度可知: (n) 分布就是 , 2 2 2 的分布, 即 (n) (n / 2, 1/2).
N (0, 2 ) ,X1,X2,X3 为取自总体的一个样本, 2.设总体 X~
试求:(1)3X1-2X2+X3 的分布;(2)
2 X1 X 22 X 32
的分布。
大连理工大学《概率论与数理统计》课件-第6章

第6章数理统计的基本概念一. 统计的基本概念二. 统计量的分布三. 抽样分布,由大数定律:(3)则在 8.1,需确定估计区间()。
(2)构造2σ甲μ甲μ乙μμ−→−PX1.8=x统计工作最基本内容:1.估计电视机寿命的平均值µ,估计电视机寿命的方差2.比较两厂电视机寿命值有无差别,方差有无差别。
总体样本统计量参数点估计假设检验区间估计目的:(方差同理)方法:()··21是否一致与μμ()··2221是否一致与σσ()··0是否一致与μμ()··22是否一致与σσ().,...,21n x x x 统计工作的基本步骤1.收集资料:2.统计分析:对数据整理和分析3.统计推断:i )点估计:确定未知参数θ的估计量ii )区间估计:确定(左,右)区间(1)参数估计:(2)假设检验:i )推断两个总体均数是否一致ii )推断两个总体方差是否一致iii )推断一个总体均数有无变化iv )推断一个总体方差有无变化⎪⎪⎩⎪⎪⎨⎧-2221212σσμμσμθ一. 统计的基本概念()为样本一组观察值。
,21n x x x ⎩⎨⎧总体有限总体(观察值有限个)无限总体(观察值无穷多个)随机变量 X 总体⇔(n 为样本容量)研究对象观察值的全体(样本是从总体中抽取的部分个体)n X X X 21,个体:每个观察值。
独立同分布,则称()n X X X 21,为简单随机样本,简称为样本。
(),,21n X X XnX X X 21,(),...2,1,===i p x X P i i ()n n x X x X x X P ===,...,2211()∏===ni i x X P 1样本联合分布列:(1)代表性:保证总体中每个个体有同等机会被抽到。
(2)独立性:每次抽取独立进行,各个体值互不影响。
(1)离散型:总体X 的分布列()发生的概率x x x 样本点n 21,与总体同分布()n x x x F ,...,21()n x x x f ,...,21(2)连续型:总体X 的分布密度f (x )样本联合密度:(3)总体X 的分布函数F (x )样本联合分布函数为:()()()n x f x f x f 21=()()()n x F x F x F 21=()发生的可能性x x x 样本点n 21,n X X X ,,21n X X X ,,21()n X X X 21,设为总体X 的样本,()n X X X T T 21,=函数,且不含任何未知参数,称T 为统计量。
概率论与数理统计第六章

Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。
《概率论》 第六章 数理统计的基本概念.

2. 抽样原则 为使抽取的样本能很好地反映总体的特征,
一般要求抽取样本时遵循以下两点原则:
(1) 代表性 要求样本中的每个样品都是从总体 中 完全随机地抽出的,即每个样品与总体 具有相同
的分布;
(2) 独立性 要求每个样品的抽出相互之间是互不 影响的,即要求每个样品之间相互独立.
满足以上两点要求的样本称为简单随机样本.
1n
n 1 i1
i
2
(4) 样本 k 阶原点矩
Mk
1 n
n
i 1
k i
,
k
1,
2, ;
(5)样本 k 阶中心矩
M
k
1 n
n
(i
i 1
)k
, k 2, 3, ;
注 1. 上述几个统计量统称为样本矩;
2.
X
M1 ,
S2
M
2
.
三、样本矩的性质
2. 2分布的性质
性质1 ( 2 分布的可加性)
设 ~ 2(n1 ), ~ 2(n2 ), 并且 , 独立, 则 ~ 2(n1 n2 )
推广: 设 i ~ 2(ni ), 并且 i (i 1, 2,, m) 相互
独立,
则
m
i
~
2 (n1
2π
标准正态分布的上侧分位点
定义 设 U ~ N (0,1) ,对给定的正数(0 1),
若实数u 满足
P{U u }
则称点 u为标准正态分布U的 上侧分位点(或称 上 分位数或 临界值).
《概率论与数理统计》学习笔记

《概率论与数理统计》(19)电子科技大学应用数学学院,徐全智吕恕主编。
2004版第6章数理统计的基本概念概率论与数理统计是两个紧密联系的姊妹学科,概率论是数理统计学的理论基础,而数理统计学则是概率论的重要应用.数理统计学是使用概率论和数学的方法,研究如何用有效的方式收集带有随机误差的数据,并在设定的模型下,对收集的数据进行分析,提取数据中的有用信息,形成统计结论,为决策提供依据. 这就不难理解,数理统计应用的广泛性,几乎渗透到人类活动的一切领域! 如:农业、生物和医学领域的“生物统计”,教育心理学领域的“教育统计”,管理领域的“计量经济”,金融领域的“保险统计”等等,这些统计方法的共同基础都是数理统计.数理统计学的内容十分丰富,概括起来可以分为两大类:其一是研究如何用有效的方式去收集随机数据,即抽样理论和试验设计;其二是研究如何有效地使用随机数据对所关心的问题做出合理的、尽可能精确和可靠的结论,即统计推断.本书主要介绍统计推断的基本内容和基本方法. 在这一章中先给出数理统计中一些必要的基本概念,然后给出正态总体抽样分布的一些重要结论.6.1总体、样本与统计量一、总体在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个基本元素称为个体.二、样本样本是按一定的规定从总体中抽出的一部分个体" 这里的“按一定的规定”,是指为保证总体中的每一个个体有同等的被抽出的机会而采取的一些措施" 取得样本的过程,称为抽样.三、统计量6.2抽样分布统计量是我们对总体的分布规律或数字特征进行推断的基础. 由于统计量是随机变量,所以在使用统计量进行统计推断时必须要知道它的分布. 统计量的分布称为抽样分布.一、三个重要分布二、抽样分布定理6.3应用一、顺序统计量及其应用二、极值的分布及其应用。
第6章 数理统计的基本概念

(
n1 2
n1
)
+ n2 2
(
)
n2 2
)
(
n1 n2
)(
n1 n2
n1 −1
x) 2 (1 +
n1 n2
−
x)
n1 + n2 2
,x
0
0,
x0
24
f (x) =
(
(
n1 2
0
n1 + n2 2
) ( ,
)
n2 2
)
(
n1 n2
)(
n1 n2
n1 −1
x) 2 (1 +
n1 n2
− n1 + n2
n−2 23
3、F 分布
定义 设 X ~ 2 (n1 ) , Y ~ 2 (n2 ) ,且 X 与 Y 相互
独立,则称随机变量
F = X / n1 Y / n2
服从自由度为 (n1, n2 )的 F 分布,记为 F ~ F (n1, n2 ) .
F(n1,n2)的概率密度为
f (x) =
(
实际上,每一次测量所得结果是一个个体, 而总体是由“一切可能的测量值”组成。这只是 一个想象中存在的集合,因为不可能去进行无限 次测量。它的个体是通过试验“制造”出来的。
这种情况在实际应用中非常之多。给这种总 体同样可规定分布,例如上述例子中说“测量结 果服从正态分布”是容易理解的。
8
二、样本
一般情况下,对总体的每一个个体都进行观察或试 验是不可能的,这是因为经济上、时间上不允许(如个体 的数量很大),或观察试验是带破坏性的(如灯泡的寿命、 炮弹的射程).因此,必须对总体进行抽样观察.
概率论与数理统计 第六章

F-分布的概率密度为
n1 n1 1 2 2 [(n1 n2 ) / 2](n1 / n2 ) x , x 0, n1 n2 f ( x) (n1 / 2)(n2 / 2)[1 (n1 x / n2 )] 2 0, 其它.
河南理工大学精品课程
概率论与数理统计
河南理工大学精品课程
n 1 2
( x )
概率论与数理统计
f (x)
n
n 10
n 1
O
x
t-分布的概率密度性质
t-分布的概率密度为偶函数,且以标准正态概率 密度为其极限(n→∞)。
河南理工大学精品课程 概率论与数理统计 上α分位点(双侧 Nhomakorabea/2分位点)
定义 点 t (n) 为 t (n) 分布的上α 分位点
究,就是对相应的随机变量X的研究。
今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征,并不再区分总体与相应的随机变量
X.对总体的称呼:总体,总体X与总体F.
河南理工大学精品课程 概率论与数理统计
例如,当X~N(μ,σ2)时,称总体X为正态总体.正态 总体有以下三种类型: ①μ未知,但σ2已知; ②σ2未知,但μ已知; ③μ,σ2均未知.
P{t t (n)} (0 1).
查附表4[P.298]:
t0.025 (8) 2.3060, t0.005 (4) 4.6041.
河南理工大学精品课程
概率论与数理统计
双侧α/2分位点:
t1 / 2 (n), t / 2 (n)
f (x)
/2
t1 / 2 (n) O
河南理工大学精品课程
概率论与数理统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F分布性质2 若X ~t(n),则X2~F(1,n)
例4.设X1,X2, …,Xn是来自正态总体N(0,1) 的样本,试问c=( )统计量
c
2 X i 3 i 1 n
X
i 4
2 i
服从F分布?
抽样分布的分位点
设α为给定的常数,且0<α<1.若存在χα2(n)使
P ( n)
分位点的性质
(1) u1 u (2)
t1 (n) t (n)
1 (3) F (m, n) F1 (n, m)
回顾1. 设X1 ,X2 ,X3, X4是来自总体N(0,4)的简单 随机样本,X=a(X1-2 X2)2+b(3X3 -4X4)2,问当 a,b为何值时,统计量X服从 2分布 .
Max=1572, Min=738, 组数=6 组距=(Max-Min)/6=139140 取a0=735, 则分组区间及相关数据如下
组序 1 2 分区区间 (735,875] (875,1015] 频数 6 8 频率 0.2 0.27 累计频率 0.2 0.47
3
4 5 6 合计
(1015,1155]
2
所服从的分布为自由度为 n 的 分布 记为
2
~ (n)
2 2
分布的密度函数为
2
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
其中伽玛函数 ( x )通过积分
( x ) e t dt, x 0 0 来定义.
(1155,1295] (1295,1435] (1435,1575]
9
4 2 1 30
0.3
0.13 0.07 0.03 1
0.77
0.9 0.97 1.0
经验分布函数
设X1,X2, …,Xn是取自总体X的样本,对应的次 序统计量为X(1) X(2) … X(n) ,当给定次序 统计量的观测值x(1) x(2) … x(n)时,对任意实 数x,称下面函数为总体X的经验分布函数。
服从t分布?
3. F分布 定义:设 X ~ 2 (n1 ), Y ~ 2 (n2 ), X与Y相互独立, 则称统计量 X n1
F Y n2
服从自由度为n1及 n2 的F分布,n1称为第一自 由度,n2称为第二自由度,记作 F~F(n1,n2) .
F分布性质1 若X~F(m,n), 则1/X~F(n,m)
2.已知F分布的分位点F0.05(9,12)=2.8, F0.05(12,9)=3.07,则F0.95(12,9)=( )
三、正态总体的抽样分布
定理1:设X1,X2, …,Xn是来自正态总体N(μ,σ2) 的样本,则
X ~ N ( ,
2
n
)
2
(n 1) S 2
2
~ (n 1)
2
X与S 相互独立
■抽样分布
统计量既然是依赖于样本的,而后者又 是随机变量,故统计量也是随机变量,它的 分布叫做统计量的“抽样分布” .
■统计三大分布
1. 分布
定义: 设 X 1, X 2 ,, X n 相互独立, 都服从正态 分布N(0,1), 则称随机变量:
2
X X2 Xn
2 2 1 2
t x 1
性质1(可加性) Y1 ~χ2(m), Y2 ~χ2(n),Y1与Y2独立, 则Y1 +Y2 ~ χ2(m+n)
性质2(数字特征) 若χ2 ~χ2(n),则 E(χ2)=n,D(χ2)=2n
2. t 分布
定义: 设X~N(0,1) , Y~ (n) , 且X与Y相互 独立,则称变量 X T Y n
0, 1 , 8 2 , 8 3 , 8 Fn ( x) 5 , 8 6 , 8 7 , 8 1, x 25, 25 x 27, 27 x 30, 30 x 33, 33 x 35, 35 x 45, 45 x 65, 65 x.
0, k Fn ( x) n 1, x x(1) , x( k ) x x( k 1) , k 1, 2 x( n ) x. n 1,
例1:从总体X中抽取容量为8的样本,其观测值为 33,45,25,33,35,65,30,27。 试求X的经验分布函数。 解:将样本观测值由小到大排序得 25<27<30<33=33<35<45<65
X (1) min{ X1 , , X n }为最小次序统计量
频数/频率直方图
某地区30名2000年某专业毕业实习生实习期满后的 月薪数据如下:
909 1091 967 1232 1096 1164 1086 1071 1572 950 808 971 1120 1081 825 775 1224 950 999 1130 914 1203 1044 866 1320 1336 992 1025 871 738 A. 构造该数据的频率分布表(组数为6) B. 画出直方图
2 2
2
( n )
f n ( x)dx
其中 fn(x) 为 χ2 的概率密度,则称点 χα2(n) 为 χ2分布关于α的上侧分位点。
设α为给定的常数,且0<α<1. 若存在tα (n)使
PT t (n)
t ( n )
f n (t )dt
其中fn(t)为T的概率密度,则称点tα (n)为 t分布关于α的上侧分位点。
第六章 数理统计的基本概念
§6.1
■总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体,
总体中每个成员称为个体.
总体
…
研究某批灯泡的寿命
■样本 为推断总体分布及各种特征,随机地从总 体中抽取若干个体进行观察试验,这一抽取过 程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.
•容量为n的样本可以看作n维随机变量 (X1,X2,…,Xn)
一旦取定一组样本,得到的是n个数 (x1,x2,…,xn),称为 样本的一次观察值,简称样本观测值 .
简单随机样本
设X1,X2, …,Xn为总体X的一个容量为n的 样本。若它满足 (1)独立性,即X1,X2, …,Xn 相互独立; (2)同分布性,即每个Xi都与总体X服从 相同的分布. 则称这样的样本为简单随机样本,简称 为样本。
则有
( X Y ) ( 1 2 ) ~ t (m n 2) 1 1 Sw m n
2 2 ( m 1) S ( n 1) S 2 1 2 Sw mn2
定理 3 (两总体样本方差比的分布)
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X m是取自X的样本, Y1,Y2,…, Yn 是
2
所服从的分布为自由度为 n的 t 分布.
记为T~t(n).
T的密度函数为:
[( n 1) 2] f n ( x) (1 n (n 2) n
2 n 1 x ) 2
例3.设X1,X2, …,Xn是来自正态总体N(0,4) 的样本,试问c=( )统计量
c X1
X
i 2
n
2 i
t1 (n) t (n)
设α为给定的常数,且0<α<1. 若存在Fα (m,n)使
PF F (m, n)
F ( m , n )
f ( y )dy
其中f(y)为 F的概率密度,则称点 Fα (m,n)为 F分布关于α的上侧分位点。
1 F (m, n) F1 (n, m)
总体、样本、样本值的关系 总体(理论分布) ? 样本 样本值
统计是从手中已有的资料--样本值,去 推断总体的情况---总体分布F(x)的性质. 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
§6.2
■统计量
设X1,X2, …,Xn是总体X的样本,g(X1,X2, …,Xn) 是样本的实值函数,且不包含任何未知参数, 则称g(X1,X2, …,Xn)为统计量。
常用统计量
样本均值
1 X Xi n i 1
样本方差
n 1 2 2 S (Xi X ) n 1 i 1
n
样本k阶原点矩
1 k Ak X i n i 1 1 n k Bk ( X i X ) n i 1
n
样本k阶中心矩
次序统计量 设X 1 , X 2 , , X n为总体X 的样本, 函数
( X ) ~ t (n 1) S/ n
定理 2 (两总体样本均值差的分布)
设X ~ N ( 1, 2 ),Y ~ N ( 2 , 2 ), 且X与Y独立, X1,X2,…, X m 是取自X的样本, Y1,Y2,…, Yn 是
取自Y的样本, X和Y 分别是这两个样本的 样本
2 均值, S12和S2 分别是这两个样本的样本方差,
2 1 2 2
取自Y的样本, X和Y 分别是这两个样本的 样本
2 均值,S12和S2 分别是这两个样本的样本方差,
则有
S ~ F (m 1, n 1) S
2 1 2 2 2 1 2 2
X (k ) X (k ) ( X1, X 2 , x1 , x2 ,
, X n ), k 1,
, n, , X n的观察值
其中X ( k )的观察值是样本X 1 , X 2 , 则称X (1) , , X ( n )为次序统计量。
, xn中由小到大排列后的第k 个数值,