5.1--5.3数理统计的基本概念

合集下载

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)
1. 引言
本文旨在对数理统计的基本知识点进行归纳总结,帮助读者快速了解数理统计的核心概念和方法。

2. 概率论基础
- 概率的基本定义和性质
- 随机事件的运算规则
- 条件概率和独立性
- 贝叶斯定理
3. 随机变量和分布
- 随机变量的定义和分类
- 离散型随机变量和连续型随机变量
- 常见离散型分布(如伯努利分布、二项分布、泊松分布)
- 常见连续型分布(如均匀分布、正态分布、指数分布)
4. 数理统计的基本概念
- 总体和样本的概念
- 估计与抽样分布
- 统计量和抽样分布
5. 参数估计
- 点估计的定义和性质
- 常见的点估计方法(如最大似然估计、矩估计)
- 区间估计的基本原理和方法
6. 假设检验
- 假设检验的基本思想和步骤
- 单侧检验和双侧检验
- 假设检验中的错误类型和显著性水平
- 常见的假设检验方法(如正态总体均值的检验、两样本均值的检验)
7. 相关分析
- 相关系数的定义和计算方法
- 相关分析的假设检验
- 线性回归分析的基本原理和方法
8. 统计软件的应用
- 常见的统计软件介绍(如SPSS、R、Python)
- 统计软件的基本操作(如数据导入、数据处理、统计分析)
9. 结语
本文对数理统计的核心知识点进行了简要的概括,供读者参考和研究。

通过研究数理统计,读者可以更好地理解和应用统计学在实际问题中的作用,提高数据分析和决策能力。

以上是根据数理统计知识点的归纳总结,希望有助于您对数理统计的理解和学习。

如需深入了解各个知识点的具体内容,请参考相关教材或课程。

数理统计

数理统计
数理统计
四、数理统计的基本概念 五、参数估计
四、数理统计的基本概念
1. 总体和样本 总体:研究对象的某项数量指标的值的全体。 个体:总体中的每个元素为个体。 容量:总体中所包含的个体的个数。 按此分为有限总体和无限总体。 例如:某工厂生产的灯泡的寿命是一个总体,每 一个灯泡的寿命是一个个体;某学校男生的身高 的全体一个总体,每个男生的身高是一个个体。


1 ˆ 解得: n
2
x
i 1 n
n
i
x
1 ˆ n

i 1
( X i X )2
(3)估计量的评选标准
1) ˆ ˆ 无偏性:若 ( X 1 , , X n )的数学期望存在, ˆ ˆ 且E . 则称是的无偏估计量。
2)
ˆ ˆ ˆ ˆ 有效性:若1 1 ( X 1 , , X n ), 2 2 ( X 1 , , X n ) ˆ ˆ 都是的无偏估计量;若D( ) D( ).
ˆ 所以 A1 X ,
ˆ A2
2 2 A1
1 n

i 1
n
X i2
1 X n
2

i 1
n
( X i X )2
(2) 极大似然估计法
(1).若总体X属离散型,其分布律 { X x} p( x; ), P 的形式为已知, 为待估参数,是可能取值的范围。
解:X的概率密度为: 1 1 2 f ( x; , ) exp{ (x )2} 2 2 2
似然函数为:
L( , )
2
2 2 2 i 1 n n 1 ln L ln(2 ) ln( ) 2 2 2 2

数理统计的基本概念

数理统计的基本概念
(n 2) n n

n 1 2
, x .
t 分布的概率密度图形
图形关于 x 0 对称, lim f ( x; n) 0 , 且 x 当 n 充分大时,f (x; n) 趋近于标准正态 分布的概率密度。
定理 4: X 1, 2, , n 是抽自正态总体 设 X X
若总体 X 是离散型的,其分布律为:
则样本的联合分布为
§6.2 抽样分布
6.2.1 统计量的概念 由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。 这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。 定义2:设 X 1 , X 2 , , X n 是来自总体X的样本, g( X 1 , X 2 , , X n ) 是样本 X 1 , X 2 , , X n 的函数,如果 g( X 1 , X 2 , , X n ) 中不包含任何未知参数,则称它 是一个统计量。
1 (0.82)
1 0.7939 0.2061
X ~ N (0, 22 ), X1 , X 2 , X3 , X 4 为其样本,求a,b 例2:总体
(2). (n 1)S / ~ (n 1)
2
X (1). X ~ N ( , / n), 或 ~ N (0,) ; 1 / n 2 2 2
2
X (3). X 与 S 相互独立; (4). ~ t(n 1). S/ n
定理5:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自总体 2 两样本独立, X ~ N ( 1 , 12 )和Y ~ N ( 2 , 2 )的样本, 2 S12 / S2 则有 F 2 ~ F ( m 1, n 1). 2 1 / 2 定理6*:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自

数理统计的基本概念

数理统计的基本概念

样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
河南理工大学精品课程
1 Ak = n 1 Bk = n
∑ ∑
n
n
i =1
X ik ( k = 1, 2 , L )
i =1
( X i − X ) k ( k = 1, 2 , L )
概率论与数理统计
说明 (修正 样本方差还可表示为 修正)样本方差还可表示为 修正
n 1 S2 = [ ∑ X i2 − n X 2 ] n − 1 i =1
1 n 推导】 【推导】 S 2 = ( X i − X )2 ∑ n − 1 i =1 = = = =
河南理工大学精品课程
1 n ( X i2 − 2 X i X + X 2 ) ∑ n − 1 i =1 n n n 1 [ ∑ X i2 − 2 X ∑ X i + ∑ X 2 ] n − 1 i =1 i =1 i =1 n 1 [ ∑ X i2 − 2 n X 2 + n X 2 ] n − 1 i =1 n 1 [ ∑ X i2 −n X 2 ] n − 1 i =1
河南理工大学精品课程 概率论与数理统计
做法
从总体中随机地抽取若干个体(灯泡、 从总体中随机地抽取若干个体(灯泡、工大男
生),测试其所需数据(寿命、身高),最后对所得数据通过 ),测试其所需数据 寿命、身高), 测试其所需数据( ),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况. 的分布情况,从而了解整体情况. 一般,我们所研究的总体的某项数量指标X 一般,我们所研究的总体的某项数量指标X是一个随 机变量,其取值在客观上有一定的分布.因此, 机变量,其取值在客观上有一定的分布.因此,对总体的研 究,就是对相应的随机变量X的研究。 就是对相应的随机变量X的研究。 今后,我们称X 今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征, 分布函数和数字特征,并不再区分总体与相应的随机变量 X.对总体的称呼 总体,总体X 总体F X.对总体的称呼:总体,总体X与总体F. 对总体的称呼:

数理统计的基本概念

数理统计的基本概念
第二章 数理统计的基本概念 与抽样分布
数理统计是研究大量随机现象统计规律的 一门数学科学,以概率论为基础: 收集、整理和分析受到随机性影响的数据 为随机现象选择和检验数学模型 推断和预测随机现象的性质、特点和统计 规律 为决策提供依据和建议
(1) (2) (3) (4)
具体内容: 基本概念 经验分布函数和直方图 常用统计分布 抽样分布 顺序统计量与样本极差 充分统计量
X i2 ~ 2 ( n)
i 1 n
(2) 若总体 ~ N (, 2 ),而 X1 , X 2 ,, X n )为来自 的 X ( X
一个样本,则统计量
1 2 ( X i ) 2 ~ 2 ( n)
i 1 n
(3) 若 2 ~ 2 (n),则 2 的特征函数为(t ) (1 2it )
n 2 2 k ~ nk . k 1 k 1
n
定理3: 若随机变量 2 ~ 2 (n),则 定理4: (Fisher定理)
2 - 2 n 1
2
2 n
2n
~ N (0,1)。
设2 ~ 2 (n),则
N (0,1)
n .
L
举例,先复习一个定理 设 X 是一个取值于区间[ a , b ],具有 概率密度 f ( x ) 的连续型随机变量 ;又设 y = g ( x ) 处处可导,且对于任意 x , 恒有 g ( x ) 0 或恒有 g ( x ) 0 ;则 Y = g (X) 是一个连续型随机变量 , 它的概率密度为
min g x , max g x
a xb a xb
22

设总体
X f ( x)

3.数理统计基础知识

3.数理统计基础知识

假设从总体 X 中抽取了 n 个个体 X1 ,X2 ,…,X n 来对 总体 X 进行抽样观察,由于在观察测试结束之前,这 n 个个 体的观测值是不确定的,而且反复抽样所得到 n 个个体的观 测结果也是不相同的。 因此,所抽取的 n 个个体 X1 ,X2 ,…,X n 实际上就是 一个随机向量(X1 ,X2 ,…,X n ),称之为一个“ 样本” , 每一个个体 X i 称之为一个样品; 对样本(X1 , X2 , … , X n )的一次观测值(x1 ,x2 ,…, x n ),就是样本的一个“ 实现值(样本值)” 。 统计学的主要任务,就是提供科学的方法,借助样本值 (x1 ,x2 ,…,x n ),对未知的总体进行合理的推断。
2.3 顺序统计量
设(X1 ,X2 ,…,Xn )为总体 X 的一个
样本,将样本中的各分量按由小到大的顺序排
列成 X (1) X (2) … X ( n ) 。
则称(X (1) ,X (2) ,… ,X ( n ) )为样本的一组 顺序统计量,称X (i) 为样本的第 i 个顺序统计量。 特别地,称 X (1) 与 X ( n ) 分别为样本的极 小值与极极差。
3 常用的统计分布 统计推断的基本做法是:在取得总体 X 的样本(X1 ,X2 ,…,Xn )之后,借助样本 统计量来对未知的总体分布进行推断。
1.3 统计推断问题简述
统计学要解决的主要问题,就是借助总体 X 的一个样本 (X1 ,X2 ,…,Xn ),利用其样本值(x1 ,x2 ,…,xn ), 对总体 X 的未知分布或参数进行科学地、合理地推断。人们 将这类问题统称为统计推断问题。 在进行统计推断的过程中,为了保证推断的科学性与合 理性,需要借助样本构造一些合适的统计量(即样本的函数, 它是一个随机变量),然后再利用所构造的统计量的 “良好” 性质,对总体分布所属的类型以及总体分布中所含的未知参数 进行统计推断。

概率论与数理统计(理工类.第四版)吴赣昌主编答案5,6,7,8章

概率论与数理统计(理工类.第四版)吴赣昌主编答案5,6,7,8章
因此
T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+ ⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),
注意到X′,Y′2相互独立.
习题5
设总体X∼N(0,4), 而X1,X2,⋯,X15为取自该总体的样本,问随机变

Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)
D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2)) =a(4+4×4)=20a=1,
D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4) =b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,
分别得a=120,b=1100. 这时Y∼χ2(2), 自由度为n=2. 解法二 因Xi∼N(0,22)且相互独立,知
(百元)
1010-1111-12
合计
户数 18357624191414 200
求样本容量n,样本均值X¯,样本方差S2.
解答:
对于抽到的每个居民户调查均收入,可见n=200. 这里,没有给出原始 数据,而是给出了整理过的资料(频率分布), 我们首先计算各组 的“组中值”,然后计算X¯和S2的近似值:
则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?
解答:
解法一 Y=[a(X1-2X2)]2+[b(3X3-4X4)]2, 令Y1=a(X1-2X2),Y2=b(3X3-4X4), 则
Y=Y12+Y22, 为使Y∼χ2(2), 必有Y1∼N(0,1),Y2∼N(0,1), 因而

数理统计的基本概念课件

数理统计的基本概念课件

离散程度
通过方差、标准差等指标 来描述数据的离散程度, 反映数据的变化程度。
数据的中位数、均值和众数
中位数
将数据按照大小顺序排列,处于 中间位置的数值即为中位数。中 位数可以反映数据的集中趋势和
离散程度。
均值
将所有数据相加后除以数据个数 ,得到的数值即为均值。均值可 以反映数据的集中趋势和离散程
度。
拟合优度
决定于所选择的非线性函数形式,常 用的有R²和SSPE(残差平方和)。
显著性检验
一般采用基于参数的假设检验和似然 比检验。
THANKS FOR WATCHING
感谢您的观看
05
假设检验
假设检验的基本思想
统计假设
假设检验的核心是对提出的问题(即假设)进行统计推断,先假设所要考察的 总体参数按某种规律或分布(即统计模型)分布,然后根据样本信息对原假设 进行检验。
假设检验的基本步骤
首先提出假设,然后收集样本数据,接着根据样本数据对原假设进行检验,最 后根据检验结果做出结论。
多元线性回归分析
• β0: 截距 • β1, β2, ...: 斜率
• ε: 误差项
多元线性回归分析
拟合优度
R²,表示模型解释因变量的方差的比例 。
VS
显著性检验
整体显著性检验(F检验)和单个变量的 显著性检验(t检验)。
非线性回归分析
定义
非线性回归分析是研究非线性关系的 统计方法。
模型
Y = f(X) (其中 f 是非线性函数)
• β0: 截距
一元线性回归分析
01
• β1: 斜率
02
• ε: 误差项
03
04
拟合优度:R²,表示模型解 释因变量的方差的比例。

数理统计的基本概念

数理统计的基本概念

证明:设F~F(n1,n2),则
P{F F1 (n1 , n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1 , n2 )
得证!
1 P{ F (n2 , n1 )} F
5.1.4 统计量及抽样分布
2. F分布的分位点 对于:0<<1,
若存在F(n1, n2)>0,
满足
P{FF(n1, n2)}=, 则
称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
注:
1 F1 (n1 , n2 ) F (n2 , n1 )
1 ~ F ( n2 , n1 ) F
列出其频数频率分布表。
组序 分组区间 组中值 1 (147,157] 152 2 (157,167] 162 3 (167,177] 172 4 (177,187] 182 5 (187,197] 192 合计
频数 4 8 5 2 1 20
频率 累计频率(%) 0.20 20 0.40 60 0.25 85 0.10 95 0.05 100 1
1、设X 1 , X 2 ,
, X n (n 2)为来自总体N (0,1)的简单随机样本, (n 1) X 12
2 X i i 2 n
X 为样本均值,S 2为样本方差,则统计量

从 __________ 分布。 (05—06二)
2、设 X 1 , X 2 , X 3是来自正态分布 N (0, 2 )总 体的简单随机样本,则 统计量 2 服从 ________ 分布。(05—06三) X1 X X
3.总体、样本、样本观察值的关系 总体

数理统计的基本概念

数理统计的基本概念

简单随机样本。
本书只讨论简单随机样本,简称样本。一般说来, 采用重复抽样方法得到的样本为简单随机样本;实际中, 当总体为无限,或抽取的样本容量n远远小于总体单元 数时,不重复抽样方法得到的样本亦可近似为简单随机 样本。
2014-3-5 12
设X 1 , X 2 , , X n为抽自总体X的样本,则n维随机向量 (X 1 , X 2 , , X n )的概率分布称为样本 分布。
解 总体 X 的概率密度为
e x , x 0, f ( x) x 0, 0,
因为 X 1 , X 2 ,, X n 相互独立, 且与 X 有相同的分布,
所以 ( X 1 , X 2 ,, X n )的联合概率密度为
2014-3-5 14
xi ne i 1 , f ( x1 , x2 , , xn ) f ( xi ) i 1 0,
2014-3-5 7
5.总体特征数
总体期望和总体方差
也称总体数字特征,是反映总体在某 指标上数量变动规律性的数字
设总体为有限总体,有N个个体,在某个指标上 的取值为: x1 , x 2 , , x N,若随机地等可能的从总体中抽一个个体观察 , 其结果用X表示,则 P{ X xi } 1 ,i 1,2, , N。 N X的分布就是总体的分布,我们称下面两个值为总体的期望 和方差: 1 1 E ( X ) xi N N i 1
2014-3-5
9
§5.1.2 样本
1. 样本
在数理统计中,人们都是通过从总体中按照预先设计和要求 抽取一部分个体,根据获得的数据来对总体分布作出推断的。被 抽出的这一部分个体叫做总体的一个样本。 假设从总体中按照预先设计和要求抽取了n个个体我们把 这样一件事看成一次试验,这个试验等价于我们随机的从总体 中抽取n个个体,每次试验所获得的n个个体会发生变化,因 此要描述每次试验的结果需n个随机变量X1,X2,…,Xn。

第六章 数理统计的基本概念(1)

第六章 数理统计的基本概念(1)
(k 1, M1就是X )
XK
1 n
n i 1
X
k i
(4)样本k阶中心矩:
1 n
n i 1
(Xi
X )k
(5)顺序统计量: X(1) X(2) X(n) . 其中 X(k) 为将 X1, X2 , , Xn 从小到大排列第 k 位值.
18 September 2020
概率论与数理统计
理学院数学系
2、离散型 设总体X的分布律为 P{ X x} p( x)
则样本X1, X2 ,的, 联Xn合分布律为 P{ X1 x1, X2 x2 ,, Xn xn } p( x1 ) p{ x2 ) p( xn )
18 September 2020
概率论与数理统计
理学院数学系
样本分布
第六章 数理统计的基本概念
(1)样本均值:
X
1 n
n i 1
Xi
(2)样本方差:
Sn2
1 n
n
(Xi
i 1
X )2
修正样本方差:
Sn*2
1 n1
n i 1
(Xi
X )2
nSn2 (n 1)Sn*2
18 September 2020
概率论与数理统计
理学院数学系
第六章 数理统计的基本概念
第22页
(3)样本k阶原点矩:
第13页
1、样本的联合分布函数 设总体 X 的分布函数为 FX (., ), (X1, X2 ,
则样本的联合分布函数为
, Xn ) 为样本.
FX1,X2 , ,Xn ( x1, x2 , , xn ; ) FX ( x1, )FX ( x2 , ) FX ( xn , )

数理统计的基本概念

数理统计的基本概念
第二章 数理统计的基本概念
概率论与数理统计的区别: 在概率论中,假设随机变量的分布列或者分布函数已知,然 后描述随机变量的统计规律. 数理统计首先解决,如何知道 随机变量的分布规律,如何知道分布中所含的参数.
数理统计研究问题:它研究怎样有效地收集整理和分析带有随 机性的数据,以对所考察的问题作出推断或预测,直至为采取一 定的决策和行动提供依据和建议.
概率统计的基本问题:依据有限个观测或试验如何对整体所作 出推论的问题.这种伴随有一定概率的推断称为统计推断.
母体与子样、经验分布函数
1、母体:把研究对象的全体所构成的一个集合称为母体或总体; 组成母体的每一个成员称为个体. 注:10、实际应用中总体往往指研究对象的某项数值指标的全体。 20、总体的某个数值指标是一个具有分布函数F(x)随机变量,称 总体为具有分布函数F(x)的总体。 30、也可能是一个随机向量,相应的分布函数就为多元函数.
(i
n! 1)!(n
i)![F (
y)]i1[1
F(
y )] n1
f
(
y),
0 ,
a yb 其它
证明 第 i个次序统计量(i)落入无穷小区间 [ y , y y)
内这一事件等价于”容量为n的子样1 ,2 , n 中有(i 1)
个分量落入区间[a , y)内,1个分量落入区间[ y , y y)内,
n
F ( x1 ,, xn ) F ( xi ) i 1
例1 设总体 X 服从参数为 ( 0)的指数分布, ( X1, X2 ,, Xn )
是来自总体的样本, 求样本( X1, X2 ,, Xn )的概率密度.

总体 X 的概率密度为
ex ,
f (x)

数理统计的基本概念

数理统计的基本概念
一类是如何科学地安排试验,以获取有效的随机数据。 此部分内容称为描述统计学如:试验设计、抽样方法。
另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
我们主要讨论有关推断统计学中几个最基本的 问题。
在数理统计中总体X的分布永远是未知的,即使 有足够的理由可以认为总体X服从某种类型的分布, 但这个分布的参数还是未知的。
例如本市家庭的月收入X是个随机变量,X服从什么
分布事先是不清楚的,根据资料可确信 X ~ N , 2 .
但 , 2 究竟取什么值还是未知的,
由于总体X的分布是未知的,因此X的数字特征如 均值、方差等往往也是一个未知的值。对于这些未知
不过在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布
情况. 这时,每个个体具有的数量指标的全体就是总体.
称总体中所含个体的数目为总体容量, 总体容量有限的称为有 限总体, 总体容量无限的称为无限总体.
当个体个数很大时通常把有限总体看作无限总体。
从另一方面看: 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重, 灯泡的寿命,汽车的耗油量…), 所谓总体的性质,无非就是这 些指标值集体的性质. 概率分布是刻划这种集体性质最适当的工具. 因此在理论上可 以把总体与概率分布等同起来. 如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此 总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.
一个统计量.
ex1.设 X1, X 2, X3 是取自正态总体 X ~( , 2) 的一个样本,

数理统计的基本概念

数理统计的基本概念

且相互独立
X / n X ~ t ( n 1) ( n 1) S 2 S / n 2 ( n 1)
说明:
X ~ N ( , 2 )
X 已 知 : U ~ N (0,1) / n
1. 未知, X
X 未知: t ~ t (n 1) S/ n
2
估计
EX
1 n 2 估计 ( 2) 样 本 方 差 S : ( Xi X ) n 1 i 1
DX
n 1 : ( X1 X ) ( X 2 X ) ( X n X ) 0
受到1个约束,独立的变量个数为n-1
( 3) 样本标准差 : S
1 n 估计 ( X i X )2 n 1 i 1
Y X X X ~ (n)
2 1 2 2 2 n 2
n
独立的r.v. 的个数
2
(4) 分位点 ( n)
P (n) n
2 2


X 轴上的一个数
P (n) n
2 2


2 (n )
2 ( n) 有表可查(P217附表5)
n1 1 2
n1 1 n2
y

n1 n2 2
,
y0
(2)构造性定理
设 X ~ 2 ( n1 ), Y ~ 2 ( n2 ), 相互独立,则有
X / n1 F ~ F ( n1 , n2 ) Y / n2 1 显然, ~ F ( n1 , n2 ), 则 ~ F ( n2 , n1 ) F F (3) 分位点F ( n1 , n2 )
四. 正态总体统计量的分布Fra bibliotek前提条件:X ~ N ( , 2 ), X1 , X2 ,, Xn ~ N ( , 2 ), 相互独立

数理统计基本概念

数理统计基本概念
1 f (X i , X j ) (X i X j )2 2
S n2
1 C n2

i j
f (X i, X j)
1 ( X i X j )2 n ( n 1) i j
1 [ ( X i2 X 2 j ) 2 X i X j ] n ( n 1) i j i j 1 {( n 1) X i2 [( n X ) 2 X i2 ]} n ( n 1) 1 { X i2 n X 2 } n 1
22
(2) t分布
①定义1.2.3:设X~N(0,1), Y ( n) ,且X与Y独立, 则称随机变量 X T Y n 所服从的分布为t分布,记为T~t(n),称n为自由度.
2
(3)F分布
①定义1.2.4:设 X 2 (n) , Y 2 ( m ) , 且X与Y独立,则称随机变量
m0.25 Q1
第一四分位数 第三四分位数
17
m0.75 Q3
为该样本的 p 分位数(或 p 分位点).
m0.5 称为样本中位数, 显然有
Q1
Q3
18
3
2014-9-29
例2 设 ( X 1 , X 2 ,, X n ) 是 F(x) 的样本,
, 2
j
分别为总体均值与方差, 从中任选两个分量 X i 和 X 令
i 1 n
二、样本 为了推断总体分布及其各种特征,就必须从总体中 按一定法则抽取若干个体进行观测或试验,以获得 有关总体的信息 .这一抽取过程称为抽样 .所抽取的 部分个体称为样本,样本中个体的数目称为样本容量. 例如容量为n的样本可以看作是n维随机变量 ( X , X , , X ), 其观察值为( x1 , x2 , , xn ).

数理统计的基本概念

数理统计的基本概念

数理统计的基本概念
1. 总体和样本:总体是研究对象的全体,样本是从总体中选取的一部分。

2. 参数和统计量:参数是总体的性质,统计量是样本的函数,用来估计总体的参数。

3. 随机变量和概率分布:随机变量是取值不确定的变量,概率分布是描述随机变量取值可能性的函数。

4. 分布特征:包括均值、方差、标准差、偏度和峰度等。

5. 假设检验:用样本的统计量推断总体参数的方法。

6. 置信区间:用来估计总体参数的区间,表示参数真值有一定概率落在该区间之内。

7. 方差分析:用来比较多组数据的差异来源和大小的方法。

8. 回归分析:用来研究自变量和因变量之间关系的方法。

概率论与数理统计-第五章

概率论与数理统计-第五章

【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.

数理统计的基本概念

数理统计的基本概念

i 1
若总体X是持续型r.v. ,d.f.为f(x),则样
本的联合d.f.为
n
fn( x1, x2 ,, xn ) f ( xi )
i 1
若总体X是离散型r.v. ,其概率分布为
p(x)=P(X=x),则样本的概率分布为: n
pn (x1, x2, , xn ) P(X1 x1, X2 x2, , Xn xn) p(xi ).
注:在统计研究中,人们关心总体仅仅是关心其每个 个体的一项(或几项)数量指标和该数量指标在总体中 的分布状况.这时,每个个体含有的数量指标的全体就 是总体.
样本 —— 从总体中抽取的部分个体. 用 ( X1, X 2,, X n )表示, n 为样本容量.
称 (x1, x2,为,总xn体) X 的一个容量为n
★K.皮尔森在1990年提出了检验拟合优
度的 2统计量,并证明了其极限分布就是 2分布。
★K.皮尔森的学生英国医生戈塞特1908
年导出了 t统计量的精确分布— t分布,开
创了小样本的先河。
★费希尔系统发展了正态分布总体下多 个统计量的抽样分布理论;建立了以极 大似然预计为中心的点预计理论;创立
了实验设计,并发展了对应的数据分析 办法——方差分析。
k 1
n ik e
sn
e n
k 1 ik !
i1 !i2 ! in !
其中ik (1 k n)取非负整数,sn i1 i2 in.
统计推断:运用总体的样本信息对未知的总
体分布进行推断。
总体、样本及样本值间的关系
总体(理论分布)?
样本值
样本
样本是联系两者的桥梁
总体分布决定了样本取值的概率规律,也就 是样本取到样本值的规律,因而能够由样本 值去推断总体.

数理统计学的基本概念

数理统计学的基本概念
样本 X 1 , X 2 ,, X n 是随机向量;在抽样结束后,得到的
的,则称所得样本为简单随机样本.
是一组具体实数 x1 , x2 ,, xn ,称之为样本观测值. 简单随机样本 X 1 , X 2 ,, X n 的特点:各个 X i 相互独立, 且与总体同分布. 若总体 X ~ f ( x ),则简单随机样本

S 12 12 S
2 2 2 2
2 1
n1 ②


2 2
~ N (0,1)
n2
~ F ( n1 1, n2 1) ( n1 1) S 12 ( n2 1) S 22 n1 n2 2 ,有
2 2 ③ 当 12 2 时, 记S p
( X Y )(1 2 ) ~ t ( n1 n2 2) 1 1 Sp n1 n2
性质:
①若X~t(n),则X2~F(1,n). ②若X~F(m,n),则1/X~F(n,m). ③ F (m, n) F1 (n, m) 1.
f(x)
x
四、正态总体抽样分布基本定理
单正态总体情形:设X1,X2,…,Xn是来自 N ( , 2 ) 的 简单随机样本,则:
① X 与 S 2 独立 ② X μ σ n ~ N (0,1)
X 1 , , X 9 与Y1 , , Y9 例2 设总体X,Y 独立,且都服从N(0,9)分布, 是取自二总体的简单随机样本,求如下统计量的分布:
U
1 X 9
9
X 1 X 9 Y Y9
2 1
i
2

X
i 1
9
~ N (0,1),
Yi ~ N (0,1) 3
Yi 2 1 Y ( ) 3 9 i 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率统计(ZYH)
取次序统计量的一组观测值 x(1) , x( 2) ,, x( n) 则对任意的实数 x, 事件{X ≤x} 发生的频率为
F(x) 0 , x x(1) 1 k Fn ( x ) , x( k ) x x( k 1) n 1 , x x( n ) (k=1,2,· · · ,n-1) O x(1) x(2) …
x1 , x2 ,, xn
为X1, X2, … , Xn 的一个观测值, 简称 样本观测值
概率统计(ZYH)
抽样(抽取样本)目的:
通过获取样本(X1, X2, … , Xn)的有限信息 对总体X的概率分布及其各种特征进行推断
抽样要求: 1o 代表性: X1, X2, … , Xn 与总体X 有相同的分布 2o 独立性: X1, X2, … , Xn 是相互独立的随机变量 满足上述要求的样本称为简单随机样本, 获取
如 当总体期望已知时,有下述统计量: n 1 2 2 S ( X ) n i 1 i
概率统计(ZYH)
常用的统计量
样本均值
样本方差 样本标准差 样本k阶原点矩
1 n X Xi n i 1 1 n 2 2 S ( X X ) n 1 i 1 i
1 n 2 S ( X X ) n 1 i 1 i
分布密度估计表
区间划分 频数 频率 密度估 计值 yi
总区间划分要求6~17个, 每区间至少含1个观测值.
频率
ai ni P 概 率 f ( x ) d x a i 1 n
ni ni / n
(a0 , a1 ]
(a1 , a2 ]

n1 n1 / n
n2 n2 / n

n1 / n a1 a0 n2 / n a2 a1
得分范围 得分 人数 区间划分
分布密度估计表
频数
ni
ni / n
2/150 14/150 32/150 43/150 39/150
频率
密度估 计值 yi
(41,50] (51,60] (61,70] (71,80]
(81,90] (91,100]
概率统计(ZYH)
2 14 32 43 39
20
(41,50] (51,60] (61,70] (71,80]
并根据观测得到的资料对随机变量的分布数字特
征等作出科学的推断.
《数理统计》研究的问题:怎样选择有效的
抽样方法采集数据(抽样), 并利用抽样获得的有
限数据, 对被研究的随机现象的规律性作出尽可能
精确而可靠的结论(推断).
概率统计(ZYH)
7.1 基本概念
一、总体与样本 二、统计量与样本矩 三、经验分布函数与直方图
从总体X 中抽取一个个体, 就是对总体X 进行
一次试验 (观测), 从总体X 中随机的抽取n个个体:
X1 , X 2 ,, X n
就是对总体 X 进行了一组试验 . 通常把由这 n 个试 验组成的试验组称为总体 X 的一个样本 ( 或子样 ), 样本中个体的数目n称为样本容量,其中的Xi叫样本 的第 i 个分量. 对Xi的一次观测值,记之为xi ,并称
概率统计(ZYH)
5.1 总体与样本
总体(母体):研究对象(取实值)的全体. 个体:组成总体的每个元素.
如:某厂 生产灯泡 的寿命的 全体就是 一个总体
灯泡的寿命
如:每个灯 泡的寿命就 是一个个体
概率统计(ZYH)
每个个体的出现带有随机性 ,因此代表总体取
值的变量都是一个随机变量 ,通常用X(或Y,Z)表示.
如果函数φ(x1, x2, …, xn)为x1, x2 , …, xn 的一个实
值函数, 且φ 中不包含任何未知参数, 那么称 T ( X1 , X 2 ,, X n (是随机变量) ) 为一个统计量. 若 x1, x2 , …, xn 为样本观测值, 则称 t ( x1 , x2 ,, xn )是统计量T 的一个观测值.
总体的概率分布就是随机变量 X 的概率分布 . 故今 后将不区分总体与相应的随机变量.常称作总体X. 《数理统计》研究的宗旨: 寻找总体X 的概率分布及其各种特征
F(x) 1
寻求 : EX , DX ,Cov( X ,Y )
x
同集 合的 代表
O
概率统计(ZYH)
E( X kY l ) E [( X EX )k (Y EY )l ]
x (n )
x
显然, Fn(x)具有分布函数的特征, 且根据大数定律,
P Fn ( x) F ( x) (n ), 所以当较大时, F ( x) Fn ( x).
故通常称 Fn(x)为X 的 经验分布函数.
概率统计(ZYH)
若总体X是连续型的. 为了获取密度函数f(x),
可选取包含样本观测值的区间(a1,al],并填表绘图:
f ( x ) yi


nl / n a l a l 1
O a0 a1 a2 a3 … al-1 al x
( a l 1 , a l ]
nl nl / n
频率直方图
概率统计(ZYH)
例1 从某校升学考卷中随机抽取150份, 其成绩 分布如下表, 试依据这些资料作出成绩频率直方图.
成绩分布表
简单随机样本的方法称为简单随机抽样。
今后,凡提到的样本都是指简单随机样本。
概率统计(ZYH)
5.2 样本分布 为了获得总体X 的分布, 先引入一个定义 定义1 设X1, X2, …, Xn是来自总体X 的一个容
量为n的样本, 把它们依大小顺序排列为 X(1) , X( 2) ,, X( n) 则称其为样本次序统计量。 样本最大值统计量为 X max X ( n) 由此 样本最小值统计量为 X min X (1) 定义 样本中值统计量为 Me X([n / 2]1) 可知 R X ( n ) X ( 1) 样本级差为
(81,90] (91,100]
2 14 32 42/1500 43/1500 39/1500
20 20/150 20/1500
根据分布密度估计表即可画出频率直方图.
5.3 统计量
对总体X 推断前需要对样本进行加工或提炼 定义 设 X1, X2, … , Xn 是来自总体X 的样本,
节目录
第五章 数理统计的基本概念
5.1 总体与样本 5.2 样本分布 5.3 统计量 54 抽样分布
概率统计(ZYH)
从本章开始, 我们将讲述数理统计的基本内容. 与概率论一样,数理统计是研究随机现象统计规 律性的一门数学学科. 它是以概率论为基础, 由实 际观测资料出发, 研究如何合理地采集或收集资料
1 n k M k X i (k 1, 2,...) n i 1
1 n 样本k阶中心矩 M k ( X i X )k (k 1, 2,...) n i 1 n1 2 2 M X , M M X S 统计量间的关系: 1 2 2 n
概率统计(ZYH)
相关文档
最新文档