数理统计的基本概念汇总
根据数理统计知识点归纳总结(精华版)
![根据数理统计知识点归纳总结(精华版)](https://img.taocdn.com/s3/m/ee39bd7c32687e21af45b307e87101f69e31fbe0.png)
根据数理统计知识点归纳总结(精华版)
1. 引言
本文旨在对数理统计的基本知识点进行归纳总结,帮助读者快速了解数理统计的核心概念和方法。
2. 概率论基础
- 概率的基本定义和性质
- 随机事件的运算规则
- 条件概率和独立性
- 贝叶斯定理
3. 随机变量和分布
- 随机变量的定义和分类
- 离散型随机变量和连续型随机变量
- 常见离散型分布(如伯努利分布、二项分布、泊松分布)
- 常见连续型分布(如均匀分布、正态分布、指数分布)
4. 数理统计的基本概念
- 总体和样本的概念
- 估计与抽样分布
- 统计量和抽样分布
5. 参数估计
- 点估计的定义和性质
- 常见的点估计方法(如最大似然估计、矩估计)
- 区间估计的基本原理和方法
6. 假设检验
- 假设检验的基本思想和步骤
- 单侧检验和双侧检验
- 假设检验中的错误类型和显著性水平
- 常见的假设检验方法(如正态总体均值的检验、两样本均值的检验)
7. 相关分析
- 相关系数的定义和计算方法
- 相关分析的假设检验
- 线性回归分析的基本原理和方法
8. 统计软件的应用
- 常见的统计软件介绍(如SPSS、R、Python)
- 统计软件的基本操作(如数据导入、数据处理、统计分析)
9. 结语
本文对数理统计的核心知识点进行了简要的概括,供读者参考和研究。
通过研究数理统计,读者可以更好地理解和应用统计学在实际问题中的作用,提高数据分析和决策能力。
以上是根据数理统计知识点的归纳总结,希望有助于您对数理统计的理解和学习。
如需深入了解各个知识点的具体内容,请参考相关教材或课程。
数理统计
![数理统计](https://img.taocdn.com/s3/m/14e570fdf705cc1755270933.png)
四、数理统计的基本概念 五、参数估计
四、数理统计的基本概念
1. 总体和样本 总体:研究对象的某项数量指标的值的全体。 个体:总体中的每个元素为个体。 容量:总体中所包含的个体的个数。 按此分为有限总体和无限总体。 例如:某工厂生产的灯泡的寿命是一个总体,每 一个灯泡的寿命是一个个体;某学校男生的身高 的全体一个总体,每个男生的身高是一个个体。
1 ˆ 解得: n
2
x
i 1 n
n
i
x
1 ˆ n
i 1
( X i X )2
(3)估计量的评选标准
1) ˆ ˆ 无偏性:若 ( X 1 , , X n )的数学期望存在, ˆ ˆ 且E . 则称是的无偏估计量。
2)
ˆ ˆ ˆ ˆ 有效性:若1 1 ( X 1 , , X n ), 2 2 ( X 1 , , X n ) ˆ ˆ 都是的无偏估计量;若D( ) D( ).
ˆ 所以 A1 X ,
ˆ A2
2 2 A1
1 n
i 1
n
X i2
1 X n
2
i 1
n
( X i X )2
(2) 极大似然估计法
(1).若总体X属离散型,其分布律 { X x} p( x; ), P 的形式为已知, 为待估参数,是可能取值的范围。
解:X的概率密度为: 1 1 2 f ( x; , ) exp{ (x )2} 2 2 2
似然函数为:
L( , )
2
2 2 2 i 1 n n 1 ln L ln(2 ) ln( ) 2 2 2 2
数理统计基本概念
![数理统计基本概念](https://img.taocdn.com/s3/m/29b389601ed9ad51f01df289.png)
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )
理
统
计
的
引
入
数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品
率
3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。
数
理
统
计
的
引
入
数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/8fad56cfbb4cf7ec4afed0af.png)
n 1 2
, x .
t 分布的概率密度图形
图形关于 x 0 对称, lim f ( x; n) 0 , 且 x 当 n 充分大时,f (x; n) 趋近于标准正态 分布的概率密度。
定理 4: X 1, 2, , n 是抽自正态总体 设 X X
若总体 X 是离散型的,其分布律为:
则样本的联合分布为
§6.2 抽样分布
6.2.1 统计量的概念 由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。 这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。 定义2:设 X 1 , X 2 , , X n 是来自总体X的样本, g( X 1 , X 2 , , X n ) 是样本 X 1 , X 2 , , X n 的函数,如果 g( X 1 , X 2 , , X n ) 中不包含任何未知参数,则称它 是一个统计量。
1 (0.82)
1 0.7939 0.2061
X ~ N (0, 22 ), X1 , X 2 , X3 , X 4 为其样本,求a,b 例2:总体
(2). (n 1)S / ~ (n 1)
2
X (1). X ~ N ( , / n), 或 ~ N (0,) ; 1 / n 2 2 2
2
X (3). X 与 S 相互独立; (4). ~ t(n 1). S/ n
定理5:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自总体 2 两样本独立, X ~ N ( 1 , 12 )和Y ~ N ( 2 , 2 )的样本, 2 S12 / S2 则有 F 2 ~ F ( m 1, n 1). 2 1 / 2 定理6*:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/37ce9004a6c30c2259019ed3.png)
样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
河南理工大学精品课程
1 Ak = n 1 Bk = n
∑ ∑
n
n
i =1
X ik ( k = 1, 2 , L )
i =1
( X i − X ) k ( k = 1, 2 , L )
概率论与数理统计
说明 (修正 样本方差还可表示为 修正)样本方差还可表示为 修正
n 1 S2 = [ ∑ X i2 − n X 2 ] n − 1 i =1
1 n 推导】 【推导】 S 2 = ( X i − X )2 ∑ n − 1 i =1 = = = =
河南理工大学精品课程
1 n ( X i2 − 2 X i X + X 2 ) ∑ n − 1 i =1 n n n 1 [ ∑ X i2 − 2 X ∑ X i + ∑ X 2 ] n − 1 i =1 i =1 i =1 n 1 [ ∑ X i2 − 2 n X 2 + n X 2 ] n − 1 i =1 n 1 [ ∑ X i2 −n X 2 ] n − 1 i =1
河南理工大学精品课程 概率论与数理统计
做法
从总体中随机地抽取若干个体(灯泡、 从总体中随机地抽取若干个体(灯泡、工大男
生),测试其所需数据(寿命、身高),最后对所得数据通过 ),测试其所需数据 寿命、身高), 测试其所需数据( ),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况. 的分布情况,从而了解整体情况. 一般,我们所研究的总体的某项数量指标X 一般,我们所研究的总体的某项数量指标X是一个随 机变量,其取值在客观上有一定的分布.因此, 机变量,其取值在客观上有一定的分布.因此,对总体的研 究,就是对相应的随机变量X的研究。 就是对相应的随机变量X的研究。 今后,我们称X 今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征, 分布函数和数字特征,并不再区分总体与相应的随机变量 X.对总体的称呼 总体,总体X 总体F X.对总体的称呼:总体,总体X与总体F. 对总体的称呼:
数理统计的基本概念汇总
![数理统计的基本概念汇总](https://img.taocdn.com/s3/m/9bcb8df9240c844769eaeedc.png)
6数理统计的基本概念6.1 基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。
能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。
2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。
3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。
4 理解样本均值、样本方差及样本矩的概念。
了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。
了解正态总体的某些常用抽样分布。
6.2 内容提要6.2.1 总体和样本1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。
总体是一个随机变量,常用X,Y等来表示。
2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。
3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。
4 样本的联合分布*该部分内容考研不作要求。
149150若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为∏==ni i n x F x x x F 121)(),,,(若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为∏==ni in x f x x x f 121)(),,,( (6.1)若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为∏======ni i i n n x X P x X x X x X P 12211}{},,,{ (6.2)其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。
6.2.2 样本分布1 频率分布设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中x 1*< x 2*<…< x l *且n n li i =∑=1。
第六章 数理统计的基本概念
![第六章 数理统计的基本概念](https://img.taocdn.com/s3/m/01517a1914791711cc791757.png)
1 n 2 S S ( X X ) i n 1 i 1
2
(4) 样本k阶(原点)矩
1 n k Ak X i n i 1
k 1, 2,
k 2,3,
(5) 样本k阶中心矩
1 n Bk ( X i X )k n i 1
§2
常用统计量的分布
统计量的分布称为抽样分布.下面介绍三种由 正态总体演化而来的统计量的分布:
• 从二战后到现在,是统计学发展的第三个时期,这是一个在 前一段发展的基础上,随着生产和科技的普遍进步,而使这 个学科得到飞速发展的一个时期,同时,也出现了不少有待 解决的大问题.
学科奠基者
数理统计作为一个进一步完善的数学学科的奠基者是英国人费歇尔。他1909 年入剑桥大学,攻读数学物理专业,三年后毕业。毕业后,他曾去投资办工 厂,又到加拿大农场管过杂务,也当过中学教员。1919年,他开始对生物统 计学产生了浓厚的兴趣,参加罗萨姆斯泰德试验站的工作,致力于数理统计 在农业科学和遗传学中(费歇尔1890—1962)的应用研究。 年轻的费歇尔主要的研究工作是用数学将样本的分布给以严格的确定。 在一般人看来枯燥乏味的数学,常能带给研究者极大的慰藉,费歇尔热衷于 数理统计的研究工作,后来的理论研究成果有:数据信息的测量、压缩数据 而不减少信息、对一个模型的参数估计等。 最使科学家称赞的工作则是试验设计,它将一切科学试验从某一个侧面 “科学化”了,不知节省了多少人力和物力,提高了若干倍的工效。 费歇尔培养了一个学派,其中有专长纯数学的,有专长应用数学的。在30- 50年代费歇尔是统计学的中心人物。1959年费歇尔退休后在澳大利亚度过了 最后三年。
若 x1 , x2 , , xn 是样本的观察值, 则 g ( x1 , x2 , xn ) 是 g ( X 1 , X 2 , X n )
数理统计学的基本概念
![数理统计学的基本概念](https://img.taocdn.com/s3/m/7d29047df242336c1eb95e0a.png)
的,则称所得样本为简单随机样本.
是一组具体实数 x1 , x2 ,, xn ,称之为样本观测值. 简单随机样本 X 1 , X 2 ,, X n 的特点:各个 X i 相互独立, 且与总体同分布. 若总体 X ~ f ( x ),则简单随机样本
S 12 12 S
2 2 2 2
2 1
n1 ②
2 2
~ N (0,1)
n2
~ F ( n1 1, n2 1) ( n1 1) S 12 ( n2 1) S 22 n1 n2 2 ,有
2 2 ③ 当 12 2 时, 记S p
( X Y )(1 2 ) ~ t ( n1 n2 2) 1 1 Sp n1 n2
性质:
①若X~t(n),则X2~F(1,n). ②若X~F(m,n),则1/X~F(n,m). ③ F (m, n) F1 (n, m) 1.
f(x)
x
四、正态总体抽样分布基本定理
单正态总体情形:设X1,X2,…,Xn是来自 N ( , 2 ) 的 简单随机样本,则:
① X 与 S 2 独立 ② X μ σ n ~ N (0,1)
X 1 , , X 9 与Y1 , , Y9 例2 设总体X,Y 独立,且都服从N(0,9)分布, 是取自二总体的简单随机样本,求如下统计量的分布:
U
1 X 9
9
X 1 X 9 Y Y9
2 1
i
2
解
X
i 1
9
~ N (0,1),
Yi ~ N (0,1) 3
Yi 2 1 Y ( ) 3 9 i 1
数理统计的基本概念课件
![数理统计的基本概念课件](https://img.taocdn.com/s3/m/556912986e1aff00bed5b9f3f90f76c661374cef.png)
离散程度
通过方差、标准差等指标 来描述数据的离散程度, 反映数据的变化程度。
数据的中位数、均值和众数
中位数
将数据按照大小顺序排列,处于 中间位置的数值即为中位数。中 位数可以反映数据的集中趋势和
离散程度。
均值
将所有数据相加后除以数据个数 ,得到的数值即为均值。均值可 以反映数据的集中趋势和离散程
度。
拟合优度
决定于所选择的非线性函数形式,常 用的有R²和SSPE(残差平方和)。
显著性检验
一般采用基于参数的假设检验和似然 比检验。
THANKS FOR WATCHING
感谢您的观看
05
假设检验
假设检验的基本思想
统计假设
假设检验的核心是对提出的问题(即假设)进行统计推断,先假设所要考察的 总体参数按某种规律或分布(即统计模型)分布,然后根据样本信息对原假设 进行检验。
假设检验的基本步骤
首先提出假设,然后收集样本数据,接着根据样本数据对原假设进行检验,最 后根据检验结果做出结论。
多元线性回归分析
• β0: 截距 • β1, β2, ...: 斜率
• ε: 误差项
多元线性回归分析
拟合优度
R²,表示模型解释因变量的方差的比例 。
VS
显著性检验
整体显著性检验(F检验)和单个变量的 显著性检验(t检验)。
非线性回归分析
定义
非线性回归分析是研究非线性关系的 统计方法。
模型
Y = f(X) (其中 f 是非线性函数)
• β0: 截距
一元线性回归分析
01
• β1: 斜率
02
• ε: 误差项
03
04
拟合优度:R²,表示模型解 释因变量的方差的比例。
数理统计基本概念
![数理统计基本概念](https://img.taocdn.com/s3/m/c5c15064a45177232f60a2fd.png)
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体样本方差比的分布)
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X n1是取自X的样本, Y1,Y2,…, Yn2 是
样本是联系二者的桥梁 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本 值进行“加工”,这就要构造一些样本的 函数,它把样本中所含的(某一方面)的 信息集中起来.
这种不含任何未知参数的样本的函数 称为统计量. 它是完全由样本决定的量.
2. 独立性: X1,X2,…,Xn是相互独立的随机 变量.
由简单随机抽样得到的样本称为简单 随机样本,它可以用与总体独立同分布的 n个相互独立的随机变量X1,X2,…,Xn表示.
若总体的分布函数为F(x),则其简单随机 样本的联合分布函数为 F(x1) F(x2) … F(xn) 简单随机样本是应用中最常见的情 形,今后,当说到“X1,X2,…,Xn是取自某 总体的样本”时,若不特别说明,就指简 单随机样本.
数理统计的基本概 念
一、总体和样本
1.总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅 是关心其每个个体的一项(或几项)数量指标 和该数量指标在总体中的分布情况. 这时, 每个个体具有的数量指标的全体就是总体.
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/cd64cbb9f524ccbff1218499.png)
证明:设F~F(n1,n2),则
P{F F1 (n1 , n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1 , n2 )
得证!
1 P{ F (n2 , n1 )} F
5.1.4 统计量及抽样分布
2. F分布的分位点 对于:0<<1,
若存在F(n1, n2)>0,
满足
P{FF(n1, n2)}=, 则
称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
注:
1 F1 (n1 , n2 ) F (n2 , n1 )
1 ~ F ( n2 , n1 ) F
列出其频数频率分布表。
组序 分组区间 组中值 1 (147,157] 152 2 (157,167] 162 3 (167,177] 172 4 (177,187] 182 5 (187,197] 192 合计
频数 4 8 5 2 1 20
频率 累计频率(%) 0.20 20 0.40 60 0.25 85 0.10 95 0.05 100 1
1、设X 1 , X 2 ,
, X n (n 2)为来自总体N (0,1)的简单随机样本, (n 1) X 12
2 X i i 2 n
X 为样本均值,S 2为样本方差,则统计量
服
从 __________ 分布。 (05—06二)
2、设 X 1 , X 2 , X 3是来自正态分布 N (0, 2 )总 体的简单随机样本,则 统计量 2 服从 ________ 分布。(05—06三) X1 X X
3.总体、样本、样本观察值的关系 总体
第五章 数理统计的基本概念
![第五章 数理统计的基本概念](https://img.taocdn.com/s3/m/2d0e57de49649b6648d7479f.png)
线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)E
最小方差线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)对 的一切线性无偏估计量 0,D D 0
定理 (R-C不等式)
设总体X具有分布密度f ( x; )。抽取样本( x1 ,..., xn ), 设g ( )为 的一个可估函数,T T ( x1 ,..., xn )为g ( ) 的一个无偏估计量,且 满足正则条件
• 若12, 22已知
(X Y) ( 1 2 ) U ~ N (0,1)
2 1
n
2 2
m
• 若12, 22未知,但是12= 22
T (X Y) ( 1 2 ) ~ t (m n 2)
12
m
2 2
n
mS12
12
2 nS2 2 2
T
(X Y) (1 2 ) 1 1 2 mS12 nS2 /(m n 2) m n
~ t (m n 2)
推论:设( X 1 ,..., X n )和(Y1 ,..., Ym )分别为来自
2 2 正态总体N ( 1 , 1 )和N ( 2 , 2 )的两个相互
独立的样本,则随机变量
F
2 若 1 2 2
2 2 Sm / 1 2 Sn 2 / 2
~ F (m 1, n 1)
F
2 Sm 2 Sn
~ F (m 1, n 1)
第六章 参数估计
第一节 点估计
• 定义:设为总体分布中的未知参数,从X 中抽取样本 (x1,…,xn) ,构造适当的统计量 (x1,…,xn), 估计 (以的值作为的近似), 这种方法称为参数的点估计。 • 统计量称为的点估计量; • 对于一组样本观测值 (x1,…,xn) ,该统计量 相应的值(x1,…,xn)称为的点估计值 • 的点估计量和点估计值简称为的点估计。
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/d1cfd0ddafaad1f34693daef5ef7ba0d4a736d1e.png)
概率论与数理统计的区别: 在概率论中,假设随机变量的分布列或者分布函数已知,然 后描述随机变量的统计规律. 数理统计首先解决,如何知道 随机变量的分布规律,如何知道分布中所含的参数.
数理统计研究问题:它研究怎样有效地收集整理和分析带有随 机性的数据,以对所考察的问题作出推断或预测,直至为采取一 定的决策和行动提供依据和建议.
概率统计的基本问题:依据有限个观测或试验如何对整体所作 出推论的问题.这种伴随有一定概率的推断称为统计推断.
母体与子样、经验分布函数
1、母体:把研究对象的全体所构成的一个集合称为母体或总体; 组成母体的每一个成员称为个体. 注:10、实际应用中总体往往指研究对象的某项数值指标的全体。 20、总体的某个数值指标是一个具有分布函数F(x)随机变量,称 总体为具有分布函数F(x)的总体。 30、也可能是一个随机向量,相应的分布函数就为多元函数.
(i
n! 1)!(n
i)![F (
y)]i1[1
F(
y )] n1
f
(
y),
0 ,
a yb 其它
证明 第 i个次序统计量(i)落入无穷小区间 [ y , y y)
内这一事件等价于”容量为n的子样1 ,2 , n 中有(i 1)
个分量落入区间[a , y)内,1个分量落入区间[ y , y y)内,
n
F ( x1 ,, xn ) F ( xi ) i 1
例1 设总体 X 服从参数为 ( 0)的指数分布, ( X1, X2 ,, Xn )
是来自总体的样本, 求样本( X1, X2 ,, Xn )的概率密度.
解
总体 X 的概率密度为
ex ,
f (x)
数理统计的基本概念知识点
![数理统计的基本概念知识点](https://img.taocdn.com/s3/m/c8c0eb4fc5da50e2524d7fed.png)
10 06 数理统计的基本概念知识网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧主要内容一、样本我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。
样本中所含的样品数称为样本容量,一般用n 表示。
在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。
在泛指任一次抽取的结果时,n x x x ,,,21Λ表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21Λ表示n 个具体的数值(样本值)。
我们称之为样本的两重性。
二、.统计量1.定义:称不含未知参数的样本的函数),,,(21n X X X f Λ为统计量2.常用统计量样本均值 .11∑==ni i x n x 样本方差∑=--=n i i x x n S 122.)(11 样本标准差 .)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i k i k k x n A 1.,2,1,1Λ 样本k 阶中心矩∑==-=ni k i k k x x n B 1.,3,2,)(1Λ μ=)(X E ,n X D 2)(σ=,22)(σ=S E ,221)(σnn B E -=, 其中∑=-=ni i X X n B 122)(1,为二阶中心矩。
三、抽样分布1.常用统计量分布(1)设n X X X ,,,21Λ是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212n n X X X X Λ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ.(2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n YXT =服从自由度为n 的-t 分布,记为()n t T ~.(3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1221n n Y X n Y n XF ⋅==。
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/53489077a9956bec0975f46527d3240c8447a1b6.png)
数理统计的基本概念
1. 总体和样本:总体是研究对象的全体,样本是从总体中选取的一部分。
2. 参数和统计量:参数是总体的性质,统计量是样本的函数,用来估计总体的参数。
3. 随机变量和概率分布:随机变量是取值不确定的变量,概率分布是描述随机变量取值可能性的函数。
4. 分布特征:包括均值、方差、标准差、偏度和峰度等。
5. 假设检验:用样本的统计量推断总体参数的方法。
6. 置信区间:用来估计总体参数的区间,表示参数真值有一定概率落在该区间之内。
7. 方差分析:用来比较多组数据的差异来源和大小的方法。
8. 回归分析:用来研究自变量和因变量之间关系的方法。
数理统计的基本概念
![数理统计的基本概念](https://img.taocdn.com/s3/m/a372ff754a73f242336c1eb91a37f111f1850d3c.png)
i 1
若总体X是持续型r.v. ,d.f.为f(x),则样
本的联合d.f.为
n
fn( x1, x2 ,, xn ) f ( xi )
i 1
若总体X是离散型r.v. ,其概率分布为
p(x)=P(X=x),则样本的概率分布为: n
pn (x1, x2, , xn ) P(X1 x1, X2 x2, , Xn xn) p(xi ).
注:在统计研究中,人们关心总体仅仅是关心其每个 个体的一项(或几项)数量指标和该数量指标在总体中 的分布状况.这时,每个个体含有的数量指标的全体就 是总体.
样本 —— 从总体中抽取的部分个体. 用 ( X1, X 2,, X n )表示, n 为样本容量.
称 (x1, x2,为,总xn体) X 的一个容量为n
★K.皮尔森在1990年提出了检验拟合优
度的 2统计量,并证明了其极限分布就是 2分布。
★K.皮尔森的学生英国医生戈塞特1908
年导出了 t统计量的精确分布— t分布,开
创了小样本的先河。
★费希尔系统发展了正态分布总体下多 个统计量的抽样分布理论;建立了以极 大似然预计为中心的点预计理论;创立
了实验设计,并发展了对应的数据分析 办法——方差分析。
k 1
n ik e
sn
e n
k 1 ik !
i1 !i2 ! in !
其中ik (1 k n)取非负整数,sn i1 i2 in.
统计推断:运用总体的样本信息对未知的总
体分布进行推断。
总体、样本及样本值间的关系
总体(理论分布)?
样本值
样本
样本是联系两者的桥梁
总体分布决定了样本取值的概率规律,也就 是样本取到样本值的规律,因而能够由样本 值去推断总体.
6.1.数理统计的基本概念
![6.1.数理统计的基本概念](https://img.taocdn.com/s3/m/59abbd610166f5335a8102d276a20029bd646390.png)
对容量较小的样本可分为5-6组,容量100左右的可分7-10组,
容量200左右的可分9-13组,容量300左右及以上的可分12-20 组,目的是使用足够的组来表示数据的变异。本例中只有20个 数据,我们将之分为5组,即k=5。
(2) 确定每组组距:每组区间长度可以相同也可以不同,实用中 常选用长度相同的区间以便于进行比较,此时各组区间的长度 称为组距,其近似公式为:
频数fi
3
4
8
3
2
试写出此分组样本的经验分布函数。
解:由经验分布函数的定义得到
0
0.15
Fn
(
x)
0.35 0.75
0.9
1
x 37.5 37.5 x47.5 47.5 x57.5 57.5 x67.5 67.5 x77.5 x 77.5
例6 以下是一组来自标准正态分布总体的样本的观测值: -1.4462 , -0.7012 , 1.2460 , -0.6390 , 0.5774 , -0.3600 , -0.1356, -1.3493 , -1.2704 , 0.9846
13
100—110
105
16
110—120
从总体X中抽取一个个体,就是对总体X进行一次观察并记 录其结果。取样是随机的,且观察前无法预知起结果,故每 个观察结果都是随机变量,且与总体同分布。
定义 1 在相同的条件下,对总体X进行n次重复的、独立的 观察,得到n个结果 X1, X 2 , , X n ,称随机变量X1, X 2 , , X n 为来自总体X的容量n的简单随机样本,简称样本。其观测值
641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值,对应的总体为该厂生产 的瓶装啤酒的净含量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6数理统计的基本概念6.1 基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。
能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。
2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。
3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。
4 理解样本均值、样本方差及样本矩的概念。
了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。
了解正态总体的某些常用抽样分布。
6.2 内容提要6.2.1 总体和样本1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。
总体是一个随机变量,常用X,Y等来表示。
2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。
3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。
4 样本的联合分布*该部分内容考研不作要求。
149150若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为∏==ni i n x F x x x F 121)(),,,(若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为∏==ni in x f x x x f 121)(),,,( (6.1)若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为∏======ni i i n n x X P x X x X x X P 12211}{},,,{ (6.2)其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。
6.2.2 样本分布1 频率分布设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中x 1*< x 2*<…< x l *且n n li i =∑=1。
则样本的频数分布及频率分布可由表6-1给出。
1512 经验分布函数定义 设(X 1,X 2,…,X n )为总体X 的一个样本,其样本值为(x 1,x 2,…,x n ),则称函数)(},,,{)(21+∞<<-∞=x nx x x x F x n n 的个数中小于或等于为样本值(x 1,x 2,…,x n )的经验分布函数。
则经验分布函数⎪⎪⎩⎪⎪⎨⎧≥-=<≤++<=+.1)1,,2,1(,,,,0)(**1*1*1l i i in x x l i x x x n n n x x x F (6.3)6.2.3 几个重要分布及临界值1.2χ分布 设X 1,X 2,…,X n 是相互独立的随机变量,且X i ~N (0,1) (i =1,2,…,n ),则称随机变量∑==+++=ni i nX X X X 12222212χ152服从自由度为n 的2χ分布,简记为2χ~2χ(n )。
2 2χ分布的性质: (1)设2χ~2χ(n ),则n E =2χ, n D 22=χ(2)设)(~121n Y χ,)(~222n Y χ,且Y 1,Y 2相互独立,则有)(~21221n n Y Y ++χ3.t 分布 设)1,0(~N X ,)(~2n Y χ,且X ,Y 相互独立,则称随机变量n Y X T /=服从自由度为n 的t 分布,或称学生氏(Student )分布,简记为T ~t (n )。
4.t 分布的性质 (1) )2(2))((,0))((>-==n n nn t D n t E (2) 2221)(lim x n ex f -∞→=π;这里f (x )为t 分布的概率密度函数。
5.F 分布 设)(~2m X χ,)(~2n Y χ,且X ,Y 相互独立,则称随机变量n Y m X F //=所服从的分布是自由度为m ,n 的F 分布,简记为F ~F (m ,n )。
6.F 分布的性质 (1) 若),,(~n m F X 则(2) )4()4()2()422(),2(222>---+=>-=n n n m n m n DX n n n EX (2) 若F ~F (m ,n ),则),(~1m n F F。
1537.临界值(1) 标准正态分布的临界值 设X ~N (0,1),对给定的正数α)10(<<α,若存在实数αz 满足απαα==>⎰∞+-z t dt ez X P 2221}{则称点αz 为标准正态分布X 的α临界值 (或称上α分位点或分位数)。
由αα-=Φ1)(z ,若已知α)5.00(≤≤α,可通过反查标准正态分布表,求出α临界值αz 。
当5.0>α时,表中无法查出,此时查表αα=Φ-)(1z ,再由αα--=1z z 可求得临界值αz 。
(2)2χ分布的临界值 设)(~22n χχ,概率密度为f (x )。
对给定的数α(0<α<1),若存在实数)(2n αχ满足αχχαχα==>⎰+∞dx x f n P n )(222)()}({则称数)(2n αχ为2χ分布的α临界值。
已知n ,α,通过查2χ分布表可求得)(2n αχ。
当n >45时,可利用近似公式:,)12(21)(22-+≈n z n ααχ这里αz 是标准正态分布的临界值。
(3) t 分布的临界值 设T ~t (n ),概率密度为f (x )。
对给定的α(0<α<1)。
若存在实数)(n t α满足ααα==>⎰∞+)()()}({n tx f n t T P则称点)(n t α为t 分布的α临界值。
已知n ,α,通过查t 分布表可求得)(n t α。
注:1) 类似标准正态分布临界值的性质,对t 分布亦有:)()(1n t n t αα--=;1542) 当n >45时,可用正态分布近似 ααz n t ≈)(。
(4) F 分布的临界值 设F ~F (m , n ),概率密度为f (x )。
对给定的α(0<α<1),若存在实数αF (m ,n )满足ααα==>⎰+∞dx x f n m F F P n m F),()()},({则称数αF (m ,n )为F 分布的α临界值。
注意公式=-),(1n m F α),(1m n F α6.2.4 统计量及样本矩1.统计量 设(X 1,X 2,…,X n )为总体X 的一个样本,ϕ(X 1,X 2,…,X n )是X 1,X 2,…,X n 的函数,若ϕ是连续函数且不含末知参数,则称ϕ(X 1,X 2,…,X n )是一个统计量。
2.几个常用的统计量——样本矩 (1)样本均值 ∑==ni i X n X 11。
(2)样本方差212)(11X X n S i n i --=∑=。
(3)样本标准差 21)(11X X n S i ni --=∑=。
(4)样本k 阶原点矩,2,1,11==∑=k X n A n i ki k 。
(5)样本k 阶中心矩,2,1,)(11=-=∑=k X X n B k i ni k 。
3 样本矩与总体矩的关系由样本的独立性及与总体同分布这一特性出发,运用数字特征的运算法则,可得:若总体X 的期望、方差存在,即μ=EX ,2σ=DX ,155又(X 1,X 2,…,X n )是取自总体X 的一个样本,则μ=X E ,nX D 2σ=;22σ=ES ,221σnn EB -=。
(6.4) 上述结论无论总体服从什么样的分布都正确,故它是计算任意总体,特别是非正态总体的样本均值X 和样本方差2S 的期望、方差的常用结论。
6.2.5 正态总体样本均值和样本方差的分布1. 设总体X ~N (2,σμ),(n X X ,,1 )为样本,X 为样本均值,2S 为样本方差(1) X ~),(2nN σμ,或nX /σμ-~N (0,1); (6.5)(2))(~)(2212n Xni iχσμ∑=- (6.6)(3))1(~))1(~)1(2212222----∑=n X X n S n ni iχσχσ(或, (6.7)(4) 样本均值X 与样本方差2S 相互独立;(5)nS X /μ-~)1(-n t (6.8)2.设(1,,1n X X )是取自总体X 的一个样本,(2,,1n Y Y )是取自总体Y 的一个样本,且这两个样本相互独立,即假定1,,1n X X ,2,,1n Y Y 是n 1+n 2个相互独立的随机变量。
若总体X ~N (211,σμ),Y ~N (222,σμ),则有1561)22212121)()(n n Y X σσμμ+---~N (0,1); (6.9)2)22222121//σσS S ~F (n 1-1,n 2-1); (6.10) 3)当22221σσσ==时,有212111)()(n n S Y X W +⋅---μμ~t (n 1+n 2-2); (6.11)其中∑=--=112121)(11n i i X X n S ,∑=--=212222)(11n i i Y Y n S ,2)1()1(212222112-+-+-=n n S n S n S W。
6.3 典型例题分析已知总体,求样本的联合分布例1.设(X 1,X 2,…,X n )是取自总体X 的一个样本。
试在下列三种情况下,分别写出样本(X 1,X 2,…,X n )的联合分布律或联合概率密度。
(1)X ~B (1,p );(2)X 服从参数为λ的指数分布;(3)X 服从(0,θ)(θ>0)上的均匀分布。
分析: 解此类题先写出总体X 的分布律(或概率密度);再由X i 与X 有相同的分布以及X i 之间的相互独立性,由式(6.1),(6.2)即可写出样本(X 1,X 2,…,X n )的联合分布律或联合概率密度。
解:(1) 因为总体分布律为1,0)1(}{1=-==-k p p k X P kk157于是1,0,)1(}{1=-==-i k k i i k p p k X P i i 样本),,,(21n X X X 的联合分布律为:ni k p pk X P k X P k X P k X k X k X P i k n k n n n n ni ini i,,2,1,1,0)1(}{}{}{},,,{1122112211 ==-==⋅⋅=⋅=====∑∑==-(2) 因为总体概率密度函数为:⎩⎨⎧≤>=-0,00,)(x x e x f x λλ所以,每一个样本i X 的概率密度为:n i x x e x f i i x i i ,,2,1;0,00,)( =⎩⎨⎧≤>=-λλ故样本),,,(21n X X X 的联合概率密度为:ni x x e x f x f x f x x x f i i x nn n ni i ,,2,1;0,00,)()()(),,,(12121 =⎪⎩⎪⎨⎧≤>=⋅⋅⋅=∑=-λλ (3)因为总体概率密度函数为:⎪⎩⎪⎨⎧<<=其它,00,1)(θθx x f所以样本X i 的概率密度为158⎪⎩⎪⎨⎧<<=其它,00,1)(θθi i x x f故,样本),,,(21n X X X 的联合概率密度为:n i x x f x x x f i n ni i n ,,2,1;,00,)(),,,(121 =⎩⎨⎧<<==-=∏其它θθ例2.设X ~N (2,σμ),(X 1,X 2,X 3)为来自总体X 的一个样本。