第五章 数理统计的基本概念n

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020/11/15
12
• 统计学中组成总体的个体不仅可以是人、物、 组织单位等实体,也可以是现象、事件、活动 过程等非实体。但在个体是非实体时,总体通 常不是有形的,而是概念性的。
• 例如,要判断一枚硬币是否均匀,先对这枚硬 币进行100次投掷试验,然后根据这100次投掷 试验的结果做出这枚硬币是否均匀的结论。这 个统计问题的个体是对这枚硬币的每次投掷试 验,这种个体显然是个活动过程。这个统计问 题的总体是所有可能的对这枚硬币的投掷试验, 这个总体显然是概念性的。
Ii
1, 0,
{Xi {Xi
xx}}不 发发 生生, 则
Fn( x)
n( x).
n
2020/11/15
28
2020/11/15
29
§5.2 统计量
由样本推断总体情况,需要对样本值进行 “加工”,这就需要构造一些样本的函数,它把样 本中所含的信息集中起来. • 统计量
来自总体X的样本X1,X2, …,Xn的函数g (X1,X2, …,Xn) ,若是连续的且不含任何未知 参数,则称为一个统计量。
生机会的信念
频率的稳定值
统计推断与概率论的区别
• 在概率论中,我们研究的随机变量的分布都是假设已 知的,在这一前题下去研究它的性质、特点和规律性。 例如求出它的数字特征,讨论随机变量函数的分布, 介绍常用的各种分布等。
• 统计推断以概率论为理论基础,根据试验或观察得到 的数据,来研究随机现象,对研究对象的客观规律性 作出种种合理的估计和判断。
• 随机样本与样本值
样本的定义: 从总体X中,随机地抽取n个个体:X1, X2,, Xn
称为总体X的一个样本,记为 ( X1, X2 , , Xn ) 样本中所包含个体的总数n称为样本容量.
样本值: 每一次抽取所得到的n个具体数值:( x1 , x2 , , xn )
称为一个样本值(观察值)。
2020/11/15
30
设( x1, x2 ,, xn )是样本( X1, X 2 ,, X n ) 的观察值 则称f ( x1, x2 ,, xn )是 f ( X1, X2,, Xn ) 的观察值
注 1统计量 f ( X1, X2,, Xn )是随机变量; 2°统计量用于统计推断,故不应含任何关
1
π3 (1 x12 )(1 x22 )(1 x32 ) , x1 , x2 , x3 R
2020/11/15
P133 例5.2 23
• 直方图与经验分布函数
2020/11/15
24
2020/11/15
25
2020/11/15
26
例 某食品厂生产听装饮料,现从生产线上随机抽取5听 饮料,称得其净重(克)为: 351 347 355 344 351
2020/11/15
15
• 容量为 n 的样本在观察之前为一个n 维 随机向量 ( X1,X2,…,Xn),当 n 次 观察一经完成,我们就得到由一组实数
组成的 n 维向量 (x1,x2,…,xn) ,
它是n 维随机向量(X1,X2,…,Xn )的 一次实现。
2020/11/15
16
由于我们是利用样本观察来对总体的分布进行推 断,因而从总体中抽取样本进行观察时必须是随机的。 所以对于随机抽样来说,对其某一次观察结果而论, 是完全确定的一组值,但它又是随每次抽样观察而改 变的,由于我们要依据这一观察结果进行分析推断, 并研究比较各种推断方法的好坏,因而一般考虑问题 时,就不能把看为确定的数值,而应该看作为随机向 量X= (X1,X2, …,Xn) ,称它为容量是n的样本,因而 对样本也有分布可言。
于总体 X 的未知参数; 3º 统计量是样本的函数,它是一个随机变
量,统计量的分布称为抽样分布.
2020/11/15
P135 例5.4 31
(1)若总体X的分布函数为F(x),则样本( X1X 2, , X n )
n
的分布函数为 F(xi ) i 1
(2)若X为离散型随机变量,概率分布律为P( X xk )
n
pk ,则样本( X1X 2, , X n )的联合分布律为 pki i 1
(3)若X为连续型随机变量,概率分布律为f (x),则
2020/11/15
2
• 当然统计学中研究的问题要比这个例子 复杂得多。
• 现代统计学所提供的各种统计方法,作 为在不确定情况下进行预测和决策的重 要辅助工具,被广泛地应用于所有出现 定量数据且需要对它们进行分析和解释 的问题中(称这类问题为统计问题)。
2020/11/15
3
• 在对什么是统计学做详细解释之前,我 们先考查两个需要应用统计方法的问题, 从这些问题中我们希望大家能领悟出统 计问题的基本要素。
(1) 代表性:X1, X2 ,, Xn中每一个与总体 X 有相同的分布. (2) 独立性:X1, X2,, Xn 是相互独立的随机变量.
则称 ( X1, X2 , , Xn ) 为n的简单随机样本.
获得简单随机样本的抽样方法称为简单随机抽样.
2020/11/15
20
• 样本的分布
定理: 设( X1, X2,, Xn)为来自总体X的样本.
为什么要学数理统计
数理统计是运用概率论的基础知识,更侧重于应用随 机现象本身的规律性来考虑资料的收集整理和分析,建 立有效的数学方法,从而找出相应的随机变量的分布律 或它的数字特征,对所关心的问题作出估计与检验。
概率论中的一个最基本的假设就是:研究对象的分布 已知。而在实际中,我们往往不知道随机变量,的确切 分布,这就是数理统计所讨论问题的应用背景,它需要 用已有的部分信息去推断整体情况。
例2 • 某百货公司对购买的一批电灯泡进行抽样
检验。在检验的基础上决定是否接受这批 灯泡。这种检验可能从这批灯泡中抽取15 只作为样本,检验样本的废品数和平均使 用寿命。是否接受的决定建立在观察到的 废品数和平均使用寿命上。
• 在以上两个例子中,都需要在不确定情况下对总体状 态进行预测或决策,之所以产生不确定性,是因为我 们无法拥有进行预测或决策所需的全部信息(总体数 据)。在使用不完全信息(样本数据)进行预测和决策 时,必须借助于一种叫做统计推断的统计方法。
11
§5.1 总体与样本
• 总体与个体
总体: 在数理统计中研究对象的全体 个体: 组成总体的每个单元
例如在研究某批灯泡的平均寿命时,该批灯泡的全 体就组成了总体,而其中每个灯泡就是个体。但是在 统计里,由于我们关心的不是每个个体的种种具体特 性,而仅仅是它的某一项或某几项数量指标X和该数 量指标X在总体中的分布情况。在上述例子中X是表 示灯泡的寿命,就此数量指标X而言,每个个体所取 的值是不同的。
n
样本( X1X 2, , X n )的联合密度函数为 f (xi )
2020/11/15
i 1
21
例:设Xk来自于参数为k的指数分布,k 1, 2, , n,
且相互独立,求(X1, X 2,
,
X
)的联合分布函数
n
解 由于Xk来自于参数为k的指数分布,
所以 FXk ( xk ) 1 ek xk , xk 0
• 依据推断形式不同,统计推断可分为估计和假设检验两 种,它们构成了统计学的基础 。
• 依据不同的理论模型,统计推断可分为许多不同的分支 学科。比如,参数和非参数、线性和非线性、方差分析、 回归分析、时间序列分析、多元统计分析等等。
• 依据对概率的不同解释,统计推断可分为频率统计和贝
叶斯统计。对某件事情发
分析:这是一个容量为5的样本,经排序可得有序样本:
x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 351, x(5)= 355 经验分布函数
Fn(x) =
0,
0.2, 0.4, 0.8, 1,
x < 344 344 x < 347 347 x < 351 351 x < 355
• 通过上面的例子大家对统计问题应该有了初步的了解。 下面我们将介绍上面例子中涉及到的几个统计学的基 本概念,这些概念是对统计学的本质和特征的概括和 反映,是统计思维网络上的结点。掌握了这些基本概 念后,大家对统计问题会有更深刻的认识和理解。
2020/11/15
7
概括地讲,数理统计研究以有效的方式 采集、 整理和分析受到随机因素影响的数据,并对所考 察的问题做出推断和预测,直至提供依据和建议.
• 在统计推断中,我们研究的随机变量的分布是未知的, 或者是不完全知道的,人们是通过对研究的随机变量 进行重复独立的观察,得到许多观察值,对这些数据 进行分析,从而对所研究的随机变量的分布作出种种 推断。
第五章 数理统计的基本概念
总体与样本 统计量 数理统计中几个常用分布 抽样分布定理
2020/11/15
2020/11/15
4
例1 • 某市场分析人员搜集一个消费者的样本,
要求样本中每个人回答对某商品的观点。 从得到的这些样本数据中,市场分析人员 必须做出这种商品有无足够需求量的决定。 若存在足够需求,分析人员还要选择包括 设计、价格及市场范围。所有这些问题都 可以从调查的样本数据所提供的信息中得 到回答。
( X1, X2 , X3 )的联合概率密度.
解 因为Xi自于柯西分布,所以Xi 的密度函数是
pXi
(
xi
)
1 π
1
1 xi2
,
xi (i 1,2,3)
所以
(
X1
,
X
2
,
X
3
)
的联合概率密度是:
3
p( X1,X2,X3 )( x1, x2 , x3 ) pXi ( xi )
i 1
1
总体、样本、样本观察值的关系
总体
理论分布
样本
样本观察值
统计是从已有的资料——样本的观察值,去推断 总体的情况——总体分布。
样本是联系两者的桥梁。
总体分布决定了样本取值的概率规律,可以用样
本观察值去推断总体
2020/11/15
19
简单随机样本
若来自总体 X的样本( X1, X2,, Xn )具有下列 两个特征:
数理统计的基本任务是:根据从总体中抽取的样本,
利用样本的信息推断总体的性质.
2020/11/15
17
总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的样本值。如我们从全班同学中抽取10人测 量身高,得到10个数,它们是样本值而不是样 本。我们只能观察到随机变量的取值而见不到 随机变量。
数理统计研究内容十分广泛,其中一类重要的问题便 是统计推断.统计推断是利用试验数据对研究对象的性质 作出推断,其中有两个重要方面:参数估计和假设检验。
2020/11/15
1
• 例如,要了解全班同学的身高情况,先 要测量并记录班上每个同学的身高,然 后用记录下来的身高数据计算全班同学 的平均身高。这里的第一步就是搜集数 据,第二步就是从搜集到的数据集中获 取信息。平均身高正是反映全班同学身 高状况的重要信息。
试验设计
数理统计
统计推断
参数估计 假设检验
统计推研断究:如何加工、处理数据,从而
对所考察对象的性质做出尽可能精确和可靠的 推断.
2020/11/15
8
统计学的研究内容
• 研究如何用有效的方法收集和整理数据的抽样调查、试 验设计和描述性统计;
ቤተ መጻሕፍቲ ባይዱ
• 研究如何用有效的方法对所得的数据进行分析、研究, 从而对所研究的对象的性质 、特点作出推断的统计推 断(“样本”推断“总体”)。
x 355
2020/11/15
27
注 1° k为样本中不超过x的样本的最大个数,
即在n次重复独立试验中,事件 { X x}
发生的次数. ( x(1) x(2) x(k) x,有k个样品的取值 x)
2 Fn( x)为事件{X x}的频率.
n
事实上,令 n( x) Ii,其中
i 1
由独立性有:
n
F( X1,,Xn )( x1, x2 ,, xn )
FXi ( xi )
k 1
n
(1 e λk xk ), xk 0, k 1,2,, n.
k 1
2020/11/15
22
例:设X1
,
X
2
,
X
是来自柯西分布的样本,其
3
密度函数为p( x) 1 1 , x , 试求 π 1 x2
样本与抽样分布
• 统计推断就是通过从总体中抽取一部分个体, 根据获取的数据来对总体分布得出推断的。
• 被抽出的部分个体叫做总体的一个样本。
• 显然,样本就是总体的一个有限子集。
• 若将总体定义为随机变量 X ,总体分布就是 随机变量 X的概率分布,总体数量特征就是随 机变量 X 的数字特征。
• 这时,从总体中抽取一个个体,就是对总体X 进行一次观察并记录其结果。
相关文档
最新文档