第5章统计量、抽样分布、探索性数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体与总体特征数
一、总体与总体标志
➢ 总体(Population)
Def 在数理统计中,把研究对象的全体称为总体或母 体,而把组成总体的每个单元称为个体。描述总体单 元在某方面特性的名称或记号称为总体指标;每个总 体单元对总体指标的响应称为指标值。
总体中所包含的个体的个数称为总体的容量。
个体
…
… 研究某批灯泡的质量
体分布相联系,一般求算比较麻烦,但对于iid样本有下列
结果。
如 果 总 体 X的 概 率 函 数 为 PXxpx, X1,X2,L,Xn
为 抽 自 总 体 X的 iid样 本 , 则 样 本 分 布 的 概 率 函 数 为
n
P(X1,X2,L,Xn)(x1,x2,L,xn) pxi i1
如 果 总 体 X的 概 率 密 度 函 数 为 fX(x), X1,X2,L,Xn为 抽 自 总 体 X的 iid样 本 , 则 样 本 分 布 的 概 率 密 度 为
总 体
总体有 无限 限总 总体 体
在数理统计中,人们往往研究有关总体总是关注总体 某一项或几项指标,为此,对这些指标进行随机的试验或 观测,试验或观测结果获得这些指标的一部分或全部指标 值,从而考察该数量指标的分布情况。这时,指标值的全 体就象是总体。每个指标值就象是总体单元。
总体
指标
指标值全 集
➢ 样本应满足的性质
(1) 代表性;(2) 随机性。
➢ 简单随机样本(Independence identical distribution)
Def 设 X 1,X 2,L,X n 为 总 体 X 的 一 个 样 本 , 如 果 X 1,X 2,L,X n 相 互 独 立 , 且 均 与 总 体 X 具 有 相 同 的 分 布 , 则 称 X 1,X 2,L, X n 为 简 单 随 机 样 本 , 简 称 iid样 本 。 例如:要通过随机抽样了解一批产品的次品率,如果每 次抽取一件产品观测后放回原来的总量中再抽第二件产 品,则这样获得一个简单随机抽样。
设 样 本 任 意 一 组 实 现 为 x1, x2 ,L
,
x
,
n
由
于
样
本
为
i
id
所 以 P X i xi p xi (1 p )1 xi xi 0,1 i 1, 2,L , n
二、数理统计研究问题的一般流程 分析问
题
收集
确定总
数据
试验设计 抽样
体
统计推断
来自百度文库
数据 整理
参数估计
假设检验
我们这门课所学的数理 统计实际上是统计推断 及其应用(方差分析与 回归分析)的一部分内 容。
为什么要用数理统计方法研究问题?随机现象有它的规律 性,随机现象的特点注定了进行足够多次观察,其规律性才 能清楚地呈现出来。但是,客观上只允许对随机现象进行有 限次观察试验,只能获得局部观察资料.
D(X)称 为 总 体 方 差 , 并 分 别 记 为 2. 即 有 E(X) 2D(X)
如果总体为有限总体,指标值的全体为x1,x2,L,xN,则
E(X)N 1 iN 1 xi 2D(X)N 1iN 1(xi )2
如 果 总 体 容 量 为 N, 具 有 某 特 点 总 体 单 元 数 为 M , 则
随机变量
总体可以用随机变量及其分布来表示,研 究总体等价于研究表达总体的随机变量概 率分布;在理论上可以把总体与概率分布 等同起来,总体分布就是表达总体的随机 变量的分布。
例如:研究某批灯泡的寿命时,关心的指标是寿命,那么, 该总体就可以用随机变量X和其概率分布表示。
➢ 总体特征数
设 总 体 用 随 机 变 量 X表 示 , 那 么 E(X)称 为 总 体 均 值
n
f(x1,x2,L,xn) fXi(xi) i1
➢ 总体、样本、样本实现的关系
推断
总体
样本
样本实现
例5.1 设 总 体 X 服 从 0 - 1 分 布 , X 1 ,X 2 ,L ,X n 是 抽 自 总 体 X 的 iid 样 本 , 求 样 本 分 布 。
解 : 总 体 X 的 概 率 函 数 为 P X x p x (1 p )1 x x 0,1
数理统计
第5章 统计量、抽样分布、数据探索分析
•数理统计 •总体与总体特征数 •样本与统计量 •统计三大分布与抽样分布 •数据探索分析
数理统计
一、数理统计及其任务 数理统计是一门以概率论为基础的应用学科。 它是研究
如何有效地收集、 整理、分析带有随机性的数据,以便对所 考察的问题作出推断和预测,从而为决策提供依据。
实际抽样中,往往是不再放回产品,则这不是一个 简单随机抽样。但当总量N很大时,可近似看成是简单 随机抽样。
➢ 样本分布
Def 设 X 1 ,X 2 ,L ,X n 为 总 体 X 的 一 个 样 本 , 则 ( X 1 ,X 2 ,L ,X n ) 的 分 布 称 为 样 本 分 布 。
注意:样本分布反映样本取不同实现的概率规律,其与总
pM N
称 为 总 体 频 率 或 总 体 重 数 。
,2 ,p 统 称 为 总 体 特 征 数 。 显 然 , 它 们 是 由 总 体 唯 一
决 定 的 常 数 。 实 践 中 , 由 于 它 们 的 值 未 知 又 称 为 参 数 。
样本与统计量
一、样本
➢ 样本(Sample)
Def 按一定规则从总体中抽取一部分总体单元进行观 测或试验,这一抽取过程称为“抽样”,所抽取的部 分总体单元的整体称为总体的一个样本(子样)。 样本 中所包含的总体单元称为样本单元,样本中样本单元 的数目称为样本容量。
如果用X1,X2,L,Xn表示抽自总体的一个样本的样 本单元指标,显然,X1,X2,L,Xn是一组随机变 量,我们就称其为样本。而将一个具体抽定的样
本的观测结果x1,x2,L,xn称为样本实现,它是随机 变量组X1,X2,L,Xn许多取值种的一组。
样本 X1,X2,L,Xn
抽定 样本实现 x1,x2,L ,xn
数理统计的任务就是研究有效地收集数据,科学地整理 与分析所获得的有限的资料,对所研究的问题, 尽可能地作 出精确而可靠的结论。
数理统计研究问题的方式,不是对所研究对象的全体 ( 称 为总体)进行观察,而是抽取其中的部分(称为样本)进行观察 获得数据(抽样),并通过这些数据对总体进行推断。
数理统计方法具有“部分推断整体”的特征。