数理统计方法ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 样本与抽样
实际应用中,为了研究总体的特性,总是从总 体中抽出部分个体进行观察和试验,根据观察或 试验得到的数据推断总体的性质. 我们把从总体中抽出的部分个体称为样本, 把样本中包含个体的数量称为样本容量, 把对样本的观察或试验的过程称为抽样, 把观察或试验得到的数据称为样本观测值(观测 数据),简称样本值.
设总体X的前k阶矩
1. 表示位置的统计量
设X1,X2,…,Xn为总体X的样本,x1,
x2,...,xn为样本观测值,
(1) 样本均值
1 n
X n i1 X i
常用来作为总体期望(均值)的估计量,
其观测值为
(2)中位数
x
1 n
n i1
xi
把一组数据按大小顺序排序后处于中间位置的数。
(3)分位数
设X为一随机变量,我们知道对于给定的实数x, P{X > x}是事件{X > x}的概率.在统计中,我们常 常需要对给定事件{X > x}的概率,由此确定的x取是 一个临界点,称为分位数(点),有如下定义:
意
其中 s 是样本标准差。
用来衡量数据的总体分布的对称性,即
整体的分布是否明显的偏向某一方
奇数 阶中 心距
计算公式: g1
n (n 1)(n 2)
1 s3
n
( xi
i1
3
x)
其中 s 是样本标准差。
g1 0 g1 0 g1 0
频 数
频 数
其中s样本标准差. g1 0 分布对称;g1 0 称正偏度(右偏态) 均值右边数据更分散;g1 0 负偏度,均值左边的数据更分散.
4.峰度
g2 0,接近正态分布 g2 0,尖峰,粗尾,极端数值分布广 g2 0,平峰,细尾,极端数值少
反映与正态分布相比某 一分布的尖锐或平坦度.
g2
(n
n(n 1) 1)(n 2)(n
3)
n i1
(
xi
s
x
)4
3(n 1)2 (n 2)(n 3)
1.正峰值表示数据中含有较多远离均值的极端数值,相对尖锐 的分布,尾部粗2.负峰表示两侧的极端数值比较少,数据大部分 在均值周围,相对平坦,尾部细
一、基本概念
1. 统计量的定义
设 X1, X2 , , Xn 是来自总体X 的一个样本, g( X1, X2 , , Xn )是 X1, X2 , , Xn 的函数, 若 g中 不含未知参数, 则称 g( X1, X2 , , Xn ) 是一个统 计量.
设 x1, x2 , , xn 是相应于样本X1, X2 , , Xn 的样本值, 则称 g( x1, x2 , , xn )是 g( X1, X2 , , Xn ) 的观察值.
定义 设X为随机变量,若对给定的 (0,1), 存在x满足 P{X > x} = ,则称x为X的上 分位数
(点).
2 表示分散性的数字特征
1.方差、标准差与变异系数 、极差
n
(xi x)2
s 2 i1
———方差
n 1
标准差(方差)越 大,表示观察值 分布越分散;反 之分布越集中.
n
刻划数 s (x x)2 / n 1 ———均方差
总体X
随机抽样 获得样本
样本X1,X2,…,Xn
完成试验 获得数据
样本值x1,x2,…,xn
整理加工 统计推断
统计 工作
3 统计量与抽样分布
在利用样本推断总体的性质时,往往不能直接 利用样本,而需要对它进行一定的加工,这样才 能有效地利用其中的信息,否则,样本只是呈现 为一堆“杂乱无章”的数据.
数理统计中提到的总体,是指分布未知或 者分布类型已知但至少某些参数未知的随机变
量,常用X,Y,Z等表示。
因此,总体可以是一维随机变量,也可以是多 维随机变量.
例如,在研究某厂生产的灯泡的质量时,可以 分别用X,Y表示灯泡的寿命和光亮度,那么,对 上面两个问题的研究就转化为对总体(X,Y)的研 究了.
在应用中,我们从总体中抽出的个体必须具有代 表性,样本中个体之间要具有相互独立性,为保证 这两点,一般采用简单随机抽样.
定义 一种抽样方法若满足下面两点,称其为简单 随机抽样:
(1) 总体中每个个体被抽到的机会是均等的; (2) 样本中的个体相互独立. 由简单随机抽样得到的样本称为简单随机样本.
如果没有特殊说明,以后所说样本均指简单随机样 本.
Ak
1 n
n i 1
X
k i
,(k = 1,2,…)
(2) 样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
显然
,(k = 2,3,…)
A1 X ,
B2
1 n
n i 1
(Xi
X )2
(3)偏度 (skewness)
注
计算公式: g1
n (n 1)(n 2)
1 s3
n
( xi
i1
3
x)
我们研究总体时,所关心的往往是总体某方面 的特性,这些特性又常常可以用一个或多个数量 指标来反映.
例如,在研究某厂生产的灯泡的质量时,关心 的可能是这些灯泡的寿命和光亮度等.
总体指一个或多个数量指标,我们可以用一个 或多个随机变量来表示它们.
总体
指标
指标值全集
随机变量
把总体与某个随机变量的可能取值的集合等同, 把总体分布与某个随机变量的分布等同,把对总 体的研究转化为对某个随机变量规律的研究。
第八章 数理统计方法
描述统计——学
数 理
对随机现象进行观测、试验,
统
以取得有代表性的观测值
计 推断统计—学—
的
wenku.baidu.com
对已取得的观测值进行整理、
分
分析,作出推断、决策,从而
类
找出所研究的对象的规律性
推断 统计学
参数估计 假设检验 方差分析 回归分析
总体和样本
总体与个体
总体或母体指我们研究对象的全体构成的集合, 个体指总体中包含的每个成员.
g2 0尖峰粗尾
g2 0平峰细尾
8.2 参数估计法-- 矩估计法 理论根据:样本矩(的连续函数)依概率收敛于总
体矩(的连续函数). 矩估计法:用样本矩(函数)来估计总体矩(函数). 设已知总体X的可能分布函数族为:
F(x;1,2,...,k )
其中 1, 2 ,..., k 为待估参数.
矩估计法
据相对 分散指
i 1
标 CV s / x 100% s / x ——变异系数
n 1 时,有
2 s2 , s, CV
R x(n) x(1)
——极差
样本方差、标准差与变 异系数为总体方差、标 准差、变异系数的相合 估计
3 表示分布形态的数字特征
(1) 样本k阶原点矩(简称样本k阶矩)