数理统计基本概念

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SK反映了总体分布密度曲线的对称性信息.当 SK>0时,分布的形状是右尾长,称为正偏的;当 SK<0时,分布的形状是左尾长,称为负偏的.
Fn
(
x)
0.3 0.4
340 x 342 342 x 343
0.6 343 x 344 0.9 344 x 345
1 345 x
11
§1.2 统计量及其分布
1.定义1.2.1 设 X1, , X n 是取自某总体的一个 容量为n的样本,假如样本函数 T T ( X1,L , X n )
某食品厂用自动装罐机生产净重量为345克的午餐肉
罐头,由于随机性,每个罐头的净重有差别,现从中随
机取10个罐头,其净重如下: 0 x 336
344,336,345,342,340, 0.1 336 x 338
338,344,343,344,343, 0.2 338 x 340
求经验分布函数.
1
§1.1 总体与样本
一、 总体与个体
总体指研究对象的某项数量指标值的全体。组成总体 的每个元素称为个体。由于每个个体的出现带有随机 性,即相应的数量指标值的出现带有随机性。从而可 把此种数量指标看作随机变量,我们用一个随机变量 及其分布来描述总体。为此常用随机变量的符号或分 布的符号X,Y,Z…来表示总体。
中不含任何未知参数,则称T为统计量.统计量的 分布称为抽样分布.
2.常用的几个统计量
设 X1, , X n 是来自总体X的样本
⑴样本均值
X
1 n
n i 1
Xi
样本均值是反映总体数学期望所在位置信息的一
个统计量,是总体数学期望的一个很好的估计. 12
⑵样本方差 样本标准差
S 2
1 n 1
n i 1
例1.3 在研究某批灯泡的质量时,若关心的是其质量 是否合格,若合格记为0,不合格记为1,因此该总体就 可用仅取0和1的随机变量X来表示.显然,这个总体 的分布就是一个参数为p的二点分布b(1,p),由于p 未知,故这个总体分布也是未知的,但可以假定该总 体分布是二点分布族
F={b(1,p);0<p<1} 5
定义1.1.1 设总体X的分布函数为F(x),从中获得
的样本观察值为 x1, , xn ,将它们从小到大排
列成 x(1) x(2) x(n) ,令
0,
x x(1)
Fn (x) k n , x(k ) x x(k1)
1,
x x(n)
称 Fn (x) 为该样本的经验分布函数.
10
例1.5 写出经验分布函数
Ch 1 数理统计基本概念
数理统计是研究如何有效地收集、整理和分析带有随机影 响的数据,从而对所观察的现象做出推断或预测,为决策 提供依据的一门学科。
在近一个多世纪的发展中,数理统计不同程度地渗透到 人类活动的许多领域。人口调查、税收预算、测量误差、 出生与死亡统计、保险业中赔款额和保险金的确定等,这 些数理统计早期主要研究的问题,直到现在仍然值得认真 研究。在近半个世纪以来,数理统计在理论、方法、应用 上都有较大的发展。抽样调查、试验设计、回归分析与回 归诊断、多元分析、时间序列分析、非参数统计、统计决 策函数、统计计算、随机模拟、探索性数据分析等统计方 法相继产生并在实践中普遍使用,把以描述为主的统计发 展到以推断为主的统计。数理统计的内容已异常丰富,应 用广泛,成为当前最活跃的学科之一。
若人们关心的是灯泡的寿命。这是一个无限总体。 假如人们根据过去的资料知道灯泡的寿命X服从 指数分布,其密度函数为
ex , x 0
f (x) 0, x 0
所需确定的参数是λ>0.
6
四、从样本去认识总体
⑴ 频数频率分布表及其图示
例1.4 我们通常饮用的矿泉水有19个指标.某市 技术监督局一次抽查了58批矿泉水,记录每一批 矿泉水的每个指标是否合格,从中可统计出每批矿 泉水不合格指标的个数X.这里X是一个离散型随 机变量,其一切可能取值为0,1,…19。 58批矿泉 水的指标不合格数构成了一个容量为58的样本的 观察值,每个可取0,1,…,19中某个值,将它们整理 后列成表1.1.1
(Xi
X )2
S S2
样本方差与样本标准差反映了数据取值分散与 集中的程度,即反映了总体方差与标准差的信息.
⑶样本k阶(原点)矩
Ak
1 n
n i 1
X
k i
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它们分别反映了总体k阶(原点)矩与k阶中心矩的 信息.
13
⑷样本偏度
SK
B3
3
B2 2
( X1, X 2 , , X n ), 其观察值为( x1, x2 , , xn ).
3
简单随机抽样:
它要求满足两点:
(1)代表性. 样本中每个个体与所考虑的总体有相同 的分布.即样本中每个个体与总体X具有相同的分布.
(2)独立性. 样本中每个个体取什么值并不影响其它 个体取什么值.即必须是相互独立的随机变量.
由简单随机抽样所得到的样本称为简单随机样本.假
如总体的分布函数为F(x),则其简单随机样本的联合
分布函数为
n
F (x1, , xn ) F (xi ) i1
n
ຫໍສະໝຸດ Baidu
f (x1, , xn ) f (xi )
i1
4
三、 分布族
在概率论研究中,随机变量的分布总是假设给定 的,但在数理统计的研究中,总体的分布是未知 的,但总可以假定总体的分布是某一个分布族的 成员.
例1.1研究某灯泡的使用寿命时,总体可用随机变量X 来表示,或用其分布函数F(x)表示。
2
例1.2研究某地区学龄前儿童发育情况,人们关心的 是其体重X和身高Y这两个数量指标,则此总体就可 用二维随机变量(X,Y)或其联合分布函数F(x,y)表示.
二、样本
为了推断总体分布及其各种特征,就必须从总体中 按一定法则抽取若干个体进行观测或试验,以获得 有关总体的信息.这一抽取过程称为抽样.所抽取的 部分个体称为样本,样本中个体的数目称为样本容量. 例如容量为n的样本可以看作是n维随机变量
7
表 1.1.1 58批矿泉水不合格指标数的频率、 频数分布表
不合格 指标数 0
频数 33
频率 0.57
1
17
0.293
2
5
0.086
3
1
0.017
4
2
0.034
合计
58
1
8
直方图
频率
40
20
频率
0 0 1 2 3 4 其他
个数
9
(2) 经验分布函数
样本直方图可以形象地去描述总体概率密度函数大致 形状,经验分布函数将可以用来描述总体分布函数的 大致形状.
相关文档
最新文档