[数学]数理统计基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019/1/29 第一章 数理统计的基本概念 15
(2)样本中位数 样本中位数 X 定义为
X n 1 (2) X Xn Xn 1 2 2 2 n为奇数
n为偶数
ห้องสมุดไป่ตู้
平均数和中位数都是反映样本观察值的集 中程度,而中位数不受极端值的影响,更 具代表性。
876 354 189 804 570 690 388 504 563 435 885 731 698 464 336 605 1020 505 537 557 605 374 843 706 376 448 628 685 562 639 393 718 868 877 817 516 811 971 421 447 758 561 719 673 393 624 559 814 491 856 352 296 809 498 685 529 684 224 626 562 578 735 661 210 928 720 562 807 647 291 751 480 298 410 526 341 592 703 642 771 496 267 466 631 508 571 481 460 739 585
二. 常用的统计量
①样本矩
样本均值: 1 X Xi n i 1
n
它反映了总体均值 的信息
n n 1 1 2 2 2 2 样本方差:S ( X X ) [ X n X ] i i n 1 i 1 n 1 i 1
它反映了总体方差 的信息
1 样本k阶(原点)矩:Ak n
一、总体和个体 二、抽样和样本
一、总体和个体
• 总体:研究对象的全体; • 个体:总体中的每个元素. • 例1 考察一大批灯泡质量时,该批灯泡的 全体组成总体,每个灯泡是个体。但实际 上我们只关心灯泡的“使用寿命”这个指 标,每一个灯泡都有一个寿命值,这批灯 泡使用寿命的全体是总体,每个灯泡使用 寿命值就是个体.
X1 , X 2 ,
1 n Xi n i 1
, X n 是 X 的一个样本.则
1 n 2 Xi 和 , n i 1
3 i
2 3 X i 都是统计量. i 1
n
X 和 X
1
n
1
n
i 1
2
i 1
i
2
都不是统计量.
11
2019/1/29
第一章 数理统计的基本概念
频率 f i
0.033333 0.044444 0.111111 0.166667 0.177778 0.166667 0.133333 0.100000 0.044444 0.022222
ni n
直方图纵坐标 0.00037 0.000494 0.001235 0.001852 0.001975 0.001852 0.001481 0.001111 0.000494 0.000247
pn x1 , x2 , , xn p xi p
i 1 i 1 n n xi
1 p
1 xi
p i1
xi
n
1 p
n n xi i 1
2019/1/29
第一章 数理统计的基本概念
9
§1-3 统计量
一、统计量 二、常用统计量
一、统计量
i i
n
2019/1/29
第一章 数理统计的基本概念
20
区间 ti 1 , ti (150 (240 (330 , (420 (510 (600 (690 (780 (870 (960 240] 330] 420] 510] 600] 690] 780] 870] 960] 1050]
频数 ni 3 4 10 15 16 15 12 9 4 2
1 1 2 2 2 s ( xi x ) [ xi nx 2 ] n 1 i 1 n 1 i 1
n
n
2019/1/29
第一章 数理统计的基本概念
13
1 ak n
s
i 1
n
xi k , k 1,2
n
1 n 1
n
i 1
( xi x ) 2
1 k bk ( xi x ) , k 1,2 n i 1
定义1 设 X1, X 2 , , X n是总体X 的一个样本, g X1, X 2 , , X n 为一个n 元函数,若此函数中不 含任何未知参数,则称函数 g X1, X 2 , , X n 为一 个统计量. 例1
2 2 X ~ N , 设总体 ,其中 已知,但 未知.
fi ti
(3)以变量为横轴,在横轴上标出 t0 , t1 , , tm, fi 分别以 ti1, ti 为底,作高为 t 的长方形,即得直 i 方图,如下图所示. 画直方图时,也可以用各区间上的频数或频率 作为矩形的高,称为频数直方图和频率直方图。
2019/1/29 第一章 数理统计的基本概念 21
2019/1/29 第一章 数理统计的基本概念 5
例2 有一大批产品共1000个,每个产品可 区分为一等、二等及次品。要研究这批产 品质量时,1000个产品的等级构成总体, 每个产品的等级是个体。如果用“1”表示 一等品,“2”表示二等品,“0”表示次 品。则总体={1,2,0,1,2,2,… … , 1,0},总体中共1000个元素. 例3 一大批炮弹,检查质量时,我们只关 心射程,则总体={每个炮弹射程},个体是 每个炮弹的射程.
Fn x1 , x2 ,
, xn F xi
i 1
若总体 X 是离散型随机变量,其分布律为 p x p X x ,则(X1, X 2 , , X n )的联合分布律为:
pn x1 , x2 ,
2019/1/29
, xn p xi
i 1
2019/1/29
第一章 数理统计的基本概念
14
②.顺序统计量,样本中位数和样本极差
(1)顺序统计量 设 X1, X 2 , , X n 是从总体 X 中抽取的容量为 n 的 x1, x2 , , xn 是样本的一个观察值.将观察值 样本, 由小到大按顺序重新排列为:x(1) x(2) x(n). k 1, 2, , n ,由此得到 定义 X (k ) 取值为 x( k ) , X (1) , X (2) , , X ( n) 称为样本 X1, X 2 , , X n 的一组顺 序统计量, x(1) , x(2) , , x( n) 称为顺序统计量的值. X 1 min X i 称为最小(极小)顺序统计量. 1i n X n max X i 称为最大(极大)顺序统计量. 1 i n X k k 1, 2, , n 称为第 k 个顺序统计量.
2019/1/29 第一章 数理统计的基本概念 6
二、抽样和样本
• 1、简单随机样本 从总体X中抽取一部分,如n个: , n 这一部分个体叫样本, 叫样本容量,样本 X1 , X 2 , , X n 中的每一个个体称为样品,取得样本的过 程叫抽样.
抽样方法需要满足:1代表性;2独立性.
2019/1/29
第一章 数理统计的基本概念
§1-1 引言
一、数理统计 二、数理统计的研究内容
一、数理统计
统计一词的英文“statistics”源于拉丁文 “status”,即国家.
例子:要检验一大批产品的质量,将产品分为正 品和废品,求这批产品的废品率. 方法一:采用逐个检查的方法,然后汇总产品总 数、废品数,再计算出废品率. 方法二:从这批产品中随机抽取一部分产品,算 出废品率,然后根据部分产品的废品率推断整批产品 的废品率.
8
n
第一章 数理统计的基本概念
.
例4 设总体 X 服从参数为 p 的两点分布,即 P X 1 p, P X 0 1 p ,0 p 1 , 试求样本( X1 , X 2 , , X n )的联合分布律. 解:由于总体 X 的分布律可以写成 1 x p x p X x p x 1 p x 0,1 故样本( X1 , X 2 , , X n)的联合布律为
2019/1/29
第一章 数理统计的基本概念
19
解 (1)首先把变量的取值范围分成若干区间。 记观察值为 x1, x2 , , xn,最大最小值分别记为 x n 和 x1 ,取 a 略小于 x1,取 b 略大于x n .
将 a, b 分成 m 个小区间,小区间长度可以不 等,设分点为 a t0 t1 tm b,得 m 个小区间 ti1, ti i 1, 2, , m .
2019/1/29
i 1
n
Xik
k 1,2,
它反映了总体k 阶矩 12 的信息
第一章 数理统计的基本概念
样本标准差:S S
2
1 n 1
i 1
n
( X i X )2
1 样本k阶中心矩:Bk n
i 1
n
( X i X )k
k 1,2,
它们的观察值分别为: n 1 x xi n i 1
2019/1/29
第一章 数理统计的基本概念
22
二、经验分布函数
将 n 个样本值 x1, x2 , , xn 排列成 x(1) x(2) x(n) 记 Fn x 为不大于 x 的样本值出现的频率,则
0 x x1 k Fn x x k x x k 1 n x x n 1
第一章 数理统计的基本概念
7
• 2 样本的联合分布 设总体X 的分布函数为 F x ,概率密度函数 为 f x ,则由概率论知识可得,样本 ( X1, X 2 , , X n )的联合概率密度为: n
f n x1 , x2 , , xn f xi
i 1
n
联合分布函数为:
2019/1/29 第一章 数理统计的基本概念 16
(3)样本极差
定义R X n X 1为样本极差,它的观察值为 r x n x1 ,是反映样本值分散程度的量. 例2 从总体中抽取容量为6的样本,测得样本值为: 32,65,35,30,28,29,试求样本均值,样本方 差,样本标准差,样本中位数,样本极差. 解 将样本值从小到大排列:28,29,30,32,35,65.则
.
1 6 x xi 36.5 6 i 1
6 1 2 s2 x x i 201.1 6 1 i 1
s s2 14.81
2019/1/29
x
30 32 31 2
第一章 数理统计的基本概念
r 65 28 37
17
§1-4 直方图与经验 分布函数
本例中 x1 189, xn 1020, n 90, a 150, b 1050, 取 m 10,各区间等长,每个区间长度 b a 1050 150 h t 90 .
i
m
10
(2)其次,求出观察值落入每个小区间的频数 n ni ,并计算频率 f ,如下表所示:
格列汶科定理 设总体X 的分布函数为 F x, Fn x 是其经验分布函数, X1 , X 2 , , X n是一个样本, 则 p lim sup F x F x 0 1
一、直方图 二、经验分布函数
一、直方图
设总体 X 的概率密度函数为 f x ,而 X1, X 2 , , X n x1 , x2 , , xn 是一组样本观察值,直方 是其样本, 图能够用样本数据来刻划总体的概率密度函数.
例1 美国1990年90个大城市暴力犯罪率(每100000 居民中暴力犯罪的数量)数据如下,画出这些数据的 直方图.
2019/1/29
第一章 数理统计的基本概念
2
二、研究内容
两大类问题: 一、试验的设计和研究,即如何有效的收 集数据。 二、统计推断,即如何有效的使用数据。 常用统计软件: SPSS,SAS,Excel,TSP; 本书中用SPSS举例.
2019/1/29 第一章 数理统计的基本概念 3
§1-2 总体和样本
(2)样本中位数 样本中位数 X 定义为
X n 1 (2) X Xn Xn 1 2 2 2 n为奇数
n为偶数
ห้องสมุดไป่ตู้
平均数和中位数都是反映样本观察值的集 中程度,而中位数不受极端值的影响,更 具代表性。
876 354 189 804 570 690 388 504 563 435 885 731 698 464 336 605 1020 505 537 557 605 374 843 706 376 448 628 685 562 639 393 718 868 877 817 516 811 971 421 447 758 561 719 673 393 624 559 814 491 856 352 296 809 498 685 529 684 224 626 562 578 735 661 210 928 720 562 807 647 291 751 480 298 410 526 341 592 703 642 771 496 267 466 631 508 571 481 460 739 585
二. 常用的统计量
①样本矩
样本均值: 1 X Xi n i 1
n
它反映了总体均值 的信息
n n 1 1 2 2 2 2 样本方差:S ( X X ) [ X n X ] i i n 1 i 1 n 1 i 1
它反映了总体方差 的信息
1 样本k阶(原点)矩:Ak n
一、总体和个体 二、抽样和样本
一、总体和个体
• 总体:研究对象的全体; • 个体:总体中的每个元素. • 例1 考察一大批灯泡质量时,该批灯泡的 全体组成总体,每个灯泡是个体。但实际 上我们只关心灯泡的“使用寿命”这个指 标,每一个灯泡都有一个寿命值,这批灯 泡使用寿命的全体是总体,每个灯泡使用 寿命值就是个体.
X1 , X 2 ,
1 n Xi n i 1
, X n 是 X 的一个样本.则
1 n 2 Xi 和 , n i 1
3 i
2 3 X i 都是统计量. i 1
n
X 和 X
1
n
1
n
i 1
2
i 1
i
2
都不是统计量.
11
2019/1/29
第一章 数理统计的基本概念
频率 f i
0.033333 0.044444 0.111111 0.166667 0.177778 0.166667 0.133333 0.100000 0.044444 0.022222
ni n
直方图纵坐标 0.00037 0.000494 0.001235 0.001852 0.001975 0.001852 0.001481 0.001111 0.000494 0.000247
pn x1 , x2 , , xn p xi p
i 1 i 1 n n xi
1 p
1 xi
p i1
xi
n
1 p
n n xi i 1
2019/1/29
第一章 数理统计的基本概念
9
§1-3 统计量
一、统计量 二、常用统计量
一、统计量
i i
n
2019/1/29
第一章 数理统计的基本概念
20
区间 ti 1 , ti (150 (240 (330 , (420 (510 (600 (690 (780 (870 (960 240] 330] 420] 510] 600] 690] 780] 870] 960] 1050]
频数 ni 3 4 10 15 16 15 12 9 4 2
1 1 2 2 2 s ( xi x ) [ xi nx 2 ] n 1 i 1 n 1 i 1
n
n
2019/1/29
第一章 数理统计的基本概念
13
1 ak n
s
i 1
n
xi k , k 1,2
n
1 n 1
n
i 1
( xi x ) 2
1 k bk ( xi x ) , k 1,2 n i 1
定义1 设 X1, X 2 , , X n是总体X 的一个样本, g X1, X 2 , , X n 为一个n 元函数,若此函数中不 含任何未知参数,则称函数 g X1, X 2 , , X n 为一 个统计量. 例1
2 2 X ~ N , 设总体 ,其中 已知,但 未知.
fi ti
(3)以变量为横轴,在横轴上标出 t0 , t1 , , tm, fi 分别以 ti1, ti 为底,作高为 t 的长方形,即得直 i 方图,如下图所示. 画直方图时,也可以用各区间上的频数或频率 作为矩形的高,称为频数直方图和频率直方图。
2019/1/29 第一章 数理统计的基本概念 21
2019/1/29 第一章 数理统计的基本概念 5
例2 有一大批产品共1000个,每个产品可 区分为一等、二等及次品。要研究这批产 品质量时,1000个产品的等级构成总体, 每个产品的等级是个体。如果用“1”表示 一等品,“2”表示二等品,“0”表示次 品。则总体={1,2,0,1,2,2,… … , 1,0},总体中共1000个元素. 例3 一大批炮弹,检查质量时,我们只关 心射程,则总体={每个炮弹射程},个体是 每个炮弹的射程.
Fn x1 , x2 ,
, xn F xi
i 1
若总体 X 是离散型随机变量,其分布律为 p x p X x ,则(X1, X 2 , , X n )的联合分布律为:
pn x1 , x2 ,
2019/1/29
, xn p xi
i 1
2019/1/29
第一章 数理统计的基本概念
14
②.顺序统计量,样本中位数和样本极差
(1)顺序统计量 设 X1, X 2 , , X n 是从总体 X 中抽取的容量为 n 的 x1, x2 , , xn 是样本的一个观察值.将观察值 样本, 由小到大按顺序重新排列为:x(1) x(2) x(n). k 1, 2, , n ,由此得到 定义 X (k ) 取值为 x( k ) , X (1) , X (2) , , X ( n) 称为样本 X1, X 2 , , X n 的一组顺 序统计量, x(1) , x(2) , , x( n) 称为顺序统计量的值. X 1 min X i 称为最小(极小)顺序统计量. 1i n X n max X i 称为最大(极大)顺序统计量. 1 i n X k k 1, 2, , n 称为第 k 个顺序统计量.
2019/1/29 第一章 数理统计的基本概念 6
二、抽样和样本
• 1、简单随机样本 从总体X中抽取一部分,如n个: , n 这一部分个体叫样本, 叫样本容量,样本 X1 , X 2 , , X n 中的每一个个体称为样品,取得样本的过 程叫抽样.
抽样方法需要满足:1代表性;2独立性.
2019/1/29
第一章 数理统计的基本概念
§1-1 引言
一、数理统计 二、数理统计的研究内容
一、数理统计
统计一词的英文“statistics”源于拉丁文 “status”,即国家.
例子:要检验一大批产品的质量,将产品分为正 品和废品,求这批产品的废品率. 方法一:采用逐个检查的方法,然后汇总产品总 数、废品数,再计算出废品率. 方法二:从这批产品中随机抽取一部分产品,算 出废品率,然后根据部分产品的废品率推断整批产品 的废品率.
8
n
第一章 数理统计的基本概念
.
例4 设总体 X 服从参数为 p 的两点分布,即 P X 1 p, P X 0 1 p ,0 p 1 , 试求样本( X1 , X 2 , , X n )的联合分布律. 解:由于总体 X 的分布律可以写成 1 x p x p X x p x 1 p x 0,1 故样本( X1 , X 2 , , X n)的联合布律为
2019/1/29
第一章 数理统计的基本概念
19
解 (1)首先把变量的取值范围分成若干区间。 记观察值为 x1, x2 , , xn,最大最小值分别记为 x n 和 x1 ,取 a 略小于 x1,取 b 略大于x n .
将 a, b 分成 m 个小区间,小区间长度可以不 等,设分点为 a t0 t1 tm b,得 m 个小区间 ti1, ti i 1, 2, , m .
2019/1/29
i 1
n
Xik
k 1,2,
它反映了总体k 阶矩 12 的信息
第一章 数理统计的基本概念
样本标准差:S S
2
1 n 1
i 1
n
( X i X )2
1 样本k阶中心矩:Bk n
i 1
n
( X i X )k
k 1,2,
它们的观察值分别为: n 1 x xi n i 1
2019/1/29
第一章 数理统计的基本概念
22
二、经验分布函数
将 n 个样本值 x1, x2 , , xn 排列成 x(1) x(2) x(n) 记 Fn x 为不大于 x 的样本值出现的频率,则
0 x x1 k Fn x x k x x k 1 n x x n 1
第一章 数理统计的基本概念
7
• 2 样本的联合分布 设总体X 的分布函数为 F x ,概率密度函数 为 f x ,则由概率论知识可得,样本 ( X1, X 2 , , X n )的联合概率密度为: n
f n x1 , x2 , , xn f xi
i 1
n
联合分布函数为:
2019/1/29 第一章 数理统计的基本概念 16
(3)样本极差
定义R X n X 1为样本极差,它的观察值为 r x n x1 ,是反映样本值分散程度的量. 例2 从总体中抽取容量为6的样本,测得样本值为: 32,65,35,30,28,29,试求样本均值,样本方 差,样本标准差,样本中位数,样本极差. 解 将样本值从小到大排列:28,29,30,32,35,65.则
.
1 6 x xi 36.5 6 i 1
6 1 2 s2 x x i 201.1 6 1 i 1
s s2 14.81
2019/1/29
x
30 32 31 2
第一章 数理统计的基本概念
r 65 28 37
17
§1-4 直方图与经验 分布函数
本例中 x1 189, xn 1020, n 90, a 150, b 1050, 取 m 10,各区间等长,每个区间长度 b a 1050 150 h t 90 .
i
m
10
(2)其次,求出观察值落入每个小区间的频数 n ni ,并计算频率 f ,如下表所示:
格列汶科定理 设总体X 的分布函数为 F x, Fn x 是其经验分布函数, X1 , X 2 , , X n是一个样本, 则 p lim sup F x F x 0 1
一、直方图 二、经验分布函数
一、直方图
设总体 X 的概率密度函数为 f x ,而 X1, X 2 , , X n x1 , x2 , , xn 是一组样本观察值,直方 是其样本, 图能够用样本数据来刻划总体的概率密度函数.
例1 美国1990年90个大城市暴力犯罪率(每100000 居民中暴力犯罪的数量)数据如下,画出这些数据的 直方图.
2019/1/29
第一章 数理统计的基本概念
2
二、研究内容
两大类问题: 一、试验的设计和研究,即如何有效的收 集数据。 二、统计推断,即如何有效的使用数据。 常用统计软件: SPSS,SAS,Excel,TSP; 本书中用SPSS举例.
2019/1/29 第一章 数理统计的基本概念 3
§1-2 总体和样本