概率论及数理统计第六章{样本及抽样分布}第二节:样本分布函数直方图

合集下载

概率论与数理统计 第六章 样本及抽样分布

概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]

概率论与数理统计第6章(公共数学版)

概率论与数理统计第6章(公共数学版)

Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2

概率论6-1,2,3

概率论6-1,2,3

例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.

概率论第六章

概率论第六章

P( X1 = x1 , X2 = x2 ,, Xn = xn )记作 f ( x1 , x2 ,, xn ) = P( X1 = x1 ) P( X2 = x2 )P( Xn = xn ) = f ( x1 ) f ( x2 ) f ( xn ) = ∏ f ( xi )
i =1 n
(1)
(2)当总体 X是连续型随机变量 且具有概率 当总体 是连续型随机变量,且具有概率 密度函数 f ( x) 时 ,则样本 ( X1 , X2 ,, Xn ) 的联 则样本 合概率密度为
的分布函数为F(x),则称总体的分布函数为 若X的分布函数为 的分布函数为 ,则称总体的分布函数为F(x) 。
对总体进行研究时, 对总体进行研究时,对总体中每个个体逐一 进行考察,这在实际中往往是行不通的, 进行考察,这在实际中往往是行不通的,一是试 验具有破坏性,二是需花费大量的人力物力; 验具有破坏性,二是需花费大量的人力物力; 常用的方法是: 常用的方法是:从总体中随机地抽取若干个 个体, 个体,根据对这部分个体的研究结果推判总体某 方面的特征。 方面的特征。 二、样本 从总体X中随机地抽取 个个体, 中随机地抽取n个个体 定义 从总体 中随机地抽取 个个体,称之为 的样本。 总体X的一个样本容量为 的样本 的一个样本容量 总体 的一个样本容量为n的样本。
解 总体 X 的分布律为 P{ X = k } = p k (1 p )1 k
所以 ( X 1 , X 2 , , X n ) 的分布律为
f ( x1 , x 2 , , x n ) = ∏ f ( x i ) =
n i =1
( k = 0, 1)
= p i =1 (1 p )
∑ xi
n
n
i =1

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲英文名称:Probability and statistics课程代码:221101008课程类别:专业基础课课程性质:必修开课学期:第三学期总学时: 54学时总学分:3考核方式:闭卷先修课程:高等数学适用专业:经济学专业一、课程简介概率论与数理统计是经济学专业的一门专业基础课。

概率论与数理统计是研究不确定性现象的数量规律性的一门学科,是对随机现象进行定量分析的重要工具,它在现代科学技术中占有很重要的地位,是研究自然现象、处理现代工程技术、解决科研和生产实际问题的一种有力的数学工具,已被广泛应用于每一学科领域、工农业生产和经济管理部门中。

开设本课程的目的在于,通过本课程的学习,使学生初步掌握概率论与数理统计等方面的基础知识,了解它的基本理论与基本方法,培养学生的抽象思维能力、逻辑推理能力、数学建模与实践能力,注意培养学生的自学能力,注意理论联系实际,不断提高学生的综合素质以及运动所学知识解决实际问题的能力,同时使学生了解概率论与数理统计在经济方面的应用,具备概率思想分析实际随机问题的能力,为专业课程的学习打下基础。

学生在进入本课程学习之前,应学过高等数学课程,该课程的学习为本课程提供了必须的数学基础知识。

本课程学习结束后,学生可具备进一步学习相关课程的理论基础。

本课程总54学时,其中理论课47学时,习题课7学时,考核方式为闭卷考试,根据平时考勤成绩、习题作业成绩、阶段性单元检测成绩及闭卷期末考试成绩综合给予最终成绩评定。

二、课程目标及其对毕业要求的支撑目标1人文素养目标:教育学生认真学习马克思列宁主义、毛泽东思想、邓小平理论、“三个代表”、科学发展观和新时代中国特色社会主义的重要思想;忠诚党的教育事业和体育事业,培养学生互教互学、团结友爱、共同提高的集体主义精神;培养学生有严格组织纪律性,吃苦耐劳和勇敢顽强的意志品质。

目标2理论知识培养目标:使学生掌握概率论与数理统计的基本理论和基础知识,初步掌握处理随机事件的基本思想和方法。

概率论与数理统计教学课件-ch6 样本及抽样分布

概率论与数理统计教学课件-ch6 样本及抽样分布
(4) X~t(n1). Sn
Stop
定理
iid
若 X 1 ,X 2 , i,iX dn 1~N ( 1 , 1 2 ),
X Y n 1 1 1 , iY n 1 1 2,X i,,Y n 2 S 1 ~ 2 N n ( 1 1 2 ,1 i2 n 2 1 1 )(X ,i且 两X 样)2本;独立
t1 (n ) t (n )
t(n)
Stop
存在t/2(n)>0, 满足 P{|T| t/2(n)}=,则称 t/2(n)为t(n)的双侧分位点.
t/2(n)
t/2(n)
Stop
• F—分布 构造 若1 ~2(n1), 2~2(n2),1, 2独立,则
F 2 1//n n1 2~F(n1,n2).
(1 11 n1 n2
2)
~
t(n1
n2

2).其中
Sw2
(n11)S12 (n2 1)S22 n1 n22
称为混合样本方. 差
Stop
例 设总 X~体 N(,2)如 , 果9要 .9 7% 的 以 概率保X 证 偏 0.1,差 试问 2 在 0.5时 , 样本n应 容取 量?多大
例 设(X1, X2,,X6)是来自正态 N(0总 ,1)的 体 样本 ;又设 Y(X1X2X3)2(X4X5X6)2 试确定c常 使c数 Y服从 2分布 ,并指出其自 . 由
样本观测值 对样本 X1, … ,Xn进行观测, 即可得一组观测值 x1, … ,xn • 统计量
样本 X1, … ,Xn的函数 g(X1, … ,Xn )称 为是总体 X 的一个统计量,若g(X1, … ,Xn ) 与任何未知参数无关。
统计量的观测值 若样本 X1, … ,Xn的观测值为x1, … ,xn,

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

例2: 检验一批灯泡的寿命,从中选择100只,则: 总体: 这批灯泡(有限总体)
个体: 这批灯泡中的每一只 样本: 抽取的100只灯泡 样本容量: 100 样本值: x1, x2,…, x100
数理统计
二、简单随机抽样
数理统计
1. 若从总体 X 中抽取样本 X1, X2,…, Xn,满足: 1) 随机性:总体中每一个个体都有同等机会被选入, 即样本 Xi 与总体 X 有相同的分布; 2) 独立性:样本中每一样品的取值不影响其它样品的取值, 即 X1, X2,…, Xn 相互独立; 这种随机的、独立的抽样方法称为简单随机抽样。 由简单随机抽样得到的样本称为简单随机样本。
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
一、总体和样本
数理统计
1. 总体——研究对象全体元素组成的集合. 所研究的对象的某个(或某些)数量指标的全体, 它是一个随机变量(或多维随机变量), 记为 X. 总体有三层含义: 研究对象的全体;全部数据; 分布. 2. 个体——组成总体的每一个元素. 即某个数量指标的全体中的一个, 可看作随机变量 X 的某个取值, 用 Xi 表示.
数理统计
第六章 样本及抽样分布
第一节 总体与样本 第二节 样本分布函数 直方图 第三节 样本函数与统计量 第四节 抽样分布
数理统计
数 理 统 计 的 分 类
描述统计学
对随机现象进行观测、试验,以取得有代表性 的观测值,并对已取得的数据进行归纳整理、画 出统计图表,来反映研究对象的数据分布特征.
推断统计学
数理统计方法具有“部分推断整体”的特征 .
数理统计
第一节 总体与样本

概率论与数理统计第六章样本与抽样分布精品PPT课件

概率论与数理统计第六章样本与抽样分布精品PPT课件

100.9 99.6 103.1 98.1 99.2 101.4 100.4 99.1 100.2 97.5 99.7
99.8 102.9 98.2 96.0 101.5 100.3 96.9 101.2 98.1 99.4 100.6
102.7 97.7 95.8 99.0 100.2 97.8 99.5 100.2 97.4 101.8 102.1
第六章 样本与抽样分布
• 本章主要内容
§1 总体与个体 §2 直方图与经验分布函数 §3 统计量及其分布
2021年1月20日星期三
1
§6.1 总体与个体
一.总体与个体
1.定义1:一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
2021年1月20日星期三
从国产轿车中抽5辆 进行耗油量试验
样本容量为5
2021年1月20日星期三
9
§6.1 总体与个体
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量.
但是,一旦取定一组样本,得到的是 n个具体的数 (x1,x2,…,xn),称为样本的一 次观察值,简称样本值 .
2021年1月20日星期三
某批 灯泡的寿命
鉴于此,常用随机变量的记号
或用其分布函数表示总体. 如 说总体X或总体F(x) .
2021年1月20日星期三
7
§6.1 总体与个体
类似地,在研究某地区中学生的营养状 况时,若关心的数量指标是身高和体重,我 们用X和Y分别表示身高和体重,那么此总体 就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.

《概率论与数理统计》第六章

《概率论与数理统计》第六章
所以,X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .

概率论第六章样本及抽样分布

概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12

2 1

2 (n2 1) S2

2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2

2
~ (n 1)
2
X n1 X n
故 Y

(n 1) S 2
n n 1 ~ t (n 1) /(n 1)

2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1

概率论与数理统计—第六章样本及抽样分布

概率论与数理统计—第六章样本及抽样分布

)n X +=2)i X -,S 2()iX X -21(,2N μ22(,4N μ212()22x e μ--⋅如果用X 的测试值x 估计μ1,用Y 的测试值y 估计μ2,从上面的图形可以看出,当可靠性(概率)取相同值(如90%)时,y 比x 更“接近”它的待估计量.当要求两个“接近"相同时,y 比x 的可靠性更高。

能够得到这些有价值的结论,应归功于我们知道了X 和Y 的分布.综上所述,我们需要知道统计量g (X 1,X 2,…,X n )的分布。

那么,g (X 1,X 2,…,X n )服从什么分布呢?不同的g 会有不同的结果.下面给出几种常见的分布,这些分布在统计推断中起着重要的作用。

(一)2χ分布(2χdistribution )设n X X X ,,,21 为相互独立的随机变量,它们都服从标准正态)1,0(N 分布,则随机变量221ni i X χ==∑ 服从自由度为n 的2χ分布,记作22()n χχ.)(2n χ分布的密度函数为122/210()2(/2)00n yn y e y f y n y --⎧>⎪=Γ⎨⎪≤⎩其中 )(αΓ称为伽马函数,定义为10(),0x x e dx ααα∞--Γ=>⎰。

下图描绘了)(2n χ分布密度函数在n = 1,4,10,20时的图形。

μ10.16μ20.082χ分布具有可加性:如果2211()n χχ、2222()n χχ,则 2221212()n n χχχ++2χ分布期望和方差:设22~()n χχ,则2()E n χ=,2()2D n χ=。

2χ分布分位点 对于给定的α( 0 〈 α < 1),称满足条件222(){()()}()ααn n n f y dy αχχχ+∞>==⎰P的数2()αn χ为2()n χ分布的上分位点。

教材后附表的2χ分布表给出分位点2()αn χ,可通过查表得到.如20.99(17) 6.408χ=,20.90(17)10.085χ=,20.05(17)27.587χ=等等。

概率课件-样本及抽样分布

概率课件-样本及抽样分布
是来自总体的一个样本,则
(1) E( X ) E( X ) ,
(2) D( X ) D( X ) 2 n ,
n
(3) E(S 2 ) D( X ) 2
矩估計法的 理論根據
若总体X的k阶矩E( X k ) k存在,则
(4) Ak
1 n
n i 1
Xik
p k
k 1, 2,
.
(3)证明:E(S2 )
2. 樣本
• 總體分佈一般是未知,或只知道是包含未知參 數的分佈。
• 為推斷總體分佈及各種特徵,按一定規則從總 體中抽取若干個體進行觀察試驗,以獲得有關 總體的資訊,這一抽取過程稱為 “抽樣”。
• 所抽取的部分個體稱為樣本。 • 樣本中所包含的個體數目稱為樣本容量。
对总体X在相同的条件下,进行n次重复、独立 观察,其结果依次记为X1,X2,,Xn .
概率論與數理統計的區別: • 概率論所研究的隨機變數,其分佈都是假設已知
的,在這個前提下研究其性質、特點和規律性。 • 數理統計所研究的隨機變數,其分佈是未知或不
完全知道的。需要通過獨立重複的觀察並對觀察 數據進行分析,來推斷其分佈。
數理統計的任務就是研究有效地收集、整理、 分析所獲得的有限的資料,對所研究的問題, 盡 可能地作出精確可靠的結論.
Y ( X1 X2 X3 )2 ( X4 X5 X6 )2
试决定常数C,使随机变量CY 服从 2分布.
解: 因为 X1 X2 X3 ~ N (0,3) 所以 X1 X2 X3 ~ N (0,1) 3
从而
X1
X2 3
X3
2
~
2 (1)
同理可知
X4
X5 3
X6
2

《概率论与数理统计》第六章样本及抽样分析

《概率论与数理统计》第六章样本及抽样分析

身高总体
178.4 161.5 174.9 182.7 171.0 165.3 172.8 182.1 180.2 176.8 181.7 175.7 177.3 180.0 179.4 177.0 181.3 176.5 176.0 175.7 168.1 184.6 169.1 177.8 175.1 161.8 174.3 176.0 163.7 176.8 177.3 175.3 180.2 176.8 181.9 178.4 181.5 177.6 179.9 178.2 174.7 176.0 175.7 180.3 166.2 177.2 171.9 182.9 176.8 179.5 167.0 174.8 182.7 174.9 178.1 179.9 175.4 184.4 175.1 179.4 173.2 176.1 177.6 180.5 164.3 170.5 177.5 168.3 173.0 176.8 173.9 180.7 166.5 180.0 165.6 179.4 182.2 176.3 177.4 183.4 167.9 176.1 177.4 183.4 176.9 168.0 179.0 178.8 173.1 173.2 162.2 179.9 178.2 183.0 174.0 180.8 173.1 173.2 176.8 171.1 169.0 178.3 171.6 181.2 167.6 161.1 166.0 190.2 180.3 166.2 174.9 175.8 176.5 164.2 173.0 176.8 170.5 180.5 177.3 175.3 163.7 176.8 171.1 168.5 171.2 170.2 177.1 169.4 175.7 177.3 183.2 168.6 175.1 179.4 169.1 169.9 168.5 180.2 174.9 171.0 171.0 168.8 177.7 168.6 176.6 175.9 176.8 179.5 174.3 176.0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

其中和式
xi
是对小于或等于
x
x
的一切
x(i)
的频率
fi
求和,
则称 Fn(x)为样本分布函数,经验分布函数。
2. 样本分布函数Fn(x)具有下列性质:
(1) 0 ≤ Fn(x) ≤1 (2) Fn(x)是非减函数
(3 )F n 0 , F n 1
(4) Fn(x)在每个观测值 x(i)处是右连续的, 点 x(i)是 Fn(x)的跳跃间断点, Fn(x)在该点的跃度就等于频率fi
因为样本容量 n充分大时, 随机变量 X的取值落在 各个子区间 (ti-1 - ti)内的频率近似等于其概率, 即:
f i P t i 1 X t i,i 1 ,2 , ,l
所以直方图大致地描述了总体X的概率分布。
例2: 测量100个某种机械零件的质量, 得到样本观测值如下(单位:g):
246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244
数理统计
总计
100
1.00
直方图如图所示:
作业
习题6-2 1
数理统计
写出零件质量的频率分布表并作直方图。
解: 因为样本观测中最小值为 237, 最大值为 265, 所以我们把数据的分布区间确定为: (236.5, 266.5)
并把这个区间等分为 10个子区间:
(236.5, 239.5), (239.5, 242.5), …, (263.5, 266.5)
数理统计
由此得到零件质量的频率分布表:
数理统计
第二节 样本分布函数 直方图
样本分布函数 直方图
一、样本分布函数(sample distribution function) 数理统计
我们把总体的分布函数 F(x)=P(X ≤ x) 称为总体分布函数. 从总体中抽取容量为 n 的样本得到 n 个样本观测值, 若样本容量 n 较大,则相同的观测值可能重复出现若干次, 为此,应当把这些观测值整理,并写出下面的样本频率分布表:
并以各子区间为底, 以 fi /(ti - ti-1)为高作小矩形,
各个小矩形的面积 ∆Si 就等于样本观测值落在该子区间内的频率,
即:
S ititi 1 ti fiti 1fi,l
i1 ,2, ,l.
l
所有小矩形的面积的和: Si fi 1.
i1
i1
这样作出的所有小矩形就构成了直方图。
理 论基础.
例 1:设 总 体 F 具 有 一 个 样 本 值 1, 1, 2,数理统计
则 经 验 分 布 函 数 F 3(x)的 观 察 值 为 :
0, 若x 1
F3 ( x)

2 3
,
若1
x
2
1, 若 x 2
二、直方图(histogram)
作样本的频率直方图(简称直方图), 步骤如下:
把区间 (a, b)分成 l个子区间:
(a, t1), (t1, t2), …, (ti-1, ti), …, (tl-1, b) 第 i个子区间的长度为: ti ti ti 1 ,(i 1 ,2 , ,l)
各子区间的长度可以相等, 也可以不等;
若使各子区间的长度相等,
则有:
ti
b
l
a
子区间的个数一般取为 8至 15个,
数理统计
样本分布函数Fn(x)的图形
数理统计
对于任意的实数 x总体分布函数 F(x)是事件X ≤ x 的概率; 样本分布函数 Fn(x)是事件 X ≤ x发生的频率. 根据伯努利大数定理可知, 当 n→∞时, 对于任意的正数 ε, 有:
ln i m PF nxF x1
格利文科(Glivenko) 进一步证明了, 当n→∞时, 样本分布函数 Fn(x)与总体分布函数 F(x)之间存在着更密切的 近似关系的结论. 这些结论就是我们在数理统计中可以依据样本来推断总体的
观测值 x 1
频数
n1
频率
f1
x 2

n2

f2

数理统计
x l
总计
nl
n
fl
1
其中 x1x2 xl
fi
ni n
i1,2,
,l
l n
l
ni n
i1
l
fi 1
i1
1. 定义: 设函数:
0,
x x1
Fn
x
fi , xi x xi1
xi x
1,
x xl
数理统计
i1,2, ,l1
数理统计
1. 找出样本观测值 x1, x2, …, xn中的最小值与最大值, 分别记作 x1* 与 xn*, 即: x1* =min(x1, x2, …, xn), xn* =max(x1, x2, …, xn)
2. 适当选取略小于 x1*的数 a与略大于 xn*的数 b, 并用分点: a=t0 < t1 < t2 < … < tl-1 < tl=b
太多则由于频率的随机摆动而使分布显得杂乱,
太少则难于显示分布的特征。
此外, 为了方便起见, 分点 ti 应比样本观测值 xi多取一位小数.
3. 把所有样本观测值逐个分到各子区间内,
并计算样本观测值落在各子区间内的频数 ni及频率:
fi
ni ,i
n
1,2,
,l.
数理统计
4. 在 Ox轴上截取各子区间,
相关文档
最新文档