数据的统计分析ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学建模与数学实验
数据的统计描述和分析
14.05.2020
后勤工程学院数学教研室
.
1
实验目的
1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业。
数 据 的 统 计 描 述 和 分 析
14.05.2020
统计的基本概念 参数估计 假设检验
得 x 1 * x 2 * x n * .在 包 含 [ x 1 * ,x n * ]的 区 间 [ a , b ] 内 插 入 一 些 等 分 点 : a x 1 ' x 2 ' x n ' b ,注 意 要 使 每 一 个 区 间 ( x i ',x i ' 1 ]( i = 1 , 2 , … , n - 1 )
14.05.2020
.
4
3. 表示分布形状的统计量—偏度和峰度
偏度:g1
1 s3
n
(Xi
i1
X)3
峰度:g2
1 s4
n
(Xi
i1
X)4
偏度反映分布的对称性,g1 >0称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0称为左偏态,情况相反;而g1接近0 则可认为分布是对称的.
峰度是分布形状的另一种度量,正态分布的峰度为3,若g2比3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数
( ) Y = X 1 2 X 2 2 X n 2
服 从 自 由 度 为 n 的 2分 布 , 记 为 Y ~ 2 n.
Y 的 均 值 为 n , 方 差 为 2 n .
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
14.05.2020
.
8
3、 t分 布 t( n)
3 、 作 频 率 直 方 图 : 在 直 角 坐 标 系 的 横 轴 上 , 标 出 x 1 ',x 2 ', ,x n ' 各 点 , 分 别 以
( x i ',x i ' 1 ]为 底 边 , 作 高 为 f x ii ' 的 矩 形 , x i ' x i ' 1 x i ',i 1 ,2 , ,n 1 ,即 得
若 X ~N ( 0, 1) , Y ~2( n) , 且 相 互
独 立 , 则 随 机 变 量
TX Y
n
服 从 自 由 度 为 n的 t分 布 , 记 为 T ~t( n) . t分 布 t( 20) 的 密 度 函 数 曲 线 和 N ( 0, 1) 的
曲 线 形 状 相 似 .理 论 上 n 时 , T ~t( n) N ( 0, 1) .
2. 区间估计:构造两个函数i1( X1,X2,…,Xn)和i2( X1,X2,…, Xn)做成区间,把这(i1,i2)作为参数i的区间估计.
14.05.2020
.
11
一、点估计的求法
(一)矩估计法
假 设 总 体 分 布 中 共 含 有 k个 参 数 , 它 们 往 往 是 一 些 原 点 矩 或 一 些 原 点 矩 的 函 数 , 例 如 , 数 学 期 望 是 一 阶 原 点 矩 , 方 差 是 二 阶 原 点 矩 与 一 阶 原 点 矩 平 方 之 差 等 .因 此 , 要 想 估 计
密度函数
j(x)
1
x2
e2
2p
分布函数
F(x)
1
x
y2
e 2 dy
2p
0.4
0.35
0.3
0.25
0.2
0.15

0.1
0.050-4-202
4
6
14.05.2020
.
7
( ) 2 、 2 分 布 2 n
若 随 机 变 量 X 1 , X 2 , … X n 相 互 独 立 , 都 服 从 标 准 正 态 分 布 N ( 0 , 1 ) , 则 随 机 变 量
频 率 直 方 图 .
14.05.2020
.
6
三、几个在统计中常用的概率分布
1.正态分布N (m,s 2 )
密度函数: p(x)
1
( xm )2
e 2s 2 分布函数:F (x)
2p s
其中 m 为均值,s 2 为方差, x .
1
e dy x
( ym)2 2s 2
2ps
标准正态分布:N(0,1)
.
3
一、统计量
1、表示位置的统计量—平均值和中位数
平均值(或均值,数学期望) :X1 n
ni1
Xi
中位数:将数据由小到大排序后位于中间位置的那个数值.
2、表示变异程度的统计量—标准差、方差和极差
标准差:s[n11i n1(Xi
1
X)2]2
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
极差:样本中最大值与最小值之差.
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
2
4
6
14.05.2020
.
9
4. F分布F(n1,n2)
若X~2 (n1),Y~2 (n2),且相互独立,则随机变量
X
F n1 Y
n2
服从自由度为(n1,n2)的F分布,记作F~ F(n1,n2).
由 F 分布的定义可以得到F 分布 的一个重要性质:
参数估计就是从样本(X1,X2,…,Xn)出发,构造一些统计量 ˆi( X1,
X2,…,Xn) (i=1,2,…,k)去估计总体X中的某些参数(或数字特
征)i(i=1,2,…,k).这样的统计量称为估计量.
1. 点估计:构造(X1,X2,…,Xn)的函数 ˆi( X1,X2,…,Xn) 作为参数i的点估计量,称统计量ˆi为总体X参数i的点估计量.
1 若F~F(n1,n2),则F ~ F(n2,n1)
F分布F(10,50)的密度函数曲线
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
14.05.2020
.
返回
10
无论总体X的分布函数F(x;1,2,,k)的类型已知或未知,
我们总是需要去估计某些未知参数或数字特征,这就是参数估计问题.即
内 都 有 样 本 观 测 值 x i( i = 1 , 2 , … , n - 1 ) 落 入 其 中 .
2 、 求 出 各 组 的 频 数 和 频 率 : 统 计 出 样 本 观 测 值 在 每 个 区 间 ( x i ', x i ' 1 ] 中 出
现 的 次 数 n i, 它 就 是 这 区 间 或 这 组 的 频 数 . 计 算 频 率 f i n n i.
据,因而峰度可用作衡量偏离正态分布的尺度之一.
4.
k阶原点矩:Vk
1 n ni1
Xik
k阶中心矩:Uk
1 n ni1
(Xi
X)k
14.05.2020
.
5
二、分布函数的近似求法
1 、 整 理 资 料 : 把 样 本 值 x 1 , x 2 , … , x n 进 行 分 组 , 先 将 它 们 依 大 小 次 序 排 列 ,
相关文档
最新文档