数学建模数据统计与分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
5
10
15
20
2018/10/14
数学建模
7
3、 t 分布 t(n) 若 X~N (0 , 1 ) ,Y~ ( n ) ,且相互自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n 时,T~t(n) N(0,1).
1 n k 4. k 阶原点矩:Vk n X i i 1
1 n k U ( X X ) i k 阶中心矩: k n i 1
2018/10/14
数学建模
4
二、分布函数的近似求法
得
1、整理资料: 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列,
* * * * * x1 x2 xn [ x1 , xn ] 的区间[a,b]内插入一些等分点: .在包含 ' ' a x1' x 2 xn b, 注意要使每一个区间 ( xi' , xi' 1 ] (i=1,2,…,n-1)
频率直方图.
2018/10/14 数学建模 5
fi ' ' ' x x x 的矩形, i i 1 i , i 1, 2, , n 1 , 即得 ' xi
三、几个在统计中常用的概率分布
1.正态分布 N ( m , s )
2
1 1 2s e 密度函数: p( x) 分布函数: F ( x) 2p s 2p s 2 其中 m 为均值,s 为方差, x .
我们总是需要去估计某些未知参数或数字特征,这就是参数估计问题.即
ˆ( 参数估计就是从样本(X1,X2,…,Xn)出发,构造一些统计量 i
X1 ,
X2,…,Xn) (i=1,2,…,k)去估计总体 X 中的某些参数(或数字特 征) i (i=1,2,…,k).这样的统计量称为估计量.
i ( 1. 点估计:构造(X1,X2,…,Xn)的函数
中位数:将数据由小到大排序后位于中间位置的那个数值. 2、表示变异程度的统计量—标准差、方差和极差
1 n 2 2 s [ ( X X ) ] 标准差: i n 1 i 1
它是各个数据与均值偏离程度的度量. 方差:标准差的平方. 极差:样本中最大值与最小值之差.
1
2018/10/14
2
( xm )2
x
e
( y m )2 2s 2
dy
标准正态分布:N(0,1)
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -4
密度函数
j ( x)
1
2p
e
x2 2
分布函数
F ( x)
1
2p
x
e
y 2
2
,
-2 0 2 4 6
dy
2018/10/14
作为参数
ˆ
i
i1 ( i2 ( 2. 区间估计:构造两个函数 X1,X2,…,Xn)和 X1,X2,…, i1 , i 2 i
Xn)做成区间,把这( )作为参数 的区间估计.
i 的点估计量,称统计量
ˆ
X1,X2,…,Xn)
i 为总体 X 参数
的点估计量.
2018/10/14
数学建模
数学建模
6
2、 分布 (n) 若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1) ,则随机 变量
2 2 2 2 服从自由度为 n 的 分布,记为 Y~ (n).
2 2 2 X X X 1 2 n Y=
Y 的均值为 n,方差为 2n.
0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
-4
-2
0
2
4
6
2018/10/14
数学建模
8
4.
F 分布 F(n1 ,n2 ) 2 2 若 X~ (n1 ) ,Y~ (n2 ) ,且相互独立,则随机变量
X n1 F Y n2
服从自由度为(n1 ,n2 )的 F 分布,记作 F~ F(n1 ,n2 ). 由 F 分布的定义可以得到 F 分布 的一个重要性质:
10
一、点估计的求法
(一)矩估计法
内都有样本观测值 xi (i=1,2,…,n-1)落入其中.
( xi , xi 1 ] 中出 2、求出各组的频数和频率:统计出样本观测值在每个区间
现的次数ni ,它就是这区间或这组的频数.计算频率 f i
' '
'
'
ni . n
'
x1 , x 2 , , x n 各点,分别以 3、作频率直方图:在直角坐标系的横轴上,标出 ( xi' , xi' 1 ] 为底边,作高为
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2
1 若 F~ F(n1 ,n2 ) ,则 ~ F ( n 2 , n1 ) F
F分布F(10,50)的密度函数曲线
0.1 0 0 0.5 1 1.5 2 2.5 3
2018/10/14
数学建模
返回
9
1 , 2 , , k )的类型已知或未知, 无论总体 X 的分布函数 F(x;
数学建模
3
3. 表示分布形状的统计量—偏度和峰度
1 偏度: g 1 3 s
(X i X )
i 1
n
3
1 峰度: g 2 4 s
4 ( X X ) i i 1
n
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之一.
实验目的
1、直观了解统计基本内容。
2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。
3、实验作业。
数 据 的 统 计 描 述 和 分 析
2018/10/14
统计的基本概念
参数估计
假设检验
数学建模
2
一、统计量
1、表示位置的统计量—平均值和中位数
1 n 平均值(或均值,数学期望) :X Xi n i 1