概率论与数理统计数学实验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计数学实验
目录
实验一几个重要的概率分布的MATLAB实现 p2-3 实验二数据的统计描述和分析 p4-8 实验三参数估计 p9-11 实验四假设检验 p12-14 实验五方差分析 p15-17 实验六回归分析 p18-27实验一几个重要的概率分布的MATLAB实现
实验目的
(1) 学习MATLAB软件与概率有关的各种计算方法
(2) 会用MATLAB软件生成几种常见分布的随机数
(3) 通过实验加深对概率密度,分布函数和分位数的理解
Matlab统计工具箱中提供了约20种概率分布,对每一种分布提供了5种运算功能,下表给出
了常见8种分布对应的Matlab命令字符,表2给出了每一种运算功能所对应的Matlab命令字符。
当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。
N,在x=处的概率密度。
例1 求正态分布()2,1-
解:在MATLAB命令窗口中输入:
normpdf,-1,2)
结果为:
例2 求泊松分布()3P ,在k=5,6,7处的概率。 解:在MATLAB 命令窗口中输入: poisspdf([5 6 7],3) 结果为:
例3 设X 服从均匀分布()3,1U ,计算{}225P X .-<<。
解:在MATLAB 命令窗口中输入: unifcdf,1,3)-unifcdf(-2,1,3) 结果为:
例4 求概率995.0=α
的正态分布()2,1N 的分位数αX 。
解:在MATLAB 命令窗口中输入: norminv,1,2) 结果为:
例5 求t 分布()10t 的期望和方差。 解:在MATLAB 命令窗口中输入: [m,v]=tstat(10) m = 0 v =
例6 生成一个2*3阶正态分布的随机矩阵。其中,第一行3个数分别服从均值为1,2,3;第二行3个数分别服从均值为4,5,6,且标准差均为的正态分布。 解:在MATLAB 命令窗口中输入: A=normrnd([1 2 3;4 5 6],,2,3) A =
例7 生成一个2*3阶服从均匀分布()3,1U 的随机矩阵。 解:在MATLAB 命令窗口中输入: B=unifrnd(1,3,2,3) B =
注:对于标准正态分布,可用命令randn(m,n);对于均匀分布()1,0U ,可用命令rand(m,n)。
实验二 数据的统计描述和分析
实验目的
(1) 学习MATLAB 软件关于统计作图的基本操作 (2) 会用MATLAB 软件计算计算几种常用统计量的值
(3) 通过实验加深对均值、方差、中位数等常用统计量的理解
1. 频数表和直方图
一组数据(样本观察值)虽然包含了总体的信息,但往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。
2 经验累计分布函数图
设n x x x ,,,21Λ是总体X 的一个容量为n 的样本观察值。将n x x x ,,,21Λ按自小到大的次序排列,并重新编号,设为
记
则称()x F n 为总体X 的经验累积分布函数,它的图像即为经验累计分布函数图。 3 几种常用的统计量
(1)算术平均值和中位数
算术平均值(简称均值),∑==n
i i X n X 1
1 ,中位数是将数据由小到大排序后位于中间位
置的那个数值。 (2)标准差、方差
标准差: ()2
1
1211⎥
⎦
⎤
⎢⎣⎡--=∑=n
i i X X n s
,它是各个数据与均值偏离程度的度量。方差是标准差的平方,记为2
s 。
(3)偏度和峰度
表示数据分布形状的统计量有偏度和峰度。偏度:()∑=-=n
i i
X X
s
g 1
3
3
11
反映数据分布对
称性的指标,当01>g 时,称为右偏态,此时数据位于均值右边的比位于左边的多;当
01 i i X X s g 1 4 4 21),是数据分布形状的另一种度量,正态分布的峰度为3,若2g ?比3大 得多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。 将样本的观测值()n x x x ,,,21Λ代入以上各式后,即可求得对应统计量的观测值。 4 MATLAB 实现 下面我们列出用于数据的统计描述和分析的常用MATLAB 命令。其中,x 为原始数据行向量。 (1) 用hist 命令实现作频数表及直方图,其用法是: [n,y] = hist(x,k) 返回x 的频数表。它将区间[min(x),max(x)]等分为k 份(缺省时k 设定为10),n 返回k 个小区间的频数,y 返回k 个小区间的中点。 hist(x,k) 返回x 的直方图。 (2) 用cdfplot 命令作累积分布函数图,其用法是: [h,stats] =cdfplot(x) 在返回x 的累积分布函数图的同时,在stats 中给出样本的一些特征:样本最小值、最大值、平均值、中位数和标准差。 cdfplot(x,k) 则直接返回x 的累积分布函数图。 (3) 算术平均值和中位数 Matlab 中mean(x)返回x 的均值,median(x)返回中位数。 (4) 标准差、方差和极差 极差是n x x x ,,,21Λ的最大值与最小值之差。