第3章上机实验指导
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计学实验指导
实验五:统计抽样与抽样分布
实验目的:
运用“数据分析”工具生成满足一定分布条件的随机数据。
理解抽样分布的实质。
能根据标准正态分布计算累积概率和指定累积概率下的分位数。
实验要求:
独立完成课堂各类习题和练习,按要求完成实验内容。
实验形式:
教师演示、指导
实验学时:2学时
实验内容:
1、简单随机抽样:从既定的总体数据中生成一个指定样本容量的样本
2、指定分布形态的随机数样本:根据指定总体分布形态,利用“随机数发生器”生成一个指定样本容量的样本。
3、已知总体数据的前提下,利用简单随机抽样得出一定数目的样本,验证样本统计量与总体参数间的关系。
4、利用函数相互计算Z分布条件下的概率与Z值。
一、简单随机抽样
是指从一个已知总体中,随机抽取一定容量的数据组成样本的过程。
操作方法:利用“数据分析”工具,选择“抽样”统计功能,进入抽样对话框。
输入区域:待抽样的总体数据,只能是数值型数据。如果变量名一同被选入,则选中“标志”,表示所选区域中第一个单元格不参与抽样,否则不选。抽样方法:周期——从第一个数据开始,按指定周期整数倍的位置选出数据组成样本,可理解成(非概率)等距抽样。
随机——简单随机重复抽样。样本数——样本容量
输出选项:指明样本数据的存放位置。通常为输出区域(定义起始单元格即可)。应用1:从容量为30的总体中随机重复抽取容量为10的样本。
应用2:模仿教材,从容量为4的总体中(取值分别为1、2、3、4)随机抽取容
量为2的所有样本。观察样本均值的抽样分布特征与总体分布特征间的关系。操作步骤:(1)按照重复抽样从总体中共组合出16个样本;
(2)分别计算总体均值、方差、各样本组合的均值、方差;
(3)对样本均值进行分组整理,并绘制次数分布图,观察形状。
结论:样本均值的抽样分布为对称单峰钟形分布(正态)
样本均值的均值为总体均值;样本方差的均值为总体方差;样本均值的方差为总体方差的1/n。
二、产生指定总体分布类型下的随机样本数据
如果已知某类变量的数据所服从分布的类型,根据其分布特征,我们可以在某种程度上“模拟”此分布条件下的随机数。
操作方法:“数据分析”工具中的“随机数发生器”统计功能。在对话框中:
变量个数:默认生成指定分布的样本数据列,即一次生成的样本个数,通常为1个样本列。
随机数个数:样本中数据的个数,即样本容量。
分布:常用的随机变量分布类型,比如离散变量对应的分布(柏努利、二项分布、泊松、模式、自定义等),连续变量的分布(均匀分布、正态分布等)。
参数:某特定分布类型的参数特征值。如均匀分布的起止值、正态分布的均值和方差、泊松分布的均值、伯努利分布的成功概率、二项分布的成功概率和试验总次数、指定数据及其对应出现概率的一般离散分布等。
随机数基数:通常不需设定基数。但在某种特殊情形下,有时候需要数据重现,在指定基数后,以后再产生同分布的随机数列时,输入该基数时,数据不再随机出现,而是和指定基数时产生的数据相同。
应用3:从一个总体均值为10,总体标准差为2的正态分布总体中,随机抽取容量为50的样本数据。
操作步骤:在随机数发生器中,选择正态分布类型,设计好参数取值和数据的存放区域即可生成随机数列。
应用4:生成容量为20的2个相同样本数据,生成条件:取值介于0到100之间的均匀分布。
操作步骤:利用随机数发生器,与正态分布操作类似,设定基数。
应用5:
操作步骤:在excel 表中,如果已知数据出现概率,对应使用离散型分布,将变量取值和对应概率按列放置。然后生成数据即可。 三、正态分布下概率与分位数计算
1、由于一切正态分布都可以标准化。普通正态分布都可以转化为Z 分布求解。 针对标准正态分布,我们计算分布概率的函数为normsdist (Z )即可。
2、已知标准正态分布概率值,求Z 值。直接利用normsinv (1-P )即可求得。 应用6:(1)求当Z=1、1.645、1.96、2、2.58、3时的累积分布概率。
(2)求以原点为对称点的标准正态分布的区间分位数,使其中间所夹分布概率分别为68.27%、90%、95%、95.45%、99%、99.73%。
0 1p -p 1p Z -=-