(完整版)SPSS数据分析教程-4概率论初步

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般考虑连续型随机变量的分布函数(即累积 概率函数(Probability Cumulative Function, CDF)和密度函数(Probabilitty Density Function,PDF)。
SPSS的CDF函数族给出的就是分布函数的值。
CDF.NORMAL(x,0,1)是给出均值为0,标准差 为1的正态分布变量x的累计概率分布函数值。
问题是:落在1号、2号、3号和4 号正方形中的情况如何呢?
1
2
4
3
模拟投掷的过程 (1)
第1步:设置随机数种子 选择【转换】→【随机数字生成器】,勾选 “设置起点”,并在“固定值”下的“值”中 输入一个用户给定的数值。
第2步:生成均匀分布的随机数,等可能的产生 1,2,3和4这四个数共计1 000个. 选择【转换】→【计算变量】,在“目标变量” 框中输入变量名 “Spinn”,在“数字表达式” 框中输入TRUNC(RV.UNIFORM(1,5)),然后 单击【确定】按钮.
n i
pi
(1
p)ni
i0
这里[x]表示不大于的最大整数。。
PDF.BINOM(x,10,0.25)计算而X取某个特定值
i的概率为:
P( X
i)
n i
pi
(1
p)ni
(2)
由上面(1)式计算出的为分布函数的值;如 果是离散随机变量,(2)式给出的为概率值, 它是随机变量X取各个离散值0,1,2,…, 10的概率 。
PDF.NORMAL(x,0,1)是给出均值为0,标准差 为1的正态分布变量x的密度函数值。
可以画出累计概率分布 函数的线图
可以画出正态分布变量x 的密度函数的线图
比较不同参数的正态分布函数
4.3 经 验 分 布
把观测到的样本数据的相对频率分布称为经验 分布,根据概率的频率定义,当样本量足够大 时,频率稳定到概率。实际问题中样本数据所 服从的分布常常是未知的,我们只能通过样本 数据的经验分布来了解数据的分布情况。
绘制随机数的序列图,有几种方法
方法1:选择【图形】→【图表构建程序】,选择“条” 方法2:选择【分析】→【预测】→【序列图】 方法3:选择【图形】→【旧对话框】→【线图】
该样本数据的确是从正态分布的总体 中随机抽取的呢?
绘制随机数的带有正态 曲线的直方图
4.2 理 论 分 布
除4.1中的均匀分布和正态分布外,常见的分 布还有二项分布、负二项分布、泊松分布、指 数分布、t分布等。SPSS软件中提供了这些常 见分布的分布函数、概率分布函数和概率密度 函数。
SPSS数据分析教程
—《SPSS数据分析教程》
第4章 概率论初步
目录
4.1 离散型随机变量的仿真
4.1.1 均匀分布的随机数 4.1.2 正态分布的随机数
4.2 理论分布
4.2.1 二项分布的分布函数和概率 4.2.2 连续分布的随机变量—正态分布
4.3 经验分布 4.4 抽样分布 4.5 置信区间
函数RV.Normal(0,1)。
SET SEED=123456. COMPUTE Rnorm01= RV.NORM(0,1). SAVE OUTFILE='D:\SPSSIntro\data\Sim_norm.sav' /COMPRESSED. EXECUTE
生成随机数示意图
二、分析这些正态随机数的性质
函数CDF.BINOM(x,10,0.25)用于计算n=10, p=0.25的二项分布下x的分布函数值或者称为 累计概率。
二项分布的概率分布图
4.2.2 连续分布的随机变量—正态分布
连续型随机变量的任何两个可能取值之间都有 无限多个可能的取值,因此所有可能取值是不 能列举的,也不能给随机变量的某可能取值赋 给一个唯一的概率值。
模拟投掷的过程 (2)
第3步:然后分析这四个数出现的次数和相对 频率。 选择【分析】→【描述统计】→【频率】
随机数分析(1)
有效
1.00 2.00 3.00 4.00
合计
频率 237 259 264 240
1 000
Spinn 百分比
23.7 25.9 26.4 24.0 100.0
有效百分比 23.7 25.9 26.4 24.0
100.0
累积百分比 23.7 49.6 76.0 100.0
随机数分析(2)
4.1.2 正态分布的随机数
正态分布的随机变量是连续型随机变量, 它的可能取值是所有实数。数据分析的许 多模型和理论都要求数据服从正态分布, 因此正态分布的随机数在模拟中有广泛的 应用。
一、生成正态分布的随机数
第1步:设置随机数种子为123456 第2步:选择【转换】→【计算变量】, 应用
本章学习目标
用仿真方法从总体中抽取随机样本:生成服从 某种分布的随机数;
得到观测值的理论分布、经验分布; 理解抽样分布的形状; 掌握如何求置信区间; 学习如何从数据集中选择符合条件的个案。
4.1 离散型随机变量的仿真
4.1.1 均匀分布的随机数
假设我们有一个正方形,它被均 匀的分为4个相同大小的小正方 形。现在从正方形的中心上方随 机地投掷一颗玉米粒1 000次, 假设每次投掷的玉米粒都等可能 的落在4个小正方形中的一个之 中。
进行次n次,这一串重复的独立试验称为重n贝
努力试验。如果用X表示在这次试验中成功的
次数,则随机变量X服从二项分布,其分布函
数为
P( X
i)
n
i
pi (1
p)ni ,i
Fra Baidu bibliotek
0,1, 2,..., n
CDF.BINOM(x,10,0.25),该函数用于计算出x
所对应的累计概率,即:
x
(1) P(X ≤ x)
SPSS的PDF与非中心PDF函数族提供了相关分 布的概率分布函数或者概率密度函数,CDF与 非中心CDF函数族提供了相关分布的累积概率 分布函数(或简称分布函数)。而逆DF函数 族则给出了相应分布的分位数。
4.2.1 二项分布的分布函数和概率
如果随机试验只有两个可能的结果,设该试验
中成功的概率为p。如果将该试验独立地重复
SPSS描述性统计菜单的的频率过程中把频率 称为百分比,而把结果出现的次数称为频率。
频率
数据GSS2004.sav,它记录了美国2004年社 会调查的数据,有调查对象的年龄、性别、受 教育年限、最高学历、子女个数等。这里我们 考察调查对象子女个数的分布情况。
相关文档
最新文档