第4章 SPSS基本统计分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自由度df=k-1=3-1=2 查表得出,在显著性水平为0.05,自由度为2 2 时的卡方值为: 0.05 (2) 5.991 比较计算得出的卡方值
卡方检验:双因素卡方检验
假设我们被要求调查政治取向与儿童教育的放任 性之间的关系。我们以二分法对我们的样本成员 进行分类,得到如下数据:
2 f SQ 21 Me L2 4 i2 f Q2

4.2.1.2 离散趋势统计量 样本标准差(standard deviation: Std Dev) 样本方差(Variance) 全距(Range)
S 1 n ( ∑x x ) 1
i i 1 n 2
S2
4.3.1 交叉分析下的频数分析的目的和基本任务 (1)二维或多维交叉列联表 (2)分析相关性 4.3.2 交叉列联表的主要内容 举例:二维、三维交叉列联表
一、卡方检验原理 例一
一份50道题正确答案观察频数分布如下:
A B C D E 12 14 9 5 10
零假设:这位老师把正确答案从A到E分配时并没有 显示出任何倾向。 研究假设:这位老师把正确答案从A到E分配时显示 出了一种特定的倾向。
第4章 SPSS基本统计分析
加州大学伯克利分校:《数据统计分析》 巴黎高商:《决策统计学》 SPSS19.0官方教程 http://bbs.pinggu.org/thread-1348751-1-1.html http://www.fjmu.edu.cn/news/spss/doc3/index.ht m http://www.itongji.cn/spss/list_1.html [精品课程]SPSS统计软件在社会学中的应用
C
χ2 χ2 n
• Phi
Phi 是基于卡方统计量 的关联性测量,它将 卡方检验统计量除以 样本大小,并取结果 的平方根。
4.1.2 频数分析的基本操作 (1)菜单选项:analyze->descriptive statistics->frequencies
(2)选择几个待分析的变量到variables框.
(3)chart选项,选择所需要的图形
(4)格式
(5) Bootstrap bootstrap是指从原始样本中做有放回的再 抽样,从而估计出估计量的样本分布、标 准误差、置信区间或者构造假设检验的统 计方法,也译为“自举法”、“拔靴法”。
列联表行变量与列变量都是有序变量,用 Linear-by-Linear Association 。
fo Likelihood Ratio 卡方:T 2 ln fe ij Yates连续检验 :
2
( f o f e 0.5) fe
R1! R2 !C1!C2 ! fisher检验 : P A1.1! A1.2 ! A2.1! A2.2 ! N !
f o 某一类别的观察频数 f e 某一类别的期望频数
类别
A B C
fo
fe
fo fe
( fo fe )
2
( fo fe )2 fe
12 14 9
10 10 10
2 4 -1
4 16 1
0.4 1.6 0.1
D
E
5
10
10
10
-5
0
25
0
2.5
0.0
( fo fe )2 χ2 ∑ 4 .6 fe
1
n 1 i 1
( xi x ) 2 ∑
n
4.2.1.3 分布形态统计量
偏度(Skewness) 峰度(Kurtosis)
1 Skewness ( xi x ) 3 / S 3 ∑ n - 1 i 1
n
1 Kurtosis ( xi x ) 4 /(S 4 3) ∑ n - 1 i 1
自由度:df=k-1 在0.05的显著性水平下,查表自由度为4时的 卡方临界值为:9.488 在spss中的操作
卡方检验原理 例二
我们假设有一位社会研究者有兴趣调查高级中学学 生对于大学学历的重要性的态度。她询问了一个60 名高级中学学生的样本,接受大学教育是否变得更 加重要、更不重要或者没有变化。 我们可以如此设定我们的假设: 零假设:高级中学学生在对大学教育的重要性的变化 上是分成了大小相等的组的。 研究假设:高级中学学生在对大学教育的重要性的变 化上是分成了大小不相等的组的。
4.1.4 频数分析的应用举例:P83 分析人均住房面积分布情况 以户口为标志进行比较
4.2 计算其它基本描述 统计量 1.集中趋势 2.离散程度 3.分布形态基本统计量
练习
利用居民储蓄调查数据进行频数分析 1.分析被调查者的户口、职业基本情况 2.分析存款分布分析,并对城镇和农村储 户比较。(500元以下,500-2000-35005000-以上)
练习
4.3.6 SPSS中列联表分析的其他方法
当两个表变量都是定量变 量时,相关产生 Pearson 相关系数r. 当两个表变量都是定序变 量时,相关产生 Spearman 相关系数ρ. P237-238
对名义数据: 列联系数、Phi和 Cramer’s V 、Lambda和不确定性系 数。
bootstrap核心思想和基本步骤如下: (1) 采用重抽样技术从原始样本中抽取一定数 量(自己给定)的样本,此过程允许重复抽样。 (2) 根据抽出的样本计算给定的统计量T。 (3) 重复上述N次(一般大于1000),得到N 个统计量T。 (4) 计算上述N个统计量T的样本方差,得到统 计量的方差。
相依系数
一种基于卡方的关联性 测量。值的范围在 0 到 1 之间,其中 0 表示行 变量和列变量之间不相 关,而接近 1 的值表示 变量之间的相关度很高。 可能的极大值取决于表 中的行数和列数。
C
χ2 χ2 n
户口* 什么合算 交叉制表 什么合算 买东西 户 口 城镇户口 农村户口 合计 113 59 172 存钱 87 23 110 合计 200 82 282
4.2 计算基本描述统计量 4.2.1.1 集中趋势统计量
均值(mean)、中位数(median)、众数(mode)、均值 标准误差(standard error of mean)
1 n x xi n i 1
S.E.of.Mea n x

n
Me 2(n 1) 4
( f ijo f ije ) 2 f
e ij
2.66
df (r 1)(c 1) 1
查表,df=1,α=0.05时,卡方值为3.841
例题
计算期望频数与自由度
二、交叉列联表卡方检验的说明 1.列联表中的期望频数
当n 40且T 5 χ 2检验 当n 40且 T 5 Yates连续检验 1 当n 40或T 1 fisher检验 当T 1或20%以上 T 5 Likelihood Ratio 检验
n
4.2.2 计算基本描述统计量的基本操作
4.2.3 计算基本描述统计量的应用举例 案例4-3:P88
补充知识:标准分数Z
xi x Zi S
案例4-4: P90
练习
利用居民储蓄调查数据进行描述分析 1.城乡存款金额比较分析 2. 存款数量均衡分析
4.3 交叉分组下的频数分析
应用举例:P79 案例4-1,分析从业状况和房屋产权

4.1.3 SPSS频数分析的扩展功能 4.1.3 .1 计算分位数:适用于定距数据 分位数的应用 在排除极端值影响的条件下,通过计算分位 数差,比较两组样本数据的离散程度
(1)quartiles:计算四分 位数25%(QL)、50%(中位 数)、75%(QU) (2)cut points for n equal groups: N等份 (3)percentile:自定义 百分位点
期望频数( f e )是在零假设下每项我们所期望发生 的频数。上面均匀分布假设下的期望频数如下: A B C D E 10 10 10 10 10
卡方统计量直接关注于观察频数是如何接近于在零 假设下的期望频数的。只基于观祭频数和期望频数, 卡方的公式为: ( fo fe )2 2 fe
f f1o1 , f
o 1, 2
o
f
e
f f
o
e
(f f )
o
e 2
( f o f e )2 e f
0.5
15
12.5
2.5
6.25
10
5
12.5
7.5
-2.5
-2.5
6.25
6.25
0.5
0.83
f 2o1 . f
o 2. 2
r
10
c
7.5
2.5
6.25
0.83
χ2 ∑ ∑
i 1 j 1
4.3.4 交叉分组下的频数分析基本操作
4.3.5 交叉分组下的频数分析应用举例 1.案例4-5 .P97 2.居民储蓄调查数据,分析(1)户口和对存款的看 法;(2)户口和收入水平 3.职工数据,分析文化程度和职称关系
户口* 什么合算 交叉制表
卡方检验 渐进 Sig. (双侧) .016 值 Pearson 卡方 5.836a
df 1
精确 Sig.(双 侧)
精确 Sig.(单 侧)
连续校正b
似然比 Fisher 的精确检验 线性和线性组合
5.204
6.003
1
1
.023
.014 .016 .011
百度文库5.815
1
.016
有效案例中的 N
282
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 31.99。 b. 仅对 2x2 表计算
文化程度* 职称 交叉制表
卡方检验
值 Pearson 卡方 似然比 线性和线性组合 有效案例中的 N 18.533a 20.629 2.617 16 df 9 9 1 渐进 Sig. (双侧) .029 .014 .106
a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数 为 .56。
2.样本量的大小 在列联表中,样本量扩大,卡方值也随之 扩大。但自由度和显著性水平未变,卡方 的临界值不变,进而使拒绝零假设的可能 性增加。 Phi系数是基于卡方统计量的关联性测量, 它将卡方检验统计量除以样本大小,并取 结果的平方根。
2
A1.1 A2.2 A1.2 A2.1 n R1 R2C1C2
户口* 收入水平 交叉制表
卡方检验
值 Pearson 卡方 似然比 线性和线性组合 有效案例中的 N 32.064a 29.366 15.896 282 df 3 3 1 渐进 Sig. (双侧) .000 .000 .000
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 5.23。
df (r 1)(c 1)
RT ×CT 行边缘总计×列边缘总计 fe = = n n
政治取向
教养方式
自由(1)
保守(2)
总计
RT
放任(1)
不放任(2)
总计
15(12.5)
5(7.5)
20
10(12.5)
10(7.5)
20
25
15
40
CT
χ2 ∑ ∑
i 1 j 1
r
c
( f ijo f ije ) 2 f ije
政治取向
教养方式
自由
保守
总计 25
放任 不放任
总计
15 5
20
10 10
20
15
40
( fo fe ) χ ∑ fe
2
2
χ2 ∑ ∑
i 1 j 1
r
c
( f ijo f ije ) 2 f
e ij
行(ROW),列(COLUMN)
RT ×CT 行边缘总计×列边缘总计 fe = = n n
4.1 频数分析 4.1.1 频数分析的目的和基本任务 4.1.2 频数分析的基本操作 4.1.3 SPSS频数分析的扩展功能 4.1.4 频数分析的应用举例

4.1.1 频数分析的目的和基本任务 目的 粗略把握变量值的分布状况。 例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、 选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居 民月支出状况) 采用的方法 计算频分布表:包括计算频数、累计频数、百分比、累 计百分比 绘制统计图形:条形图、饼图、直方图
相关文档
最新文档