经济学数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与频数分布有关的统计量: frequencies命令之 statistic选项;或者descriptives命令。data07-03, salary 和 minority, jobtime?
均值比较:Compare Means命令。 data07-03 gender and salary, jobcat and salary,gender /obcat, and education,
t检验的SPSS应用
单一样本t检验Data 08-02,
两个样本(相互独立样本)data07-03,gender and salary, gender and salbegin?
两个样本(配对样本)data08-04,前后“手形控制”
变量配对比较。其他数据的检验:前后睁眼力控制。
3.3方差分析
数据分析和SPSS
重点:
假设检验; t检验或z检验。
纲要
1.变量的设定 2.频数分布、列联表 3.假设检验
3.1假设检验思想和步骤 3.2 z检验和t检验(使用条件:定量因变量) 3.3F检验和方差分析(使用条件:定量因变量) 3.4卡方检验和列联表(使用条件:非定量因变
单因素(分成三组或以上)方差分析
系统数据sales.sav,分析地区和利润的显著性差异检验, DATA09-01,不同饲料对体重的影响差异
商店编号
1 2 3 4 5 6 7 8 9 10 共计
xj
x
促销水平对销售额的影响(30家商店)
促销水平



10
8
5
9
8
7
10
7
6
8
9
4
9
6
5
ห้องสมุดไป่ตู้
8
4
2
9
量)
4.相关分析和回归分析
SPSS学习内容:
1.变量的设定
练习 一、你最近一年共拥有几件T恤
1.0件2.一件 3.两件 4.三件 5.四件 6.五件或以上 二、你最近一年平均每件传统T恤平均花费了多少钱?( 三、你平时喜欢穿T恤吗
1.非常不喜欢 2.不喜欢 3.一般 4.喜欢 5.非常喜欢 四、你穿T恤最主要的原因是?
1.简单 2.个性 3.便宜4.凉快 5.舒适 6.其他
)请填写
五、你购买DIY-T恤时注重哪些方面?(多选题) 1.面料( )2. 衣料的做工( ) 3.视觉效果( ) 4.是否褪色( ) 5价格 ( ) 6.操作简单( ) 7.到货时间( ) 8.是否有人指导 ( ) 9.厂家信誉( ) 附:如果是多项选择题如何设置变量?
假设检验的步骤
首先建立零假设(即无差异假设)和备选假设
选择合适的统计量和显著性水平,并求相应统计值, 如果没有超出显著水平对应的临界值时,则说明无 显著差异(即接受零假设),反之,如果超出临界 值,则说明有显著差异(即拒绝零假设)
3.2 z检验和t检验#(使用条件:定量因变量)
假设检验 例1:
k nj
SST
2
x ij x
j1 i1
k
SSB nj xjx 2 j 1
k nj
SSW
2 xij xj
j1 i1
方差分析统计量
F

SSB C SSW n
1 c
3.3方差分析
单因素(分成三组或以上)方差分析
系统数据sales.sav,分析地区和利润的显著性差异检验, DATA09-01,不同饲料对体重的影响差异DATA07-03,岗位 种类对收入影响。
多因素方差分析.DATA09-03,不同大白鼠和激素对其重量的影 响(了解).
3.4卡方检验和列联表
χ²
(Oij Eij )2 Eij
5
3
7
5
2
7
6
1
6
4
2
83
62
37
83/10=8.3
62/10=6.2
37/10=3.7
(83+62+37)/30=6.067
1.总体平方和--SST,square sum of total
2.组间平方和---SSB,square sum between groups
3.组内平方和--SSW,square sum within groups,VW
E ij

RiC j n
df=(c-1)(r-1)
χ²
5%
男性 女性
上网 20 15 35
没有上网 10 15 25
30 30 全部:60
χ² O11 就是指“上网男性”,如何计算 O11 E11
?
3.3卡方检验和列联表
Spss应用:列联表的statistic命令
系统数据sales.sav,分析地区和产业类型的显著性 差异检验,DATA07-04,男女和“薪金高低”的 差异显著性检验?
编辑
是为了提高准确性和精确性而进行的问卷的再检查,目的 是筛选出问卷中看不清楚、不完整、不一致或模棱两可的 答案。还要进行一致性检查,比如找出逻辑上不合理的情 况。
对不合格问卷的处理 退回现场 填补缺失值
中型值代替
用估计值代替
结对删除 丢弃不合格问卷
2.频数分布、列联表
六、关于DIY-T恤你还有什么好建议吗?
问卷输入
先编号再输入,以免遗漏或重复输入
问卷检查
问卷的某些部分填写不完整 调查对象的回答表明他没有弄清楚问题的含义或没有阅读
说明,如有些问题他不必回答却回答了 调查对象的回答差异性不大,例如有的调查对象填写7级量
表时总是选择4 返回的调查问卷本身丢失了几页 问卷回收超过了时限 调查对象不符合要求
列联表:可同时描述两个或两个以上变量的情况。可以将联
列表看做是将几个频数分布表合并到一张表中。Data0703,gender and jobcat, gender and minority
3.假设检验 3.1假设检验步骤和思想 3.2 z检验和t检验(使用条件:定量因变量) 3.3F检验和方差分析(使用条件:定量因变量) 3.4卡方检验和列联表(使用条件:非定量因变量)
图: 假设平均数 µ = 3.0的抽样分布

第二种方法:与临界值比较
2.5%
2.5%
1.96
假设检验 例2:
H0: <4.0
5%
H1: > 4.0
t = (X - )/sX
sX = s/ n
sX = 1.579/ 29
= 1.579/5.385 = 0.293
t = (4.724-4.0)/0.293 = 0.724/0.293 = 2.471
相关文档
最新文档