Spss统计应用实务-问卷分析与应用统计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数值型数据
※异众比率 ※四分位差 ※方差或标准差



异众比率 ※离散系数(比较时用)



平均差






极差

四分位差


异众比率
偏态与峰态分布的形状
偏态
峰态
左偏分布 右偏分布
扁平分布
与标准正态 分布比较!
尖峰分布
EXCEL统计实例
统计基本原理与常用统计方法 1.4统计推断
1.4.1抽样与抽样分布 1.4.2参数估计 1.4.3假设检验
1.2.5时间序列数据-线图
【例】已知 1991~2000年 我国城乡居民 家庭的人均收 入数据如表。 试绘制线图
1991~2000年城乡居民家庭人均收入
年份
城镇居民
农村居民
1991 1992 1993 1994
1700.6 2026.6 2577.4 3496.2
708.6 784.0 921.6 1221.0
非常不满意 不满意 一般 满意 非常满意
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
1.2.4数值型数据整理与展示方法 数据的分组
分组方法
单变量值分组
组距分组 等距分组 异距分组
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
分组方法
单变量值分组
组距分组 等距分组 异距分组
百事可乐0 可口 旭日升 百事 汇源 露旭露日升冰茶
18% 可乐 冰茶 可乐 果汁
22% 品牌
不同品不牌同饮品料牌的饮频料数的分构布成
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
1.2.3顺序数甲据乙城城的市市家整家庭庭理对对住住与房房展状状况况示评评价价的的频频数数分分布布
累积频数 累积回回频答答率类类别别 户户数数 百百分分比比
3
准差的范围之内
4
780 1080
-0.973 -0.278
• 约有99%的数据在
5
850
-0.811
平均数加减3个标
6
准差的范围之内
7
960 2000
-0.556 1.853
8
1250
0.116
9
1630
0.996
应用标准分制定评价标准
数据类型和所适用的离散程度测度值
数据类型 分类数据 顺序数据
5. 提供了样本统计量长远我们稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布示意
总 体
计算样本统计



例如:样本均
值、比例、方

统计基本原理与常用统计方法 1.4统计推断
1.4.1抽样与抽样分布 样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。 所有样本的结果为
某电脑公司销售量分布的直方图
折线图
频 30 数 25 (天) 20
15
10
5
折线图与直方图 下的面积相等!
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量分布的折线图
茎叶图
箱线图
最小值 141
下四分位数 中位数 上四分位数
170.25 182
定义: 分类:定类变量、定序变量、定距变量、定比变量 随机事件和随机变量 总体、样本 总体参数和样本统计量 概率
统计基本原理与常用统计方法
1.1统计学的基本思想与基本概念
1.1.4 统计研究的基本过程 数据收集-----数据整理-------数据分析
1.1.5 数据收集 观测数据和实验数据 变量的定义和变量的选择 数据收集的方法:文献资料法、调查法、测量等 选择合适的样本:简单的随机抽样、分层抽样、整群抽样 收集数据时的错误和误差
统计出各组的频数并整理成频数分布表
实例
用Excel制作频数分布表
【例】某电脑 公司2002年前 四个月各天的 销售量数据 (单位:台)。 试对数据进行 分组。
直方图
频 30 数 25 (天) 20
15
10
5
直方图下的面 积之和等于1
140 150 160 170 180 190 200 210 220 230 240
统计方法
描述统计
推断统计
参数估计
假设检验
统计推断的过程
总体

样本统计量

例如:样本均
值、比例、方

统计基本原理与常用统计方法 1.4统计推断
1.4.1抽样与抽样分布
抽样方式
抽样方式
概率抽样
非概率抽样
简 单随机抽样 整 群抽样 多 阶段抽样
分 层抽样 系 统抽样
方 便抽样 自 愿样本 配 额抽样
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
1.2.1 数据的分类 定类变量-分类数据 定序变量-顺序数据
16露露 15 18%
汇源果汁 12%
12
11 9
可口可乐 30%
9
频数
定距变量-数值型数据
8
时间序列数据
6
多变量数据
4
1.2.2分类数据的整理与展示 频数与频数分布 图示:条型图、饼图
1 . 非非满常常意不满满意意 ; 2.不满意;非3常.满一意般;
2241 10989 9738 4654 3308
78.0 2241 87.0.0 330000 110000.0.0 3336.0 113220 4440.0.0 227769 9923.0 2361.0 212958 7656.0.0 116880 5660.0 2115.3 227602 9807.0.3 71502 2354.0 1120.7 330000 110000.0.0 3308 1102.7
1995
4283.0
1577.7

1996 1997
4838.9 5160.3
1926.1 2091.1

1998 1999
5425.1 5854.0
2162.0 2210.3
2000
6280.0
2254.4
线图
收入
8000 6000
城镇居民 农村居民
4000
2000
0 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 年份
甲乙城城市市 向向上上累累积积
向向下下累累积积
(户(户)) (%(%)) 户户数数 百百分分比比 户户数数 百百分分比比
【例】在一项城市住
(户(户)) (%(%)) (户(户)) (%(%))
房问题的研究中,研
究人员在甲非非乙常两常不个满不城意满 市其“中您各的对抽一您样个家意调不一不问庭查满 般满题目3意0意是前0 户:的, 住房状况是满否一意满般意?
统计应用实例及EXCEL、Spss
统计基本原理与常用统计方法 1.1统计基本思想与基本概念
1.1.1 什么是统计学?统计学是用以(1)收集数据、(2)分析数据、(3)由数据 得出结论的一组概念、原则和方法。
1.1.2 统计学的基本思想 随机性和规律性:关系密切的孪生子 规律性中的随机性
1.1.3 统计学的中几个基本概念 变量、值和个体
4.满意;5 意。
.合合非计计常满
330000 110000.0.0
——
——
——
——
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
400 累 积 300 户 数 200
(户1)00
400 累
225 270 300
积 300 户 300
276
数 200
168
132
(户) 100
75
0 24
49.30 5.75
家庭设备用品及服务
8.79
4.52

医疗保健 交通通讯
6.36
5.24
7.90
5.58

今天的 主食是
面包
娱乐教育文化服务 居住 杂项商品与服务
12.56 10.01 5.17
11.18 15.47 3.14
雷达图
杂项商品 与服务
居住
食品
50
40 30 20 10
0
衣着
家庭设备 用品及服务
197
最大值 237
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量数据的箱线图
不同数据分布的箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
衡量某一调查的结果所要考查的因素:
样本是否是合适的样本 响应率(response rate) 提问题时所用的实际措辞 在调查中该问题被安排在什么地方? 访问员是谁
抽样误差(sample error)、系统误差、过失误差、随机误差 未响应误差(nonresponse error) 响应误差(response error)
※众数
※中位数
※均值



四分位数
众数


众数
中位数



Байду номын сангаас



四分位数





相对位置-标准分
经验法则表明: 9个家庭人均月收入标准化值计算表
当一组数据对称分

布时
家庭编 人均月收入(
约有68%的数据在

元)
标准化值 z
平均数加减1个标
1
1500
0.695
准差的范围之内
2
750
-1.042
• 约有95%的数据在 平均数加减2个标
均值
1.3.4数据偏态与峰态测度指标
偏态系数、峰态系数
1.3.5相对位置测量 标准分
zi
xi
x s
数据特征的测度
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰态
众数、中位数、平均数与分布
均值 中位数 众数 均值 = 中位数 = 众数
众数 中位数 均值
左偏分布
对称分布
右偏分布
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
组距分组
确定组数:组数的确定应以能够显示数据的分布特征 和规律为目的。
2. 确定组距:组距(Class Width)是一个组的上限与下限 之差,可根据全部数据的最大值和最小值及所分的 组数来确定,即
组距=( 最大值 - 最小值)÷ 组数
众数、中位数、平均数的特点和应用
1. 众数
不受极端值影响 具有不惟一性 数据分布偏斜程度较大时应用
2. 中位数
不受极端值影响 数据分布偏斜程度较大时应用
3. 平均数
易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用
数据类型和所适用的集中趋势测度值
数据类型 分类数据 顺序数据 间隔数据
城乡居民家庭人均收入
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
1.2.5多变量数据-雷达图
【 例 】2000 年 我 国城乡居民家庭 平均每人各项生
2000年城乡居民家庭平均每人生活消费支出构成(%)
项目
城镇居民
农村居民
活消费支出构成
数据如表。试绘 制雷达图。
食品 衣着
39.18 10.01
判 断抽样 滚 雪球抽样
统计基本原理与常用统计方法 1.4统计推断
1.4.1抽样与抽样分布 抽样分布
1. 在重复选取容量为n的样本时,由每一个样本算出 的该统计量数值的相对频数分布或概率分布
2. 是一种理论分布 3. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本
众数(Mode)
中位数(Median)、分位数(quartile)
平均数(Mean)
1.3.2数据离散趋势测度指标 异众比率
集中趋势
全距(Range) 四分位距(quartile deviation)
众数
标准差(Std.deviation)
中位数
方差(Variance) 变异系数(离散系数)
Spss统计应用实务-问卷分析与应用统计
主要内容
统计基本原理与常用统计方法 统计基本思想及基本概念 统计数据整理与显示方法 统计描述 统计推断-参数估计假设检验 多变量关系研究-相关与回归,单(双)因素方差分析 常用的统计模型:因子分析、聚类分析
定量研究与统计分析 量化研究的基本概念 量表分析步骤 数据的建立 量表项目分析 量表效度与信度 信度与效度的概念 信度与效度的检验方法
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
统计基本原理与常用统计方法 1.4统计推断
1.4.1抽样与抽样分布 样本均值的抽样分布
计算出各样本的均值,如下表。并给出样本均值的抽样分布
0
30
非常 不满意 一般 满意 非常
非常 不满意 一般 满意 非常
不满意 (a)向下累积
满意
不满意 (b)向上累积
满意
甲城市家庭对住房状况评价的累积频数分布
统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
甲乙两城市家庭对住房状况的评价
娱乐教育 文化服务
医疗保健
城镇居民
交通通讯
农村居民
2000年城乡居民家庭人均消费支出构成
总结
数据的类型
品质数据
数值型数据
汇总表
分组数据 原始数据 时序数据 多元数据
条形图 饼图 环形图 直方图 折线图 茎叶图 箱线图 线图 雷达图
统计基本原理与常用统计方法 1.3描述统计
1.3.1数据集中趋势测度指标
相关文档
最新文档