统计学教程(含spss)一 概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频 200只灯泡的使用寿命频数分布表 小时数 43-48 48-53 53-58 58-63 63-68 68-73 73-78 78-83 83-88 88-93 93-98 98-103 103-108 108-113 113-118 表 使 的 数 灯泡数 2 1 2 21 28 28 33 26 21 19 10 6 2 0 1 数 的 只灯泡的 使用寿命 使用寿命 数
身高 156.0 155.0 157.9 166.0 164.5 164.7 158.0 162.0 160.5 169.0
人员 1 2 3 4 5 6 7 8 9 10
年龄 20 27 19 38 38 53 24 41 35 30
性别 女 女 男 男 男 女 男 女 女 男
投票 张三 张三 李四 张三 李四 张三 李四 李四 张三 李四
假 设 检 验
分类型变量
顺序型变量
数量型变量
分类型变量 与 数量型变量
分类型变量 与 分类型变量
顺序型变量 与 顺序型变量
数量型变量 与 数量型变量
数量型变量 与 分类型变量
方 差 分 析
卡 方 分 析
秩 的 方 法
回 归 分 析
逻 辑 斯 蒂 分 析
结束
用SPSS作数据集
Statistical package for the social science (简写spss)是美 国spss公司在20世纪80年代开发的大型统计学软件包。在 全世界的范围内的科研活动中应用十分广泛。Spss for windows 10.0是其在90年代未推出的新版本。与其它统计 软件相比,spss不用记忆繁琐、枯燥的语句和命令,只要 用户具有一般的计算机和统计学知识,就能运用鼠标进行 操作,得到所需要的统计分析结果。以下简明扼要地介绍 定的具体使用方法。
统 计 学 (含SPSS)
概
述
用 S P S S 作 数 据 集
统计是搜集、分析、 统计是搜集、分析、表述和解释数 据的艺术和科学。 据的艺术和科学。它在社会经济活动的 各个领域有着广泛的应用。 各个领域有着广泛的应用。
本教程讲解统计的基本方法原理。 本教程讲解统计的基本方法原理。
统计的 本 总体参数
一个典型的统计问题
推 断
推 断 总 体 样 样 本
某电子公司采用新技术 生产出一批高亮度灯泡。这 批灯泡的使用寿命多长?合 格率是多少?与传统技术相 灯泡的使用寿命是 高?
述 描
述 样本数 统计
描
总体 样本数 计 样本数 的
样本
样本 的统计 与统计 的计
的 总体参数。 的 与 个 是
样本数
样本数 的 。
11名学生各科成绩
编号 1 2 3 4 5 6 7 8 9 10 11 英语 76 90 97 71 70 93 86 83 78 85 81 数学 65 95 51 74 78 63 91 82 75 71 55 经济学 93 81 76 88 66 79 83 92 78 86 78 营销学 74 87 85 69 90 80 77 84 91 74 70 统计 55 91 68 73 84 81 70 69 94 62 71
度 不 满 意 对 反
1
2
3
1
2
3
2
3
定序尺度
量
定距尺度
3点
6点
定距尺度数据不能计算比值。
定比尺度
6枚 定比尺度数据可以计算比值。
3枚
变量类型的划分 变量 类型 计量 尺度 定类(=、≠) 定序(<、>) 定距(+、-) 定比(×、÷) 品质型变量 定类变量 定类变量 ∨ 定序变量 定序变量 ∨ ∨ 数值型变量 数值型变量 定距变量 ∨ ∨ ∨ 定比变量 ∨ ∨ ∨ ∨
态度 中立 反对 反对 赞成 赞成 赞成 赞成 反对 中立 赞成
10青少年身高体重表
关于投票选举一次抽样调查的数据阵列
200只灯泡使用寿命频数分布表 数量型变量 品质型变量 小时数 43-48 48-53 定序 定类 数量型变量 53-58 58-63 63-68 68-73 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 编码 1 2 3 4 5 频数 24 108 93 45 30 300 频率% 8 36 31 15 10 100 73-78 78-83 83-88 88-93 93-98 98-103 103-108 某城市家庭对住房状况评价频数分布表 108-113 113-118 灯泡数 2 1 2 21 28 28 33 26 21 19 10 6 2 0 1
我们对总体中众多个体 某一个或几个方面的属性感 兴趣,这些属性称为变量 (variable) 。如本例中灯 泡的“使用小时数”就是一 个变量。
样本数据是就某一个或 某几个变量,对样本中的个 体集得到的数据。本例表中 的数据就是一个典型的样本 数据。
变量(variable) n×p项观测值 (observation)。 观测1 变量1 X11 X21 变量2 X12 X22 变量k X1k X2k 变量p X1P X2P
的
统计
样
个体
总体由我们所感兴趣 的所有个体的集合构成。
样本是总体 的一个子集。
总体 样本 抽样
某电子公司从其灯泡产品中随机抽取二百只,测得其使用小时数数据如下: 200只灯泡样本的可使用小时数 107 54 66 62 74 92 75 65 81 83 78 90 96 66 68 85 83 74 73 73 73 65 62 116 86 78 90 81 62 70 66 78 75 86 72 67 68 91 77 63 68 71 79 65 73 88 62 75 79 70 66 71 64 96 77 87 72 76 79 63 97 80 86 88 80 77 89 62 83 81 94 101 76 89 60 80 67 83 94 89 76 84 68 64 68 103 71 94 93 77 77 78 72 81 87 84 92 66 63 82 79 88 74 79 78 88 71 71 61 72 63 43 77 71 84 93 89 68 59 64 94 62 61 78 89 63 74 85 65 84 66 59 74 85 75 69 82 61 62 85 49 61 82 79 72 68 70 84 62 67 75 67 65 99 77 76 96 73 71 92 98 79 65 77 58 88 74 83 92 59 68 61 82 59 51 89 77 72 81 64 57 98 98 86 69 81 76 63 65 58 76 71 86 92 45 75 102 76 65 73
关于灯泡总体平均使用寿命的统计推断过程
抽
样
随机抽样
非随机抽样
简单抽样
复杂抽样
重复抽样
不重复抽样
分层抽样
整群抽样
系统抽样
样
本
样本数据
总 样
体 本
图
形
统 计量
品质型变量
数量型变量
集中趋势
离散趋势
分布形态
条 形 图
饼 形 图
盒 形 图
直 方 图
均 值
中 位 数
众 数
极 差
方 差
峰 度
偏 度
参 数 估 计
国籍与对等陌生人的态度样本数据 丹麦 信任 怀疑 合计
625 360 985
法国
206 763 969
合计
831 1123
1954
数据的计量有四种尺度
定类尺度 nominal scale
定序尺度 ordinal scale
定距尺度 interval scale
定比尺度 ratio scale
按照某属性对 事物进行平行的分 类。(=、≠)
与某一
观测2
个体相联系 的各个变量 的取值,称 为一个观测。
观测j 观测n
Xj1 Xn1
Xj2 Xn2
Xjk Xnk
Xjp Xnp
数据阵列的一般结构
10名青少年身高体重表 姓名 周汝今 马 帅 丁 一 古 晨 江 峰 孙 悦 王小霞 胡 萍 张 红 曲 萍 性别 男 男 男 男 男 女 女 女 女 女 年龄 13 13 14 15 14 14 13 13 14 15 身高 156.0 155.0 157.9 166.0 164.5 164.7 158.0 162.0 160.5 169.0 体重 47.5 37.8 49.2 57.0 44.0 44.1 57.3 47.0 53.0 51.1 编号 1 2 3 4
代表性误差
调查者造成的登记性误差
被调查者登记性误差
系统误差
随机误差
理论上可以避免
理论上不可避免
背离随机原则的样本会造成数据的系统误差。抽样 的随机性造成随机误差。
三十名学生的身高与体重数据 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 身高x 156.0 155.0 144.6 161.5 161.3 158.0 161.0 162.0 164.3 144.0 157.9 176.1 168.0 164.5 153.0 164.7 160.5 147.0 153.2 157.9 166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0 体重y 47.5 37.8 38.6 41.6 43.3 47.3 47.1 47.0 33.8 33.8 49.2 54.5 50.0 44.0 58.0 44.1 53.0 36.4 30.1 40.4 57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.1
性别 1 1 1 1 1 2 2 2 2 2
为方便计 算机操作 可对品质 型变量的 取值进行 编码。
5 6 7 8 9 10
ຫໍສະໝຸດ Baidu
关于投票选举一次抽样调查的数据阵列 人员 1 2 3 4 5 6 7 8 9 10 年龄 20 27 19 38 38 53 24 41 35 30 性别 女 女 男 男 男 女 男 女 女 男 投票 张三 张三 李四 张三 李四 张三 李四 李四 张三 李四 态度 中立 反对 反对 赞成 赞成 赞成 赞成 反对 中立 赞成
表 数 只灯泡使用小时数 灯泡使用寿命的 76.1 用
的
µ
总体参数是由总 体的全部数据计算得 来的数。
δ
P
统计量由样 本数据计算出来 的数。
x p
s
样本 数据
总体 样本
抽样
该电子 公司灯泡产 品总体的平 均寿命是 多少? 从灯泡总体随机抽取 200只做为样本,并 就使用小时数取得样 本数据。
由样本数据计算得出 样本均值用于对总体 均值进行估计。 200灯泡的使用小时 数均值为76。
四种颜色饮料销售量样本数据 超 市 1 2 3 4 5 27.9 25.1 28.5 24.2 26.5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 30.8 29.6 32.4 31.7 32.8 黄色 无色 粉色 绿色
男性与女性饮者啤酒偏好的样本数据 淡啤 男性 女性 合计 20 30 50 普啤 40 30 70 黑啤 20 10 30 合计 80 70 150
对事物类别间等级 或顺序差别的测度。 (<、>)
对事物类别或次 序之间差距的测度。 (+、-)
对事物类别或 次序之间差距及差 别程度的测度。 (×、÷)
定类尺度
变量
性别
人种
变量值 编码
男 1
女 2
白 1
黄 2
棕 3
黑 4
定类尺度数据没有顺序和大小区别。
定序尺度
变量 一 等 变量 品
产品等级 二 等 等 满 品 意 意 立 品 三 很 满 中
品质型变量
数量型变量
品质型变量 体重 47.5 37.8 49.2 57.0 44.0 44.1 57.3 47.0 53.0 51.1
数量型变量
品质型变量
编号 1 2 3 4 5 6 7 8 9 10
性别 1 1 1 1 1 2 2 2 2 2
年龄 13 13 14 15 14 14 13 13 14 15
关于投票选举一次抽样调查的数据阵列 人员 1 2 3 4 5 6 7 8 9 10 年龄 20 27 19 38 38 53 24 41 35 30 性别 2 2 1 1 1 2 1 2 2 1 投票 1 1 2 1 2 1 2 2 1 2 态度 2 1 1 3 3 3 3 1 2 3
数据的误差
登记性误差
编码
10青少年身高体重表 年龄 13 13 14 15 14 14 13 13 14 15 身高 156.0 155.0 157.9 166.0 164.5 164.7 158.0 162.0 160.5 169.0 体重 47.5 37.8 49.2 57.0 44.0 44.1 57.3 47.0 53.0 51.1