统计学资料类型ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有序分类变量(等级变量):各类别之间有程 度的差别。
如:疾病的严重程度可以分为,轻、中、重;中医 辨证中按脉的深浅,可以分为浮、中、沉。
计量资料
定量变量
二分类变量 计
变
数
量
无序分类变量
多分类变量
资 料
分类变量
有序分类变量 (等级变量)
等级资料
变量类型与资料类型示意图
变量类型的判断
病历号 1 2 3 4 5 6 7 8 9
89
20
3女
63 上 高分化 Ⅳ 阴性
93
19
4女
71 下 中分化 Ⅱ 阳性
78
5
5男
59 上 高分化 Ⅲ 阴性
85
35
…… … … … … …
…
…
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等
8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
计数资料
17 重度高血压
SPSS软件的特点
统计分析方法比较全面:包括一般统计描述、 简单列联表分析、均数比较、一般线性模型、混 合模型、相关回归、对数线性模型、聚类和判别 、因子分析、非参数检验、时间序列、生存分析 及缺失值估计等内容;
SPSS结果输出的管理也很有特色;
绘图和图形编辑功能也很方便、全面。
分析
报告 描述统计量 报表 均数比较 通用线性模型 混合模型 相关 回归 对数线性模型 聚类 数据简化 标度 非参数检验 时间序列 生存分析 多重响应
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
计量资料
计数资料
实例数据
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)
(1)(2) (3) (4) (5) (6) (7) (8)
(9)
1男
61 上 低分化 Ⅰ 阳性
52
14
2女
58 中 高分化 Ⅱ 阴性
体重 71.5 74.0 68.0 69.0 62.0 68.0 66.0 70.5 57.0
住院天数 5 5 6 5 11 2 4 3 7
职业 无 无
管理员 无
商业 无 无 无
干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩方式 顺产 助产 顺产
剖宫产 剖宫产
顺产 助产 助产 剖宫产
将所得数据进行统计学处理的过程
5. 作结论:在数据分析的基础上,应用统计学处
理的结果,进行统计学推断。同时,依据相应的专 业知识,作出专业性的结论
第六节 SPSS统计软件说明
SPSS-----Statistical Package for Social Science (社会科学统计软件包)现改名 为Statistical Product and Service Solutions(统计产品与服务解决方案)
以12kPa为界分为正常与异常两组,统计每组例数
第五节 统计工作的基本步骤
1. 统wk.baidu.com设计:包括调查、实验设计。
运用医学统计学的起点,也是高质量地完成整 个研究的重要基础。
2. 收集资料:在研究设计基础上,通过试验或调
查,取得准确可靠的原始资料
3. 整理资料:对资料进行清理、改错,数量化
4. 分析资料:包括统计描述、统计推断
与著名统计软件SAS相比,更适用于统计初 学者或非统计学专业人员
SPSS软件的特点
操作简便,方便自学。 数据转换功能较强:可存取和转换多种数 据类型,如Spss(*.sav),Excel(*.xls), Text(*.txt) , dBase(*.dbf) 文件等。 数据管理功能强大且操作直观:在基本界面 上集数据录入、转换、检索、统计分析、作 图、制表及编辑等功能于一身; 可用SPSS命令编程,形成SPSS环境下的 可执行文件。
计数资料包括:二分类资料和多分类资料
个体individuals
变量
variables
住院号 2025655 2025653 2025830 2022543 2022466 2024535 2025834 2019464 2025783
年龄 27 22 25 23 25 27 20 24 29
身高 165 160 158 161 159 157 158 158 154
1. 20世纪60年代末,美国斯坦福大学的三位 研究生研制开发了最早的统计分析软件 SPSS,同时成立了SPSS 公司
2. 1975 年在芝加哥组建了SPSS 总部
3. 1984年开发了DOS操作系统下的PC+1.0 版本
4. 1992年的DOS版升级为Windows版本, 即最初的4.0版
5. 1999年升级到10.0版、2001年升级为11 .0版、 2003年 Windows操作平台下的最 新版本为12.0;目前已开发14.0、15.0
第四节 变量及资料类型
变量类型 资料类型
变量的类型决定资料的类型 一份统计资料中可能包括所有的变量类
型
一、医药统计中的变量类型
变量按变量值的性质分为不同类型:
定量变量(数值变量):其变量值是定量的, 表现为数值大小,有度量衡单位。例如:患者的
身高(cm)、体重(kg)、血压(mmHg)、脉 搏(次/分)、红细胞计数(1012/L)
年龄 35 44 26 25 41 45 50 28 31
性别 女 男 男 女 男 女 女 男 男
身高cm 165 174 180 161 171 158 160 176 162
血型 A B O AB A B O AB O
心电图 正常 正常 正常 正常 异常 正常 异常 正常 正常
尿WBC + + ++ ++ ++
+++ +
职业 教师 工人 职员 农民 工人 工人 干部 干部 军人
RBC1012/L 4.65 5.21 4.10 3.92 3.49 5.48 6.78 7.10 5.24
二、医药统计中的资料类型
按变量的类型整理成不同资料:
定量资料(计量资料或数值资料) 分类资料:
分类资料分为计数资料和等级资料两种:
分类变量:表现为互不相容的类别或属性,也 称为定性变量。 分类变量分为无序和有序两类:
无序分类变量:指所分类别或属性之间无程度 和顺序的差别。按照所分类别或属性的数量, 还可以细分为:
• 二分类变量,如男、女,中医的虚、实,阴、阳等;
• 多分类变量(名义变量),如中医的六气,风、寒
、暑、湿、燥、火。
如:疾病的严重程度可以分为,轻、中、重;中医 辨证中按脉的深浅,可以分为浮、中、沉。
计量资料
定量变量
二分类变量 计
变
数
量
无序分类变量
多分类变量
资 料
分类变量
有序分类变量 (等级变量)
等级资料
变量类型与资料类型示意图
变量类型的判断
病历号 1 2 3 4 5 6 7 8 9
89
20
3女
63 上 高分化 Ⅳ 阴性
93
19
4女
71 下 中分化 Ⅱ 阳性
78
5
5男
59 上 高分化 Ⅲ 阴性
85
35
…… … … … … …
…
…
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等
8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
计数资料
17 重度高血压
SPSS软件的特点
统计分析方法比较全面:包括一般统计描述、 简单列联表分析、均数比较、一般线性模型、混 合模型、相关回归、对数线性模型、聚类和判别 、因子分析、非参数检验、时间序列、生存分析 及缺失值估计等内容;
SPSS结果输出的管理也很有特色;
绘图和图形编辑功能也很方便、全面。
分析
报告 描述统计量 报表 均数比较 通用线性模型 混合模型 相关 回归 对数线性模型 聚类 数据简化 标度 非参数检验 时间序列 生存分析 多重响应
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
计量资料
计数资料
实例数据
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)
(1)(2) (3) (4) (5) (6) (7) (8)
(9)
1男
61 上 低分化 Ⅰ 阳性
52
14
2女
58 中 高分化 Ⅱ 阴性
体重 71.5 74.0 68.0 69.0 62.0 68.0 66.0 70.5 57.0
住院天数 5 5 6 5 11 2 4 3 7
职业 无 无
管理员 无
商业 无 无 无
干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩方式 顺产 助产 顺产
剖宫产 剖宫产
顺产 助产 助产 剖宫产
将所得数据进行统计学处理的过程
5. 作结论:在数据分析的基础上,应用统计学处
理的结果,进行统计学推断。同时,依据相应的专 业知识,作出专业性的结论
第六节 SPSS统计软件说明
SPSS-----Statistical Package for Social Science (社会科学统计软件包)现改名 为Statistical Product and Service Solutions(统计产品与服务解决方案)
以12kPa为界分为正常与异常两组,统计每组例数
第五节 统计工作的基本步骤
1. 统wk.baidu.com设计:包括调查、实验设计。
运用医学统计学的起点,也是高质量地完成整 个研究的重要基础。
2. 收集资料:在研究设计基础上,通过试验或调
查,取得准确可靠的原始资料
3. 整理资料:对资料进行清理、改错,数量化
4. 分析资料:包括统计描述、统计推断
与著名统计软件SAS相比,更适用于统计初 学者或非统计学专业人员
SPSS软件的特点
操作简便,方便自学。 数据转换功能较强:可存取和转换多种数 据类型,如Spss(*.sav),Excel(*.xls), Text(*.txt) , dBase(*.dbf) 文件等。 数据管理功能强大且操作直观:在基本界面 上集数据录入、转换、检索、统计分析、作 图、制表及编辑等功能于一身; 可用SPSS命令编程,形成SPSS环境下的 可执行文件。
计数资料包括:二分类资料和多分类资料
个体individuals
变量
variables
住院号 2025655 2025653 2025830 2022543 2022466 2024535 2025834 2019464 2025783
年龄 27 22 25 23 25 27 20 24 29
身高 165 160 158 161 159 157 158 158 154
1. 20世纪60年代末,美国斯坦福大学的三位 研究生研制开发了最早的统计分析软件 SPSS,同时成立了SPSS 公司
2. 1975 年在芝加哥组建了SPSS 总部
3. 1984年开发了DOS操作系统下的PC+1.0 版本
4. 1992年的DOS版升级为Windows版本, 即最初的4.0版
5. 1999年升级到10.0版、2001年升级为11 .0版、 2003年 Windows操作平台下的最 新版本为12.0;目前已开发14.0、15.0
第四节 变量及资料类型
变量类型 资料类型
变量的类型决定资料的类型 一份统计资料中可能包括所有的变量类
型
一、医药统计中的变量类型
变量按变量值的性质分为不同类型:
定量变量(数值变量):其变量值是定量的, 表现为数值大小,有度量衡单位。例如:患者的
身高(cm)、体重(kg)、血压(mmHg)、脉 搏(次/分)、红细胞计数(1012/L)
年龄 35 44 26 25 41 45 50 28 31
性别 女 男 男 女 男 女 女 男 男
身高cm 165 174 180 161 171 158 160 176 162
血型 A B O AB A B O AB O
心电图 正常 正常 正常 正常 异常 正常 异常 正常 正常
尿WBC + + ++ ++ ++
+++ +
职业 教师 工人 职员 农民 工人 工人 干部 干部 军人
RBC1012/L 4.65 5.21 4.10 3.92 3.49 5.48 6.78 7.10 5.24
二、医药统计中的资料类型
按变量的类型整理成不同资料:
定量资料(计量资料或数值资料) 分类资料:
分类资料分为计数资料和等级资料两种:
分类变量:表现为互不相容的类别或属性,也 称为定性变量。 分类变量分为无序和有序两类:
无序分类变量:指所分类别或属性之间无程度 和顺序的差别。按照所分类别或属性的数量, 还可以细分为:
• 二分类变量,如男、女,中医的虚、实,阴、阳等;
• 多分类变量(名义变量),如中医的六气,风、寒
、暑、湿、燥、火。