第八章科研资料的整理与分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用线条高低、面积大小等来代表数
统
量。通俗易懂,便于理解和比较。 计
图
和
但从统计图中不
统
能获得确切数字
计 表
常用的统计图类型
1.直条图 2.百分条图、圆图 3.线图、半对数线图 4.直方图 5.散点图
条图(bar chart)
适用资料:不连续的、
有明确分组的资料。
形式:单式(图1)
复式(图2)
绘制要点:横轴为观察
处理 甲法 乙法 合计
愈合 54(48.22) 44(49.78)
98
未愈合 合计 愈合率(%)
8(13.78) 62 87.10
20(14.22) 64 68.75
28
126 77.78
该资料适合用什么统计分析方法?
四、统计图和统计表
(一)统计表(statistical table)
定义:是以表格的形式表达研究对象的 特征、内部结构及研究项目分组之间的 数量关系。 结构:统计表由文字、数字和线条组成
一、核校原始数据
审核资料的准确性(检查错误)和 完整性(缺项链)。
(一)缺项的处理
缺项的调查表还能不能要? 1、十分重要成废表 如研究有关糖尿病患者自理行为与患病 时间长短的关系。 2、单项缺失处理(100名成年男性身高 )
(二)错误的检查
1、专业检查(宫颈癌、产后15天, C型血) 2、统计检查(身高) 3、计算机检查(性别1293)
对各观察单位用定量方法测定某项指标量的 大小,一般有度量衡单位。
特点:有计量单位,如患者的身高(cm)、
体重(kg)、血压(mmHg)、脉搏(次/分)、 红细胞计数(1012/L)
2、计数资料
定义:将全体观察单位按某种性质或特征
分组,然后分别清点每组中观察单位的个数 所得的数据称计数资料。
特点:如肤色(黑、白)、血型(A、B、
二项分布
等级资料 率、构成比
检2 验、
秩和检验
注:当资料分布类型为不确定或者呈非正态分布 时,可选用秩和检验
中医护理技术对减少乳腺 癌患者术后并发症的效果
研究
中华护理杂志 2017 年 3 月第 52 卷 第3期
祝亚男 俞国红 杨方英 孔红武 汪永 坚 倪建芬 陈晓洁
举例
甲乙两种方法治疗压力性溃疡的效果
表面看B高,实际一样。 为何差异?抽样误差。 到底如何判断?假设检验
162 164 166
参数: 总体的统计指标 μ π σ 统计量: 样本的统计指标 x ρ s
(一)概率和假设检验
1、概率(probability) 是描述某一事
件发生的可能性大小的一个度量, 常用符号P表示,其值在0和1之间。
绘制表格的基本要求
1、表号、表题:表格上方中央,扼要说明 表的主要内容。
2、标目:有计量单位者应注明单位。标目 均须注法定计量单位,标目应遵循从小到 大排列。
3、线条:统计表中只有横线,无竖线和斜 线。通常为三线表,复合表可出现分层线
4、数字:用阿拉伯数字表示,同一列 小数位数一致,且位次对齐。表格 中不应有空格,暂无记录或未记录 用“··· ”表示,无数据用“—”表示 ,数据为零则填“0”。
必然事件 P = 1 不可能事件 P = 0 随机事件 0<P<1
小概率事件:
P ≤ 0.05(5%)或P ≤ 0.01(1% )称为小概率事件(习惯),统计学上 认为不大可能发生。
基 本
2、假设检验:应用统计学的原理从 概
念
样本之间的差别去推断样本所代表的 总体之间是否存在差别的一个重要的 推断方法,又称显著性检验。
第八章 科研资料的 整理与分析
科研顺序
拿到资料-核查原始数据并整理(录入 易查) 进行分析(前提弄清数据类型) 根据数据类型借助SPSS统计分析(描 述和推断) 分析的结果用图和表在论文呈现
主要内容
第一节科研资料的整理 第二节科研资料的统计学分析
第一节科研资料的整理
原始数据和资料是庞杂和无序的,经过 整理和加工使之系统化条理化,这是资 料的整理过程。资料的整理是统计分析 的前提。 两方面:核校原始数据、建立数据库
5、备注:不列入表中,特殊情况需要 说明时可用“*”号标出,文字叙述 写在表的下方。
表1 某基层医院医师和护士论文发表情况
期刊类别
护士 例数 百分比
医师 例数 百分比
核心期刊 7 非核心期刊 12
5.8% 10%
21
17.5%
27
22.5%
(二)统计图(statistical graph)
定义:是用图形将数据资料形象化,
中位数(median):是将一组观察值从 小到大按顺序排列,住次居中的观察 值。
平均数(mean):反映一组观察值在数 量上的平均水平
平均数
1、均数:即算术平均数的简称,反映 一组观察值在数量上的平均水平。 总体均数用希腊字母ū表示,样本均数 用X表示。
2. 几何均数(geometric mean G): 适用 于资料变量值呈倍数变化(等比资料) 或偏态分布资料
第二节科研资料的统计学 分析
统计方法是揭开科学研究结果的钥 匙
选对钥匙开对门
一、资料类型 二、描述性统计 三、推断性统计 四、统计表和统计图
统计学分析分为两大类:描述性统计 和推断性统计。
两大类方法的分析前提一定要明确 资料的类型。
一、资料类型
计量资料 计数资料 等级资料
1、计量资料
定义: 用仪器、工具等测量方法获得的数据,
实际抽样差异时统计学回答
湿干扫哪个更能减少空气中菌落数
假设检验的步骤
(1)建立假设:无效假设H0 备择假设H1
如:H0:两种扫床方法扫床后空气中菌落数 无差别
H1:两种扫床方法扫床后空气中菌落数 有差别
(2)确定显著性水平: 显著性水平是用来判断小概率事
件是否发生的标准 ,常用 来表示。 通常 取值为0.05 或 0.01。
O)、性别(男、女);无固有计量单位, 且均为整数,
3. 等级资料(Rank data)
定义:是介于计量资料和计数资料之间的一
种资料类型,也称半定量资料、有序分类资 料。如:
①癌症分期:早、中、晚 ②药物疗效:治愈、好转、无效、死亡 ③尿蛋白: 、、、++、+++及以上
三类资料举例
一组2040岁成年人的血压 以12kPa为界分为正常与 异常两组,统计每组例数
(3)计算统计量:
根据所选用的统计方2 法,公式计 算相应的统计量,如t值、F值、 值
等
(4)确定概率值 根据计算所得的统计量查相应的
工具表可得出概率P的大小。从而得 出概率P与a大小的关系
计算机软件进行统计处理时会自 动报告P值的大小
(5)作出推断结论
如果P>α,则H0假设成立,即两种 扫床方法扫床后空气中菌落数无差别。
在论文中均数和标准差以 x s 的形式写出。
2. 计数资料的统计描述
相对比(ratio R): 指两个有关指标之比, 说明A是B的若干倍 或百分之几. 指标可以性质相同或不同 相对比=A/B, 护士数与床位数之比 构成比(percentage):又称百分比, 表示事物内部各组成部分 在总和中所占比重的大小 率(rate):指某种现象人数占调查人数的比例。
婴儿死亡率(1/千)
140 120 100 80 60 40 20
0 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 年份
图5 某地1949-1958年婴儿死亡率
直方图(histogram)
频
数
适用资料:连续变量的
频数分布。
形式:以各矩形的面积表
例:某地区老年人640人,其中患病者为320人,有患 者痴呆病患者8人,问患老年痴呆者的构成比和百分率各 是多少。构成比=8/320×100%=2.5%
百分率=8/640×100%=1.25%
三、推断性统计
定义:统计推断是指如何由样本信息推 断总体特征问题。
先看2组数据,比较AB两地人的身高。
A162 164 166 164 166 168 B164 166 168
示各组频数多少
绘制要点:横轴代表等
距的离变量值,纵轴代 表频数,各矩形间不留 空隙。
125.45 130.45
160.45
身高
散点图(scatter diagram)
适用资料:双变量资料
形式:以点的密
集程度和趋势表 示两种现象的相 关关系
绘制要点:横轴
和纵轴各代表一 个变量。
绘制统计图的要求
1. 根据资料性质和分析目的选择适当图类。如:独 立资料用直条图;连续资料用线图或直方图;构 成比用百分条图或圆图;双变量资料用散点图。
部分在全体中所占的比例
绘制要点:
一定有标尺在图 的上方或下方,全 长100%;附图例说 明
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
呼吸系疾病 传染病 先天缺陷 其它
图3.某地5岁以下儿童死因分布
圆图 (pie chart)
9% 18%
呼吸系疾病
43%
传染病
计量资料 计数资料
12 kPa 轻度高血压 15 kPa 中度高血压 17 kPa 重度高血压
等级资料
二、描述性统计
统计描述是指用统计指标、统计表 、统计图等方法,对资料的数量特 征及其分布规律进行测定和描述不 涉及由样本推论总体问题。
1. 计量资料的描述性分析: 集中趋势
众数(mode):在分布中出现频率最高的 数值。
2.离散趋势
离散趋势:一组计量资料中各数据 之间的ቤተ መጻሕፍቲ ባይዱ差程度。
了解资料离散情况的常用指标有极 差、方差、标准差和变异系数,最 常用的是标准差和方差。
标准差(S):
一般都是计算样本的标准差。 单用均数不能表达出实验数据的离散程序,
还需要通过计算标准差值来反映均数中各值的 波动范围(离散程度),标准差值越小,说明 观察值(X)的变异程度越小,则均数的代表 性越好,收集的资料可靠性大。
2.统计图要有合适的图号和标题。标题写在图的下 方,扼要概括图的内容。
3.横、纵坐标上要有刻度和单位,刻度要均匀等距 ,横、纵长度之比为7∶5较合适。
如果P<α,则H1假设成立,拒绝H0
接受H1 ,差 别有统计学意义。即 两种
扫床方法扫床后空气中菌落数有差别。
(二)常用的推断性统计 方法
计量资料
t检验:(大样本用u检验) ➢ 样本均数与总体均数的比较 ➢ 两样本均数的比较(独立样本t检验) ➢ 配对样本均数比较(配对t检验) 方差分析(F检验) 适用于两个以上样本均数比较 两个以上样本均数间的两两比较用q检验 相关分析:变量间相互关系的密切程度 回归分析:某变量随着其他变量的变化而变化的数量
统计表的结构
表号、表题
表1 甲、乙两地某年HbsAg阳性率
地区 调查数 阳性数 阳性率(%)
甲地 5000 1100
22.0
乙地 6000 1050
17.5
合计 11000 2150
19.5
顶线 横标目 分界线
数据
纵标目
底线
统计表的结构
分层线 表2 甲乙两种方法治疗压疮的效果
轻中度压疮
重度压疮
处理 总例数 治愈 治愈率 总例数 治愈 治愈率
甲法 50 40 80.00 20 12 60.00
乙法 40 26 65.00 18
6 33.33
合计 90 66 73.33 38 18 47.37
分层线
统计表的绘制原则
总原则:是以最小的篇幅,显示出最 多的信息。 ① 重点突出,简单明了。避免包罗 万象,一个表格说明一个中心问题 为宜。 ② 层次分明,排列合理。避免层次 过多或结构混乱。
项目,纵轴为数值;各 直条等宽,等间距;间 距宽度与条宽相等或等 于条宽的1/2
死亡率(1/10万)
120 100
80 60 40 20
0 癌症
男 女
心血管疾病
图2.某地1995年癌症、心血管疾病死亡率
百分条图(percentage bar chart)
适用资料:计数资料的构成比
形式:以各段面积所占的百分比来表示各
先天性疾病
其它
30%
图4.某地5岁以下儿童死亡原因分布
适用资料:描述构成比 形式:圆内各扇形面积表示各部分所占构成比例 绘制要点:每部分用不同线条或颜色表示,并
在标出百分比,下附图例说明。
线图(line diagram)
适用资料:适用于连续性资料,反映事物
的动态变化规律
绘制要点:横轴表示
时间或组段,纵轴表 示频数或率。有两条 以上曲线在同一图上 时,须用不同颜色或 不同图形加以区分, 并附图例加以说明。
关系
计数资料 四格表X2检验:两个样本率的比较 行×列表X2检验:多个样本率或构 成比的比较
等级资料: 秩和检验
常用统计分析方法
描述性统计
推断性统计
计量资料 均数、几何均数、 中 t 检验、 u
位数、众数、方差、 检验、 方
标准差、变异系数、 差分析、 或
相关与回归分析
秩和检验
计数资料 率、相对比、构成比 检2 验 、