科研数据的分析与处理资料讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、缺项与差错检查
• 人工检查 • 计算机检查
可疑数据的处理
在周密实验设计指导下获得的实验数据,不应 随意舍弃,否则实验结果的真实性与完整性就会受 到破坏。
30
Leabharlann Baidu
20
10
0
-10
-10
0
10
20
30
X
Y
可疑数据的处理
在该数据指标服从正态分布的前提下,可用统计 方法检查个别“可疑值”是否应当舍弃。
▪正态近似法 当样本含量足够大,且样本率p和(1-p)均
不太小。一般认为np和n(1-p)≥5。 p±uαsp
一、统计分析方法概述
(一)假设检验 (二)区间估计 (三)变量间关系的研究 (四)判别分析
(三)变量间关系的研究
1.各指标之间无自变量与因变量之分 (1)研究变量之间的相互关系有直线相关分析、典 型相关分析等。 (2)研究多个变量的内部从属关系,并寻找综合指 标,降低变量的维数,其常用的方法主要有主成分 分析、因子分析和对应分析。 (3)研究多个变量内部或多个样品之间的亲疏关系 有聚类分析。 (4)研究多个变量内部的各种复杂关系有线性结构 方程的协方差分析。
(一)假设检验
包括有计量资料分布类型的假设检验、计量资料 方差的假设检验、计量资料均数的假设检验、等级 资料分布或位置的假设检验、两种属性间的独立性 检验以及两种方法判断结果一致性的检验等。
(二)区间估计
▲概念:根据样本均数,按一定的可信度计算
出总体均数很可能在的一个数值范围,这个 范围称为总体均数的可信区间。
第二节 科研数据的描述表达
一、统计指标 二、统计表 三、统计图
医学科研数据的整理与分析
第一节 科研数据的检查与整理 第二节 科研数据的描述 第三节 统计分析方法的选择 第四节 科研数据的综合分析 第五节 统计分析结果的解释与表达
一、统计分析方法概述
(一)假设检验 (二)区间估计 (三)变量间关系的研究 (四)判别分析
(三)变量间关系的研究
2.各指标之间有自变量与因变量之分 研究变量之间 的依存关系有直线回归分析、曲线回归分析、多项 式回归分析、多元线性回归分析、概率模型回归分 析、生存资料的参数模型回归分析、COX模型回归分 析和对数线性模型分析。
一、统计分析方法概述
(一)假设检验 (二)区间估计 (三)变量间关系的研究 (四)判别分析 根据一些明确分类的总体所提供的信 息,对未知个体的归属进行分类的判别分析。
• 每次只分析两个变量时,可将资料整理为2×2表、
2×k 表 和 R×C 表 的 形 式 。 常 用 的 统 计 分 析 方 法 有 Pearson χ2检验、校正χ2检验、配对计数资料的 McNemar χ2检验、Fisher精确概率法检验、秩和检
验、Ridit分析、等级相关分析、典型相关分析、一 般趋势和线性趋势检验、Kappa检验等; •如果需要同时分析研究的定性变量的个数≥3时,
法。
R×C表检验方法的选择
1. 双向无序R×C表资料及其统计分析方法的选择 2. 单向有序R×C表资料及其统计分析方法的选择 3. 双向有序且属性不同的R×C表资料及其统计分析
当n>10时,可以用“
的准则。
”作为舍弃可疑值
当n≤10时,可以采用Q检验法、Dixon检验法或
Grubbs检验法,进行测量值的一致性检验,从而判 断是否剔除可疑值。
三、资料的整理
在对资料做好检查、核对后,就需要把杂乱无章 的资料条理化,以便于进行统计计算与分析,即整 理资料。
数据的计算机管理
• 数据库的选择 • 数据录入 • 数据核查与清理 • 数据加工(如编码、标准化、根据原始记录
产生新的研究变量等) • 数据最终锁定并进入分析
医学科研数据的整理与分析
第一节 科研数据的检查与整理 第二节 科研数据的描述 第三节 统计分析方法的选择 第四节 科研数据的综合分析 第五节 统计分析结果的解释与表达
科研数据的分析与处理
医学科研数据的整理与分析
第一节 科研数据的检查与整理 第二节 科研数据的描述 第三节 统计分析方法的选择 第四节 科研数据的综合分析 第五节 统计分析结果的解释与表达
第一节 科研数据的检查与整理
一、对象的检查 二、缺项与差错 三、资料的整理
一、对象的检查
首先要鉴别所调查或研究的个体是否属于所规 定的调查对象或研究对象。
▲方法:
(1)u分布法 (2)t分布法
(二)区间估计
总体均数(μ)的100(1-α)%置信区间(CI): (1)已知总体标准差σ,按正态分布原理,计算公式为:
(2)σ未知,n较小,按t分布原理计算:
(3)σ未知,n足够大(如n>100),按正态分布原理计算:
总体率的置信区间估计
▪查表法 当n≤50时
常 用 的 统 计 分 析 方 法 有 加 权 χ2 检 验 、 Mantelhaenszel χ2检验、logistic回归模型和对数线性模
型等。
R×C表检验方法的选择
在计数资料的分析过程中,对于R×C表形式资料
的分析是一个难点,存在的问题比较多。 根据二维列联表中两个分组变量的类型以及分析
的目的,对R×C表资料进行分类,因为不同类型的 R×C表资料和不同的分析目的,就有不同的分析方
第二节 科研数据的描述表达
一、统计指标 二、统计表 三、统计图
一、统计指标
(一)总量指标与相对数指标 (二)平均数指标 (三)变异指标
二、统计表
统计表是用表格的方式表达统计资料和指标。 在编制统计表时,应该遵循以下原则: 1.重点突出,简单明了。即一张表只包含一个中心 内容,使人一目了然,不要包罗万象。 2.主谓分明,层次清楚。
在进行临床研究时,要特别注意疾病诊断、分 类的正确性,这对于保证研究结果的正确性是十分 必要的。
二、缺项与差错检查
由于多种原因在一些调查表中经常可以见到缺 项的存在,缺项的存在严重地影响到资料的完整性。
通过检查发现研究资料中的差错也是十分必要 的,应对研究数据作认真的检查。
二、缺项与差错检查
• 专业检查 • 统计检查
选择统计分析方法需考虑的因素
分析目的 资料类型 设计方案 数理统计条件
二、计量资料假设检验方法的选择
例:欲了解某地城乡婴儿营养状况有无差别,测 量了其血红蛋白含量,见下表。
三、计数资料假设检验方法的选择
• 首先要明确每次拟分析的定性变量个数是多少? • 其次要弄清定性变量的属性、列联表中频数的多少 以及资料的收集方式。
相关文档
最新文档