统计学基本概念与步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
认识统计资料的分类
某社区调查1000名居民,由测出的1000 个血压值组成资料,属于什么资料? 如果将对象分为高血压患者200名,健康者 800名,又属于什么资料? 如果再将200名患者分为轻度、中度和重度 患者,此时属于什么资料?
统计工作的基本步骤
1、研究设计:是统计工作最关键的步骤
确定研究目的、对象、内容;对照;误差控制
频数表制作分为三个步骤: 1、求全距: 即数据最大值与最小值之差
最小值为 125.9 全距= 160.9 -125.9 =35 找出资料最大值为 160.9 2、确定组段数和组距: 频数表一般分为10个组 段左右。即将全距除以10。 35÷10=3.5 ≈5(cm)
3、制作频数表: 故将上述资料分为8个 一般采用划记“正”字法。 组段。其中最小和最大组 段,分别容纳了最小和最 大数据,125.9与160.9。
总体 样本1 样本2
同质
抽样误差也是同质
虽然有抽样误差存在,但样本均数总是 与总体均数相差不大。 因此抽样误差是有规律的,可用统计学 的方法估计。
不同质
总体 样本1 样本2
这些不同 本质 称之为? 差别
抽样误差与变异的异同与联系
共性:两者均为同质基础上所产生差异
区别:变 异是个体水平上表现出来的差异 抽样误差是群体水平上表现出来的差异 联系:变异是导致抽样误差的原因。
4、资料分析:
以统计指标(均数、率等)描述样本资料
为个体定性提供依据——医学参考值估计
以样本指标估计总体——总体均数估计
判断不同样本是否同质—假设检验
反映不同事物间的关系—相关分析
研究设计 资料收集 资料整理 资料分析
由甲事物推测乙事物——回归分析
讨论一
某医院将糖尿病
患者随机分为两组,
某地130名12岁 健康男孩身高资料 组段 (cm)
125~ 130~ 135~ 140~ 145~ 150~ 155~ 160~ 合计
频数 (f)
2 7 21 36 40 17 6 1 130
左侧是130个未经整理的原始数据,右侧是经 过整理形成的”频数表”
频数表的制作过程
某地130名12岁健康 男孩身高(cm)测量资料
观察样本只是手段,反映总体才是目的
样本具备“代表性”应遵循的原则
(1)随机抽样: 总体中每一个体被抽取的机会相同 (2)样本含量适宜: 太小代表性差,太大则调查费力 (3)样本与总体同源: 样本来源于欲观察的总体
4、抽样误差:
指样本指标之间或与总体指标之间存 在的差别。
例如:随机抽取110名7岁男孩,样本的平均 身高一般不等于全体7岁男孩的平均身高; 再抽取另一个样本,平均身高可能又有差别
某医院将糖尿病患者随机分为两组,每组30人。 分别给予不同的医护方法,以比较疗效。病情用血糖 浓度表示。
(3)现在两组疗法不同,观察结束时也出现了血 糖均数不等的现象,你是否意识到这种均数差异反 映了两种可能? 疗效相同——差异属于抽样误差
疗效不同——差异属于本质区别 (4)理解观察样本是手段, 反映总体才是目的?
组织、设备、资金、程序、时间安排
设计原则——
重复、随机、对照、齐同、双盲
研究设计
2、资料收集:
&经常性资料: &专题调查资料: &实验室资料:
研究设计 资料收集
3、资料整理:
使资料条理化、系统化,以便进一步统 计分析。
下面以计量资料整理成频数表的过程为例, 认识一下资料的整理。
研究设计 资料收集 资料整理
Baidu Nhomakorabea
抽样误差也是同质
虽然有抽样误差存在,但样本均数总是 与总体均数相差不大。 因此抽样误差是有规律的,可用统计方 法估计。
同质
这些不同 抽样 称之为? 误差
总体 样本1 样本2
抽样误差也是同质
虽然有抽样误差存在,但样本均数总是 与总体均数相差不大。 因此抽样误差是有规律的,可用统计学 的方法估计。 这些不同 抽样 称之为? 误差
社区常用医学统计方法
——基本概念和步骤
学习目标
1. 掌握统计基本概念及其联系
2. 叙述统计基本步骤及其要点
常用医学统计方法
统计学是一门方法学,是以数学方法观 察和比较事物的科学。 存在变异的事物或现象 统计学的研究对象:
1、变异:同质(性质相同)对象之间存在的差异。
喂 , 我 比 你 个 大
可 你 我 都 是 同 类 呀
你能举出一 些变异事例 吗?
变异事物的观察
必须通过群体观察认识变异事物
以某同学成绩代表所有同学的学习能力, 应怎样正确反映? 你同意吗? 样本 总体 2、总体:同质研究对象的全 群体 观察
体
经总体观察是最正确的方法, 欲了解某地6岁健康男孩身 但往往不能直接观察 高情况,总体是?
3、样本:对总体有代表性的部 分
讨论二
(1)指出下列可能由变异导致的现象: (2)指出下列可能由抽样误差导致的现象:
X :个体观察值,X :样本平均数,μ:总体平均数
A、X1 ≠ X2
B、X1 ≠ X2 C、X ≠ X D、X ≠ μ E、μ1≠ μ2
频数表的制作过程
某地130名12岁健康 男孩身高(cm)测量资料
155.5 145.9 140.2 145.4 145.2 143.5 154.2 146.8 137.9 132.5 150.3 148.3 138.9 145.1 147.1 148.1 159.6 148.9 149.8 143.6 150.0 143.3 146.5 149.8 134.7 138.5 145.4 138.9 149.8 153.1 146.2 140.5 145.8 147.9 152.9 143.5 142.6 146.9 142.4 146.1 146.7 139.2 147.0 147.3 134.7 148.8 141.2 145.8 142.7 140.1 147.8 147.9 141.8 147.5 142.9 143.8 139.2 156.1 142.4 138.7 142.3 151.1 150.8 129.4 144.7 145.7 151.3 143.9 151.6 141.9 142.3 141.4 149.7 146.6 130.5 151.6 149.0 148.9 137.4 156.6 141.2 144.5 142.5 138.1 138.2 137.9 140.7 154.5 139.2 143.6 140.9 139.9 152.3 153.3 139.6 146.7 144.0 148.8 147.5 125.9 142.7 137.1 141.6 148.8 141.9 146.4 145.2 134.9 141.4 137.7 147.7 136.7 144.4 143.4 157.9 133.5 139.2 152.7 132.4 152.9 145.5 135.1 156.3 143.8 137.4 142.9 160.9 138.5 154.0 154.4
每组30人。分别给予
不同的医护方法,以
比较疗效。病情用血
糖浓度表示。
某医院将糖尿病患者随机分为两组,每组30人。 分别给予不同的医护方法,以比较疗效。病情用血糖 浓度表示。
(1)研究开始以前,两组患者病 情要求相同吗?两组血糖均数一定 要求相等吗?
(2)假设两组用了相同的疗法, 观察一段时间以后,两组血糖均数 出现不相等的情况?你认为这种差 异反映了疗效不同吗?
频数表的制作过程
某地130名12岁健康 男孩身高(cm)测量资料
155.5 145.9 140.2 145.4 145.2 143.5 154.2 146.8 137.9 132.5 150.3 148.3 138.9 145.1 147.1 148.1 159.6 148.9 149.8 143.6 150.0 143.3 146.5 149.8 134.7 138.5 145.4 138.9 149.8 153.1 146.2 140.5 145.8 147.9 152.9 143.5 142.6 146.9 142.4 146.1 146.7 139.2 147.0 147.3 134.7 148.8 141.2 145.8 142.7 140.1 147.8 147.9 141.8 147.5 142.9 143.8 139.2 156.1 142.4 138.7 142.3 151.1 150.8 129.4 144.7 145.7 151.3 143.9 151.6 141.9 142.3 141.4 149.7 146.6 130.5 151.6 149.0 148.9 137.4 156.6 141.2 144.5 142.5 138.1 138.2 137.9 140.7 154.5 139.2 143.6 140.9 139.9 152.3 153.3 139.6 146.7 144.0 148.8 147.5 125.9 142.7 137.1 141.6 148.8 141.9 146.4 145.2 134.9 141.4 137.7 147.7 136.7 144.4 143.4 157.9 133.5 139.2 152.7 132.4 152.9 145.5 135.1 156.3 143.8 137.4 142.9 160.9 138.5 154.0 154.4
P越接近0(0 %),表示发生可能性越小 P≤0.05( 5% )的事件,称为小概率事件, 可认为这类事件不会发生。 P越接近1(100%),表示发生可能性越大
统计资料种类
计量资料:
由定量数据组成,可以计算平均数
计数资料:
由定性数据组成,可以计算率、比
等级资料:
既有计量又有计数性质(了解) 意义:资料不同,所需统计指标和分析方法均不同
种类 原因 性质
测值-真值 测值-真值
表现
存在与解决
测量误差 (系统) 单一因素 测量误差 测量变异 (随机)
方向单一 可避免 大小一致 查明并去除原因 随机 随机 不可避免 提高测量精度 不可避免 增加样本含量
样本--总体 抽样误差 个体变异 (随机) 样本--样本
5、概率:
指事件发生的可能性,用符号“P”表示
155.5 145.9 140.2 145.4 145.2 143.5 154.2 146.8 137.9 132.5 150.3 148.3 138.9 145.1 147.1 148.1 159.6 148.9 149.8 143.6 150.0 143.3 146.5 149.8 134.7 138.5 145.4 138.9 149.8 153.1 146.2 140.5 145.8 147.9 152.9 143.5 142.6 146.9 142.4 146.1 146.7 139.2 147.0 147.3 134.7 148.8 141.2 145.8 142.7 140.1 147.8 147.9 141.8 147.5 142.9 143.8 139.2 156.1 142.4 138.7 142.3 151.1 150.8 129.4 144.7 145.7 151.3 143.9 151.6 141.9 142.3 141.4 149.7 146.6 130.5 151.6 149.0 148.9 137.4 156.6 141.2 144.5 142.5 138.1 138.2 137.9 140.7 154.5 139.2 143.6 140.9 139.9 152.3 153.3 139.6 144.4 146.7 143.4 144.0 157.9 148.8 133.5 147.5 139.2 125.9 125.9 152.7 142.7 132.4 137.1 152.9 141.6 145.5 148.8 135.1 141.9 156.3 146.4 143.8 145.2 137.4 134.9 142.9 141.4 160.9 160.9 137.7 138.5 147.7 154.0 136.7 154.4
个体 群体
统计基本概念之间的联系
统计学研究对象是存在变异的事物,反 映变异的特征和变化规律,应经群体观察。 总体观察一般不可行,通过样本观察时,通 常存在抽样误差。 观察样本是手段,反映总体才是目的。 变异和抽样误差都属同质, 差异仅为表象。
其他常见误差
Ω 系统误差 Ω 随机测量误差
各种常见误差的区别
同质与不同质
个体之间的差异属于同质,称为变异。此时, 测量值总是比较接近均数。 以成人舒张压为例,相距均数75mmHg太远则属 于血压异常。故变异是有规律的!
低血压区 60
血压正常范围 75 90
高血压区 mmHg
卫生领域中的变异现象
服用同样剂量的药物,但患者的疗效、副 同一份样品(空气、食物、血液),测试 同为健康人,但身高、肺活量、血细胞数、 方法或人不同,测得某物质浓度都可能不一样 代谢物含量、„„都可能不一样 反应、药物的血浓度、 „„都可能不一样