1统计学基本内容及统计图表
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率(probability) 描述随机事件发生的 可能性大小的数值
频率(frequency) 指一次试验结果得到 的样本率
频率与概率间的关系:
1. 样本频率总是围绕概率上下波动 2. 样本含量n越大,波动幅度越小,频率越接近概率。
与概率相关的几个概念
随机事件
–在同样条件下可能会出现两种或多种结果,究竟会 发生哪种结果,事先不能确定。0﹤P﹤1 – 肯定会发生某种结果的事件。 – P=1 –肯定不发生某种结果的事件。 – P=0
二、搜集资料
搜集资料(collection of date) —— 是根 据设计的要求,获取准确可靠的原始资料,是 统计分析结果可靠的重要保证。 医学统计资料的来源主要有以下三个方面: 1.统计报表 统计报表是医疗卫生机构根据国家 规定的报告制度,定期逐级上报的有关报表。 如法定传染病报表、出生死亡报表、医院工作 报表等,报表要完整、准确、及时。
统计表与统计图
第一节 统计表
第二节统计图
第一节
统计表
统计表(statistical table)--- 把统计分 析资料及其指标用表格列出,称为统计表。它 可以代替冗长的文字叙述,便于计算、分析和 对比。 统计图(statistical graph)---- 是用点、 线、面等表达统计资料中数量及其变化趋势, 使统计资料更形象、更易懂,可直观地反映出 事物间的数量关系。
3.线条 线条应尽量减少,除顶线、标目线、合 计线和底线外,其余线条均可省略。特别是表 的左上角的斜线和两侧的边线应一律不用 。 4.数字 表内的数字一律用阿位伯数字,同一指 标位数要对齐,小数点的位数要一致,一般保 留1~2位小数。无数字的空格用“—”表示,暂 缺或未记录用“…”表示。 5.备注 表内不应有其他文字出现,需要说明的 备注用“*”号标出,写在表的底线下面。
表12-2 某地1995年流行性脑脊髓膜炎不同病型病死率与病情轻重的关系
病 型 病人数 轻 死亡 人数 菌血型 脑 型 混合型 合 计 25 428 373 826 0 2 1 3 病死率 (%) 0.00 0.47 0.26 0.36 27 224 241 492 病人数 中 死亡 人数 0 11 7 18 病死率 (%) 0.00 4.91 2.90 3.65 7 126 170 303 病人数 重 死亡 人数 4 35 31 70 病死率 (%) 54.14 27.78 18.23 23.10
图示:总体与样本
sample1 sample2
sample3 population sample4
sample5
统计学的任务:在变异的背景上描述同一总体的同质性, 揭示不同总体的异质性。发现不确定现象背后隐藏的规律。
统计学是一门处理数据中变异性的科学与艺术。
三、参数与统计量
参数(parameter):由总体计算或得到的统计 指标称为参数。总体参数具有很重要的参考价 值。如总体均数μ,总体标准差σ等。 统计量(statistic):由样本计算的指标称为 统计量。如样本均数,样本标准差s等。 注意:一般不容易得到参数,而容易获得样本 统计量。
1.标题 : 简明扼要能概括表中内容,它应包括时间、 地点、内容等。标题应写在表顶线的上端中间 的位置 。 2.标目 用以说明表内数字含义的部分叫标目。 (1)横标目 横标目位于表左侧,是统计表所要 叙述的主语,它说明同一横行数字的意义。 (2)纵标目 纵标目位于标目线的上端,是被说 明事物的宾语,一般是绝对数或统计指标。
2.医疗卫生工作记录 如病历、医学检查 记录、卫生监测记录等。 3.专题调查或实验研究 它是根据研究目 的选定的专题调查或实验研究,搜集资 料有明确的目的与针对性。它是医学科 研资料的主要来源。
三、整理资料
整理资料(sorting data)的目的就是将搜集到的原始 资料进行反复核对和认真检查,纠正错误,分类汇总,使 其系统化、条理化,便于进一步的计算和分析。整理资料 的过程如下: 1.审核:认真检查核对,保证资料的准确性和完整性。 2.分组:归纳分组,分组方法有两种: ①质量分组,即将观察单位按其类别或属性分组,如按性别、 职业、阳性和阴性等分组。 ②数量分组,即将观察单位按其数值的大小分组,如按年龄 的大小、药物剂量的大小等分组。
–事件发生的可能性很小,认为其在一次抽样中不可 能发生. – P ≤ 0.05 或 P ≤ 0.01
必然事件
不可能事件
小概率事件
• 小概率事件
P≤0.05
• 小概率原理
–小概率事件发生的可能性很小,进而认 为其在一次抽样中不可能发生,此即为
小概率原理。
–进行统计推断的依据
医学统计中的基本概念与步骤 第一节 基本概念 第二节 医学统计的基本步骤
二、统计表的种类
1.简单表 只按一个特征或标志分组的统计表称 为简单表。如表12-1。 2.复合表 按两个或两上以上特征或标志结合起 来分组的统计表称复合表或组合表。
• 表12-1 某地某年流行性脑脊髓炎各病型的病死率
病 型 菌血型 脑 型 混合型 合 计 病人数 59 778 784 1621 死亡人数 4 48 29 91 病死率(%) 6.78 6.17 4.97 5.61
连续性资料 • 线图——①表示数量随时间的变迁;②表示某 种现象随另一种现象而变迁 。 • 半对数线图——比较两个或几个率的变化速度 • 直方图——表示变量的频数分布。 地域性资料 : • 统计地图:表示某种事物的地理分布 。
2.每图应有标题,其要求与统计表相同,一般放 在图下方正中。 3.纵横两轴应有标目并注明单位。 横标目:一般表示主语,如疾病名称、发病时间、 年龄组等,尺度自左向右; 纵标目:表示宾语,一般表示频数、比或率,尺 度自下而上,一般需从零开始,由小到大。 纵横两轴长宽比例一般为5:7为宜。 4.若图中用不同颜色或线条代表不同事物,则须 在图中加以说明。
2、定性资料
定性资料( qualitative data ) 亦称计数资料 ( enumeration data ) 或 分 类 资 料 ( categorical data ),是将观察单位按某种属性或类别分组,清点 各组的观察单位数,所得的资料称定性资料。 定 性 资 料 的 观 察 指 标 为 分 类 变 量 ( categorical variable )。如人的性别按男、女分组;化验结果按 阳性、阴性分组;动物实验按生存、死亡分组;调查 某人群的血型按A、B、O、AB分组等,观察单位出现的 结果为分类变量,分类变量没有量的差别,只有质的 不同,其组成的资料为定性资料。
变异(variation) 由于生物个体的各种指标所受影 响因素极为复杂,同质的个体间各种指标存在差异, 这种差异称为变异。如同质的儿童身高、体重、血压、 脉搏等指标会有一定的差别。
二、总体与样本
总体(population):根据研究目的所确定的 同质观察单位的全体。(包括有限总体和无限 总体) 样本(sample):是从总体中随机抽取的部分 观察单位变量值的集合。样本的例数称为样本 含量(sample size)。 注意: 1。总体是相对的,总体的大小是根据研究目 的而确定的。 2。样本应有代表性,即应该随机抽样并有足 够的样本含量。
第二节 统计工作的基本步骤
医学统计工作可分为四个步骤: 统计设计、搜集资料、整理资料和分析资料。 这四个步骤密切联系,缺一不可,任何一个步骤 的缺陷和失误,都会影响统计结果的正确性。
一、统计设计
设计(design)是统计工作的第一步,也是关 键的一步,是对统计工作全过程的设想和计划 安排。 统计设计---就是根据研究目的确定试验因 素、受试对象和观察指标,并在现有的客观条 件下决定用什么方式和方法来获取原始资料, 并对原始资料如何进行整理,以及整理后的资 料应该计算什么统计指标和统计分析的预期结 果如何等。
参数(parameter):总体的统 计指标,如总体均数,采用希
抽取部分观察单位
总体
腊字母记为 μ。 其大小是客观 样本 存在的,然而往往是未知的。 统计量( statistic ):样本的统
μ?
推断
ቤተ መጻሕፍቲ ባይዱ
X
计指标,如样本均数,采用拉
丁字母分别记为 X 。统计量是
参数附近波动的随机变量 。
四、随机
随机(random):即机会均等。 1、抽样随机:总体中每一个个体有同等的机会被 抽到样本中来。 2、分组随机:每一个实验对象被分配到不同处 理组的机会相同。 3、实验顺序随机:每个实验对象先后接受处理 的机会相同。 随机≠随便
3、等级资料 等级资料(ranked data)亦称有序分类资料 (ordinal categorical data),是将观察单位 按属性的等级分组,清点各组的观察单位数,所 得的资料为等级资料。 如治疗结果分为治愈、显效、好转、无效四个 等级。
根据需要,各类变量可以互相转化。若按贫血 的诊断标准将血红蛋白分为四个等级:重度贫血、 中度贫血、轻度贫血、正常,可按等级资料处理。 有时亦可将定性资料或等级资料数量化,如将等 级资料的治疗结果赋以分值,分别用0、1、2… 等表示,则可按定量资料处理。 如调查某人群的尿糖的情况,以人为观察单位, 结果可分—、±、+、++、+++五个等级。
五、变量的分类
医学统计资料按研究指标的性质一般分为定量 资料、定性资料和等级资料三大类。 1、定量资料 定量资料(quantitative data) 亦称计 量资料(measurement data),是用定量的方 法测定观察单位(个体)某项指标数值的大小, 所得的资料称定量资料。如身高(㎝)、体重 (㎏)、脉搏(次/分)、血压(kPa)等为数 值变量,其组成的资料为定量资料。
由于统计图对数量的表达比较粗略, 不便作深入细致的分析,所以一般 在绘制统计图时,都应附有统计表。
• 统计表主要有表序、标题、标目、表体和线条等组成, 其基本格式如下:
表序 标题××××××××
纵标目…… 横标目 ┆ ┆ 合计 底线 合计 顶线 标目线 表体(数字) 合计线
一、制表的基本要求
六、抽样误差
抽样误差(sample error): 由于随机抽样所 引起的样本统计量与总体参数之间的差异以及 样本统计量之间的差别称为抽样误差。如样本 均数与总体均数之间的差别,样本率与总体率 的差别等。 注意:抽样误差是不可避免的。无论抽样抽得 多么好,也会存在抽样误差。
系统误差
七、概率与频率
医学统计中的基本概念与步骤 第一节 基本概念 第二节 医学统计的基本步骤
第一节 统计学中的几个基本概念 一、同质与变异
同质(homogeneity) 是指观察单位或研究个体间被 研究指标的主要影响因素相同或基本相同。如研究儿 童的生长发育,同性别、同年龄、同地区、同民族、 健康的儿童即为同质儿童。
第二节
统计图
• 统计图有多种,医学研究工作中常用的统计图 有: • 直条图、百分直条图、圆形图、线图、半对数 线图、直方图、散点图、箱式图和统计地图等。
1.根据资料性质和分析的目的,正确选择合适的图 型。 间断性资料: (1)直条图、箱式图——比较各个相互独立的 样本指标 。 (2)圆形图、百分直条图——表示各组成部分 或各构成部分的情况 。
二、常用统计图及其绘制方法
1. 直条图(bar graph) • 它是以等宽直条的长短来表示各指标的数值, 用来表示各相互独立指标之间的对比关系。直 条图有单式直条图、复式直条图两种。
3.汇总:分组后的资料要按照设计的要求进行汇总,整 理成统计表。原始资料较少时用手工汇总,当原始资 料较多时,可使用计算机汇总。
四、分析资料
分析资料(analysis of data) —— 是根据设计的要求, 对整理后的数据进行统计学分析,结合专业知识,作出科 学合理的解释。 1. 统计描述 (descriptive statistics) 将计算出的统计指 标与统计表、统计图相结合,全面描述资料的数量特征及 分布规律。 2.统计推断(inferential statistics) 使用样本信息 推断总体特征。通过样本统计量进行总体参数的估计和假 设检验,以达到了解总体的数量特征及其分布规律,才是 最终的研究目的。