医学统计学第1章绪论

合集下载

01医学统计学绪论

01医学统计学绪论

的风险,但一直无法证实。该项研究使用统计学方法确定
了服用叶酸组与对照组的差别不是简单偶然出现的,而是 归因于叶酸的作用。
Medical statistics
问题:

胃溃疡治疗新技术的研究结论为什么会出现错误?
为了证明服用叶酸的作用,应如何进行分组?
如何准确地估计两组出现神经管缺陷的发病率?

案例1:1962年美国医学学会杂志(JAMA)曾发表了一篇 关于胃溃疡治疗新技术的报告,该报告根据动物实验和24
名患者的临床试验结果得出结论,即将冷冻液导入胃中使
胃冷却可以缓解溃疡症状,之后这一研究成果在临床中被 广泛应用。后证实这种方法无效甚至有害。

案例2: 20世纪80年代早期,两项观察性研究结果提示孕 妇在怀孕期间补充维生素可以降低新生儿神经管缺陷(NTD)
Variable and data

定性数据:也称计数资料。变量的观测值是定性的 ,表现为互不相容的类别或属性。血型分为A、B、
O、AB等。

有序数据:也称半定量数据或等级资料。变量的观 测值是定性的,但各类别(属性)之间有程度或顺 序上的差别,如尿糖的化验结果分为-、+、++ 、+++。

统计分析方法的选用与数据类型有密切的关系。根

抽样误差(sampling error): 由于抽样而引起的
样本统计量与总体参数间的差异,在统计学上称为 抽样误差。

概率(probability):描述某事件发生可能性大
小的度量。事件A发生的概率可以写成 P (A),其
取值范围为 0 P(A) 1, P(A) 0 表示该事件不可
能发生, P(A) 1 表示该事件必然发生。

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学(PPT课件)绪论

医学统计学(PPT课件)绪论
国内1984年对《中华医学杂志》、《中华内科 杂志》、《中华外科杂志》、《中华妇产科杂志》 、《中华儿科杂志》595篇论文的调查结果,相对数 误用为11.2%,抽样方法误用15.9%,统计图表误用 11.7%。某研究者1996年对4586篇论文统计(中华 医学会系列杂志仅占6.9%),数据分析方法误用达 55.7%。
表1-1 120名正常成年男子红细胞计数值(1012/L)
5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84 4.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.20 4.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.21 4.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.05 4.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.97 4.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.22 4.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.53 4.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.51 4.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.77 4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。

医学统计学课件-绪论

医学统计学课件-绪论
– 偏倚:志愿参加研究者更关心自己的健康: 注意饮食及营养,禁烟酒、坚持体锻。
2019年9月15日
健康工人偏倚
化学物质接触与白血病发生的队列研究; 研究组:接触苯的工人,对照组:普通工人; 结果:两组发生白血病比例相似; 结论:接触苯与白血病发生无关
2019年9月15日
非同期对照偏倚
2019年9月15日
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
分类资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例

2019年9月15日
3. 误差 error
误差:实际观察值与客观真实值之差
2019年9月15日
2. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
编号 性别 体重 疗效 (ID) (X) (kg) (Z)
(Y)
张1
1
66
0
李2
1
78
1
王3
0
57
2




2019年9月15日
(1). 计量资料
研究监护室建立在心梗中作用; 研究组:2019-2000年监护室建立后死
亡率15%,对照组:2019-2019年监护 室建立前死亡率25%; 结果:建立监护室减少心梗死亡率。
2019年9月15日
(2)随机误差random error
排除上述误差后尚存的误差,受多种无法控制 的因素的影响。976年New Science 杂志关于科研舞弊 行为的调查

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

医学统计学第一章ppt课件

医学统计学第一章ppt课件

ppt课件.
16
+ 统计不是万能的:统计只能认识规律而不能“创造” 规律。 对统计结论的解释也要由专业知识解释
如:对出生性别比(103~107:100)的认识和解释
ppt课件.
17
+ 统计分析手段需要有正确的医学理论作指导,不 能将医学问题归结到纯粹的数量问题,否则会归 纳出错误的结论
如:在样本容量较大时,统计上有显著性和临床上 有实际价值有时候是两码事 实例:采用某种降压新药和传统药物治疗高血压 病人,各500 例,新药比传统药物平均多下降 0.5mmHg.
1. 使大家具备新的推理思维,学会从不确定性和概 率的角度去考虑问题
(借你一双慧眼!透过现象看清本质)
2. 学会结合专业问题合理设计试验,通过精细的试验 观察获得可靠、准确的资料
注:统计学的主要作用是体现在“统计研究设计”上
ppt课件.
14
3. 学会正确运用统计方法充分挖掘资料中隐含的信 息,并能恰如其分地作出理性概括,写成具有一 定学术水平的研究报告或科学论文。
ppt课件.
18
1.2 几个基本概念
1.2.1 同质
性质相同的事物称为同质的,否则称为异质 的或间杂的。
观察单位间的同质性是进行研究的前提
不同研究或同一研究中不同观察指标对观察对象的 同质性的要求不同,即同质是相对的。
如研究身高和红细胞数、血红蛋白等指标时,男女是异质的, 而在研究白细胞数指标时又是同质的。
+ 小概率原理是统计推断的一条重要原理
ppt课件.
34
ppt课件.
返回
35
Ronald A. Fisher(费歇尔,1890~1962),英国统计 学家和遗传学家,现代统计学的奠基人

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。

②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。

③、等级资料,⼜称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。

2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。

③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发⽣率。

⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。

⽤⼤写的P表⽰。

3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。

第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。

医学统计学PPT课件

医学统计学PPT课件
23.10.2023
46
统计设计可分为: (1)观察性研究设计 (2)实验性研究设计 ①实验设计 ②临床试验
23.10.2023
47
(1)观察性研究设计
是指研究者旨在客观地描述研究总体, 不对研究对象施加任何干预措施,其目的在 于了解某一事物的水平和分布现状。
如:某地某年某人群恶性肿瘤死亡率。
23.10.2023
- + ++ +++
人数
12 25 36 10
特点: ①无确切定量 ②分组有程度差别
23.10.2023
28
冠心灵与单纯西药 疗效对比
单纯西药 冠心灵
显效
9 19
有效
25 18
无效
6 5
合计
40 42
特点:①无确切定量 ②分组有程度差别
23.10.2023
29
资料的类型
计量资料
(数值变量或
定量资料)
23.10.2023
22
(1)计量资料 (定量资料或数值变量)
对每一观察对象用定量的方法,测定某 项指标所得的资料。其变量值是定量的,表 现为数值的大小,一般有度量衡单位。
①连续型计量资料(如身高、体重等) ②离散型计量资料
(如某医院每年的病死人数等)
23.10.2023
23
某年某地健康成人空腹血糖值(mmol/L)
者,整理后的资料
计数
按低血压、正常、高血压分
资料
组所得资料。
等级资料
23.10.2023
32
三、误差
1、误差:误差是指对事物某一特征的度量值 偏离真实值的部分,即实测值与真实值之差。 2、按其产生的原因和性质可分为
(1)随机误差 (2)非随机误差

医学统计学重点要点

医学统计学重点要点

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合.总体参数:刻画总体特征的指标,简称参数。

是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。

称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计.用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3。

资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料.是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

每个个体都能观察到一个观察指标的数值,有度量衡单位.(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容.多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析.第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2。

误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3。

实验设计的三个基本原则:对照原则、随机化分组原则、重复原则.4。

医学统计学知识点

医学统计学知识点

第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。

统计学通过对变异的研究来探索事物。

(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。

(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。

包括二分类、无序多分类。

(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、A B等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。

统计方法的选用与数据类型有密切的关系。

(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。

样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。

抽样,是从研究总体中随机抽取部分有代表性的观察单位。

参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差误差,指观测值与真实值、统计量与参数之间的差别。

可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。

随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。

抽样误差主要来源于个体的变异。

医学统计学-绪论

医学统计学-绪论

描述性统计 统计图表 统计推断 文字表达
一、研究设计(study design)
统计设计首先要考虑选用什么研究方法 调查研究(survey):对特定人群进行观察、分析比较,
从而找出事物变化的规律 按调查范围分为:全面调查、抽样调查、典型调查 设 计 方 案 包 括 6W1H ( What, Why , Whom, Who , When, Where, How)
统计推断:
参数估计:用样本统计量推断总体参数 如:总体均数的可信区间估计
假设检验(hypothesis testing 或significance test):用样 本统计量的差异来推断总体参数是否存在差异,即用样本 信息检验关于总体的两个对立假设 如:t检验(两个均数的比较):根据两个样本均数等信息 推测总体均数之间是否有差别 2 检验(两个率的比较):根据两个样本率的信息推测 总体均数之间是否有差别
调查设计的一般工作流程
确定研究题目 明确研究目的和意义 确定研究的主要指标 明确研究范围 确定研究方法 估计样本含量 调查表设计与资料收集方式 资料的整理与统计分析 调查的组织实施与质量控制
• 实验(试验)研究 (experiment study or trial): • 对研究对象随机分组(使各组间均衡可比)、施加
频率与概率间的关系:
1)样本频率总是围绕概率上下波动 2)样本含量n越大,波动幅度越小,频率越接近概 率
五、变量与随机变量
Variable and random variable
变量:研究对象的某个或某些特征或属性(研究指标或项目)
随机变量:变量的值是随机而获得的非确定值,随机取值的 变量就是随机变量
• 样本:
• 从总体中随机(random) 抽取一部分有代表性的个 体组成样本(sample),

医学统计学:第一章 绪论

医学统计学:第一章 绪论
通过计算各种统计指标和统计图表来描述 资料的集中趋势、离散趋势和分布特征况。
3.统计推断
是通过统计检验方法(如t检验、u检验、F检验、
卡方检验、秩和检验等)来推断两组或多组统计指标 的差异是抽样误差造成的还是有本质的差别。
4.相关与回归
医学中存在许多相互联系、相互制约的现象。如 儿童的身高与体重、胸围与肺活量、血糖与尿糖等, 都需要利用相关与回归来分析。
❖ 注意:抽样误差是不可避免的。无论抽样抽得多么好, 也会存在抽样误差。
五、概率
概率(probability):是描述随机事件发生可 能性大小的量值。用英文大写字母P来表示。 概率的取值范围在0~1之间。当P=0时,称为 不可能事件;当P=1时,称为必然事件。
小概率事件:统计学上一般把P≤0.05或 P≤0.01的事件称为小概率事件。
第一章 绪论
目录
第一节 医学统计学的定义和内容 第二节 统计工作的基本步骤 第三节 统计资料的类型 第四节 统计学中的几个基本概念
第一节 医学统计学的定义和内容
统计学(statistics)- 是搜集,整理,分
析资料,并作出决策的一门学科。
医学统计学(medical statistics)-是
如同质的儿童身高、体重、血压、脉搏等指标会 有一定的差别。
二、总体与样本
总体(population):根据研究目的确定的同质观
察单位某项变量值的集合或全体。 无限总体(infinite population) 有限总体(finite population)
样本(sample):从总体中随机抽出的部分观察单
统计推断(inferential statistics)
使用样本信息推断总体特征。通过样本统计 量进行总体参数的估计和假设检验,以达到了 解总体的数量特征及其分布规律,才是最终的 研究目的。

医学统计学 第一章 绪论

医学统计学 第一章  绪论

第一章绪论第一节医学统计学的地位和作用当人们研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?最基本的方法就是比较。

通常将患者以随机的方式分成两个组,一组服用该新药,另一组服用对照药物,观测并记录两种药物的疗效,最后统计分析该新药的有效性和安全性,这就是一个常见的临床试验。

其中,统计学扮演什么角色?在这个临床试验中有诸多问题需要回答:需要多少名患者参加试验?如何随机地将患者分为两个组?哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应?应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制临床试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别?换言之,我们需要了解这种差别是机会造成的,还是真实存在的?统计学可以回答上述问题。

我们再看另一种情形,假定为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。

那么,如何在这个城市选取这一部分个体?因为只有这部分个体能够很好地代表整个城市人群,用这种部分推论全体的做法才是准确的。

此外,需要选取多少人进行调查?如何保证收集到的资料是准确和可靠的,又如何评价这种准确性和可靠性?几百人的血压值(如收缩压值)各不相同,看上去是一堆“杂乱无章”的数据,如何描述高血压病的患病状况,如何才能推论到整个城市人群?我们对于这种推论的正确性抱有多大的信心?统计学也可以回答上述问题。

每个人的血压都不一样,每个高血压病患者对同一种药物治疗的反应也存在着差别,这就是所谓的个体差异和不确定性。

个体差异是自然界普遍存在的现象,个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。

在统计学中,我们将这种差异称为变异(variation)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:瓶中有50片药,其中3片次品
一次取一片,取得次品的概率: 3/50=0.06 一次取5片, 5片中有2片是次品的概率:
CC C
3 5 50
2
3 47

9 0.023 362
三、概率的运算
1.加法定理
⑴互斥事件的加法定理 若事件A与B互斥,则P(A+B)=P(A)+P(B)。 证明:设试验的全部结果包含n个基本事件,而事件A 包含其中m1个基本事件,事件B包含其中m2个基本事件。 由于A与B互斥,故A+B包含的基本事件数为m1+m2,按 古典定义有P(A+B)=m1/n+m2/n=P(A)+P(B). 若n个事件互斥,则P(A1+A2+┄+An) =P(A1)+ P(A2)+ ┄+P(An) 若n个事件构成互斥完备群,则
(二)按统计学方法的层次划分
1. 基本统计方法
绪论(一章) 统计图表(二章) 定量资料的统计描述(三章) 定性资料的统计描述(四章) 参数估计(五章) 假设检验的基本概念 (六章)
两组样本均值比较的t检验(七章) 多组样本均值比较的方差分析(八章) 定性资料的统计推断 (九章) 非参数检验 (十章) 两变量间直线相关与回归分析(十一章) 实验设计(十二章) 调查设计(十三章) 样本含量的估计 (十八章) 生命统计的常用指标(二十章)
随访时间资料的生存分析(十六章) 判别分析——观察对象的分类分析(十六章) 重复测量定量资料均数间的比较(八章) Meta分析(第十九章)
第二节
统计学中的几个基本概念
观察单位(observed
unit)
根据研究目的所确定的卫生统计学研 究对象中的基本研究单位,可以是一个人 一头动物,一群人(如一个县,一个乡, 一个村,一所学校,一个家庭等);可 以是一个器官,一个细胞,一个采样点等
Hale Waihona Puke 附:事件与概率一、随机事件及其运算
1. 随机事件 必然现象:确定性现象 随机现象:不确定性现象,也称偶然现象 随机试验:对随机现象的观察 特征:⑴在相同条件下可重复进行;⑵各次试 验结果可不同,不能预先判断;⑶预先可明确所
有可能的结果,每次试验各结果必居其一。 随机事件:随机试验观察的结果,可能出现也可能 不可能出现的事件。 必然事件:Ω 不可能事件:Ф



无论是统计设计、资料收集、数据整理、 统计分析,只要某一个环节存在缺陷就有可 能导致整个研究的失败! 卫生统计学在卫生及其相关领域研究中 的地位举足轻重,是卫生工作者从事科学研 究必须掌握的一门基本技能。
第二节
卫生统计学的定义和内容
一、卫生统计学的定义
统计学的根本任务是揭露隐藏在偶 然现象背后的规律性,是认识世界 的重要工具。
3.整理资料
净化原始数据,使其系统化、条理化 统计表与统计图(第二章) 频数与频数分布(第三章第一节) 常用相对数(第四章第一节) 统计软件
4.分析资料
统计分析
统计描述 (二、三、四章) 参数估计 统计推断
(五、十一、十四、 十章、十六)
假设检验
(六、七、八、九、十、 十一、十四、十五、十 六章)
统计描述:统计表与统计图,数值变量的统计 描述,分类变量的统计描述,参考值范围 参数估计:总体均数的估计,总体率的估计, 回归模型参数的估计,总体相关系数的估计 假设检验 :两组数值变量或等级资料平均值 的比较,多组数值变量或等级资料平均值的 比较,分类变量的率或构成比的比较,回归 方程的假设检验,相关系数的假设检验,重 复测量设计资料均数间的比较
中国出生性别比(国际1.02~1.07:1): 82:1.085:1;90:1.118:1; 95:1.166:1;02:1.301:1; 已有两女孩家庭下一孩子性别比: 3.342:1
第 二 节 卫 生 统 计 学 的 定 义 和 内 容
卫生统计学 一门运用统
计学尤其是数理统计学的原
理和方法,研究医学科研及
同质和变异
当一批观察单位的主要条件(对 研究指标有影响的主要因素)相同时 称该批观察单位同质。同质基础上观 察单位间的差异称为变异。变异是由 不可控制的因素产生。
总体与样本
总体( population )根据研究目的所确定 的同质观察单位(某项特征观测值) 的集合。总体分有限总体和无限总体 样本( sample )从总体所对应的全部观察 单位中随机抽取的部分观察单位(某 项特征观测值)的集合。
A
i 1
i
举例:两个开关K1和K2并联后接入电路,设A={电路接通}, A1={K1闭合},A2={K2闭合},则 A= A1+ A2
⑷交事件:若事件C={A与B同时发生},则称C为A、B 两事件的交事件,记作C=AB。n个事件的交事件A记为: A=A1A2„An 例:两个开关K1和K2串联后接入电路,设A={电路接 通}, A1={K1闭合},A2={K2闭合},则 A= A1A2 ⑸互不相容事件:事件A与B不能同时发生,称A与B为 互不相容事件,也称互斥事件,记作AB=Ф。n个事件 互斥,是指它们两两互斥。 互斥完备群:若n个互斥事件的并事件是必然事件, 即 ,则称这n个事件构成 互斥完备群。 A A (1 i j n), 且 A
1.研究设计
包括资料收集、整理和分析全过程总 的设想和安排
实验设计(第十二章) 调查设计(第十三章)
2.收集资料
资料的三个来源: ①统计报表:法定传染病报表、职 业病报表、医院工作报表 ②经常性工作记录:卫生监测记录、 健康检查记录、门诊病历、住院病历 ③专题调查或实验: 实验设计(第十二章) 调查设计(第十三章)
卫生工作中有关科研的统计 设计,数据的收集、整理、
分析的科学。
第 二 节 医 学 统 计 学 的 定 义 和 内 容
二、卫生统计学的主要内容
(一)按卫生统计工作的 基本步骤划分:
统计设计 (statistical design) 搜集资料(co11ection of data) 整理资料(sorting data) 分析资料(analysis of data)
样本中所包含的观察单位的个数称为样 本含量(sample size) 随机抽样是指按随机原则从总体中获 取样本,(等概率抽样)总体中的每个个 体都有同等机会被抽取。
参数和统计量
参数 总体的指标称为参数,是指根据总体个
体值按有关统计公式计算出来的描述总 体特征量的统计指标。 统计量 根据样本数据按有关统计公式计算出 的用来描述样本的统计指标。 由样本信息来推断总体特征的方法 叫做抽样研究。
历史上许多科学家都做过投硬币实验: 次数n 正面朝上的次数nH 德.摩根 2048 1061 蒲丰 4040 2048 K.皮尔逊 12000 6019 K.皮尔逊 24000 12012
频率f 0.5181 0.5064 0.5016 0.5005
⑵概率的古典定义 一个随机试验,有n种 等可能的结果数,其中有利于事件A发生的 结果数为m,则事件A发生的概率等于m/n。
等级。血清反应:― 、±、+
各类别间无程度差别。
各类之间有程度差别,又称等级资料
各类变量之间的转化
定量资料
分类资料
等级资料
分正常、偏低两类
Hb (g/l)
贫血程度:重度、中度、 轻度、正常
二分类资料赋值:0、1 等级资料赋值:0、1、2、3、…… 非等级资料,禁止赋值:0、1、2、3、……
频率和概率
2. 高级统计方法
多因素对某定量指标 的影响分析——多重线 性回归 (十四章) 多因素对某定性指标 的影响分析—— Logistic回归 (十五 章)
糖尿病人的血清总胆固 醇X1、甘油三脂X2、空 腹胰岛素X3、糖化血红 蛋白X4与空腹血糖测量 值Y的关系
研究吸烟、饮酒 与食道癌关系的 病例-对照研究
n i j i=1 i
例:治疗某患者的结果,{痊愈}、{显效}、{微 效}、{无效}4事件构成互斥完备群。 ⑹对立事件: A与B不能同时发生,也不能同时不 发生,即: A+B=Ω且AB=Φ,称事件A与B对立, 记作
A B, 或A B( A为A的对立事件)
例:治疗某患者的结果, {有效}、{无效}2事件 构成对立事件。 对任一事件A,有: AA , A+ A , A A
现代实用卫生统计学
第一章 绪论
卫生统计学的作用和地位
卫生统计学的定义和内容
统计学中的几个基本概念
第一节 卫生统计学的作用和地位
案例:某疾控中心开展了一项研究,以了解当地肺 癌的患病情况,从10万人口中随机抽取2000人进 行调查,调查内容包括流行病学资料和临床实验室 检查资料。其中男性1100人,患肺癌者6人,女性 900人,患肺癌者3人。由此,研究者计算得出,男 性肺癌发病率为0.55%,女性肺癌发病率为0.33%, 并认为男性肺癌的发病率高于女性。 ①该研究者所选择的统计指标正确吗?应选用患病 率 ② “男性肺癌的发病率高于女性”的结论是否可 靠? 存在抽样误差,不能仅根据数据的大小直接下结论。
频率 将随机试验重复n次,n次试验中 随机事件 A 共发生 m 次,则 n/m 表示随 机事件A发生的频率。
频率和概率
概率 是描述随机事件发生的可能性大小,用P表示,
0 p 1
⑴概率的统计定义 当试验次数n趋向于 无穷的大时,频率m/n的极限值即为概率, m 即 。 P lim
n
n
0≤P≤1, 当P=0时称为不可能事件, 当P=1时称为必然事件。
概率推断 是按一定的概率用样本信息 推断总体的特征。即统计推断含有一定 概率。
小概率事件:P<0.05或P<0.01, 小概率事件原理:即小概率事件在一次 抽样中一般认为不会发生。
相关文档
最新文档