统计学(第一章) 绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
质或类别得到的数据,例如,职业、性别等 征的大小得到的数据。有 度量衡单位。
分类变量 包括:无序分类变量:多分类变量(血型) 连续型变量:如,血压、身高、体重等。
离散型变量:如,一月中的手术病人数,
有序分类变量:疗效(好、中、差) 一年里的新生儿数等。
二分类变量(性别)
二、统计学的若干概念
变量的类型
卫生统计学
王秀琴
工作生活中常见的统计学问题
如何判断药物的疗效?(假设检验) 体育彩票能否中奖?(概率论) 子女为什么象父母,其强度有多大? (相关与回归)
第一章
绪论
一、学习卫生统计学的意义
概念
统计学:是关于数据的收集、整理、分析、解释和表述的科学。
数理统计学
应用统计学
卫生统计学:是数理统计学的基本原理和方法在医学 领域中的应用,是关于医学研究中资料的收集、整理、分 析、解释和表述的一门科学。
抽样误差
由于抽样原因 造成的样本指标与 总体指标之间的差 别。
特点:可避免,不可 估计其大小。
特点:不可避免,不 可估计其大小。
特点:不可避免,
但可用统计学方
法估计其大小。
二、统计学的若干概念
频率与概率
频率和概率均表示随机事件发生可能性的大小, 记作P,p 。
扔硬币实验
实 验者 德 .摩 根 蒲丰 K.皮 尔 逊 K.皮 尔 逊 n 2048 4040 12000 24000 m正 1061 2048 6019 12012 f n( 正 ) 0.5181 0.5069 0.5016 0.5005
二、统计学的若干概念
同质与变异
例:研究某地2005年活产婴儿的出生体重。
同质性: 研究对象具有相同的状况或属性等共性。 变异:同一总体内的同质的各观察单位其某变量值之间的差异。
例如:研究某新药治疗胃溃疡的效果?
二、统计学的若干概念
总体与样本
总体:根据研究目的确定的同质观察单位的全体。
如:欲研究2009年厦门市成年人高血压患病率情况 。 • 根据总体中观察单位数是否已知,分为: 有限总体: 有确定的时间、空间和有限个观察单位。
计量资料 计数资料 总体 个体
练习:
1.在研究工作中 随机测量 误差是不可避免的, 系统 误差是可以而且应该避免的,统计方法能 处理的是 误差。 抽样
2.统计工作的四个步骤 收集资料 ,整理资料 , 分析资料 。 是: 设计 ,
练习:
某年级甲班、乙班各有50人。从 两个班各抽取10人测量身高,并求其 平均身高,如果甲班的平均身高高于 乙班,能否推论甲班所有同学的平均
无限总体:没有确定的时间、空间限制,观察单位数为无限。
二、统计学的若干概念
总体与样本
为了保证样本的可靠性和代 表性,需要采用随机的抽样方 法(在总体中每个个体具有相 同的机会被抽到)。
总体
抽取部分观察单位 样本
总体与样本的关系
μ?
统计推断
X
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
一、学习卫生统计学的意义 • 例1.1 ★资料分析表明在全球范围内人类的乳腺癌、男
性生殖系统癌症有明显上升的趋势,同时,男性
的精子数量和浓度有明显减少的倾向。
• 有学者提出了“环境激素”学说,即 人类越来越多的暴露于环境中有人体 激素样作用、对人体内分泌起干扰作
用的化学污染物质。
一、学习卫生统计学的意义
变量转化:变量只能由高级向低级转化: 连续型 有序 分类 二分类
离散型变量常常通过适当的变换或连续性校
正后借用连续型变量或有序变量的方法来分析。
二、统计学的若干概念
变量的类型
例:一组2040岁成年人的血压(舒张压) <8 低血压 正常血压
等 级 资 料
8
计量资料
12
15 17
轻度高血压
中度高血压 重度高血压
第2步
收集资料
第3步
整理资料
第4步
分析资料
练习
练习:
1.统计学中所说的有代表性的样 本指的是( ) E
随意抽取的总体中任意个体 有意识地选择总体中有典型个体 依照研究者要求选取总体中有意义的个体 最方便获取的部分个体 依照随机原则抽取总体中的个体
A. B. C. D. E.
练习:
2.下列变量的观测结果属于等级 资料的是( D )
由于抽样原因造成的样本指标与总体指标之间的 差别,可以通过增大样本使其减小。 特点:不可避免,但可用统计学方法估计其大小。
二、统计学的若干概念
系统误差
指数据搜集和测量过程 中由于仪器不准确、标准 不规范等原因,造成观察 结果呈倾向性的偏大或偏 小。
随机测量误差
在消除了系统误差的 前提下,由于非人为的 偶然因素,对于同一样 本多次测定结果不完全 一样,结果有时偏大有 时偏小,没有倾向性。
白细胞计数 住院天数 门诊就诊人数 患者病情分级 各临床科室的患者数
A. B. C. D.
E.
练习: 3.抽样的目的是(
A. B.
B
)
C.
D. E.
研究样本统计量 由样本统计量推断总体参数 研究典型案例 研究总体统计量 研究特殊个体特征
练习:
4.关于随机抽样,下列哪一项说法 是正确的( A )
A.
事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过
研究发现危险因素是反应停)。
一、学习卫生统计学的意义
例1.3: 某地1986年120名8岁男孩身高均数为
=123.02cm ,标准差为=4.79cm,试估计该地
8岁男孩身高在130cm以上者占该地8岁男孩总
数的百分比?
一、学习卫生统计学的意义
例1.4 某医师研究用兰芩口服液与银黄口服液治
特点:可避免,不可估计其大小。
二、统计学的若干概念
误差 随机测量误差:
在消除了系统误差的前提下,由于非人为的偶然因素, 对于同一样本多次测定结果不完全一样,结果有时偏大有 时偏小,没有倾向性,这种误差叫随机测量误差。
特点:不可避免,不可估计其大小。
二、统计学的若干概念
来自百度文库误差 抽样误差:
总体
抽取部分观察单位 样本
计量资料 计数资料 等级资料 经变量转换也可以作为计量资料
A. B.
C.
D.
练习:
6、下面的变量中,属于分类变量 的是( B )
A.脉搏 B. 血型 C.肺活量 D.红细胞计数 E.血压
练习: 7、某人记录了50名病人体重的测定结果:小于
50Kg的13人,介于50Kg和70 Kg间的20人, 大于70 Kg的17人 ,此种资料属于( C )
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
征就称为变量。被观察单位的该项特征值为变量值。
二、统计学的若干概念
变量的类型
数值变量
◆ 数值变量: ◆分类变量:
通过确定每个观察单位的某项特征的性 通过测定每个观察单位的某项特
身高高于乙班?为什么?
如:某药治疗200个病人,其治愈率为80% 。
二、统计学的若干概念
频率与概率
Certain
1
必然事件 随机事件 不可能事件
P = 1
0 < P < 1 0.5
P = 0
Impossible
0
统计分析中的很多结论都是带有概率性的。 习惯 上将 P≤0.05或P ≤ 0.01 ,称为小概率事件,表示在 一次实验或观察中该事件发生的可能性很小,可以视为 很可能不发生。
二、统计学的若干概念
参数与统计量
参数:是统计模型的特征指标,是对总体而言,其
大小是客观存在的,然而往往是未知的,如总体均
数和总体方差;
统计量:由观察资料计算出来的量,如计算观察样
本中的个体得到的样本均数,样本方差。
二、统计学的若干概念
参数与统计量
抽样研究
总体
描述和统计推断
样本
μ σ
参数
X
Ѕ
统计量
三、统计工作的步骤
第 1步
设
计
制定计划,对整个过程进行安排。是整个工作 的关键。如何进行设计?举例。背景-目的-方 法-内容-经费预算 根据计划取得可靠、完整的资料。收集资料的 方法有三种:统计报表、日常性工作、专题调 查。注重资料的真实性。 原始资料的整理、清理、核实、查对,使其条 理化、系统化便于计算和分析。可借助于计算 机(常用软件:EPI、SPSS、SAS)。 统计学的关键所在。运用统计学的基本原理和 方法,分析计算有关的指标和数据,揭示事物 内部的规律。包括统计描述和统计推断。
表 两种药物治疗高甘油三脂血症的疗效 表 10-4 两种药物治疗高甘油三脂血症的疗效 人数 秩次范 平均秩 疗效 按摩乐口服 山楂精降脂 按摩乐口 围 次 合计 液 片 液 (1) (2) (3) (4) (5) (6) (7)=(2 无效 17 70 87 1-87 44 748 有效 25 13 38 88-125 106.5 2662 126- 显效 27 37 64 157.5 4252 189 合计 69 120 189 766
A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E. 名义变量资料
练习:
8、下面的变量中,属于数值变量 的是( B )
A.性别 B.体重 C.血型 D.职业 E.民族
练习:
9、调查某单位科研人员论文发表的情况, 统计每人每年的论文发表数应属于 ( A )
A. B. C. D.
疗慢性咽炎疗效有无差别,将病情相似的80名患
者随机分成两组,分别用两种药物治疗。
药物 疗效 合计
有效
兰芩口服液 银黄口服液 合计 41 24 65
无效
4 11 15 45 35 80
问题:这两种药物的疗效是否相同?
一、学习卫生统计学的意义
例1.5 某研究者欲评价新药按摩乐口服液治疗高 甘油三脂血症的疗效,将高甘油三脂血症患者 189 例随机分为两组,分别用按摩乐口服液和山楂精降 脂片治疗,数据见表10-4,问两种药物治疗高甘油 三脂血症的疗效有无不同?
样本:是指总体中的一部分观察单位的某项变量 值的集合,必须对总体具有代表性。
如:欲调查某地2005年活产婴儿的出生体重 欲研究某药治疗胃溃疡的效果
二、统计学的若干概念
误差
泛指测量值与真值之差.
包括: 系统误差
随机测量误差
抽样误差
二、统计学的若干概念
误差 系统误差: 指数据搜集和测量过程中 由于仪器不准确、标准不规范 等原因,造成观察结果呈倾向 性的偏大或偏小,这种误差称 为系统误差。
计数资料
以12kPa(90mmHg)为界分为正常与
异常两组,统计每组例数。
二、统计学的若干概念
变量的类型
资料类型
数值变量 无序分类变量 分类变量 有序分类变量 等级资料 计量资料 计数资料
二、统计学的若干概念
统计资料类型:
资料类型
计量资料
变量类型 示例
数值变量 人体身高 170cm 168cm 171cm 无序分类 性别 变量 男 女 有序分类 治疗效果 变量 痊愈 好转 无效
B.
C. D.
E.
抽样时应使得总体中的每一个个体都有同 等的机会被抽取 研究者在抽样时应精心挑选个体,以使样 本更能代表总体 随机抽样即随意抽取个体 为确保样本具有很好的代表性,样本量应 越大越好 选择符合研究者意愿的样本
练习:
5、对某地200名16岁中学生口腔 检查,发现龋齿的人数54人, 该资料属于( B )
二、统计学的若干概念
观察单位与变量 变量的类型
同质与变异 总体与样本 误差 概率与频率
二、统计学的若干概念
观察单位与变量
例:欲观察某地2000年7岁正常儿童的身高。 观察单位:某地2000年每个7岁正常儿童
被观察或测量对象的最基本单位,也称个体,可以是一
个人、一个动物或一个采样点等。 变量:身高 对每个观察单位的某项特征进行测量或观察,该项特
统计指标
平均数, 标准差
统计分析方法
t,Z,F,直线相 关与回归
计数资料
率,比, 构成比
卡方检验,Z 检验
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
等级资料
构成比
秩和检验
• 例1.1
北京大学一个课题组欲研究人们经常食用的 一种食品是否含有雌激素,是否对小鼠有 雌激素作用。
统计学设计: 1.需要多少大鼠?2.如何分组? 3.如何设立对照?4.是否使用盲法? 5.选用何种指标表示雌激素作用?
6.选用何种统计方法?
一、学习卫生统计学的意义
• 例1.2 :
★ 德国(1960年代初),药物酞胺哌啶酮(又称反应停)