01_1 统计绪论
01医学统计学绪论
的风险,但一直无法证实。该项研究使用统计学方法确定
了服用叶酸组与对照组的差别不是简单偶然出现的,而是 归因于叶酸的作用。
Medical statistics
问题:
胃溃疡治疗新技术的研究结论为什么会出现错误?
为了证明服用叶酸的作用,应如何进行分组?
如何准确地估计两组出现神经管缺陷的发病率?
案例1:1962年美国医学学会杂志(JAMA)曾发表了一篇 关于胃溃疡治疗新技术的报告,该报告根据动物实验和24
名患者的临床试验结果得出结论,即将冷冻液导入胃中使
胃冷却可以缓解溃疡症状,之后这一研究成果在临床中被 广泛应用。后证实这种方法无效甚至有害。
案例2: 20世纪80年代早期,两项观察性研究结果提示孕 妇在怀孕期间补充维生素可以降低新生儿神经管缺陷(NTD)
Variable and data
定性数据:也称计数资料。变量的观测值是定性的 ,表现为互不相容的类别或属性。血型分为A、B、
O、AB等。
有序数据:也称半定量数据或等级资料。变量的观 测值是定性的,但各类别(属性)之间有程度或顺 序上的差别,如尿糖的化验结果分为-、+、++ 、+++。
统计分析方法的选用与数据类型有密切的关系。根
抽样误差(sampling error): 由于抽样而引起的
样本统计量与总体参数间的差异,在统计学上称为 抽样误差。
概率(probability):描述某事件发生可能性大
小的度量。事件A发生的概率可以写成 P (A),其
取值范围为 0 P(A) 1, P(A) 0 表示该事件不可
能发生, P(A) 1 表示该事件必然发生。
统计学原理绪论PPT课件
人数(人) 112 51 9 10 2 16
比例 0.560 0.255 0.045 0.050 0.010 0.080
频率(%) 56.0 25.5 4.5 5.0 1.0 8.0
(三 )综合指标法
▪ 案例:恩格尔系数 ▪ 什么是恩格尔系数?
恩格尔系数(%)= 食品支出总额 /家庭或个人 消费支出总额×100%
▪ 表达含义:国际上常常用恩格尔系数来衡量一个 国家和地区人民生活水平的状况。
▪ 标准:恩格尔系数在60%以上为绝对贫困,50%60%为温饱(勉强度日),40%-50%为小康,30 %-40%为富裕,低于30%为最富裕。
年份 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
统计是以数据为食物的动物 统计的本业是消化数据,并产生有营养 的结果。它的本质,和母牛相差不多。
Grass——Cow——Milk Data—— Statistics ——Information
统计数据海洋里的沧海一粟
◆2015年,河南省人均生产总值的全国排名第22 ◆2015年,我国新生婴儿性别比113.51:100 ◆2015年,中国的基尼系数为0.462 ◆2015年,中国的城镇化率为56.1% ◆超重25%和35%的肥胖症者的死亡率比正常人高28%和50% ◆社会上20%的人占有80%的社会财富 ◆2016里约奥运会奖牌榜
阿道夫·凯特勒 (A.Quetelet,1796-1874)
第一个把数学中的概率论引入社会经济现象的统计研 究中,有数理统计学派的奠定人、 “统计学之父”之称。
2. 社会统计学派
18-19世纪资本主义德国
恩格尔(1821—1886): 《恩格尔定律》
第一章统计学绪论研39页PPT
2019/9/21
绪论
流行病与卫生统计学教研室 37
【问题4.1】 该研究存在什么缺陷? 研究结果是否可靠?
【问题4.2】 该研究者所选择的统计指标正确吗? 该研究的结论是否可靠?
2019/9/21
绪论
流行病与卫生统计学教研室 38
谢谢
2019/9/21
绪论
流行病与卫生统计学教研室 13
• 设计:指制定周密的研究计划,包括资 料收集、整理和分析全过程总的设想和 安排,可分为实验设计和调查设计
2019/9/21
绪论
流行病与卫生统计学教研室 14
• 收集资料:取得真实、可靠的原始数据
资料来源: 1.统计报表 2.日常工作记录 3.专题调查或实验
2019/9/21
绪论
流行病与卫生统计学教研室 27
四、统计资料的类型
• 资料(data):变量值的集合 • 根据不同的角度,资料可以划分为不同类型
定量资料
二项分类
资料
无序分类
定性资料
多项分类
有序分类
2019/9/21
绪论
流行病与卫生统计学教研室 28
定量资料(quantitative data)
2019/9/21
绪论
流行病与卫生统计学教研室 26
① 若P(A)=0,则称A事件为不可能事件 ② 若P(A)=1,则称A事件为必然事件 ③ 若0<P(A)<1,则称A事件为随机事件 ④ 若P(A)≤0.05,则称A事件为小概率事件,表示在
一次实验或观察中该事件发生的可能性很小,可 以视为很可能不发生
有限总体(Finite Population):个体数有限,常有 特定时间、空间范围的限制
-《统计学》第1章绪论
敦的出生率、死亡率、性别比和人口发展趋势,作了分类计 算和预测,证明瘟疫对当时的伦敦没有根本的威胁。
政治算术学派被认为是无统计学之名而有 统计学之实。
第6页,共67页。
(二)、“国势学派”的简介:
数学与统计学院
统计学 第一章
第1页,共67页。
参考教材:
《新编统计学教程》,袁卫等编著,中国人民大学出版社 《统计学原理》,黄良文等编,中国统计出版社 《统计学》,陈珍珍主编,厦门大学出版社 《统计学原理》,李洁明等编著, 复旦大学出版社
第2页,共67页。
第一章 绪 论
§1 统计学的产生和发展 §2 统计学的性质和特点 §3 统计工作的基本任务和统计工作过程 §4 统计学中的几个基本概念
第34页,共67页。
描述统计与推断统计的关系
概率论
(包括分布理论、大数定律 和中心极限定理等)
反映客 观现象 的数据
样本数据
描述统计
(统计数据的搜集、整理、
显示和分析等)
总体数据
推断统计
(利用样本信息和概率 论对总体的数量特征进
行估计和检验等)
总体内在的 数量规律性
第35页,共67页。
理论统计与应用统计
第15页,共67页。
• 2008 蔡天文 (T. Tony Cai )宾州大学 (86年杭州大学( 现浙江大学)数学系 本科,温州市有名的“博士之家
”,是蔡笑晚的的老大 )
• 2012 寇星昌 (Samuel Kou )哈佛大学 (北大计算数学 系本科97届毕业, 2008年[33岁]被评为哈佛大学终身教
统计学第1章绪论
1.2.2统计学的研究对象
统计学研究社会经济现象总体的数量方面 研究的是反映总体特征的数据 提供一套用于所有科学领域的获取数据、分 析数据并从数据中得出结论的原则和方法 统计更重要的功能是分析数据
统计学是关于数据的科学
1.2.3统计学研究对象的特点
数量性 :研究社会现象的数量方面 具体性 :社会现象的数量方面是客观存在的 广泛性 :任何领域都用到 总体性 :数量方面是说明整体特征的
变量
变量: 可变的标志。变量有变量名和变量值。如年龄、 企业产值、工资收入等 1)变量按取值的不同分为离散变量和连续变量 2)变量按性质的不同分为确定性变量和随机性变 量 3)变量按形式分为定量变量和定性变量
离散变量和连续变量
离散变量:只取整数值,如产品数、出生人口数、企业数等,取 值是分散的 连续变量:可取任意值,如面积、容积、成本、产值等,取值是 连续的
指标
指标: 说明总体综合特征的数据资料 指标有指标名称、指标值、计量单位、时间特征、空间范围等五 个构成要素
指标的种类
1.指标按计量单位的不同分为实物指标和价值指标 电视机的产量和电视机的产值
2.指标按说明的内容的不同分为数量指标和质量指标 企业的利润总量和人均利润
3.指标按时间特性分为时期指标和时点指标 某银行的个人储蓄存款余额和发放的贷款额
统计作为认识工具和管理工具
2010年上海世博会 1.2010年4月30日晚8:10分开幕 2.园区面积5.28平方公里 3.5.1—10.31日,历时184天 4.平均每天参观人数40万,总数7000万人次 5.平均每天演出100场 6.主题馆有世界最大单体太阳能屋面,每年可减少 二氧化碳排放量约2800吨
统计作为认识工具和管理工具
统计学第一章绪论
统计学第一章绪论第一章绪论在科学知识和信息技术快速发展的今天,统计学已经越来越广泛地应用于国家管理、社会经济管理、自然科学以及我们日常工作、学习和生活的各个方面。
那么什么是“统计”?什么是“统计学”?这是学习《统计学》首先应认识的问题。
在本章中,我们将主要介绍统计、统计学的含义,统计学的研究方法、统计数据的种类以及统计学中的一些基本概念。
第一节统计与统计学一、统计和统计学的涵义在日常的工作和生活中,我们经常提到“统计” 一词。
“统计” 一词一般说来包含三种涵义,即:统计工作、统计资料和统计学。
统计工作是指搜集、整理、分析、展示和编制统计数据资料的实践工作。
统计资料是通过统计工作所取得的各项数字和有关情况的资料,用以反映客观事物的规模、水平、发展速度等多方面特征,它是我们进行社会经济管理和科学研究的重要依据,统计资料是统计工作的成果。
随着统计方法在各个领域的应用,统计学已成为具有多个分支学科的大家族。
因此要给统计学下一个普遍接受的定义是十分困难的。
统计学家们从不同的角度给出不同的定义,主要有:①统计学是作为指导统计工作科学运行的理论研究的学科;②统计学是对事物从数量的规律性进行分析的方法论科学;③统计学是研究社会现象特别是经济现象数量方面的科学。
我们认为,统计学是一门关于搜集、整理、分析统计数据的科学。
统计数据的搜集是取得数据的过程,它是进行统计分析的基础,离开了统计数据,统计资料的整理和统计分析就无从谈起,所以,如何取得所需的数据是统计学的研究内容之一。
统计数据的整理是对统计数据加工处理的过程,目的是使统计数据系统化、条理化,符合统计分析的需要。
统计数据的整理是介于数据搜集与数据分析之间的一个必要的环节。
统计数据的分析是统计学的核心内容,它是通过统计方法认识和分析客观事物的规模、水平、内部比例关系、发展变化规律等特征的过程。
可见,统计学是一门关于统计数据的科学。
统计资料是统计工作的成果,统计资料和统计学是理论和实践的关系,统计学起源并发展于统计实践活动,是对统计活动的经验总结和理论的概括,同时又用于指导统计实践工作。
统计学第一章PPT
世纪初至今) (三)统计学的现代期(20世纪初至今) 统计学的现代期( 世纪初至今 现代期 统计学的主流从描述统计学转向推断统计学. 统计学的主流从描述统计学转向推断统计学.20 转向推断统计学 世纪30年代 年代R费希尔的推断统计理论标志着现代数 世纪 年代 费希尔的推断统计理论标志着现代数 理统计学的确立. 理统计学的确立. 60年代以后统计学发展有三个明显的趋势: 年代以后统计学发展有三个明显的趋势: 年代以后统计学发展有三个明显的趋势 1统计学依赖和吸收数学更多; 统计学依赖和吸收数学更多; 统计学依赖和吸收数学更多 2以统计学为基础的边缘学科不断形成; 以统计学为基础的边缘学科不断形成; 以统计学为基础的边缘学科不断形成 3与电子计算机技术相结合,应用范围更广,作用更大. 与电子计算机技术相结合,应用范围更广,作用更大. 与电子计算机技术相结合
总体单位:组成总体的各个事物(或元素),是 总体单位:组成总体的各个事物(或元素),是 ), 各项统计数字的原始承担者. 各项统计数字的原始承担者.
2,标志 , 标志 总体单位的属性,特征的名称. 总体单位的属性,特征的名称. 品质标志: 品质标志:用文字表示属性 分类 数量标志: 数量标志:用数字表示特征 不变标志: 不变标志:各单位具体表现 相同 可变标志: 可变标志:各单位具体表现 不同
2,政治算术学派 , 代表人物:英国的威廉 配第 约翰格朗特等 配第, 格朗特等. 代表人物:英国的威廉配第,约翰 格朗特等. 威廉配第的代表著《政治算术》对当时的英,荷, 威廉 配第的代表著《政治算术》对当时的英, 配第的代表著 法等国的实力进行了数量的计算和比较; 法等国的实力进行了数量的计算和比较;格朗特写出 第一本关于人口统计的著作 他们开创了从数量方 的著作. 了第一本关于人口统计的著作.他们开创了从数量方 面研究社会经济现象的先例. 面研究社会经济现象的先例. 世纪末- 世纪末 世纪末) (二)统计学的近代期(18世纪末-19世纪末) 统计学的近代期( 世纪末 近代期 1,数理统计学派 , 代表人物:法国的拉普拉斯,比利时的凯特勒. 代表人物:法国的拉普拉斯,比利时的凯特勒. 拉普拉斯把古典概率论引进统计学, 拉普拉斯把古典概率论引进统计学,发展了概 古典概率论引进统计学 率论,推广了概率论在统计中的应用. 率论,推广了概率论在统计中的应用.
统计学第1章绪论-PPT课件
10.10.2020
1-8
统计学的目标
从所有类型的数据中 提取科学的和有意义的 信息。
10.10.2020
1-9
收集和分析数据
不是对一般的数据进行分析, 实质上是只讨论那种具有随 机性的数据,即对偶然现象 里面的统计规律进行分析。
10.10.2020
1-10
偶然现象
第一个问题,任选南宁9月份的某一天,它的最低 气温大于28度,这有可能发生也可能不发生;
维尼
30000次
nA 1061次 2048次 6019次 12012次
14994次
fn (A)
0.5181 0.5069 0.5016 0.5005
0.4998
10.10.2020
1-14
计算生男孩的比例
拉普拉斯 (1749~1827), 数学家、天文学 家,是天体力学 的主要奠基人、 概率论的创始人, 应用数学的先驱。 拿破仑的老师
10.10.2020
1-23
问题
“共成功入户访问了7139位年龄在18至69 岁的居民,调查误差小于2%,符合统计推 论的科学要求。”这里“调查误差小于2%” 是什么意思?
10.10.2020
1-24
【例1.4】
2008年美国发表的两项大型临床试验结果显示, 维生素及其它抗氧化剂丝毫无助于预防前列腺癌。 《美国医学会杂志》在网络版上公布了这一结果: 第一项研究是迄今进行过的规模最大的癌症预防 对照试验之一,有3.55万名中年男性参加,服用 维生素E、硒或安慰剂的时间超过5年。第二项试 验历时8年,观察了维生素C和E对近1.5万名男性 的影响。两项研究均显示,无论是对前列腺癌, 还是所有种类的癌症,这些补充剂都没有预防效 果。
第1讲 绪论
1.5.4 变异、变量和变量值
变异:指标志表现由一种状态到另一种状态称为变异 (是标志在各总体单位具体表现的差异 )。 变量:
广义变量:每个个体的性质或属性。如:年龄、高度 狭义变量:数量标志就是变量。 变量值(观测值): 广义:每个个体所有变量的值。 狭义:数量标志表现即变量的取值,称变量值。
7
1.5.2 标志与指标
1、标志是指统计总体各单位所共同具有的属性或特征,它是说 明总体单位属性或特征的名称。 标志按其特征的不同,可以分为品质标志与数量标志。 品质标志表明总体单位属性方面的特征,不能用数值表示,只能 用文字说明。如性别、籍贯、文化程度。 数量标志表明总体单位数量方面的特征,如每个职工的年龄、工 龄、工资 。 某一共同品质属性或数量特征在总体各单位身上的具体体现称为 标志表现。 品质标志的表现是概念或文字说明,例如“职业”这一品质标志 的标志表现为工人、农民、医生、教师等等。 数量标志的标志表现为数值,例如“工龄”这一数量标志的标志 表现为3年、5年、6年、20年等等。
统计整理:是对调查资料加以综合汇总,使之条理化、系 统化。
统计分析:是对经过加工汇总后的资料进行分析研究。是
统计研究的决定性阶段。
6
1.5 统计学的几个基本概念
1.5.1 总体与总体单位
统计总体:是根据一定的目的和要求所确定的研究事物 的全体。它是由客观存在的、具有某种共同性质的许多 个别事物构成的整体。统计总体同时具备三个性质,即 同质性、变异性和大量性。 总体单位:是指构成总体的个体单位,它是总体的基本 单位。 二者的关系:没有总体单位,总体就不存在;没有总体, 也就无法确定总体单位。
统计学课程(第一章-绪论)PPT课件
第一节 统计和统计学
第二阶段:近代统计学时期 近代统计学时期是指18世纪末到19世纪末统计 学的重大发展时期。其主要代表学派有数理统计 学派和社会经济统计学派。
第三阶段:现代统计学时期 现代统计学时期是指从20世纪初至今的统计学 新的发展时期。
第一章 绪论
第二节 统计学的性质、研究对象和研究方法
统计工作,就是统计实践活动,是收集、整理 和分析统计数据的活动。
统计资料,是统计实践活动过程所取得的各项 数据资料的总称。
第一节 统计和统计学
一、统计的概念
统计学,是在统计实践活动中所积累的理论和 方法的知识体系,是关于认识客观现象总体数量 特征和数量关系的科学。
统计工作是人们的统计实践工作,是基础和前 提;统计资料是统计工作的结果,统计工作与统 计资料是工作过程与工作成果的关系。统计学是 统计工作经验的总结与概括,统计学与统计工作 之间是统计理论与统计实践的关系。
调查研究,根据对这一部分观察单位的观察结果, 再去推断和估计总体情况。这部分观察单位就叫 做总体的样本。
样本具有以下特点: • 1.样本的单位必须取自同一总体的内部,不能取自不同的总体。 •来自2.从一个总体可以抽取若干个样本。
第三节 统计学的基本概念
样本具有以下特点:
• 3.样本是用来代表总体的。 • 4.从总体中抽取样本进行调查的目的是为了对总
的数量方面。包括社会经济现象总体的数量表现、 现象总体之间的数量关系,以及质量互变的数量 界限及其规律性。
统计学的研究对象具有以下几个方面的特征: (一)数量性 (二)总体性 (三)具体性 (四)社会性 (五)变异性
第二节 统计学的性质、研究对象和研究方法 三、统计学的研究方法 (一)大量观察法
统计学前言绪论幻灯
第一节 统计学的产生和发展
三.统计学的现代期
现代统计学具有3个方面的特点: 1、统计学对数学的依赖程度越来越强,不仅数理统计, 而且线性代数等都在统计学中得到广泛应用。 2、向其他学科逐步渗透,形成了一系列边缘学科,如 生物统计学,农化研究法,经济统计学等。 3、统计学在社会经济生活甚至国家管理中的作用越来 越重要。在国家管理中兼有信息、咨询、监督等3方面 的功能。(灵敏的信息、完备的咨询、科学的决策、高 效的执行、严密的监督系统)。 统计学重要内容包括统计资料的搜集、统计资料的整理、 统计资料的分析(这里有多种统计分析工作)、统计推 断和预测、统计决策等方面。以上几个方面的内容从前 到后也可以看成是统计学研究的一个基本过程。
第三节 统计学的要素和内容 一.统计要素
总体、样本、推断、及推断的可靠性, 总体、样本、推断、及推断的可靠性,这几个基本概念实际 上组成了统计学的基本要素。 上组成了统计学的基本要素。 (一)总体 统计学主要是研究现象总体规律的, 统计学主要是研究现象总体规律的,即使研究过程一开始不 是全部总体,但最终目的还是探求总体规律, 是全部总体,但最终目的还是探求总体规律,总体是统计学的最 重要的基本要素。 重要的基本要素。 具有某一共同性质的个别事物(个体) 总体是统计工作中 具有某一共同性质的个别事物(个体) 所组成的整体,它是统计总体的简称, 所组成的整体,它是统计总体的简称,组成总体的个别事物称为 总体单位或个体。 总体单位或个体。 例如具有河南农大学籍的所有学生因为具有一个共同性质就 组成了一个总体, 组成了一个总体,这个总体中的任何一个学生就称为个体或总体 单位。统计学中总体单位一般情况下都有特定的数量或质量特征。 单位。统计学中总体单位一般情况下都有特定的数量或质量特征。 总体单位数有的很多,有的则较少, 总体单位数有的很多,有的则较少,存在有有限总体和无限总体 之分。 之分。
第1章 绪论
总结:将统计学理解为国家重要事项的记述。
6
(二)近代统计学时期 (19世纪初至20世纪初)
第一章
绪论
STAT
近代统计学的主要贡献是建设和完善 了统计学的理论体系,并逐渐形成了以随 机现象的推断统计为主要内容的数理统计 学和以传统的社会经济现象的描述统计为 主要内容的社会统计学两大学派。
7
第一章
绪论
8
第一章
绪论
古典概率论 STAT 三四百年前在欧洲许多国家,贵族之 间盛行赌博之风。掷骰子是他们常用的一 种赌博方式。17世纪法国数学家帕斯卡和 费尔马创立了古典概率论,并发展了概率 论理论。19世纪初叶由法国数学家、统计 学家拉普拉斯在总结前人成果的基础上, 出版了名著《概率论分析理论》,从而形 成完整的应用理论体系。
12
第一章
绪论
第一节
统计学的产生与发展
STAT
• 20世纪中,统计学在社会经济领域里的应用首推 1953年创立的SNA(The system of national accounts)即国民收入核算体系,以及1968年发 表的新SNA体系和1993年经过改进的SNA 核算体 系。在这一领域中,著名的统计学家理查德· 斯通 和瓦西里· 列昂提夫作出了杰出的贡献。 • SNA核算体系包括5个总量:GNP(国民生产总 值)、NNP(国民生产净值)、NI(国民收入)、 PI(个人收入)、PDI(个人可支配收入)。
25
第一章
绪论
(一)大量观察法:
STAT
对要研究事物的全部或足够数量个体进行观察 的方法。可使现象中非本质的偶然因素相互抵消, 从而反映现象总体的数量特征。 数理根据:大数规律,随机现象出现的基本规 律,其一般意义是:观察过程中每次取得的结果 可能不同(因为具有偶然性),但大量重复观察结 果的平均值却几乎接近某个确定的数值。
统计学课件--CH01统计学绪论
•第一章 绪论
第一篇 基本统计方法
第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
第二篇 高级统计方法
第三篇 医学科学研究设计
第二十五章 医学科学研究设计概述 第二十六章 观察性研究设计 第二十七章 实验研究设计 第二十八章 临床试验研究设计
第四篇 数据处理与统计软件应用
第二十九章 数据处理的一般原则与方法 第三十章 SPSS统计软件 第三十一章 SAS统计软件 第三十二章 Stata统计软件 第三十三章 数据处理的其他统计方法 附录一 医学人口统计与疾病统计常用指标 附录二 统计用表 附录三 英汉名词对照
三、误 差
定义:实测值与真值之差。 1、随机误差:不恒定的、随机变化的误差,由多 种尚无法控制的因素引起。无方向性。
主要指重复测量产生的测量误差和抽样过程 产生的抽样误差。
通常,测量误差远小于抽样误差,因此统计 学主要考虑抽样误差。
非随机误差又可分为系统误差和非系统误差两类:
2、系统误差:实验过程中产生的误差,它的值或 恒定不变,或遵循一定的变化规律,其产生原因 往往是可知的或可能掌握的,大小变化有方向性。 3、非系统误差(过失误差): 研究者偶然失误而 造成的误差。
当人类科学的探索者在问题的丛林 中遇到难以逾越的障碍时,唯有统计学 工具可以为其开辟一条前进的通道。
— F Galton (1822-1911)
学习方法
掌握基本概念 重在正确应用
选择恰当方法 满足应用条件 善于解释结果
统计学绪论(初)_PPT课件
2021/3/6
主要内容
v 第一节 医学统计学的地位和作用 v 第二节 统计学中几个基本概念 v 第三节 计量资料的统计描述 v 第四节 医学统计工作的基本步骤
第一节 医学统计学的地位和作用
v 当研发了一种治疗高血压病的新药,应该怎样评价 该新药的疗效?
v 患者
二项分类和多项分类
各战期战士破伤风病死率比较
战期 第一战期 第二战期 第三战期
合计
死亡人数 28 7 12 47
存活人数 14 16 10 40
合计 42 23 22 87
3.等级资料(或有序分类变量)
ranked data, ordinal category data
Ø 定义:将观察单位按某个指标量的大小分成等级或 某种属性的不同程度分成等级后分组计数,分类汇总 各组的观察单位数称为等级资料。 Ø 特点:等级是有序分组。同计数资料的区别是:属 性的分组有程度的差别,各组按一定顺序排列;与计 量资料的区别是:每个观察单位未确切定量,所以又 称为半定量资料。
的机会被抽取)进行观察或测量的过程称为随机抽样 (random sampling)。
总体
随机≠随便
一个样本可能有哪些特征?
总体
样本特征 计量资料
集中趋势
算术均数
几何均数
中位数 众数
百分位数
离散趋势
相对比
计数资料
构成比 率
全距(极差) 分位数间距
方差 标准差 变异系数
(2)资料的类型(Type of data)
Ø 总体(population):所有同质观察单位某种
观察值(即变量值)的全体。
Ø 样本(sample):总体中抽取部分观察单位的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
绪 论 (Introduction)
柏建岭 bjlcn@ 南京医科大学公共卫生学院生物统计学系
主要内容
引言 学科定义 基本概念 学习要求
2020/8/1
柏建岭讲稿
2
生活中的统计学
投机取巧 投机取巧
天气预报
2020/8/1
柏建岭讲稿
3
社会经济中的统计学
2020/8/1
柏建岭讲稿
4
统计是什么? What is Statistics?
若想了解上帝在想什么,我们
就必须学统计,因为统计学就 是在量测他的旨意。
Florence Nightingal 1820一1910
2020/8/1
柏建岭讲稿
5
统计学(Statistics)
研究数据的收集、整理、分析的一门学科。
研究医学中这些随机现象的发生规律的学科。
2020/8/1
柏建岭讲稿
11
医学统计学(Medical Statistics)
基础:概率论和数理统计等数学的原理、方法 研究对象:医学资料 研究任务:搜集、整理、分析和推断 性质:一门应用学科
2020/8/1
柏建岭讲稿
12
数理统计学与生物医学的结合
样本 (random sample)
从研究总体中随机抽取具有代表性的部分观察单位。 – 代表性,包含了总体的特性
样本含量(sample size)
样本中包含个体的数量。
2020/8/1
柏建岭讲稿
22
参数和统计量
总体参数(population parameter)
总体的特征值称为参数。 – 未知的,固有的,不变的,需要研究的!
柏建岭讲稿
14
同质 异质
同质(homogeneity): 性质相同
异质(heterogeneity): 性质不同
例如,调查某地2011年12岁男童身高,则它的观察单位是 每一个儿童,它的同质基础是同一地区、同一年份、同一年 龄、同为男性。
个体的同质性是构成研究总体的必备条件 研究内容(指标/变量)不同,对同质性的要求不同
2020/8/1
柏建岭讲稿
6
数据处理的工具和技能
2020/8/1
柏建岭讲稿
7
7
统计学与医学研究的关系
医学研究中存在的大量随机现象
✓ 同样的药治疗患有同一疾病的患者,疗效可以不同 ✓ 相同的生活条件,各人健康状况可以不同 ✓ 同样的年龄和性别,儿童的身高和体重可以不同
几乎可以这样说:绝大部分的医学现象均是随机 现象
同质和异质是相对的概念
2020/8/1
柏建岭讲稿
15
同质和异质示例
在研究事物的形颜状色时
2020/8/1
柏建岭讲稿
16
制定血红蛋白参考值范围时
2020/8/1
柏建岭讲稿
17
制定白细胞参考值范围时
2020/8/1
柏建岭讲稿
18
变异
同质事物之间的差别称为变异(variation) 亦称个体变异。
2020/8/1
柏建岭讲稿
20
总体和样本
总体 (population)
按研究目的所确定的同质研究对象某项观察指标 的全体,即全体观察单位。 – 有限总体 (finite) – 无限总体 (infinite)
个体 (individual)
组成总体的基本单位。
2020/8/1
柏建岭讲稿
21
总体和样本
✓ 对于一个具体个体,其最终的结局是不可确切预计的
学与医学研究的关系
但是在医学观察研究中,许多结果有一定的随机 性,也有一定的内在规律。
当这些个体事件大量重复时,则可以发现其中存 在着一定的规律。
如何对这些变化规律加以总结?
2020/8/1
柏建岭讲稿
9
统计学与医学研究的关系
样本统计量(sample statistic)
由样本所算出的统计指标或特征值称为统计量。
– 已知的,变化的,有误差的!
在总体被确定之后,总体参数就是一个常数,是 不会变化的,不管你是否确切知其大小;而统计 量是几乎总是随着样本而变的。
2020/8/1
柏建岭讲稿
23
参数和统计量
参数一般用希腊字母表示,
生物统计学(Biostatistics) 医学统计学(Medical Statistics) 卫生统计学(Health Statistics)
2020/8/1
柏建岭讲稿
13
基本概念
同质 异质 变异 总体和样本 参数和统计量 随机 概率和频率 小概率事件和小概率原理 变量的分类
2020/8/1
• 变异的两个方面:
• 个体与个体间的差别 • 同一个体重复测量值间的差别
2020/8/1
柏建岭讲稿
19
个体变异(individual variation)
同质个体间的差异。 一种或多种不可控因素(已知的或未知的)作用下
所产生的反映的综合表现。 结果是随机的(无法绝对正确地预测)。 个体变异是普遍存在的。 个体变异是有规律的。 没有个体变异,就没有统计学!
如:总体均数 总体标准差
总体率
p 总体相关系数 r
统计量一般用拉丁字母表示
如:样本均数 X
样本标准差 s
样本率 p
样本相关系数 r
2020/8/1
柏建岭讲稿
24
总体
平均身高 总体参数
2020/8/1
样本
平均身高 X 样本统计量
✓《 Webster 国际大词典》 Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data.
✓《不列颠百科全书》 Statistics is the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result.
例如:分别用2种药(A药和B药)治疗类风湿关节 炎,各治疗10名类风湿关节炎患者。
组别
有效
无效
A药
7
3
B药
6
4
问:A药疗效比B药疗效好吗?
2020/8/1
柏建岭讲稿
合计 10 10
10
统计学与医学研究的关系
对于这些有一定随机性的结果,要根据发生的概 率大小才能下结论。这就是医学统计学要解决的 问题。