简明应用统计学统计学绪论ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011年2月美国《科学》杂志以数据为主题出版专刊, 学术界对数据和数据分析高度关注。
1.3 为什么要学习统计学
统计在许多学科中得到广泛的应用。 比如说,学术研究杂志就依赖于统计结果。在许多学
科中,一篇文章是否能够发表在主要杂志上,在很大 程度上取决于该文章是否能正确地使用统计方法。 除了学术领域,统计在其他领域也被人们广泛使用。 统计在工业中得到大量使用,尤其用于研究新产品、 质量控制和市场开发中;市场调查也需要统计。
finance (金融)
fisheries research (水产渔业研究)
gambling (赌博)
genetics (遗传学)
geography (地理学)
geology (地质学)
historical research (历史研究) human genetics (人类遗传学)
统计的应用领域
假设你是市场部的新任经理,一次广告活动的统计结果 摆到了你面前,声称某个结果是“统计显著”的。你如何 解释这份报告而又不暴露你对该术语的无知呢?
赶快学点统计,这对你和你的事业都非常有用。
1.2 什么是统计学?
(statistics)
1. 统计学是收集、分析、表述和解释数据的 科学(不列颠百科全书)
品种的实验等 自然科学领域的数据大多数都为实验数据
统计数据的分类
(按时间状况分)
1. 截面数据(cross-sectional data)
在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2005年我国各地区的国内生产总值数据
2. 时间序列数据(time series data)
定量变量(quantitative variable) 定量变量例子比较多,比如年龄、寿命、公司的员工人数、薪水金额等 等。
定量变量又可以分为连续的和离散的。 离散变量(discrete variable)只能取某些特定的值,并且不同取值之间通常
都存在着间距。比如具有某种特征的人口(取正整数值)、某种事故发生 的次数(非负整数)、足球射门次数等等。 连续变量(continuous variable)的观测值可以遍取某一区间中的任何值。身 高、体重、长度等等都是连续变量的例子。
2. 顺序数据(rank data)
只能归于某一有序类别的非数字型数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据(metric data)
按数字尺度测量的观察值 结果表现为具体的数值,对事物的精确测度 例如:身高为175cm、168cm、183cm
• 变量的具体表现称为变量值,即数据
变量的值(value)通常是对某一特定个体的度量,特定个体可能是 指一个人,一个家庭,一个地区,或一个国家。
从表中可知,性别变量是以人为个体的观测,孩子的数目是以家 庭为个体的观测。
变量 性别 学历 失业 孩子数
贫困程度
变量的值 男,女
小学,中学,本科,硕士,博士 有工作,无工作
1.1 引言
在金融危机发生后,各国政府对于国家经济的现状和对 未来经济走势的预测十分关注,每个月都要编制CPI等 各类指数以评价通货膨胀情况。有关商品销售额、新开 工的住宅、货币流通以及工业生产的信息仅仅是构成预 测基础的成百上千类信息的一小部分。我们该如何解读 这些数据呢?知道一些统计知识有助于我们知道这些数 据是如何与我们的生活息息相关的。
参数估计
假设检验
描述统计
(descriptive statistics)
1. 研究数据收集、处理、汇总、
图表描述、概括与分析等统
计方法

2. 内容
50
搜集数据
整理数据
展示数据
25
描述性分析
3. 目的
描述数据特征
0 Q1 Q2 Q3 Q4
找出数据的基本规律
x = 30 s2 = 105
推断统计
统计量、F 统计量等
变量及其类型
1.6 测量的水平
数据还可以按照测量水平进行分类。 数据的测量水平通常制约着在数据概括和显示时可以选用的
计算方法,它还决定着应该使用何种统计检以从下面几个方面获得数据: 来自于公开发表资料中的数据
统计年鉴 有关期刊 有关网站 实验设计数据 调查数据 观察数据
在我们做研究之前,对变量必须要有一个清晰、详 尽的定义。
meteorology (气象学)
military science (军事科学)
nuclear material safeguards (核材料安全管理)
ophthalmology (眼科学)
pharmaceutics (制药学)
physics (物理学)
political science (政治学)
0, 1, 2, 3,… 严重,一般,边缘,没有
个体 人 人 人 家庭
地区
变量的类型
(variable)
定性变量(qualitative variable)或属性变量(attribute variable) 定性变量取的值称为水平(level)或者类(class)。 比如,姓名、性别、行业、出生地、国籍/地区以及汽车类型都是定性 变量。 定性数据通常以饼图或者条形图(详见第2章)的形式表示。
统计数据的分类
(按收集方法分)
1. 观测的数据(observational data)
通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据
2. 实验的数据(experimental data)
在实验中控制实验对象而收集到的数据 比如,对一种新药疗效的实验,对一种新的农作物
统计的应用领域
经济学
医学
管理学
统计学 工程学
社会学

统计的应用领域
actuarial work (精算)
agriculture (农业)
animal science (动物学)
anthropology (人类学)
archaeology (考古学)
auditing (审计学)
crystallography (晶体学)
(inferential statistics)
1. 研究如何利用样本数
据来推断总体特征的
总体
统计方法
2. 内容 ▪ 参数估计 ▪ 假设检验
3. 目的

▪ 对总体特征作出推断

1.5 变量 (variable)
变量是说明现象某种特征的概念
如商品销售额、受教育程度、产品的质量等级等
变量
(variable)
和连续变量。 4. 区别变量的定类、定序、定距和定比测
度水平。 5. 知道数据的四种收集方式。 6. 知道常用的统计软件。
1.1 引言
根据最新的研究结果,消费者的行为对自然资源到底有 怎样的影响呢?你应该买使用柴油发动机的汽车,还是 购买电动车,或者干脆骑自行车呢?
报纸、杂志或网络中的统计结果对于你的决定非常关键, 这些结果建议你该有怎样的消费观。
只需要收集部分顾客的年龄信息,得到平均年龄的 估计以后,你就可以针对这个年龄层的顾客,制定 相应广告信息。 统计涉及两个不同阶段:(1)描述数据集和(2)根据 样本信息得出结论(估计、预测等)。 统计的应用可以被分为两个部分:描述统计学和推 断统计学。
1.4 统计学的类型
统计方法
描述统计
推断统计
demography (人口统计学)
dentistry (牙医学)
ecology (生态学)
econometrics (经济计量学)
education (教育学)
election forecasting and projection (选举预测和策划)
engineering (工程)
epidemiology (流行病学)
1.3 为什么要学习统计学
(1)数据无处不在。 (2)统计学技术对于我们做出影响日常生活的许多决
策都十分有用。 (3)无论你以后从事什么工作,你都会面临与数据打
交道做出决策的问题。对统计学方法的了解将有 助于你更加有效的做出决策。
1.4 统计学的类型
数据收集过程:抽样(sampling)。 比如,为了估计某一家超市所有顾客平均年龄,你
统计数据的分类
统计数据的分类 按计量层次 按收集方法 按时间状况
分类 的数 据
顺序 的数 据
数值 型数 据
观察 的数 据
实验 的数 据

时序

的数




统计数据的分类
(按计量尺度分)
1. 分类数据(categorical data)
只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类
收集、处理、分析、解释数据并从数据中得出结论的科学
1. 收集数据:取得数据 2. 处理数据:整理与图表展示 3. 分析数据:利用统计方法分
析数据 4. 数据解释:结果的说明 5. 得到结论:从数据分析中得
出客观结论
1.3 为什么要学习统计学
2009年8月6日《纽约时报》发表大幅文章《当今大学毕 业生的唯一关键词是:统计学》(For Today‘s Graduate, Just One Word: Statistics).文章举例说明统计对各行各业 的重要性。
2. 统计是一门收集、分析、解释和提供数据 的科学(韦伯斯特国际辞典第3版)
3. 统计指的是一组方法,用来设计实验、获 得数据,然后在这些数据的基础上组织、 概括、演示、分析、解释和得出结论(Mario
F.Triola,《初级统计学》)
4. 统计学是数据的科学和艺术
1.2 什么是统计学?
(statistics)
变量 (其他分类)
1. 随机变量和非随机变量 2. 经 验 变 量 (empirical variables) 和 理 论 变 量
(theoretical variables)
经验变量所描述的是我们周围可以观察到的事 物
理论变量则是由统计学家用数学方法所构造出
来的一些变量,比如,z 统计量、t 统计量、2
psychology (心理学)
psychophysics (心理物理学)
quality control (质量控制) religious studies (宗教研究)
sociology (社会学)
survey sampling (调查抽样)
taxonomy (分类学)
weather modification (气象改善)
hydrology (水文学)
industry (工业)
linguistics (语言学)
literature (文学)
manpower planning (劳动力计划)
management science (管理科学)
marketing (市场营销学)
medical diagnosis (医学诊断)
2009年8月25日华尔街杂志刊登《有利于找工作的5个专 业》文章,认为在美国“工程、生命科学、统计学、 环境研究和金融”是就业市场最受欢迎的专业。
2010年6月3日第64届联合国大会第90次会议通过决议, 每年10月20日被联合国确定为“世界统计日”。体现 出全世界对统计数据和统计空前的关注和重视。
简明应用统计学
(第2版)
第 1 章 统计学绪论
1.1 引言 1.2 什么是统计学 1.3 为什么要学习统计学 1.4 统计学的类型 1.5 变量的类型 1.6 测量的水平 1.7 数据的收集 1.8 统计软件
学习目标
1. 理解我们为什么要学习统计学。 2. 什么是描述统计学和推断统计学。 3. 区别定性变量和定量变量,区别离散变量
在不同时间上收集到的数据 描述现象随时间变化的情况 比如,2000年至2005年国内生产总值数据
1.7 数据收集:定义变量
数据收集的第一个准则是要清楚测量的是什么。换 句话说,变量必须有一个明确的适合研究目的的定 义。
这有时是说起来容易做起来难。如果我们对问题考 虑得不全面,那么就没理由指望回答问题的人(一 般称为响应者)能按照我们期望的回答问题。
变量
(例题分析)
【例1.1】 下面是关于是否喜欢锻炼的部分调查数据。
表1.1 是否喜欢锻炼的部分调查数据
性别
锻炼的态度 出生日期
身高
体重

非常喜欢
170
65

喜欢
175
60

一般
165
61

不太喜欢

很讨厌
179
70
153
45

喜欢
180
65

一般
172
55

非常喜欢
167
52
表1.1中的姓名、是否锻炼为定性变量。出生日 期、身高和体重为定量变量,出生日期是离散 变量,而身高和体重为连续变量。
相关文档
最新文档