第一章 应用统计学 导论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
身高?
当你告诉别人你已经交上一个新朋友 时,他们决不会问你任何有关基本事宜的 问题。他们不会对你说:“他的声音像谁? 最喜欢什么游戏?他收集蝴蝶吗?”,取 而代之,他们会问:“他有多大年龄?有 几个兄弟?体重有多少?他的父亲挣多少 钱?” 体重? 仅仅从这些数字,他们才认为 已经了解了有关他的一切。
三、 统 描述统计学 计 理论统计学 推断统计学 学 统计学 的 应用统计学 类 型
描述统计:研究如何对客观现象 的数量特征进行计量、观察、概括 和表述。 用表和图表示,计算特征量 (如平均值)等。
推断统计(统计推断)用数据所提供信
息,对数据所来自的总体的性质作推断。
描述统计
(统计数据的搜集、整 总体数据 理、显示和分析等)
(利用样本信息和概率 论对总体的数量特征进1-1 统计学探索现象数量规律性的过程
三、 统 计 学 的 类 型
数理统计学 统计学 应用技术统计学 社会经济统计学
本课程的性质
• 应用统计是一门运用统计学的原理和方法,
而对该现象的数据进行收集、
整理与分析的活动。
(统计局)
统计资料即统计数据,
是通过统计工作所获得的 能够说明现象总体某种特 征的数据,是统计实践活
动的成果。
(年鉴、杂志、网站)
国家统计局主办的 国家发展规划委员会主办的 国务院发展研究中心主办的
钱?
吸烟导致肺癌,抗生素治疗胃溃疡,锻炼 有助于预防心脏病… …我们怎么知道这 些?因为科学家有统计数据证明。
市场调查和分析人才依托自己的市场学知识, 通过自己掌握的调查工具和手段,对所关注的 行业进行调查,并依据调查的结果进行分析。 整个工作过程涵盖了统计学、经济学等多方面 的知识。
“统计就和柴、米、 油、盐、酱、醋、茶一 样,存在的时候并不是 很突出,一旦不见了, 人生就是黑白的了。”
数据的科学与艺术(art)”
–数据有随机性(带偶然误差)
–应用时有人的判断和主动性 (“艺术”),不是死套公式。
二、统计学的性质及其特点 1.数量性
统计总是用数字作为语言来表述事
实。
不是纯数学 –在质与量的辨证统一中研究;
–不同于纯数量的研究。
2.大量性
研究大量个别事物构成的现象
整体的数据
– 现象的数量规律性只有在总体层面上才 能体现出来; – 研究目的在于说明总体特征,但常常从 观察个体数量特征入手。
感 悟 统 计
为什么要学统计?
When you analyze any topic,
统计能够做些什么?
you are involved in statistics.
......
•撑死的人比饿死的人多!
据统计,肥胖并发脑血栓和心衰的发病率比 正常体重者高一倍,患冠心病者多2~5倍,高血 压发病率多2~6倍,合并糖尿病者高4倍,合并 胆石症者高4~6倍。美国生命保险协会的统计调 查结果显示,超重25%和35%的肥胖症者的死亡 率比正常人高28%和50%,表明肥胖程度和死亡 率呈正相关。美国每年因肥胖伴有冠心病、高血 压、高血脂、糖尿病和脑血管意外而死亡的人数 大约有30万人。
变量的分类
• 变量按其取值是否连续,可分为离散型变
量和连续型变量。离散型变量指只能取整 数的变量。职工人数、商店数、设备数等 都属于离散型变量。连续型变量是指在整 数之间可插入小数的变量。身高、体重、 增加值、成本、利润等都属连续型变量。
变量的分类
• 变量按其所受因素影响的不同,可分为确
定性变量和不确定性变量。由确定性因素 影响所形成的变量为确定性变量,由不确 定性因素影响所形成的变量为不确定性变 量。
变异与变量
• 我们一般将品质标志不同的具体表述,称为变异。 •
如民族标志,其具体表述为汉、满、蒙、回、藏、 维…… 有时也将数量标志的不同取值称为变异。但一般 是将数量标志不同的具体表现称为变量。变量的 不同取值,称为变量值或标志值。如工人年龄变 量,其取值可30岁、40岁、50岁不等;工 资变量,其取值可75元、80元、100 元……
Name4 Name5
Name6 Name7 Name8
期望 波澜
天山绿 中美纯 雪浪花
Product4 Product5
Product6 Product7 Product8
果汁饮料 保健食品
空调 洗衣机 毛毯
Feel4 Feel5
Feel6 Feel7 Feel8
纯净 安闲
个性 兴奋 高档
由直观图可以看出,“波澜” (Name5)与“洗衣机”(Product7)产品 相联系,引起的感觉是“兴奋”,因此 “波澜”不是合适的纯净水品牌名称。
(二)统计指标
1、统计指标的概念 统计指标简称为指标,是反映总体数量特征
的概念和具体数值,即:将标志的具体表现
(变异和变量)进行登记、汇总,最后形 成说明事物综合特征的各种数字资料。
任何统计指标都包括指标名称、指标数值、 计量单位。指标名称是总体数量特征的概念,反
映指标的经济意义和包括的内容范围、时间范围
教学内容
• 第二章 • 第三章 • 第四章 • 第七章 • 第八章 • 第九章
数据搜集与整理 数据的汇总 统计比率与统计指数 方差分析 相关与回归分析 时间数列
第 二 节 数 据 信 息 处 理 的 方 法
一、总体与总体单位
(一)
总体与总体单位概念
总体是在一定的研究目的下, 所要研究事物的全体,它是由客观存 在的、具有某种共同性质的众多个别 事物构成的整体。 ——调查对象
研究区域化发展、事业管理等学科中有关 数据收集、整理、分析的科学。在人类迈 进21世纪知识经济时代的今天,面对日益 增多的信息需求量和处理量,学习和掌握 数据处理和分析技术的统计方法十分重要。
该课程能解决的问题
• 通过本课程的学习,能够掌握统计数据的
收集、整理、特征数的描述统计方法,以 及公共事业管理中常用的统计分析方法, 掌握定性和定量有机结合的技能,为今后 的学习、科学研究和管理工作的开展奠定 基础。 • 教学时数:40学时(其中实验4学时)
北京大学教育学院
统计科学即统计学
一门研究收集数据、表现数 据、分析数据、解释数据,从而
认识数量规律的方法论科学。
Statistic is the science for learning from data.
《不列颠百科全书》的定义:
统计学是:“关于收集和分析
3.差异性
• 客观事物的差异是普遍存在的。例如商业职工的
工龄、工资各不相同,各个商业企业的效益也有 差异。正因为这些个体之间存在着差异,才需要 综合大量个体的差异,以掌握全体的综合特征。 差异可以表现为数量方面(如工龄、工资、产量、 销售额等),也可以表现为非数量方面(如性别、 民族、所有制等)。非数量方面的差异,只有将 之转化为数量方面的差异,才能成为统计研究的 对象。
想,如“纯净”、“清爽”等。
后来中美纯水有限公司委托调查统计研究所,
进行了一次全面的市场研究,在调查中还包括简
单的名称测试。
调查的代码和含义如下:
代码 Name1 Name2 Name3 含义 玉泉 雪源 春溪 代码 Product1 Product2 Product3 含义 雪糕 纯水 碳酸饮料 代码 Feel1 Feel2 Feel3 含义 清爽 甘甜 欢快
总体单位是构成总体的个别事物。 总体单位是所要研究具体问题的承担 者。——调查单位。
研究某个班学生的学习情况 总体:全班所有的学生 总体单位:每一个学生 某市的工业生产情况 总体:所有的工业企业 总体单位:每一个工业企业 某市的工业生产设备情况 总体:所有的工业生产设备 总体单位:每一台工业生产设备
感 悟 统 计
案例1:起名为“ 波澜”恰当 吗 案例2:后40回出自谁的手笔
中美纯水有限公司欲为其新推出的一种纯水 产品起一个合适的名字,为此专门委托了当地的 策划咨询公司,取了一个名字“波澜”。
一个好的名字至少应该满足两个条件:
(1)会使消费者联想到正确的产品“纯水”;
(2)会使消费者产生与正确产品密切相关的联
后40回出自谁的手笔
众所周知,《红楼梦》一书共120回,一
般认为前80回为曹雪芹所写,后40回为高鹗
所续,长期以来对这个问题一直有争议。
80年代中期,一位教授带领他的学生作
了这项有意义的工作。
他们创造性想法是将120回看成是120个样 本,然后确定与情节无关的虚词作为变量, 用统计的方法聚类,果然将120回分成两类即 前80回为一类,后40回为一类。 之后又进一步分析前80回是否为曹雪芹所 写?这时又找了一本曹雪芹的其它著作,结果 证实了用词手法完全相同,断定为曹雪芹一 人手笔,而后40回是否为高鹗写的呢?结果推 翻了后40回是高鹗一个人所写。这个论证在 红学界轰动很大,使红学界大为赞叹。
第一节
数据信息和统计学
第二节 数据信息处理的方法 第三节 计算机软件在统计
中的应用
第一节 数据信息和统计学
据统计,在某市 搞统计的人中, 有30%的人没 学过统计。
一、统计的含义
统计工作 统计资料 统计科学
统计工作即统计实践活动,
是人们为了说明所研究对象的 某种数量特征和数量规律性,
按随机原则从总体中抽出的部分单位构
成的整体。
总体
样 本
(二)样本与总体的关系
一个样本单位是一个总体单位;样本具
有总体的特征(带来总体的信息);总体
具有唯一性,样本具有随机性。
三、标志与统计指标
(一)标志
标志是说明总体单位特征的概
念或名称,所以也称为单位标志。
在统计调查中称为调查项目或登记
项目。
标志一般不具备时间、地点等条件;
但完整的统计指标一定要讲明时间、 地点、范围。
标志与指标 既有区别又有联系
(二)总体的特点
同质性 大量性 差异性
两层含义: ①统计学研究的是大量现象的数量特征,总 体包含了大量现象; ②统计单位具有某一共同性质,但其他的性质、 特征是不同的,便于在差异中寻找规律。
(三) 总体的分类
按构成总体的总体单位是否可以计
量,总体分为:
有限总体和无限总体。
二、样本
(一)样本的概念
和空间范围。
标志与指标 既有区别又有联系
区别:
标志是说明总体单位特征的;指标是
说明总体特征的。
标志中的品质标志不能用数量表示;
而所有的指标都能用数量表示。
标志与指标 既有区别又有联系
区别:
标志(指数量标志)不一定经过汇总,
可直接取得;而指标(指数量指标)一 定要经过汇总才能取得。 例如,反映重庆市统计局职工工 资水平的“平均工资”就是属于指标。 它是由个人的“工资”这个标志的标 志值经汇总、计算而得。
•
4.具体性
• 统计学研究的数量方面是指客观事物的具
体的数量方面。统计的数据都是具体的, 反映一定研究范围的数字。这与数学不同。 数学完全撇开研究对象的具体内容和质的 特征而研究抽象的数量关系。统计是在一 定质的规定下研究事物的数量方面,它需 要在质和量的辩证统一中进行研究。因此 必须对事物质的规定性有了正确的认识以 后,才能统计它们的数量。
中美纯水公司的产品是“纯水”,如 果想要使该名称给人们一种“纯净” 的
感觉,那么“中美纯” 将是最好的商品 名称;如果想要使该名称给人们一种“清 爽” 的感觉,那么“玉泉” 将是最好的 商品名称。 中美纯水公司接受了调查统计研究所 的建议,没有用“波澜”这个名称,而用 了“中美纯”作为品牌的名称。实践证明,
举例
• 如果重庆市统计局是研究的总体,每一个
职工都是一个个体,那么反映每一个职工 的属性特征的性别、民族、家庭住址及反 映每一个职工数量特征的年龄、身高、收 入等概念就是标志。
(一)标志
• 标志仅是指概念或名称,而对标志的回答
叫标志表现。 • 根据标志表现的不同,标志可以分为品质 标志(性质特征)和数量标志(数量特 征)。
推断会有错误、误差,用概率论的术语
和方法来描述和论证。怎样尽可能减少推
断的误差,是统计推断的中心问题。
• 内容
推 断 统 计
参数估计 假设检验
•
目的——对总体特征作出推断
总体
样 本
描述统计与推断统计的关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
反映客 观现象 的数据
推断统计
样本数据