统计学基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.4统计学的内 容
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计
根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提,推 断统计是描述统计的发展。
1.5统计学与其他学科的关系
(一)统计学与数学的关系
3. 统计学:一门研究总体数量特征的方法论科学。 统计工作 统计资料 统 计学 工作与工作成果关系
实践与理论关系
统计研究的过程
实际问题
收集数据 (取得数据) 整理数据 (处理数据 ) 解释数据 (结果说明) 分析数据 (研究数据 )
1.3 统计数据的类型
1.3.1
分类数据
按照计量尺度不同
对事物进行平行的分类,各类别可以指定数字代码 表示
时间序列数据
在不同时间收集到的数据 , 按时间顺序收集的,用于 描述现象随时间变化的情 况
1.4 统计学的基本概念
1.统计总体与样本
2.标志与指标
3.变量
1.总体与总体单位 总体 即统计总体,是指客观存在的、具有
某种共同性质的许多个别单位所构成的整体。
总体单位 即构成统计总体的每一个事物或基
本单位。
案例1
初步核算,全年国内生产总值519322亿元,按可 比价格计算,比上年增长7.8%。分季度看,一季 度同比增长8.1%,二季度增长7.6%,三季度增长 7.4%,四季度增长7.9%。分产业看,第一产业增 加值52377亿元,比上年增长4.5%;第二产业增 加值235319亿元,增长8.1%;第三产业增加值 231626亿元,增长8.1%。从环比看,四季度国 内生产总值增长2.0%。
在现实生活中,要么总体都是无限总体;要么 总体规模较大,总体单位数量较多,因此,现代
统计学所采用的研究思路一般是根据样本信息来
推断总体。所以说,样本是现代统计学中非常重 要的概念。 注意:在一个具体问题的研究中,总体总是唯 一确定的,而样本却不唯一。
样本单位:组成样本的各个单位(或元 素),是各项统计数字的原始承担者。
1.1统计的发展历史
统计学不是经济学,不是数学 但统计学起源于研究社会和经济问题 统计学家不要求是经济学家,但经济学家必须 是统计学家
统计学是一门古老的学科,始于古希腊的亚里 斯多德时代,迄今有四五千年的历史。经历了 萌芽期、近代期、现代期
统计学发展
萌芽期:17世纪中叶至18世纪,政治算术 学派、国势学派 近代期:18世纪末至19世纪末,数理统计 学派、社会统计学派 现代期:20世纪初----,统计学的主流从描述
总体根据它所包含的总体单位的数目是否有限
分为有限总体和无限总体。对于有限总体既可 以进行全面调查也可以进行非全面调查;而对 于无限总体只能进行非全面调查。
3)差异性。即各总体单位之间,除了必 须在某一方面有共性之外,其他方面必 然存在差异。
Eg:工业普查中,各工业企业的经济类型、 行业性质、职工人数、资金总额、产值等必 然存在着差异。)这些差异是统计研究的基 础,如果各总体单位之间不存在任何差异 ,则没有必要进行统计调查和研究。
例如:在工大抽取100名大学生进行学习情况的调查
2.标志与指标
1)标志与标志表现 2)统计指标与指标体系 3)指标和标志的关系
1)标志和标志表现
1.标志
(1)定义:说明总体单位共同属性或特征的名称。 (2)分类
品质标志——只能用文字表示的属性 数量标志——可用数值表示的特征 不变标志——各单位具体表现相同
0.1%,非食品价格上涨0.1%;消费品价格下降0.1%,服务价格 上涨0.5%。
2014年7月居民消费价格主要数据 7月 1-7月 环比涨 同比涨 涨跌幅 跌幅 跌幅 (%) (%) (%) 0.1 2.3 2.3 0.1 2.3 2.3 0.0 2.1 2.0 -0.1 0.1 -0.1 0.5 0.2 0.2 3.6 1.6 2.2 2.5 1.7 2.0 3.4 1.7 2.0 2.8 1.7 1.9
统计学转向推断统计学。20世纪30年代R·费希尔 的推断统计理论标志着现代数理统计学的确立
统计学的应用领域
经济学 医学
管理学
统计学
工程学
社会学
…
1.2什么是统计 ?
1.2.1统计包含三种涵义,两重关系
1. 统计工作:对统计数据进行搜集、整理和分析的过 程。 2. 统计数据:统计工作所产生的成果,用以描述我们所 研究现象的属性和特征 。如统计图表,统计分析报告 等。
例
产 销 率 劳动生产率
净产值率 成本利润率
工 益业 指企 标业 体经 系济 效
资金利润率 负 债 率 流动资金周转速度
3.指标和标志的关系
标志与指标 既有区别又有联系
区别:
标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都 能用数量表示。
联系:
1.统计学与数学的联系表现在统计方法以数学知识为基础。其共同点 是两者都为各学科提供研究和探索客观规律的数量方法。 2.统计学与数学的区别表现在两方面,一是统计研究的量是有计量单 位的具体的量,而数学研究的量是没有量纲的抽象的量。二是统计学 与数学研究中所使用的逻辑方法不同,统计研究是演绎与归纳的结合, 而数学所使用的是纯粹的演绎。 (二)统计学与其他学科的关系 统计方法是一种数量分析工具,它可以帮助其他学科探索各学科内在 的数量规律性。但是对这种数量规律性的解释只能由各学科的研究完 成。
统 计学
第一章 导 论 第二章 数据搜集
第三章 数据的图表展示
第四章 数据的概括性度量
第五章 参数估计 第六章 假设检验
第七章 一元线性回归 第八章 多元线性回归 第九章 时间序列分析和预测
第十章 指数
考核
30%课堂(点名和作业)+70%考试
Chaper1
导论
学习目标: 了解统计发展历史 掌握统计及统计学的涵义 掌握统计学的一些基本概念 了解统计学的基本方法和统计数据 类型
例2 2014年7月份,全国居民消费价格总水平同比上涨2.3%。其中, 城市上涨2.3%,农村上涨2.1%;食品价格上涨3.6%,非食品价 格上涨1.6%;消费品价格上涨2.2%,服务价格上涨2.5%。1-7 月平均,全国居民消费价格总水平比去年同期上涨2.3%。 7月份,全国居民消费价格总水平环比上涨0.1%。其中,城 市上涨0.1%,农村持平(涨跌幅度为0,下同);食品价格下降
居民消费价格 其中:城市 农村 其中:食品 非食品 其中:消费品 服务 其中:不包括食品和能源 其中:不包括鲜菜和鲜果
因此,统计是我们的“眼睛”,通过经济
统计,我们可以进行观察,获知经济社会 发展的基本状况。
我们相信上帝,除此之外,我们只相信数据。
——James R.Evans
学习统计学的目的和要求: 在理解基本概念的基础上,掌握统计资料的搜集、整理 以及分析的方法。重点掌握抽样推断、动态分析、指数 分析、相关与回归分析方法。 建议教学参考书或资料: 贾俊平主编《统计学》(第5版),中国人民大学出版社, 2014年; 主要参考资料: 万伦来、王立平主编《统计学原理与应用》,合肥工业 大学出版社,2007年第二版 李洁明等主编《统计学原理》(第4版),复旦大学出版 社,2010年; 邓力主编《统计学原理》,清华大学出版社,2012年; 莱文等主编《商务统计学》,中国人民大学出版社, 2010年。 中国统计局网:http://www.stats.gov.cn
总体与总体单位的转化
总体和总体单位是根据统计研究的目的来 确定的,随着统计研究目的的变化,总体 和总体单位也会发生变化。
例如一个企业、一所大学,既可以是某一调查研 究 的总体单位,也可以是另一调查研究的总体。
2.样本的定义与特点 定义:又称做抽样总体或子样,它是由从总体中按一定 规则抽选出来的一部分单位所组成的一个小的整体,是 总体的代表。 必须取自所要研究的总体; 特点 从一个总体中可抽取许多个样本,这些样本 的数值是不同的,也即存在着随机的差异; 样本必须具有代表性; 样本必须具有客观性。
1.6统计研究的基本方法
大量观察法
综合指标法
统计分组法
统计模型法
统计推断法
几种常用的统计软件 (Software)
典型的统计软件
SPSS
SAS
MINITAB STATISTICA Excel
SAS SPSS
STATISTICA MINITAB Excel
•又分为离散型变量和连续型变量
如:企业数量,温度,长度,金额等
连续变量的离散化处理
在某些特殊场合,连续变量也可作离散变 量处理。
如人口按年龄分组时,可分为0、1、2、3……
岁,其含义是“0”表示不满1岁,“1”表示满1 岁而不足2岁,“2”表示满2岁而不足3岁,依 次类推。 约定俗成,众所周知或事先明确规定,为了确 保不发生错漏统计现象,连续变量可离散化处 理。
(2)特点 1) 具体性:有具体对象、时间、地点、条件。 2) 综合性:说明总体特征是综合全部单位具体标志 表现的结果。 3) 数量性 :可度量的
(3)分类
数量指标 质量指标
按反映的数量特点不同分 按指标的功能不同分类
描述指标
按数值形式不同分
评价指标 预警指标 绝对数指标 相对数指标 平均数指标 正指标(销售收入、资金利税率)
例如:在工业普查中,“工业企业”就 是一个总体,其中每一个工业企业就 是总体单位。工业的设备普查中,总体 是“工业企业的所有设备”,而总体单 位 是“工业企业的每一台设备”。
总体具有三方面的特征:
1)同质性。即构成总体的各个单位必须具 有某一方面的共性,这个共性是确定总体 范围的标准。 2)大量性。即总体是由许多单位组成的, 而不是仅有的少数个别单位。
如:男性、女性; 医药行业、家电行业、纺织品行业
顺序数据
对事物分类的同时给出各类别的顺序,数据表现 为“类别”,但有序
如:一等品、二等品、三等品; 优、良、中、及格、不及格
数值型 数据
按数字尺度测量的观察值,其结果表现为具体 的数值
如:50cm;100kg
1.3.2 观测数据和实验数据
按照统计数据搜集方法
按表现形式分类
按有无差异分类 可变标志——各单位具体表现不同
2.标志表现
定义:是标志特征在各个总体单位上的具 体表现。 分类:品质标志表现和数量标志表现。
2)统计指标和指标体系
1.指标
(1)定义及构成要素 综合反映社会经济现象的总体数量特征的概念和数值。 指 标 = 指标名称 + 指标数值
综合关系:一些数量标志汇总可以得到指标的数值 ;
转换关系:数量标志与指标之间存在变换 关系。
变量
• 说明事物类别,取值是分类数据
分类变量
如:性别,变量值为“男”、“女”
行业,变量值为“零售业”、“旅游业”等
• 说明事物有序类别,取值是顺序数据
顺序变量
数值型变量
如:产品等级,变量值为“一等品”、“二等品”等 受教育程度,变量值为“小学”、“中学”等 • 说明事物数字特征,取值是数值型数据
观测数据
通过调查或观测而收 集到的数据,是在没有 对事物人为控制的条件 下得到的 GDP,CPI
实验数据
在实验中控制实验 对象而收集到的数据
新药疗效的实验数 据
1.3.3 截面数据和时间序列数据
按照被描述的现象与时间的关系
截面数据
在相同或近似相同的时 间点上收集的数据,用 于描述现象在某一时刻 的变化情况
按性质不同分类
逆指标(犯罪率、不及格率) 适度指标(恩格尔系数、基尼系数) 参数
按推断统计的指标说明的对象不同分
统计量
参数和统计量
•总体平均数μ •总体标准差 σ •总体比例 πFra Baidu bibliotek
1.参数
2.统计量
•样本平均数 •样本标准差 •样本比例
指标体系
(三)指标体系 1、 概念 具有内在联系的一系列指标构成的整体称为指标体系。 2、 表现形式 (1)以数学公式表现出来的指标体系,如:销售额 = 销售量×销售价格 (2)指标之间仅存在一种间接的相互依存关系,如衡量企业经济效益的若干指标所 构成的指标体系。