统计学及其基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人物:
【英国】威廉· 配第和约翰· 格朗特
贡献:
开用数量方法研究社会经济现象之先河
评价: “有统计之实,无统计之名”的学派
威廉· 配第
配第著作《政治算 术》中,对当时的英国、 荷兰、法国之间的财富 进行数量上的计算和比 较。 马克思称配第是 “政治经济学之父,在 某种程度上也可以说是 “统计学的创始人”
分类: 离散型变量、连续型变量
确定性变量、随机变量
离散型变量
discrete variable
离散型变量一般用“点数” 的方法取得,数值往往是整数, 如职工人数、企业个数、设备台 数等。
连续型变量
continuous variable
连续型变量用“测量”取得, 测量的仪器越精密,变量值就会 越精确,如人的身高、体重;产 品的长度、重量等。
统计学的现代格局
一是以社会经济问题为主要研 究对象的社会经济统计 , 从属于应用 经济学。 二是以方法和应用研究为主的 数理统计。从学科的角度看,从属 于数学。
国势学派
人物:
【德国】康令和阿亨瓦尔
贡献:
提出世界公认的名词-统计学(Statistics)
评价: “有统计之名,无统计之实”的学派
政治算术学派
变量按获取方式分:离散型变量 变量按获取方式分:确定性变量
基本概念
总体 、个体、样本、标志、指标、变量
统计计算工具
Excel:
统计函数、统计分析工具 马克威统计分析软件
(方差分析、多元统计分析等) 附:认证考试说明
统计工作
Statistical work
统计工作是为了管理或认识 的需要,对社会经济现象和自然 现象进行数量收集的活动。
许多学者把卡尔· 皮尔逊
尊称为“统计学之父”。
社会统计学派
人物: 【德国】克尼斯、恩格尔和梅尔 观点: 统计学的研究对象是社会现象,目 的在于明确社会现象的内在联系和相 互之间的关系。
在研究过程中,要用全面调查,也 可以适量的使用抽样调查。
案例
收集数据 →
整理数据 → 分析数据 → 展现结果 →
案例2
2005年3月16日上证平均指数中30支股
票的市盈率是21.08。东方电子集团有限公
司的市盈率是17.92。这时,市盈率方面的
统计信息显示:与上证指数股票的平均收入
相比,东方电子集团有限公司的股票价格较 低。因此,投资顾问可以得出结论:东方电 子集团有限公司的现行价格低估了。
案例3
假设一家会计师事务所想确定客户的资 产负债表中所显示的应收账款的数量是否公 正地体现了实际的应收账款的数量。通常, 应收账款的账目数量很大,要审查和验证每 个账户既费时又费钱。 怎么办? 抽样调查可以解决问题!
统计描述法
统计描述法是对由调查或实 验得到的统计数据资料进行整理、 归类,计算出各种能反映总体数 量特征的综合指标,并加以分析 研究,从而得出需要的数据资料 信息,用表格、图形和统计指标 数值来表示的统计方法。
统计学中的各大著名学派
1. 国势学派 2. 政治算术学派 3. 数理统计学派
4. 社会统计学派
统计学是在统计工作的经验积 累到一定程度时自然产生的,它是 收集、整理、描述分析统计数据的 方法和技术,为我们的决策提供 “量”方面的依据。
《不列颠百科全书》对统计学的定 义为:“统计学是关于收集和分析数据 的科学和艺术”。
中华人民共和国国家统计局
企业信息化模式
艺术:金字塔
描述统计学
Descriptive Statistics
描述统计学研究如何取得反 映客观现象的数据,并通过图表 形式对所收集的数据进行加工处 理和显示,进而通过综合、概括 与分析得出反映客观现象的规律 性数量特征。
推断统计学
Inferential Statistics
推断统计学是研究如何根据 样本数据去推断总体数量特征的 方法,它是在对样本数据进行描 述的基础上,对统计总体的未知 数量特征作出以概率形式表述的 推断。
相对数
relative number
相对数是由两个相互联系的 绝对数对比得到,反映事物的相 对数量。常用的相对数包括:结 构相对数、动态相对数、比较相 对数、计划完成相对数。
平均数 average
平均数反映现象总体的一般水平。 如: 职工的平均工资。
变量
变量(variable)总是可以用数值形 式表现的,可变的数量标志和所有 的统计指标都是变量。
个体
个体(Item Unit)是构成统 计总体的个别事物,又称为总体 单位。
样本
样本(Sample)是指从统计总 体中抽取出来作为代表这一总体的、 由部分个体组成的集合体。
抽取原则:随机、非随机
非随机抽样:任意抽样、判断抽样、配额抽样
标志
统计标志,简称标志(characteristic), 是指每个个体所共同具有的属性或特 征,它是说明个体的属性或特征的具 体名称。
互联网的用户人数及分布、信息流量分布、域名 注册、用户通常在什么时间上网等信息都可以从 电讯局或网络公司的业务记录中获得 。
汇总每天某个时间点上,在线用户占注册用户的 比例来反映用户通常上网的时间
作出决策
早点起,在网上飞驰
案例1
1995年9月,美国斯坦福大学经济学教
授刘遵义就通过实证比较,数量分析和模糊 评价等方法,预测出菲律宾、韩国、泰国、 印尼和马来西亚有可能发生金融危机。
面板数据
panel data
面板数据是对若干个单位 在不同时间进行重复跟踪调查 所形成的数据。
绝对数
absolute number
绝对数是统计数据的基本表 现形式,是其他指标形式形成的 基础。现象的总体规模和水平一 般都以绝对数形式表现,一个地 区的总人口、国内生产总值、货 物周转量等都是绝对数。
被统计学界称为“国际统计会议之 父”和“近代统计学之父”,其贡 献是发现了大量现象的统计规律性 和开创性地应用了许多统计方法, 为数理统计学的发展奠定了基础。
卡尔· 皮尔逊
他设计的“直线相关系数” 是最常用的相关系数,
从其构思过程中,体会“对称美”;
他构建的“ 2 检验”
是最常用的检验方法,
从其公式形式中,体会“简单美”。
顺序数据
rank data
即等级数据,是对事物进行 分类的结果,这些分类在语义上 表现出明显的等级或顺序关系, 例如,学生成绩可以分为优秀、 良好、中等、及格和不及格。
顺序数据以定序尺度(ordinal scale)来衡量。
数值型数据 metric data
数值 型数 据是 使用 自然 或 度量衡单位对事物进行测量的结 果,其结果表现为具体数值。
分类:
数量指标、质量指标
总体指标、样本指标
指标体系
指标体系
一系列相互联系、相互制约的多个统计 指标就构成统计指标体系。
举例1:工业企业统计指标体系
~企业管理与信息处理指标子体系
举例2:宏观统计指标体系
~国民经济核算体系
维度
【例】根据大量资料统计结果,汽车的车祸 有70%发生于中速行驶时,30%发生于高速 行驶时,就此能否认为高速行驶比中速行驶 更安全?
案例1 案例2 案例3 案例4
认识数据
四个数据集:
中国主要宏观经济指标数据集、95世界各国基本情况数据集
公司人力资源部数据集 、企业流水线上的抽样数据集
按测量的精度分:分类数据
顺序数据 数值型数据 截面数据 面板数据
按与时间的关系分 :时间序列数据
按数据表现形式分:绝对数
相对数 平均数
连续型变量 随机变量
标志按其性质分为品质标志和数量标志。
标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。
wk.baidu.com
指标
统计指标,简称指标(indicator),是反映总 体数量特征的,由各个个体的标志值汇总综 合而成。任何一个统计指标都是经过了从个 别到一般、从具体到抽象的过程,它体现总 体特征,具有综合性。 注意:口径 - 外延、维度
数量指标
它是反映客观事物的规模或水平的指标, 它表现为汇总后直接得到的绝对数或总量, 又称之为总量指标或绝对指标。数量指标是 最基本的指标,它是计算其他指标的基础。 数量指标包括标志总量和总体单位总量,如 总产值、工资总额、人口总数、企业个数等。
质量指标
它是反映客观现象之间的相互联系、比 例关系、发展速度、内部结构的指标,一般 用相对数或平均数表示。如劳动生产率、成 本利润率、人均国民收入等。质量指标是由 两个数量指标对比求得的,它是由数量指标 派生的。
数值型数据有两种衡量尺度:
一是定距尺度(interval scale)
二是定比尺度(ratio scale)
区别:“零点”
时间序列数据
time series data
时间序列数据是在不同时 间上收集到的数据,它所描述 的是现象随时间而变化的情况。
截面数据
cross-sectional data
截面数据是在相同或近似 相同的时间点上收集的数据, 它所描述的是现象在某一时刻 或某一时间段的变化情况。
确定性变量
certainty variables
受确定性因素影响的变量称 为确定性变量。这种影响变量值 变化的因素是明显的,是可以解 释的,是人为的或者受人控制的, 其影响变量值的大小、方向都可 以确定。
随机变量
random variable
受随机性因素影响的变量称 为随机变量,所谓随机因素,是 指各种不确定的、偶然性的因素, 这种因素对变量影响的大小和方 向都是不确定的,通常是微小的。
数理统计学派
人物:
【比利时】人才济济。如:凯特勒、戈赛 特 、费希尔、内曼、卡尔 皮尔逊 贡献:
(1)完成统计学和概率论结合
(2)建立了丰富的数理统计理论
凯特勒
比利时统计学家(1796-1874)
著作《社会物理学》提出著名的 “平均人”概念,认为:社会所有 的人与“平均人”的差距越小,则 社会矛盾就越缓和。
谁做?
统计局系统、 企业信息化
统计资料 Statistical data
统计资料是统计工作过程中 所取得的各项数字资料以及与之 相关信息的总称。统计资料是统 计工作取得的能够说明所研究对 象的数据。例如国内生产总值数 据,说明整个国家的生产规模。 这些数据经常会在报纸、杂志上 出现。
统计学
Statistics
案例4
零售付账柜台使用电子扫描仪收集数
据,可供各种营销研究应用。
数据挖掘的典型: 啤酒与纸尿裤
分类数据
categorical data
分类数据是对事物进行分类 的结果,数据的主要特征是采用 文字、数字的代码和其他符号对 事物进行简单的分类和分组。
分类数据以定类尺度(nominal scale)来衡量。
企业管理与信息处理指标子体系
工业企业经营管理指标 工业企业企业管理指标
信息获取与利用指标
工业企业财务管理指标
工业企业经济效益评价指标
国民经济核算体系
第一章 统计学及其基本概念
本章内容
一、 统计学简介 二、 认识数据
三、 基本概念
四、 统计计算工具
统计学简介
统计的涵义:
统计工作、统计资料、 统计学
案例: 我该什么时候上网?
统计学的内容 :
描述统计学 、推断统计学
统计学的过去与现在:
统计学中的各大著名学派、统计学的现代格局
统计学在经济管理中的应用:
计算工具
计算器-要求会用“统计功能” 计算机-要求会用“Excel”作分析
1. 公式和函数
2. 数据分析工具
总体
统计总体,简称总体(Population), 就是统计所要研究的事物或现象的全体, 即由客观存在的,具有某种共同特征的 许多个别事物构成的整体。 总体的特点:大量性、同质性、 差异性、相对性
【英国】威廉· 配第和约翰· 格朗特
贡献:
开用数量方法研究社会经济现象之先河
评价: “有统计之实,无统计之名”的学派
威廉· 配第
配第著作《政治算 术》中,对当时的英国、 荷兰、法国之间的财富 进行数量上的计算和比 较。 马克思称配第是 “政治经济学之父,在 某种程度上也可以说是 “统计学的创始人”
分类: 离散型变量、连续型变量
确定性变量、随机变量
离散型变量
discrete variable
离散型变量一般用“点数” 的方法取得,数值往往是整数, 如职工人数、企业个数、设备台 数等。
连续型变量
continuous variable
连续型变量用“测量”取得, 测量的仪器越精密,变量值就会 越精确,如人的身高、体重;产 品的长度、重量等。
统计学的现代格局
一是以社会经济问题为主要研 究对象的社会经济统计 , 从属于应用 经济学。 二是以方法和应用研究为主的 数理统计。从学科的角度看,从属 于数学。
国势学派
人物:
【德国】康令和阿亨瓦尔
贡献:
提出世界公认的名词-统计学(Statistics)
评价: “有统计之名,无统计之实”的学派
政治算术学派
变量按获取方式分:离散型变量 变量按获取方式分:确定性变量
基本概念
总体 、个体、样本、标志、指标、变量
统计计算工具
Excel:
统计函数、统计分析工具 马克威统计分析软件
(方差分析、多元统计分析等) 附:认证考试说明
统计工作
Statistical work
统计工作是为了管理或认识 的需要,对社会经济现象和自然 现象进行数量收集的活动。
许多学者把卡尔· 皮尔逊
尊称为“统计学之父”。
社会统计学派
人物: 【德国】克尼斯、恩格尔和梅尔 观点: 统计学的研究对象是社会现象,目 的在于明确社会现象的内在联系和相 互之间的关系。
在研究过程中,要用全面调查,也 可以适量的使用抽样调查。
案例
收集数据 →
整理数据 → 分析数据 → 展现结果 →
案例2
2005年3月16日上证平均指数中30支股
票的市盈率是21.08。东方电子集团有限公
司的市盈率是17.92。这时,市盈率方面的
统计信息显示:与上证指数股票的平均收入
相比,东方电子集团有限公司的股票价格较 低。因此,投资顾问可以得出结论:东方电 子集团有限公司的现行价格低估了。
案例3
假设一家会计师事务所想确定客户的资 产负债表中所显示的应收账款的数量是否公 正地体现了实际的应收账款的数量。通常, 应收账款的账目数量很大,要审查和验证每 个账户既费时又费钱。 怎么办? 抽样调查可以解决问题!
统计描述法
统计描述法是对由调查或实 验得到的统计数据资料进行整理、 归类,计算出各种能反映总体数 量特征的综合指标,并加以分析 研究,从而得出需要的数据资料 信息,用表格、图形和统计指标 数值来表示的统计方法。
统计学中的各大著名学派
1. 国势学派 2. 政治算术学派 3. 数理统计学派
4. 社会统计学派
统计学是在统计工作的经验积 累到一定程度时自然产生的,它是 收集、整理、描述分析统计数据的 方法和技术,为我们的决策提供 “量”方面的依据。
《不列颠百科全书》对统计学的定 义为:“统计学是关于收集和分析数据 的科学和艺术”。
中华人民共和国国家统计局
企业信息化模式
艺术:金字塔
描述统计学
Descriptive Statistics
描述统计学研究如何取得反 映客观现象的数据,并通过图表 形式对所收集的数据进行加工处 理和显示,进而通过综合、概括 与分析得出反映客观现象的规律 性数量特征。
推断统计学
Inferential Statistics
推断统计学是研究如何根据 样本数据去推断总体数量特征的 方法,它是在对样本数据进行描 述的基础上,对统计总体的未知 数量特征作出以概率形式表述的 推断。
相对数
relative number
相对数是由两个相互联系的 绝对数对比得到,反映事物的相 对数量。常用的相对数包括:结 构相对数、动态相对数、比较相 对数、计划完成相对数。
平均数 average
平均数反映现象总体的一般水平。 如: 职工的平均工资。
变量
变量(variable)总是可以用数值形 式表现的,可变的数量标志和所有 的统计指标都是变量。
个体
个体(Item Unit)是构成统 计总体的个别事物,又称为总体 单位。
样本
样本(Sample)是指从统计总 体中抽取出来作为代表这一总体的、 由部分个体组成的集合体。
抽取原则:随机、非随机
非随机抽样:任意抽样、判断抽样、配额抽样
标志
统计标志,简称标志(characteristic), 是指每个个体所共同具有的属性或特 征,它是说明个体的属性或特征的具 体名称。
互联网的用户人数及分布、信息流量分布、域名 注册、用户通常在什么时间上网等信息都可以从 电讯局或网络公司的业务记录中获得 。
汇总每天某个时间点上,在线用户占注册用户的 比例来反映用户通常上网的时间
作出决策
早点起,在网上飞驰
案例1
1995年9月,美国斯坦福大学经济学教
授刘遵义就通过实证比较,数量分析和模糊 评价等方法,预测出菲律宾、韩国、泰国、 印尼和马来西亚有可能发生金融危机。
面板数据
panel data
面板数据是对若干个单位 在不同时间进行重复跟踪调查 所形成的数据。
绝对数
absolute number
绝对数是统计数据的基本表 现形式,是其他指标形式形成的 基础。现象的总体规模和水平一 般都以绝对数形式表现,一个地 区的总人口、国内生产总值、货 物周转量等都是绝对数。
被统计学界称为“国际统计会议之 父”和“近代统计学之父”,其贡 献是发现了大量现象的统计规律性 和开创性地应用了许多统计方法, 为数理统计学的发展奠定了基础。
卡尔· 皮尔逊
他设计的“直线相关系数” 是最常用的相关系数,
从其构思过程中,体会“对称美”;
他构建的“ 2 检验”
是最常用的检验方法,
从其公式形式中,体会“简单美”。
顺序数据
rank data
即等级数据,是对事物进行 分类的结果,这些分类在语义上 表现出明显的等级或顺序关系, 例如,学生成绩可以分为优秀、 良好、中等、及格和不及格。
顺序数据以定序尺度(ordinal scale)来衡量。
数值型数据 metric data
数值 型数 据是 使用 自然 或 度量衡单位对事物进行测量的结 果,其结果表现为具体数值。
分类:
数量指标、质量指标
总体指标、样本指标
指标体系
指标体系
一系列相互联系、相互制约的多个统计 指标就构成统计指标体系。
举例1:工业企业统计指标体系
~企业管理与信息处理指标子体系
举例2:宏观统计指标体系
~国民经济核算体系
维度
【例】根据大量资料统计结果,汽车的车祸 有70%发生于中速行驶时,30%发生于高速 行驶时,就此能否认为高速行驶比中速行驶 更安全?
案例1 案例2 案例3 案例4
认识数据
四个数据集:
中国主要宏观经济指标数据集、95世界各国基本情况数据集
公司人力资源部数据集 、企业流水线上的抽样数据集
按测量的精度分:分类数据
顺序数据 数值型数据 截面数据 面板数据
按与时间的关系分 :时间序列数据
按数据表现形式分:绝对数
相对数 平均数
连续型变量 随机变量
标志按其性质分为品质标志和数量标志。
标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。
wk.baidu.com
指标
统计指标,简称指标(indicator),是反映总 体数量特征的,由各个个体的标志值汇总综 合而成。任何一个统计指标都是经过了从个 别到一般、从具体到抽象的过程,它体现总 体特征,具有综合性。 注意:口径 - 外延、维度
数量指标
它是反映客观事物的规模或水平的指标, 它表现为汇总后直接得到的绝对数或总量, 又称之为总量指标或绝对指标。数量指标是 最基本的指标,它是计算其他指标的基础。 数量指标包括标志总量和总体单位总量,如 总产值、工资总额、人口总数、企业个数等。
质量指标
它是反映客观现象之间的相互联系、比 例关系、发展速度、内部结构的指标,一般 用相对数或平均数表示。如劳动生产率、成 本利润率、人均国民收入等。质量指标是由 两个数量指标对比求得的,它是由数量指标 派生的。
数值型数据有两种衡量尺度:
一是定距尺度(interval scale)
二是定比尺度(ratio scale)
区别:“零点”
时间序列数据
time series data
时间序列数据是在不同时 间上收集到的数据,它所描述 的是现象随时间而变化的情况。
截面数据
cross-sectional data
截面数据是在相同或近似 相同的时间点上收集的数据, 它所描述的是现象在某一时刻 或某一时间段的变化情况。
确定性变量
certainty variables
受确定性因素影响的变量称 为确定性变量。这种影响变量值 变化的因素是明显的,是可以解 释的,是人为的或者受人控制的, 其影响变量值的大小、方向都可 以确定。
随机变量
random variable
受随机性因素影响的变量称 为随机变量,所谓随机因素,是 指各种不确定的、偶然性的因素, 这种因素对变量影响的大小和方 向都是不确定的,通常是微小的。
数理统计学派
人物:
【比利时】人才济济。如:凯特勒、戈赛 特 、费希尔、内曼、卡尔 皮尔逊 贡献:
(1)完成统计学和概率论结合
(2)建立了丰富的数理统计理论
凯特勒
比利时统计学家(1796-1874)
著作《社会物理学》提出著名的 “平均人”概念,认为:社会所有 的人与“平均人”的差距越小,则 社会矛盾就越缓和。
谁做?
统计局系统、 企业信息化
统计资料 Statistical data
统计资料是统计工作过程中 所取得的各项数字资料以及与之 相关信息的总称。统计资料是统 计工作取得的能够说明所研究对 象的数据。例如国内生产总值数 据,说明整个国家的生产规模。 这些数据经常会在报纸、杂志上 出现。
统计学
Statistics
案例4
零售付账柜台使用电子扫描仪收集数
据,可供各种营销研究应用。
数据挖掘的典型: 啤酒与纸尿裤
分类数据
categorical data
分类数据是对事物进行分类 的结果,数据的主要特征是采用 文字、数字的代码和其他符号对 事物进行简单的分类和分组。
分类数据以定类尺度(nominal scale)来衡量。
企业管理与信息处理指标子体系
工业企业经营管理指标 工业企业企业管理指标
信息获取与利用指标
工业企业财务管理指标
工业企业经济效益评价指标
国民经济核算体系
第一章 统计学及其基本概念
本章内容
一、 统计学简介 二、 认识数据
三、 基本概念
四、 统计计算工具
统计学简介
统计的涵义:
统计工作、统计资料、 统计学
案例: 我该什么时候上网?
统计学的内容 :
描述统计学 、推断统计学
统计学的过去与现在:
统计学中的各大著名学派、统计学的现代格局
统计学在经济管理中的应用:
计算工具
计算器-要求会用“统计功能” 计算机-要求会用“Excel”作分析
1. 公式和函数
2. 数据分析工具
总体
统计总体,简称总体(Population), 就是统计所要研究的事物或现象的全体, 即由客观存在的,具有某种共同特征的 许多个别事物构成的整体。 总体的特点:大量性、同质性、 差异性、相对性