数学统计学及其基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结论:东方电子集团有限公司的现行价格低估了。
案例1Baidu Nhomakorabea
一家会计师事务所想确定客户的资产负债表中所显示的应收账 款的数量是否公正地体现了实际的应收账款的数量。通常,应 收账款的账目数量很大,要审查和验证每个账户既费时又费钱。
怎么办?
抽样调查可以解决问题!
案例2
零售付账柜台使用电子扫描仪收集数据,可供各种营销研 究应用。
存在形式:纸质,电子版,网站数据库
部分网上数据资源
中国国家统计局:www.stats.gov.cn 上海统计局:www.stats-sh.gov.cn 信息产业部:www.mii.gov.cn/mii/hyzw 国家外汇管理局:www.safe.gov.cn 国信证券:www.guosen.com.cn 中国人民银行网:www.pbc.gov.cn 经济杂志网:www.economagic.com 北京大学网:www.gse.pku.cn/dataset/yearbook 中国疾病预防控制中心: www.chinacdc.net.cn/feiyan/default1.asp 国际货币基金组织数据库:http://www.imf.org 经合组织数据库:http://www.oecd.org 美国:www.bea.doc.gov 美国人口普查局:www.census.gov 美国会图书馆:www.loc.gov/ 美国商业部:www.stat-usa.gov/ 亚洲东盟网站:www.aseansec.org APEC 网站:www.apecsec.org.sg 美国 IBM 公司:www.ibm.com/investor 美国:www.imf.org 美国纳斯达克网:www.nasdaqnews.com 荷兰国家统计局: http://www.cbs.nl/en-GB/default.htm 美国统计协会商业与经济统计部 http://www.econ-datalinks.org
1995年9月,美国斯坦福大学经济学教授刘遵义就 通过实证比较,数量分析和模糊评价等方法,预测
出菲律宾、韩国、泰国、印尼和马来西亚有可能发
生金融危机。
案例2
2005年3月16日上证平均指数中30支股票的市盈率是21.08。
东方电子集团有限公司的市盈率是17.92。这时,市盈率方面
的统计信息显示:与上证指数股票的平均收入相比,东方电 子集团有限公司的股票价格较低。因此,投资顾问可以得出
按研究方法
描述统计学 推断统计学
描述统计学
Descriptive Statistics
描述统计学研究如何取得反 映客观现象的数据,并通过图表 形式对所收集的数据进行加工处 理和显示,进而通过综合、概括 与分析得出反映客观现象的规律 性数量特征。
推断统计学
Inferential Statistics
样本
样本(Sample)是指从统计总体中抽取出 来作为代表这一总体的、由部分个体组成的 集合体。
代表性 样本量(sample size)
抽取原则:随机、非随机
非随机抽样:
判断抽样、配额抽样、滚雪球抽样 …
总体、样本和个体间的关系
标志
统计标志,简称标志,是指每个个体所共同具有的 属性或特征,它是说明个体的属性或特征的具体 名称。
相对数
是由两个相互联系的绝对数相比得到,反映事物 的相对数量。
常用的相对数:结构相对数、动态相对数、比较 相对数、计划完成相对数。 结构相对数是在对资料进行分组的基础上,以总体 的总量作为比较的标准而得到的相对数。动态相对 数是将不同时期的同类事物的水平加以比较求得的 相对数。比较相对数是将不同单位的同类现象对比 得到的相对数。计划完成相对数将实际完成数与计 划完成数对比用以反映计划的执行情况,对于产出 类指标,如产量,大于 100%说明完成了规定的任务, 而对于投入类指标,如成本,则小于 100%说明完成 任务。
标志值
分类:品质标志和数量标志
不变标志和可变标志
是非标志
指标
统计指标,简称指标(indicator),是反映总体数 量特征的,由各个个体的标志值汇总综合而成。任 何一个统计指标都是经过了从个别到一般、从具体
到抽象的过程,它体现总体特征,具有综合性。
(一)口径一致是统计指标的基本要求 (二)统计指标按反映问题的数量特征分类 (三)统计指标按核算的范围分类
面板数据
是对若干个单位在不同时间进行 重复跟踪调查所形成的数据。
例如,我们连续20年收集得到的 企业工人的工资、受教育程度和 就业情况的数据。
数据类型III
绝对数(absolute number)
相对数(relative number)
平均数(average)
绝对数
是统计数据的基本表现形式,是其他指标形式形 成的基础。现象的总体规模和水平一般都以绝对数 形式表现,如:总人口、国内生产总值、货物周转 量等都是绝对数;其计量单位有实物单位、价值单 位和复合单位三种。 分为:时期数和时点数。 时期数是反映现象在一段时期内的总量。如产品 产量、产值、销售额等。特点:可以连续计数,并 可以累积。 时点数是反映现象在某一瞬间时刻上的总量,如 人口数、商品的库存量、银行储蓄余额等。 特点:只能间断计数,各时点不能累积。
贡献:
(1)完成统计学和概率论结合
(2)建立了丰富的数理统计理论
社会统计学派 人物: 【德国】克尼斯、恩格尔和梅尔
观点:
统计学的研究对象是社会现象,目的在于明确社 会现象的内在联系和相互之间的关系。 在研究过程中,要用全面调查,也可以适量的使 用抽样调查。
恩格尔系数
(二)统计学的现代格局
以社会经济问题为主要研究对象的社会经济统计
提出世界公认的名词-统计学(Statistics)
评价:
“有统计之名,无统计之实”的学派
政治算术学派 人物:
【英国】威廉· 配第和约翰· 格朗特
贡献: 开用数量方法研究社会经济现象之先河 评价: “有统计之实,无统计之名”的学派
数理统计学派
人物:
【比利时】人才济济。如:凯特勒、戈赛 特 、费希尔、内曼、卡尔.皮尔逊
第一章 统计学及基本概念
南京财经大学统计学系
本章内容
第一节 统计学简介
一、统计的涵义 二、统计的过去与现在 三、统计学在经济管理中的应用
第二节
数据及其分类
一、认识数据 二、数据类型Ⅰ 三、数据类型Ⅱ 四、数据类型III 五、数据类型IV
第三节
第四节 第五节
总体、个体与样本
标志、指标与指标体系 统计计算工具
分类数据(categorical data) 分类数据是对事物进行分类的结果,数据的
主要特征是采用文字、数字的代码和其他符号
对事物进行简单的分类和分组。
分类数据以定类尺度(nominal scale)来衡量。
顺序数据(rank data)
即:等级数据
也是对事物进行分类的结果,只是这些分类 在语义上表现出明显的等级或顺序关系; 例如,学生的成绩; 对商品和服务的满意程度 顺序数据以定序尺度( ordinal scale )来衡量。
数值型数据
定量数据或数量数据
数值型数据是使用自然或度量 衡单位对事物进行测量的结果,其 结果表现为具体数值。
两种衡量尺度: 定距尺度(interval scale) — 温度 定比尺度(ratio scale) 区别:“绝对零点”
数据类型Ⅱ
截面数据(cross-sectional data) 时间序列数据(time series data) 面板数据(panel data)
以方法和应用研究为主的数理统计
学科的角度,前者从属于应用经济学;后者从属于数学
对计算机的依赖越来越
统计学从有关领域中吸取的养分也越来越多 交叉发展的趋势越来越强
三、统计学在经济管理中的应用
统计给我们智慧与力量 统计学在经济领域的应用 (案例1 案例2)
统计学在管理领域的应用 (案例1 案例2)
案例1
总体与个体
统计总体,简称总体(population),就是统计 所要研究的事物或现象的全体,即由客观存 在的,具有某种共同特征的许多个别事物构 成的整体。 个体(Item Unit)是构成统计总体的个别事 物,又称为单位。
总体的特点:
1、大量性
2、同质性 3、差异性 4、相对性
总体容量 有限总体 无限总体
主要做三件事: 收集数据 整理数据 分析数据
1. 统计工作(statistical work)
统计工作是为了管理或认识的需要,对社会经济现象和自 然现象进行数据收集的活动。
统计局系统
企业信息化
2. 统计资料(statistical data)
统计资料是统计工作过程中所取得的各项数字资料以 及与之相关信息的总称。统计资料是统计工作取得的 能够说明所研究对象的数据。例如国内生产总值数据, 说明整个国家的生产规模。这些数据经常会在报纸、 杂志上出现。
(一)口径一致是统计指标的基本要求
1. 统计指标是反映研究对象总体特征的,确定研究 对象往往与一定的理论相联系,理论定义的范畴应该 和实际获得的指标数值的口径统一。 2. 统计口径包括两个方面:一是计算口径外延的明
截面数据
截 面 数 据 ( cross-sectional data)是对多个不同的个体在相同 或近似相同的时间点上收集的数据, 它所描述的是现象在某一时刻或某 一时间段的变化情况。
时间序列数据
时间序列数据(time series data )是对同一个研究对象在 不同时间上收集到的数据,它 所描述的是现象随时间而变化 的情况。
数据集1
中国历年主要宏观经济指标数据集
数据集2
1995年世界各国基本情况数据集
数据集3
公司人力资源部数据集
数据集4
工厂流水线上的抽样数据集
数据类型Ⅰ
1. 分类数据(categorical data) 2. 顺序数据(rank data) 3. 数值型数据(metric data)
定性数据
品质数据
数据挖掘的典型: 啤酒与纸尿裤
一、认识数据
1. 中国历年主要宏观经济指标数据集(数据集01) 2. 1995年世界各国基本情况数据集(数据集02) 3. 公司人力资源部数据集(数据集03) 4. 企业流水线上的抽样数据集(数据集04)
EXCEL
现代汉语词典对数据的解释是:进行各种 统计、计算、科学研究或技术设计等所依 据的数值。我们提供四个数据集,让大家 对数据有一个直观的了解。
汇总每天某个时间点上,在线用户占注册用户的 比例来反映用户通常上网的时间
作出决策 →
早点起床,在网上飞驰
二、统计的过去与现在
(一)统计学中的各大著名学派 1.国势学派 2. 政治算术学派
3.数理统计学派 4. 社会统计学派
(二)统计学的现代格局
国势学派 人物: 【德国】康令和阿亨瓦尔 贡献:
平均数
反映现象总体的一般水平。
思考:平均数和相对数的区别
五、变量
最常见的分类是:离散型变量和连续型变量。离散型变
量一般用“点数”的方法取得,数值往往是整数,如职工 人数、企业个数、设备台数等。连续型变量用“测量”取 得,如人的身高、体重;产品的长度、重量等。 变量还可分为确定性变量和随机变量。受确定性因素 影响的变量称为确定性变量。受随机性因素影响的变量称 为随机变量,所谓随机因素,是指各种不确定的、偶然性 的因素,这种因素对变量影响的大小和方向都是不确定的, 通常是微小的。 定性变量和定量变量
推断统计学是研究如何根据 样本数据去推断总体数量特征的 方法,它是在对样本数据进行描 述的基础上,对统计总体的未知 数量特征作出以概率形式表述的 推断。
案例
收集数据 →
整理数据 → 分析数据 → 展现结果 →
互联网的用户人数及分布、信息流量分布、域名 注册、用户通常在什么时间上网等信息都可以从 电讯局或网络公司的业务记录中获得 。
一、统计总体和个体 二、总体的特点 三、样本
一、统计标志 二、统计指标 三、统计指标体系
一、统计分析软件简介 二、Excel实现数据处理的主要途径
一、统计的涵义
1. 统计工作(statistical work) 2. 统计资料(statistics, statistical data) 3. 统计学(statistics)
3. 统计学(statistics) 统计学是在统计工作的经验积累到一定程 度时自然产生的,它是收集、整理、描述 分析统计数据的方法和技术,为我们的决 策提供“量”方面的依据。
《不列颠百科全书》对统计学的定义为: “统计学是关于收集和分析数据的科学和 艺术”。
统计学的分类
按研究内容:
理论统计学 应用统计学