统计学 第1章 导论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
月份 利润 (百 万) 7月
2.0
8月
2.1
9月
2.2
10月
2.1
11月
2.3
12月
2.4
你会相 信谁?
统计的另一面
• • 利用统计,既可以昭告事实,也可以瞒天过海。 此时的关键是需要你自己做出更谨慎的判断。 另外,能否为自己的工作选择合适的图表,确保 数据以最有效的方式展现出来并传达你想传达的 信息,也是十分重要的。
变量及其类型
变量
基本分类
其他分类
分类变量
顺序变量
数值型变量
随机变量 非随机变量
经验变量 理论变量
1.3 统计数据的类型
1.3.1 分类数据、顺序数据、数值型数据
1.3.2 观测数据和实验数据
1.3.3 截面数据和时间序列数据
统计数据的分类
统计数据的类型
按计量尺度
分 类 数 据 顺 序 数 据 数 值 型 数 据
有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量或样本量 (sample size)
标志与标志分类
1. 标志
总体各单位所具有的属性或特征称为标志
统计的应用领域
【例1-2】用简单的描述统计量得到一个重要发现 费舍 (R . A . Fisher) 在 1952 的一篇文章中举了一个例 子,说明如何由基本的描述统计量的知识引出一个重要 的发现。 20 世纪早期,哥本哈根卡尔堡实验室的施密特 (J.Schmidt) 发现不同地区所捕获的同种鱼类的脊椎骨和 鳃线的数量有很大不同;甚至在同一海湾内不同地点所 捕获的同种鱼类,也发现这样的倾向。 然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲 各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域 里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值 和标准差。由此,施密特推断所有各个不同海域内的鳗 鱼是由海洋中某公共场所繁殖的。后来名为“戴纳 (Dana)”的科学考察船在一次远征中发现了这个场所。
2. 顺序数据(rank data)
3. 数值型数据(metric data)
按数cm、168cm、183cm
理解统计对大众的必要性
在投资股票时,需要了解股票市场价格的信 息,了解某只特定股票的有关财务信息
如果你关心足球世界杯,在有关媒体上,你 可以看到各支球队的技术统计 如果你关心宏观经济形势,在有关媒体上你 可以得到有关数据
统计在工商管理中的应用
企业发展战略:市场研究(如广告对市场 销售额的影响)、分析企业优势和劣势以 进行市场定位 产品质量管理:分析产品的合格率 人力资源管理:对员工的年龄、性别、受 教育程度、工资、业绩等进行分析,并作 为企业制定工资计划、奖惩制度的依据
让你说出哪些领域不使用统计,这很困难, 因为几乎找不到一个不用统计的领域;让你 说出哪些领域应用统计,同样也很困难,因 为几乎所有的领域都应用统计。
学统计 爱统计
统计的另一面
统计可以成为提炼数据本质的一件法宝,然 而也需要小心提防它。统计尽管以事实为基 础,有时却具有误导性。 例:某上市公司去年下半年的盈利情况
按收集方法
观 测 数 据 实 验 数 据
按时间状况
截 面 数 据 时 序 数 据
统计数据的分类
(按计量尺度分)
1. 分类数据(categorical data)
只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 只能归于某一有序类别的非数字型数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
参数和统计量
1. 参数(parameter)
描述总体特征的概括性数字度量,是研究者想要了解的 总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体比例 ()等 总体参数通常用希腊字母表示 每个参数有对应的样本统计量
2. 统计量(statistic)
用来描述样本特征的概括性数字度量,它是根据样本数 据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值 (x)、样本标准差(s)、样 本比例(p)等 样本统计量通常用小写英文字母来表示
第1章
导 论
第1章
1.1 统计及其应用领域
导 论
1.2 统计中的几个基本概念 1.3 统计数据的类型
学习目标
1. 2. 3. 4. 5. 理解统计学的含义 理解描述统计和推断统计 了解统计学的应用领域 了解数据的类型 理解统计中的几个基本概念
1.1 统计及其应用领域
1.1.1 什么是统计学
1.1.2 统计的应用领域
•
归根到底,我们既要知晓正确使用统计方法所需 的“科学”,又要掌握其中的“艺术”。
1.2 统计中的几个基本概念
1.2.1 总体和样本 1.2.2 标志和标志分类 1.2.3 统计指标
1.2.4 参数和统计量
1.2.5 变量
总体和样本
1. 总体(population)
所研究的全部个体的集合,其中的每一个个体也 称为元素,或者叫总体单位 分为有限总体和无限总体
例如教师的文化程度、年龄、工龄等特征 统计研究从登记标志状况开始,标志是统计研究的基础
2. 标志分类
按变异情况:不变标志与变异标志 按性质:品质标志与数量标志,前者用文字表示 ,后者用数值说明
统计指标
1. 界定 反映现象总体综合数量特征的范畴和统计数值 两种理解:概念名称、指标值(统计指标的具体取值) 特点:可量性、综合性、具体性 2. 种类 总量指标:数值表现为绝对数 相对指标:统计指标数值之比,如强度相对指标(有名 数)、比例相对指标(无名数) 平均指标:数值平均数和位置平均数两类 按指标性质不同,可分为数量指标(反映现象总规模、 总水平)和质量指标(相对数或平均数)
统计中的几个基本概念
总体 样本
参数
统计量
平均数
标准差 比 例
x
s p
变 量(variable)
1. 说明个体某种特征的概念,即存在差异的标志
如商品销售额、受教育程度、产品的质量等级等 每一个个体都有相应的变量值,即数据
分类变量(categorical variable):说明事物类别的名 称 顺序变量 (rank variable) :说明事物有序类别的名称 ,如产品等级 数值型变量 (metric variable) :说明事物数字特征的 名称
2. 变量可以分为
离散变量:取有限个值 连续变量:可以取无穷多个值
变 量
(其他分类)
1. 随机变量和非随机变量 2. 经 验 变 量 (empirical variables) 和 理 论 变 量 (theoretical variables)
经验变量所描述的是我们周围环境中可以观察 到的事物 理论变量则是由统计学家用数学方法所构造出 来的一些变量,比如,z 统计量、t 统计量、2 统计量、F 统计量等
¥
50
统计分组法 综合指标法:分总量、相对、 平均指标三种 统计模型法:方程模拟
25
0
3.
目的
描述数据特征 找出数据的基本规律
Q1 Q 2 Q3 Q 4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 研究如何利用样本数 据来推断总体特征的 统计方法 2. 内容 参数估计 假设检验 3. 目的
统计的应用领域
经济学
医学
管理学
统计学
工程学
社会学
…
统计的应用领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
统计的应用领域
hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)
• • 统计学主要研究客观事物的数量特征和数 量关系。 特点: 数量性 客观性
构成总体的全部
总体性
足够多的随机个体:大数定律 (大量的随机现象的平均结果 具有稳定性)
统计研究的基本方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 研究数据收集、处理、汇总 、图表描述、概括与分析等 统计方法 2. 统计描述的方法
什么是统计学?
(statistics)
统计学研究的是数据,提供的是一套通 用于所有学科领域的获取数据、分析数 据并从数据中得出结论的原则和方法。 简单地说,统计通过某种有意义的方式 对原始事实和数字进行提炼,使得仅仅 通过观察原始数据无法立即水落石出的 一些理念得以昭示。
统计研究的过程
统计学的研究对象
总体
对总体特征作出推断
样 本
统计的应用领域
【例1-1】用统计识别作者 1787—1788年,三位作者Alexander Hamilton, John Jay和James Madison为了说服纽约人认可宪法 ,匿名发表了著名的 85 篇论文。这些论文中的大多 数作者已经得到了识别,但是,其中的 12 篇论文的 作者身份引起了争议。 通过对不同单词的频数进行统计分析,得出的结 论是, James Madison 最有可能是这 12 篇论文的作 者。现在,对于这些存在争议的论文,认为 James Madison是原创作者的说法占主导地位,而且几乎可 以肯定这种说法是正确。
统计的应用领域
【例1-3】挑战者号航天飞机失事预测
统计的应用领域
【例1-3】挑战者号航天飞机失事预测 1986 年 1 月 28 日清晨,载有 7 名宇航员的挑战者号进 入发射状态。就在发射前,有冰片牢附在机壳上。几分钟 后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭 性的爆炸声中化成碎片,机上的宇航员片骨未存。 推动航天飞机进入太空的两个固体燃料发动机是由 Thiokol 公司制造的。失事前一天晚上, Thiokol 公司的经 理们和美国国家航空航天局就如期发射还是推迟发射产生 了争执。天气预报发射时的气温为310F。争执的结果采纳 了Thiokol公司经理们的建议:按计划发射航天飞机。 事后的统计分析发现,温度对发动机密封圈的影响是 十分显著的,温度越低密封圈越容易造成液体泄露。
2.0
8月
2.1
9月
2.2
10月
2.1
11月
2.3
12月
2.4
你会相 信谁?
统计的另一面
• • 利用统计,既可以昭告事实,也可以瞒天过海。 此时的关键是需要你自己做出更谨慎的判断。 另外,能否为自己的工作选择合适的图表,确保 数据以最有效的方式展现出来并传达你想传达的 信息,也是十分重要的。
变量及其类型
变量
基本分类
其他分类
分类变量
顺序变量
数值型变量
随机变量 非随机变量
经验变量 理论变量
1.3 统计数据的类型
1.3.1 分类数据、顺序数据、数值型数据
1.3.2 观测数据和实验数据
1.3.3 截面数据和时间序列数据
统计数据的分类
统计数据的类型
按计量尺度
分 类 数 据 顺 序 数 据 数 值 型 数 据
有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量或样本量 (sample size)
标志与标志分类
1. 标志
总体各单位所具有的属性或特征称为标志
统计的应用领域
【例1-2】用简单的描述统计量得到一个重要发现 费舍 (R . A . Fisher) 在 1952 的一篇文章中举了一个例 子,说明如何由基本的描述统计量的知识引出一个重要 的发现。 20 世纪早期,哥本哈根卡尔堡实验室的施密特 (J.Schmidt) 发现不同地区所捕获的同种鱼类的脊椎骨和 鳃线的数量有很大不同;甚至在同一海湾内不同地点所 捕获的同种鱼类,也发现这样的倾向。 然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲 各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域 里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值 和标准差。由此,施密特推断所有各个不同海域内的鳗 鱼是由海洋中某公共场所繁殖的。后来名为“戴纳 (Dana)”的科学考察船在一次远征中发现了这个场所。
2. 顺序数据(rank data)
3. 数值型数据(metric data)
按数cm、168cm、183cm
理解统计对大众的必要性
在投资股票时,需要了解股票市场价格的信 息,了解某只特定股票的有关财务信息
如果你关心足球世界杯,在有关媒体上,你 可以看到各支球队的技术统计 如果你关心宏观经济形势,在有关媒体上你 可以得到有关数据
统计在工商管理中的应用
企业发展战略:市场研究(如广告对市场 销售额的影响)、分析企业优势和劣势以 进行市场定位 产品质量管理:分析产品的合格率 人力资源管理:对员工的年龄、性别、受 教育程度、工资、业绩等进行分析,并作 为企业制定工资计划、奖惩制度的依据
让你说出哪些领域不使用统计,这很困难, 因为几乎找不到一个不用统计的领域;让你 说出哪些领域应用统计,同样也很困难,因 为几乎所有的领域都应用统计。
学统计 爱统计
统计的另一面
统计可以成为提炼数据本质的一件法宝,然 而也需要小心提防它。统计尽管以事实为基 础,有时却具有误导性。 例:某上市公司去年下半年的盈利情况
按收集方法
观 测 数 据 实 验 数 据
按时间状况
截 面 数 据 时 序 数 据
统计数据的分类
(按计量尺度分)
1. 分类数据(categorical data)
只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 只能归于某一有序类别的非数字型数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
参数和统计量
1. 参数(parameter)
描述总体特征的概括性数字度量,是研究者想要了解的 总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体比例 ()等 总体参数通常用希腊字母表示 每个参数有对应的样本统计量
2. 统计量(statistic)
用来描述样本特征的概括性数字度量,它是根据样本数 据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值 (x)、样本标准差(s)、样 本比例(p)等 样本统计量通常用小写英文字母来表示
第1章
导 论
第1章
1.1 统计及其应用领域
导 论
1.2 统计中的几个基本概念 1.3 统计数据的类型
学习目标
1. 2. 3. 4. 5. 理解统计学的含义 理解描述统计和推断统计 了解统计学的应用领域 了解数据的类型 理解统计中的几个基本概念
1.1 统计及其应用领域
1.1.1 什么是统计学
1.1.2 统计的应用领域
•
归根到底,我们既要知晓正确使用统计方法所需 的“科学”,又要掌握其中的“艺术”。
1.2 统计中的几个基本概念
1.2.1 总体和样本 1.2.2 标志和标志分类 1.2.3 统计指标
1.2.4 参数和统计量
1.2.5 变量
总体和样本
1. 总体(population)
所研究的全部个体的集合,其中的每一个个体也 称为元素,或者叫总体单位 分为有限总体和无限总体
例如教师的文化程度、年龄、工龄等特征 统计研究从登记标志状况开始,标志是统计研究的基础
2. 标志分类
按变异情况:不变标志与变异标志 按性质:品质标志与数量标志,前者用文字表示 ,后者用数值说明
统计指标
1. 界定 反映现象总体综合数量特征的范畴和统计数值 两种理解:概念名称、指标值(统计指标的具体取值) 特点:可量性、综合性、具体性 2. 种类 总量指标:数值表现为绝对数 相对指标:统计指标数值之比,如强度相对指标(有名 数)、比例相对指标(无名数) 平均指标:数值平均数和位置平均数两类 按指标性质不同,可分为数量指标(反映现象总规模、 总水平)和质量指标(相对数或平均数)
统计中的几个基本概念
总体 样本
参数
统计量
平均数
标准差 比 例
x
s p
变 量(variable)
1. 说明个体某种特征的概念,即存在差异的标志
如商品销售额、受教育程度、产品的质量等级等 每一个个体都有相应的变量值,即数据
分类变量(categorical variable):说明事物类别的名 称 顺序变量 (rank variable) :说明事物有序类别的名称 ,如产品等级 数值型变量 (metric variable) :说明事物数字特征的 名称
2. 变量可以分为
离散变量:取有限个值 连续变量:可以取无穷多个值
变 量
(其他分类)
1. 随机变量和非随机变量 2. 经 验 变 量 (empirical variables) 和 理 论 变 量 (theoretical variables)
经验变量所描述的是我们周围环境中可以观察 到的事物 理论变量则是由统计学家用数学方法所构造出 来的一些变量,比如,z 统计量、t 统计量、2 统计量、F 统计量等
¥
50
统计分组法 综合指标法:分总量、相对、 平均指标三种 统计模型法:方程模拟
25
0
3.
目的
描述数据特征 找出数据的基本规律
Q1 Q 2 Q3 Q 4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 研究如何利用样本数 据来推断总体特征的 统计方法 2. 内容 参数估计 假设检验 3. 目的
统计的应用领域
经济学
医学
管理学
统计学
工程学
社会学
…
统计的应用领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
统计的应用领域
hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)
• • 统计学主要研究客观事物的数量特征和数 量关系。 特点: 数量性 客观性
构成总体的全部
总体性
足够多的随机个体:大数定律 (大量的随机现象的平均结果 具有稳定性)
统计研究的基本方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 研究数据收集、处理、汇总 、图表描述、概括与分析等 统计方法 2. 统计描述的方法
什么是统计学?
(statistics)
统计学研究的是数据,提供的是一套通 用于所有学科领域的获取数据、分析数 据并从数据中得出结论的原则和方法。 简单地说,统计通过某种有意义的方式 对原始事实和数字进行提炼,使得仅仅 通过观察原始数据无法立即水落石出的 一些理念得以昭示。
统计研究的过程
统计学的研究对象
总体
对总体特征作出推断
样 本
统计的应用领域
【例1-1】用统计识别作者 1787—1788年,三位作者Alexander Hamilton, John Jay和James Madison为了说服纽约人认可宪法 ,匿名发表了著名的 85 篇论文。这些论文中的大多 数作者已经得到了识别,但是,其中的 12 篇论文的 作者身份引起了争议。 通过对不同单词的频数进行统计分析,得出的结 论是, James Madison 最有可能是这 12 篇论文的作 者。现在,对于这些存在争议的论文,认为 James Madison是原创作者的说法占主导地位,而且几乎可 以肯定这种说法是正确。
统计的应用领域
【例1-3】挑战者号航天飞机失事预测
统计的应用领域
【例1-3】挑战者号航天飞机失事预测 1986 年 1 月 28 日清晨,载有 7 名宇航员的挑战者号进 入发射状态。就在发射前,有冰片牢附在机壳上。几分钟 后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭 性的爆炸声中化成碎片,机上的宇航员片骨未存。 推动航天飞机进入太空的两个固体燃料发动机是由 Thiokol 公司制造的。失事前一天晚上, Thiokol 公司的经 理们和美国国家航空航天局就如期发射还是推迟发射产生 了争执。天气预报发射时的气温为310F。争执的结果采纳 了Thiokol公司经理们的建议:按计划发射航天飞机。 事后的统计分析发现,温度对发动机密封圈的影响是 十分显著的,温度越低密封圈越容易造成液体泄露。