统计学基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Statistics is a collection of procedures and principles for gathering data and analyzing information in order to help people make decisions when faced with uncertainty.
值 根据定序尺度得到的数据为
顺序数据。
3、定距尺度 Interval Scale
例如年份、摄氏温度 变量的取值表现为“数值” 可以进行加减运算 “0”是只是尺度上的一个点,
不代表“不存在”
4、定比尺度 Ratio Scale
例如体重、身高 变量的取值表现为“数值” 可以进行加减、乘除运算 “0”表示“没有”或“不
总体由总体单位构成,要认识总体必须从 总体单位开始,总体是统计认识的对象。
总体、总体单位
总体、总体单位
总体或总体单位的区分不是固定的:同一个 研究对象,在一种情况下是总体,在另一种 情况下可能成了总体单位。
统计总体的种类
有限总体 指所包含的单位数目有限的总体 无限总体 指所包含的单位数目无限的总体
16
●●
6
离散型变量
其一切可能取值都以整数形式 出现,并可以一一列举的变量
特定范围的人口数、汽 车数量、企业数量、林 木株数、畜禽数量等等
取值不需 要用工具 度量,用 计数的方 式即可
在统计学中,为便于叙述,也有时把 标志值抽象化,把原总体与反映总体 单位特征的变量等同起来,把变量值 的集合看成总体,每一个变量值也就 是一个总体单位。
数据分析
为什
么?
© 1984-1994 T/Maker Co.
决策制定
© 1984-1994 T/Maker Co.
什么是统计学?
统计学是收集、分析、描述和解 释数据的科学,其内容包括数据 收集、数据整理、数据分析、数 据解释。 Statistics: the science of collecting, organizing, and interpreting data.
统计学指是一种方法,用来设计实验、获得数据, 然后在这些数据基础上组织、概括、演示、分析、 解释和得出结论(Mario F.Triola,《初级统计学》) 。
统计是一门收集、分析、解释和提供数据的科学(韦 伯斯特国际辞典第3版)。
统计学是:“关于收集和分析数据的科 学与艺术(art)”(不列颠百科全书)。
———Salvage L. J.
第2节 基本概念
总体、总体单位和样本 标志、变量及其测度 指标与指标体系 数据及其类型 参数和统计量
统计分析过程
基于统计或实际观察提出假设(问题)
概念的可操作型定义
抽取样本或受试者
调查
实验设计
数据收集
数据整理
编制图表、Hale Waihona Puke 计描述解释 数据是总体或样本
集合,而是一组数据。 样本(sample) a subset of population 从总体中抽取的一部分元素的集合 。
统计总体和总体单位
统计 总体
由客观存在的、在同一性质基础上结 合起来的许多个别单位所形成的集合
具有客观性、大量性、同质 性、变异性、相对性等特点
总体 单位
指构成总体的个体即每一个单位
不确定的、偶然的、非人为 控制的、不可解释的因素
周一下午1时~3 时的股票成交量
行情预期、 各种消息、 购买行为、 资金数量、 新股上市、 其它…
连续型变量
在一个区间内可以连续不 断取值的变量
人的身高、体重、年龄
产品的产量(重量、体 积、面积等),产值、 销售额等价值量
需要使用 度量工具 取值
身高的例子: 165
位标志 变异标志
品质标志
(标志表现有差别) 数量标志
变异标志决定
(变量)
总体的差异性
变量的种类 区分变量的意义
确定性变量 如何描述(规模、集中趋势等) 随机变量 如何推断(估计、检验等)
连续型变量 离散型变量
度量取得、重叠组限、连续分 布、概率密度函数
计数取得、间断或连续组限、 离散分布(二项分布、泊松分 布等)
统计 学
二、统计学的分类
美国数学学会出版的《数学评论》中对统计学的分类: A.基础; B.充分性和信息; C.决策理论; D.抽样理论和抽样调查; E.分布理论; F.参数推断; G.非参数推断; H.多元分析; I.线性推断; J.试验设计; K.序贯分析; L.随机过程推断; M.工程统计学; N.应用; O.统计表
统计研究是从登记标志开始,并通过对标志 的综合来反映总体的数量特征,因此标志是 统计研究的起点。
标志
标志值
性别 民族
品 质
宗教信仰 政治倾向
标 志
年龄
数
身高
量 标
体重
志
男
文
汉族 字
佛教 无党派
表 述
43岁 数
182c m75公斤
据 表 述
标志和变量
不变标志决定 总体的同质性
不变标志
总体单 (标志表现无差别)
只要是定量研究,一般来说就必须要对相关变量 进行测量,它是提出假设之后的后续工作,也是 检验假设的必要前提。
测量的主要作用在于作出准确的分类和比较。通 过一定工具进行的测量往往比仅靠人自身感觉的 测量要精确得多。
运用某种方法使自然或社会经济现象量化。
(三)测量的主要步骤
要把测量对象以概念的形式表示出来,或形 成概念化认识。
例如:性别、民族、职业 变量的取值表现为“类别” 各类之间无等级次序 各类别可以用数字代码、
字母表示 根据定类尺度得到的数据
为分类数据。
2、定序尺度(Ordinal Scale)
例如健康状况、质量等级 变量的取值表现为“类别” 可对等级、大小等排序 未测量出类别之间的准确差
大总体 小总体 指大总体的各组成部分 可加总体 指总体单位可以合计的总体 不可加总体 指总体单位不能合计的总体
二、标志和变量
标志 指总体单位所具有的属性和特征,标
志的具体表现称为标志值 品质标志 是表明事物“质” 的特性的标志 数量标志 是表明事物“量” 的特性的标志
其中,可变的数量标志又被叫作变量
第1章 统计学的基本概念
什么是统计学 基本概念
学习目的
什么是统计学? 理解统计学的一些基本概念,包括总体、
样本、变量、数据、参数与统计量等
第1节 什么是统计学
一、统计学的定义
统计学是用以收集数据、分析数据和由数据得出结 论的一组概念、原则和方法( Gudmund R. Iversen, Mary Gergen )。
从一个个体到另一个 个体,该特征会呈现 出差别或变化;
不能用一个常数来表 示。
变量的测量尺度
测量(measurement) 统计测量(statistic measurement) 测量的主要步骤 变量的测量尺度
(Levels of Measurement)
(一)测量(measurement)
有绝对零点
乘除
四种测量尺度的正确运用
对于不同的现象,注意准确性
宗教、种族、民族、性别、党派、 国别、职业等等品质方面的差异
统计学与其他学科的关系
1、统计学与数学
数学是统计学发展的重要理论基础。 统计学不是数学分支,统计学与数学是
两门不同的学科。 统计学与数学有交叉。
2、统计学与其他学科的关系
统计学可为各具体的应用领 域提供数据分析工具。
统计学只能为各学科提供数 据分析的工具,而分析所存 在的问题和解决问题则必须 依靠各学科的专业知识。
确定性变量 指受确定性因素影响的变量
明确的、可解释的、人为 的或者受人控制的因素
总收入-总成本费用=企业利润
总收入↓-总成本费用↓=企业利润(↑或↓) 总收入↑-总成本费用↓=企业利润(↑) 总收入↓-总成本费用↑=企业利润(↓) 总收入↑-总成本费用↑=企业利润(↑或↓)
随机变量 指受随机因素影响的变量
Nominal Ordinal Scale
四种测量尺度的对比
测定尺度 定类测量 定序测量 定距测量
定比测量
特征
运算功能 举例
分类 分类;排序
计数
产业分类
计数;排序 企业等级
分类;排序; 计数;排序;产品质量
有基本测量单位 加减
差异
分类;排序;
计数;排序;商品销售
有基本测量单位; 加减
额
存在”
定距尺度与定比尺度的区别
定距尺度中“0”表示一个具体数值,不表 示“没有”或“不存在”,定比尺度中“0”表
示“没有”或“不存在” 。
定距尺度
0℃
- 273.15℃ 26.85℃
-123.15 ℃
定比尺度
定距尺度与定比尺度的区别
在实际应用中定距尺度与定比尺度 差别微不足道,往往不作区分。 例如 在SPSS中,数据的测量尺度被分为3类:
Scale(定比测量,或定距测量) Ordinal (定序测量,或顺序测量) Nominal (定类测量,或名义测量)。
变量的测量尺度与类型
俱乐部:休斯顿火箭 健康状况: 良好 出生年份: 1980 体重:134公斤
定类尺度 精
定序尺度 确 程
定距尺度 度
定比尺度
1、定类尺度 (Nominal Scale)
用仪器确定空间、时间、 温 度、速度、功能等的有 关数值。
(二)统计测量 (statistic measurement)
在管理研究中,经常需要测定 各种变量。
按照一定的规则,用数字和符 号来表示某一社会现象的属性 和特征。
测量在管理研究中的地位
在管理研究中,测量处于整个研究中非常关键的 地位。
总体
结果发现,对总体进行分析
样本
统计推断
一、总体、总体单位和样本
总体(population) the set of all items of interest in a statistical problem 总体包含所研究的全部个体(或数据)的集合 ; 统计意义上的总体,通常不是一群人或一些物品的
统计学是一门关于使用科学方法收集、 整理、汇总、描述和分析数据资料,并 在此基础上进行推断和决策的科学( M. R. 斯皮格尔,L. J. 斯蒂芬斯)。
什么是统计学?
数据收集
e.g. 调查
数据显示
e.g. 统计图和统计表
数据特征
e.g. 平均数
分析数据
e.g. 估计与检验
Statistics is the science and art, which studies how to collect, organize, analyze and interpret data reflecting social, economic and management problems, and makes statistical inference on the research objectives .
统计学与其他学科
方法论和理论解说
当人类科学家在探索问题的丛林中遇到难以逾 越的障碍时,惟有统计学工具可以为其开辟一 条前进的道路 ———Galton F.
统计学基本是寄生的,靠研究其他领域的工作 而生存,这不是对统计学表示轻视,这是因为 对很多寄主来说,如果没有寄生虫就会死,对 有的动物来说,如果没有统计学,虽然不会死 亡,但一定会变得很弱。
变量(variable)
1、什么是变量?
A VARIABLE is a characteristic of interest for the elements
说明研究对象某种特征的概 念;
我们给所要研究的事物起的名 字。
2、特点:
从一次观察到下一次 观察,该特征会呈现 出差别或变化;
对概念进行操作化加工,将它们变为可测量 的变量。
用测量工具对测量对象进行经验观察,这是 “数据收集”的任务。
测量的工具:测量尺度、量表
(四)变量的测量尺度
1968年,美国统计学家斯蒂文斯按照变 量的性质和数学运算的特点,将变量的 测量尺度分为定类、定序、定比和定 距。
统计学中,通常将测量分为:
Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of data.(Webster 国际 大词典)
统计学
统计学是一系列从数据中获取有用信息以帮助决策 的原理和方法。
值 根据定序尺度得到的数据为
顺序数据。
3、定距尺度 Interval Scale
例如年份、摄氏温度 变量的取值表现为“数值” 可以进行加减运算 “0”是只是尺度上的一个点,
不代表“不存在”
4、定比尺度 Ratio Scale
例如体重、身高 变量的取值表现为“数值” 可以进行加减、乘除运算 “0”表示“没有”或“不
总体由总体单位构成,要认识总体必须从 总体单位开始,总体是统计认识的对象。
总体、总体单位
总体、总体单位
总体或总体单位的区分不是固定的:同一个 研究对象,在一种情况下是总体,在另一种 情况下可能成了总体单位。
统计总体的种类
有限总体 指所包含的单位数目有限的总体 无限总体 指所包含的单位数目无限的总体
16
●●
6
离散型变量
其一切可能取值都以整数形式 出现,并可以一一列举的变量
特定范围的人口数、汽 车数量、企业数量、林 木株数、畜禽数量等等
取值不需 要用工具 度量,用 计数的方 式即可
在统计学中,为便于叙述,也有时把 标志值抽象化,把原总体与反映总体 单位特征的变量等同起来,把变量值 的集合看成总体,每一个变量值也就 是一个总体单位。
数据分析
为什
么?
© 1984-1994 T/Maker Co.
决策制定
© 1984-1994 T/Maker Co.
什么是统计学?
统计学是收集、分析、描述和解 释数据的科学,其内容包括数据 收集、数据整理、数据分析、数 据解释。 Statistics: the science of collecting, organizing, and interpreting data.
统计学指是一种方法,用来设计实验、获得数据, 然后在这些数据基础上组织、概括、演示、分析、 解释和得出结论(Mario F.Triola,《初级统计学》) 。
统计是一门收集、分析、解释和提供数据的科学(韦 伯斯特国际辞典第3版)。
统计学是:“关于收集和分析数据的科 学与艺术(art)”(不列颠百科全书)。
———Salvage L. J.
第2节 基本概念
总体、总体单位和样本 标志、变量及其测度 指标与指标体系 数据及其类型 参数和统计量
统计分析过程
基于统计或实际观察提出假设(问题)
概念的可操作型定义
抽取样本或受试者
调查
实验设计
数据收集
数据整理
编制图表、Hale Waihona Puke 计描述解释 数据是总体或样本
集合,而是一组数据。 样本(sample) a subset of population 从总体中抽取的一部分元素的集合 。
统计总体和总体单位
统计 总体
由客观存在的、在同一性质基础上结 合起来的许多个别单位所形成的集合
具有客观性、大量性、同质 性、变异性、相对性等特点
总体 单位
指构成总体的个体即每一个单位
不确定的、偶然的、非人为 控制的、不可解释的因素
周一下午1时~3 时的股票成交量
行情预期、 各种消息、 购买行为、 资金数量、 新股上市、 其它…
连续型变量
在一个区间内可以连续不 断取值的变量
人的身高、体重、年龄
产品的产量(重量、体 积、面积等),产值、 销售额等价值量
需要使用 度量工具 取值
身高的例子: 165
位标志 变异标志
品质标志
(标志表现有差别) 数量标志
变异标志决定
(变量)
总体的差异性
变量的种类 区分变量的意义
确定性变量 如何描述(规模、集中趋势等) 随机变量 如何推断(估计、检验等)
连续型变量 离散型变量
度量取得、重叠组限、连续分 布、概率密度函数
计数取得、间断或连续组限、 离散分布(二项分布、泊松分 布等)
统计 学
二、统计学的分类
美国数学学会出版的《数学评论》中对统计学的分类: A.基础; B.充分性和信息; C.决策理论; D.抽样理论和抽样调查; E.分布理论; F.参数推断; G.非参数推断; H.多元分析; I.线性推断; J.试验设计; K.序贯分析; L.随机过程推断; M.工程统计学; N.应用; O.统计表
统计研究是从登记标志开始,并通过对标志 的综合来反映总体的数量特征,因此标志是 统计研究的起点。
标志
标志值
性别 民族
品 质
宗教信仰 政治倾向
标 志
年龄
数
身高
量 标
体重
志
男
文
汉族 字
佛教 无党派
表 述
43岁 数
182c m75公斤
据 表 述
标志和变量
不变标志决定 总体的同质性
不变标志
总体单 (标志表现无差别)
只要是定量研究,一般来说就必须要对相关变量 进行测量,它是提出假设之后的后续工作,也是 检验假设的必要前提。
测量的主要作用在于作出准确的分类和比较。通 过一定工具进行的测量往往比仅靠人自身感觉的 测量要精确得多。
运用某种方法使自然或社会经济现象量化。
(三)测量的主要步骤
要把测量对象以概念的形式表示出来,或形 成概念化认识。
例如:性别、民族、职业 变量的取值表现为“类别” 各类之间无等级次序 各类别可以用数字代码、
字母表示 根据定类尺度得到的数据
为分类数据。
2、定序尺度(Ordinal Scale)
例如健康状况、质量等级 变量的取值表现为“类别” 可对等级、大小等排序 未测量出类别之间的准确差
大总体 小总体 指大总体的各组成部分 可加总体 指总体单位可以合计的总体 不可加总体 指总体单位不能合计的总体
二、标志和变量
标志 指总体单位所具有的属性和特征,标
志的具体表现称为标志值 品质标志 是表明事物“质” 的特性的标志 数量标志 是表明事物“量” 的特性的标志
其中,可变的数量标志又被叫作变量
第1章 统计学的基本概念
什么是统计学 基本概念
学习目的
什么是统计学? 理解统计学的一些基本概念,包括总体、
样本、变量、数据、参数与统计量等
第1节 什么是统计学
一、统计学的定义
统计学是用以收集数据、分析数据和由数据得出结 论的一组概念、原则和方法( Gudmund R. Iversen, Mary Gergen )。
从一个个体到另一个 个体,该特征会呈现 出差别或变化;
不能用一个常数来表 示。
变量的测量尺度
测量(measurement) 统计测量(statistic measurement) 测量的主要步骤 变量的测量尺度
(Levels of Measurement)
(一)测量(measurement)
有绝对零点
乘除
四种测量尺度的正确运用
对于不同的现象,注意准确性
宗教、种族、民族、性别、党派、 国别、职业等等品质方面的差异
统计学与其他学科的关系
1、统计学与数学
数学是统计学发展的重要理论基础。 统计学不是数学分支,统计学与数学是
两门不同的学科。 统计学与数学有交叉。
2、统计学与其他学科的关系
统计学可为各具体的应用领 域提供数据分析工具。
统计学只能为各学科提供数 据分析的工具,而分析所存 在的问题和解决问题则必须 依靠各学科的专业知识。
确定性变量 指受确定性因素影响的变量
明确的、可解释的、人为 的或者受人控制的因素
总收入-总成本费用=企业利润
总收入↓-总成本费用↓=企业利润(↑或↓) 总收入↑-总成本费用↓=企业利润(↑) 总收入↓-总成本费用↑=企业利润(↓) 总收入↑-总成本费用↑=企业利润(↑或↓)
随机变量 指受随机因素影响的变量
Nominal Ordinal Scale
四种测量尺度的对比
测定尺度 定类测量 定序测量 定距测量
定比测量
特征
运算功能 举例
分类 分类;排序
计数
产业分类
计数;排序 企业等级
分类;排序; 计数;排序;产品质量
有基本测量单位 加减
差异
分类;排序;
计数;排序;商品销售
有基本测量单位; 加减
额
存在”
定距尺度与定比尺度的区别
定距尺度中“0”表示一个具体数值,不表 示“没有”或“不存在”,定比尺度中“0”表
示“没有”或“不存在” 。
定距尺度
0℃
- 273.15℃ 26.85℃
-123.15 ℃
定比尺度
定距尺度与定比尺度的区别
在实际应用中定距尺度与定比尺度 差别微不足道,往往不作区分。 例如 在SPSS中,数据的测量尺度被分为3类:
Scale(定比测量,或定距测量) Ordinal (定序测量,或顺序测量) Nominal (定类测量,或名义测量)。
变量的测量尺度与类型
俱乐部:休斯顿火箭 健康状况: 良好 出生年份: 1980 体重:134公斤
定类尺度 精
定序尺度 确 程
定距尺度 度
定比尺度
1、定类尺度 (Nominal Scale)
用仪器确定空间、时间、 温 度、速度、功能等的有 关数值。
(二)统计测量 (statistic measurement)
在管理研究中,经常需要测定 各种变量。
按照一定的规则,用数字和符 号来表示某一社会现象的属性 和特征。
测量在管理研究中的地位
在管理研究中,测量处于整个研究中非常关键的 地位。
总体
结果发现,对总体进行分析
样本
统计推断
一、总体、总体单位和样本
总体(population) the set of all items of interest in a statistical problem 总体包含所研究的全部个体(或数据)的集合 ; 统计意义上的总体,通常不是一群人或一些物品的
统计学是一门关于使用科学方法收集、 整理、汇总、描述和分析数据资料,并 在此基础上进行推断和决策的科学( M. R. 斯皮格尔,L. J. 斯蒂芬斯)。
什么是统计学?
数据收集
e.g. 调查
数据显示
e.g. 统计图和统计表
数据特征
e.g. 平均数
分析数据
e.g. 估计与检验
Statistics is the science and art, which studies how to collect, organize, analyze and interpret data reflecting social, economic and management problems, and makes statistical inference on the research objectives .
统计学与其他学科
方法论和理论解说
当人类科学家在探索问题的丛林中遇到难以逾 越的障碍时,惟有统计学工具可以为其开辟一 条前进的道路 ———Galton F.
统计学基本是寄生的,靠研究其他领域的工作 而生存,这不是对统计学表示轻视,这是因为 对很多寄主来说,如果没有寄生虫就会死,对 有的动物来说,如果没有统计学,虽然不会死 亡,但一定会变得很弱。
变量(variable)
1、什么是变量?
A VARIABLE is a characteristic of interest for the elements
说明研究对象某种特征的概 念;
我们给所要研究的事物起的名 字。
2、特点:
从一次观察到下一次 观察,该特征会呈现 出差别或变化;
对概念进行操作化加工,将它们变为可测量 的变量。
用测量工具对测量对象进行经验观察,这是 “数据收集”的任务。
测量的工具:测量尺度、量表
(四)变量的测量尺度
1968年,美国统计学家斯蒂文斯按照变 量的性质和数学运算的特点,将变量的 测量尺度分为定类、定序、定比和定 距。
统计学中,通常将测量分为:
Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of data.(Webster 国际 大词典)
统计学
统计学是一系列从数据中获取有用信息以帮助决策 的原理和方法。