《商务统计分析》课件—01数据与统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
描述统计(descriptive statistics):以便 利化和信息化的方式(比如图表)对数 据进行整理、汇总和展示,计算一些简 单的统计量进行分析。
推断统计(inference statistics):利用样 本数据信息对总体特征做出推断,内容 包括参数估计和假设检验两大类。
13
1.3 数据——什么是统计学(推断统计)
R:专业统计人员最常用的统计软件
15
表1-1 中国东部地区2018年人口分布情况
变量
个体
地区 北京市
年末常住人口 /万人
2171
城镇人口 /万人
1878
乡村人口 /万人
293
天津市
1557
1291
266
上海市
2418
2121
297
江苏省 浙江省
8029 5657
5521 3847
2508 1810
观测值
4
1.1 数据——定性数据和定量数据
第 1 章 数据与统计分析
1
第 1 章 数据与统计分析——目录 1.1 数据 1.2 数据来源 1.3 统计分析 1.4 统计软件
2
1.1 数据——定义
➢数据是对现象进行计量的结果。
表1-1 中国东部地区2018年人口分布情况
地区
年末常住人口 /万人
城镇人口 /万人
பைடு நூலகம்
乡村人口 /万人
北京市
2171
名义数据

顺序数据
√ √
定距数据
√ √ √
定比数据
√ √ √ √
“√”表示该尺度所具有的特性
注: 定性数据可以用数值变量表示,但不可看作是数值型数据。处理定 量数据也可转化为定性数据(如年龄→老年、中年、青年、儿童)
6
1.1 数据——截面数据和时间序列数据
按照被描述的现象与时间的关系
截面数据(cross-sectional data)是在相同或近似相 同的时间点上收集的数 据,这类数据通常是在 不同的空间上获得的, 用于描述现象在某一时 刻的变化情况。
时间序列数据(time series data)是在不同时 间收集到的数据,这类 数据是按时间顺序收集 的,用于描述现象随时 间的变化情况。
7
1.1 数据——截面数据和时间序列数据
截面数据
表1-1 中国东部地区2018年人口分布情况
地区
北京市 天津市 上海市 江苏省 浙江省
年末常住人口 /万人 2171 1557 2418 8029 5657
实验
研究问题:糖宁胶囊联合利 拉鲁肽对2 型糖尿病治疗是 否有效。 实验方法:对照组皮下注射 利拉鲁肽注射液,治疗组在 对照组基础上口服降糖宁胶 囊,然后收集每组每个人治 疗前后的血糖数据。最后数 据的统计分析将会有助于了 解该药的治疗效果。
12
1.3 数据——什么是统计学
统计学(statistics):一门分析数据的科学,涉及数据的 收集、整理、分析以及数字信息的解释。
1398.80
2017
134770.15
133447.43
1322.72
2016
120066.75
118811.24
1255.51
2015
106599.59
105467.48
1132.11
2014
95655.45
94676.31
979.14
9
1.2 数据——直接来源和间接来源
系统内部数据 ;或从公开出 版、公开报道 的数据中获得
调查或实验
优点:收集方便、 数据采集快、采集 成本低等等 缺点:针对性不够
间接来源:别 人通过调查或 实验的方式收 集的,使用者 只是找到它们 并加以使用。
直接来源 :自己直 接调查或 实验获得 的一手数 据。
调查(survey)通常针对社会 现象。 普查:调查针对总体中的所有 个体; 抽样调查:总体、样本、样本 量(举例)。
实验(experiment):在控制 条件下进行的(举例)。
10
1.2 数据——直接来源和间接来源
使用二手数据时应注意以下几点:
① 数据的含义 ② 数据搜集的时间 ③ 计算口径 ④ 计算方法 ⑤ 数据的可信度
11
1.2 数据——直接来源和间接来源(调查vs实验)
抽样调查
研究问题:一个班的平均身 高,按一定的规律抽出20个 同学的身高研究。 总体:这个班的所有同学的 身高。 个体:A同学的身高就是1个 个体。 样本:20个同学的身高。 样本容量:20。
城镇人口 /万人 1878 1291 2121 5521 3847
乡村人口 /万人 293 266 297 2508 1810
8
1.1 数据——截面数据和时间序列数据
时间序列数据
表1-2 中央财政债务余额情况
年度
中央财政债务余额 /亿元
国内债务 /亿元
国外债务 /亿元
2018
149607.42
148208.62
是否能用 数值表示


定性数据
定量数据
名义数据 顺序数据


取值是 否能排

定距数据 定比数据


是否有 比例属

变量 是否 连续
是 连续变量 否 离散变量
5
1.1 数据——定性数据和定量数据
四种计量尺度的比较
计量尺度
数学特性
分类(=,≠ ) 排序( < ,> ) 间距( + ,- ) 比值( × ,÷)
1878
293
天津市
1557
1291
266
上海市
2418
2121
297
江苏省
8029
5521
2508
浙江省
5657
3847
1810
3
1.1 数据——个体、变量和观测值
在研究中,对每个个体的每一变量收集观测值,从而得到数据(data)。
➢个体(element)是指收集数据的对象。 ➢变量(variable)是个体的特征或属性。 ➢观测值(observation)是数据集中每个个体的测量值集合。
总体:用新灯丝生产 的所有灯泡的寿命, 平均寿命未知
抽样
200个用新灯丝制成的灯泡
获得样本数据
样本平均值数据对总体平 均数进行估计
200个用新灯丝制成的灯 泡的平均寿命为760小时
推断统计的过程 14
1.4 数据——统计软件
SPSS:目前国内应用最为广泛的统计软件 Excel:不是专业的统计软件,但是依 靠Office且操作简单
相关文档
最新文档