ppt1_Introduction
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
北京@房事 http://v.youku.com/v_show/id_XMjcyO DU4NTQw.html 我们相信上帝,除此之外,我们只相信 数据 James R.Evans
12
2
统计学
统计及其研究过程
13
根据概率论我们知道,大量的随机试验中各种 结果的出现具有它的规律性。因此从理论上讲 只要对随机现象进行足够多次的观察,各种结 果的规律性 定能清楚地呈现,但是实际上所 果的规律性一定能清楚地呈现,但是实际上所 允许的观察永远是有限的,甚至是少量的。 例如:若规定灯泡寿命低于1000小时者为次品 ,如何确定次品率? 由于灯泡寿命试验是破坏性试验,不可能把整 批灯泡逐一检测,只能抽取一部分灯泡作为样 本进行检验,以样本的信息来推断总体的信息 ,这是统计学研究的问题之一。
ห้องสมุดไป่ตู้
推断统计
反映客观现 象的数据
样本数据 总体数据
描述统计 (统计数据的搜集、整 理、显示和分析等)
(利用样本信息和概率 论对总体的数量特征进 行估计和检验等)
样 本
29
总体内在的 数量规律性
30
5
统计的应用领域
经济学 医学
统计的应用领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) fisheries research (水产渔业研究) finance (金融) genetics (遗传学) gambling (赌博) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
统计学是收集、分析、表述和解释数据 的科学(不列颠百科全书)
数据收集:取得数据 数据处理:整理与图表展示 数据分析:利用统计方法分 析数据 数据解释:结果的说明 得到结论:从数据分析中得 出客观结论
15
16
统计学与概率论的区别
概率论与统计是研究随机现象数量 规律的科学
例:从桶子里随机抽出六个球, 有2个黑球。问桶子里黑球所 占的比率多少?
5
你经历过吗
6
1
银行的信用风险
对信用卡的使用,很多人会按规定还款,但 也有人恶意透支,最后申请破产逃避还款。 这一切,发卡银行都需要做到心中有数。虽 这 切,发卡银行都需要做到心中有数 虽 不可能对每个人心中有数,但可以对整体持 卡人群体,各种可能的比例、每类人的发展 趋势做到心中有数。 你知道吗?
provided outside of poor-houses created paupers.
24
4
解释数据
A contemporary of Yule's suggested that what Yule was seeing was instead an example of confounding--those areas with
第一章:绪论
经济管理领域中的一些问题 统计及其应用领域 统计研究过程 统计数据的类型 统计中的几个基本概念
经济管理领域中的一些问题
1
2
比例问题
产品促销决策
一家全国百货连锁店正在考虑是否该通 过一种直接邮寄的促销活动来促销其产 品。因为促销成本很高,公司在采取行 品 因为促销成本很高,公司在采取行 动前需要了解促销活动的效果。
统计方法与应用领域
more efficient administrations were better at both building poor-houses and reducing poverty.
David Freedman (1999), “From Association to Causation: Some Remarks on the History of Statistics”, Statistical Science, 14, 243-258
我国的GDP每年度有较大幅度的增长,预测下一 年的GDP增长率是几乎所有的经济学家感兴趣的 事。如何预测? 股民、券商,甚至是证监会,都希望预测证券市 场的发展趋势,如何利用历史数据来预测未来? 营销和生产部门经理经常需要根据经营的历史数 据,预测销售额、盈利、成本、生产水平、存货、 购买、资本需求等 财务部门经理经常根据以往的数据特征和相关金 融工具价格走势,预测金融工具的价格走势
管理学
统计学
工程学
社会学
…
31
32
统计的应用领域
hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)
3
统计研究的过程
实际问题
收集数据 (取得数据) 整理数据 (处理数据) 解释数据 (结果说明) 分析数据 (研究数据)
19
解释数据
Statistics show that those people who celebrate the most birthdays become the oldest celebration of birthdays is healthy.
33
统计应用:质量管理中的6
统计在许多领域都有应用,其中在企业产品 质量管理中的应用就是一个重要的方面。在 统计中,表示一个总体的标准差,它说的 是数据之间的差异程度 比如 在企业生产 是数据之间的差异程度。比如,在企业生产 的产品中,同一种产品也没有两个是完全一 样的,因为在生产过程中,由于各种因素的 影响而使产品质量产生波动。在服务领域就 更是如此。产品或服务的这种差异称为质量 的波动性,也正是由于波动性的存在才需要 进行质量管理
Q1 Q2 Q3 Q4
x = 30 s2 = 105
28
推断统计
(inferential statistics)
研究如何利用样本数 据来推断总体特征的 统计学分支 内容 参数估计 假设检验 目的:对总体特征作 出推断
总体
描述统计与推断统计的关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
20
解释数据
下面是某高速公路上发生的交通事故有关数据: 速度 km / h 数量 小于 70 12 70 ~ 180 32 大于 180 3
解释数据
不同种族与性别的中值年收入
男性 女性 白人 41211美元 31169美元 24% 黑人 32241美元 26965美元 16% 22% 13%
丙同学由此得出结论说:统计数据显示, 在高速公路上,汽车速度越高,也就越安全。 实际上绝大多数的汽车行驶速度都在 70 ~ 180 ,因 此发生事故的次数也就多。
8
质量管理与控制
索尼公司在美国开设美国索尼公司,在 日本与美国两处索尼公司生产的电视机 关于重要的质量指标——显像管平均寿命 方面有着相同的要求,然而数据表明美 国顾客偏爱购买日本生产的索尼电视机。 是不是美国人也有“崇洋媚外”的习性?
环境保护
某地环境保护法规定:倾入河流的废水 中某种有毒物质的平均含量不得超过 3ppm(10e-6)。环保组织如何判断某 厂是否达到要求?
统计研究的过程
问题:
研究决定工资的因素 北京公交线路站点流量 。。。
例:桶子里有灰,白,黑球 各30个。从其中随机取一球, 手中是白球的概率是多少?
---- Based on Gilbert, Norma. Statistics. W.B. Saunders Co., 1976.
17 18
9
10
通货膨胀
北京房市
【穷人是怎样炼成的】33年前,假如你 往银行里存了400元钱,当年这笔钱能盖 一套房子、买400斤猪肉、1818斤面粉、 727盒中华香烟或50瓶茅台酒。今天,你 瓶茅台酒 今天 你 取出这笔钱,连本带息835.82元,仅够 买420斤面粉、40多斤猪肉或1瓶茅台。 ——通货膨胀,就是这样疯狂吞噬着社会 财富!
工资存在种族、性别歧视 该结论是否可靠?
21 22
解释数据
解释数据
【30年前的1万相当于现在255万】北京 师范大学教授钟伟:从居民家庭人均收 入、居民人均储蓄着手,选取1981年、 1991年、 年 2001年和2007年四个时间点, 年四个时间点 对“万元户”财富的变迁进行测算。结 果是1981年的万元财富相当于当时人均 储蓄的200倍,折算到现在差不多是255 万元。今天的百万尚不及30年前的1万。
14
statistics的定义 (不列颠百科全书)
什么是统计学?
收集、处理、分析、解释数据并从数据中得 出结论的科学
statistics: the science of collecting, analyzing, presenting, and interpreting data.
Copyright 1994 1994-2000 2000 Encyclopaedia Britannica, Britannica In
人们经常要估计具有某一特征的总体的 比例是多少 公安交警部门可能要估计在汽车行驶时, 经常使用移动电话的人数比例 营销部门可能要估计喜欢某一种服装类 型的青少年的比例 政治家可能要估计支持他的选民比例 美国大选…
3
4
服务业管理
预测
很多城市的出租车都采用“承包额”方 法进行管理。出租车司机每月必须上缴 一定的承包额。假定司机每月必须上缴B 元(B待定),为了保证司机的每月的实 待定) 为了保证司机的每月的实 际收入,其营业额就应当在A元以上。 如何确定上缴额?
23
In 1899, G. Udny Yule investigated the causes of pauperism in England. Paupers were supported pp inside local poor-houses p or outside. Yule found that the change in pauperism was positively related to the change in the proportion treated outside of poor-houses. He then reported that welfare
7
产量分析
特殊产品公司生产在商店销售的昂贵而 不常见的礼品。公司研发部最新的产品 计划是有限版落地摆钟(limited edition grand-father d f th clock l k)。公司管理部门需 ) 公司管理部门需 要决定是否生产这个新产品,如果生产 的话要生产多少。 我们需要知道些什么信息?
25 26
描述统计 统计方法
统计方法 描述统计 推断统计 参数估计 假设检验
27
(descriptive statistics)
研究数据收集、整理和描 述的统计学分支 ¥ 内容 50
收集数据 整理数据 展示数据 描述性分析 描述数据特征 找出数据的基本规律
25 0
目的
北京@房事 http://v.youku.com/v_show/id_XMjcyO DU4NTQw.html 我们相信上帝,除此之外,我们只相信 数据 James R.Evans
12
2
统计学
统计及其研究过程
13
根据概率论我们知道,大量的随机试验中各种 结果的出现具有它的规律性。因此从理论上讲 只要对随机现象进行足够多次的观察,各种结 果的规律性 定能清楚地呈现,但是实际上所 果的规律性一定能清楚地呈现,但是实际上所 允许的观察永远是有限的,甚至是少量的。 例如:若规定灯泡寿命低于1000小时者为次品 ,如何确定次品率? 由于灯泡寿命试验是破坏性试验,不可能把整 批灯泡逐一检测,只能抽取一部分灯泡作为样 本进行检验,以样本的信息来推断总体的信息 ,这是统计学研究的问题之一。
ห้องสมุดไป่ตู้
推断统计
反映客观现 象的数据
样本数据 总体数据
描述统计 (统计数据的搜集、整 理、显示和分析等)
(利用样本信息和概率 论对总体的数量特征进 行估计和检验等)
样 本
29
总体内在的 数量规律性
30
5
统计的应用领域
经济学 医学
统计的应用领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) fisheries research (水产渔业研究) finance (金融) genetics (遗传学) gambling (赌博) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
统计学是收集、分析、表述和解释数据 的科学(不列颠百科全书)
数据收集:取得数据 数据处理:整理与图表展示 数据分析:利用统计方法分 析数据 数据解释:结果的说明 得到结论:从数据分析中得 出客观结论
15
16
统计学与概率论的区别
概率论与统计是研究随机现象数量 规律的科学
例:从桶子里随机抽出六个球, 有2个黑球。问桶子里黑球所 占的比率多少?
5
你经历过吗
6
1
银行的信用风险
对信用卡的使用,很多人会按规定还款,但 也有人恶意透支,最后申请破产逃避还款。 这一切,发卡银行都需要做到心中有数。虽 这 切,发卡银行都需要做到心中有数 虽 不可能对每个人心中有数,但可以对整体持 卡人群体,各种可能的比例、每类人的发展 趋势做到心中有数。 你知道吗?
provided outside of poor-houses created paupers.
24
4
解释数据
A contemporary of Yule's suggested that what Yule was seeing was instead an example of confounding--those areas with
第一章:绪论
经济管理领域中的一些问题 统计及其应用领域 统计研究过程 统计数据的类型 统计中的几个基本概念
经济管理领域中的一些问题
1
2
比例问题
产品促销决策
一家全国百货连锁店正在考虑是否该通 过一种直接邮寄的促销活动来促销其产 品。因为促销成本很高,公司在采取行 品 因为促销成本很高,公司在采取行 动前需要了解促销活动的效果。
统计方法与应用领域
more efficient administrations were better at both building poor-houses and reducing poverty.
David Freedman (1999), “From Association to Causation: Some Remarks on the History of Statistics”, Statistical Science, 14, 243-258
我国的GDP每年度有较大幅度的增长,预测下一 年的GDP增长率是几乎所有的经济学家感兴趣的 事。如何预测? 股民、券商,甚至是证监会,都希望预测证券市 场的发展趋势,如何利用历史数据来预测未来? 营销和生产部门经理经常需要根据经营的历史数 据,预测销售额、盈利、成本、生产水平、存货、 购买、资本需求等 财务部门经理经常根据以往的数据特征和相关金 融工具价格走势,预测金融工具的价格走势
管理学
统计学
工程学
社会学
…
31
32
统计的应用领域
hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)
3
统计研究的过程
实际问题
收集数据 (取得数据) 整理数据 (处理数据) 解释数据 (结果说明) 分析数据 (研究数据)
19
解释数据
Statistics show that those people who celebrate the most birthdays become the oldest celebration of birthdays is healthy.
33
统计应用:质量管理中的6
统计在许多领域都有应用,其中在企业产品 质量管理中的应用就是一个重要的方面。在 统计中,表示一个总体的标准差,它说的 是数据之间的差异程度 比如 在企业生产 是数据之间的差异程度。比如,在企业生产 的产品中,同一种产品也没有两个是完全一 样的,因为在生产过程中,由于各种因素的 影响而使产品质量产生波动。在服务领域就 更是如此。产品或服务的这种差异称为质量 的波动性,也正是由于波动性的存在才需要 进行质量管理
Q1 Q2 Q3 Q4
x = 30 s2 = 105
28
推断统计
(inferential statistics)
研究如何利用样本数 据来推断总体特征的 统计学分支 内容 参数估计 假设检验 目的:对总体特征作 出推断
总体
描述统计与推断统计的关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
20
解释数据
下面是某高速公路上发生的交通事故有关数据: 速度 km / h 数量 小于 70 12 70 ~ 180 32 大于 180 3
解释数据
不同种族与性别的中值年收入
男性 女性 白人 41211美元 31169美元 24% 黑人 32241美元 26965美元 16% 22% 13%
丙同学由此得出结论说:统计数据显示, 在高速公路上,汽车速度越高,也就越安全。 实际上绝大多数的汽车行驶速度都在 70 ~ 180 ,因 此发生事故的次数也就多。
8
质量管理与控制
索尼公司在美国开设美国索尼公司,在 日本与美国两处索尼公司生产的电视机 关于重要的质量指标——显像管平均寿命 方面有着相同的要求,然而数据表明美 国顾客偏爱购买日本生产的索尼电视机。 是不是美国人也有“崇洋媚外”的习性?
环境保护
某地环境保护法规定:倾入河流的废水 中某种有毒物质的平均含量不得超过 3ppm(10e-6)。环保组织如何判断某 厂是否达到要求?
统计研究的过程
问题:
研究决定工资的因素 北京公交线路站点流量 。。。
例:桶子里有灰,白,黑球 各30个。从其中随机取一球, 手中是白球的概率是多少?
---- Based on Gilbert, Norma. Statistics. W.B. Saunders Co., 1976.
17 18
9
10
通货膨胀
北京房市
【穷人是怎样炼成的】33年前,假如你 往银行里存了400元钱,当年这笔钱能盖 一套房子、买400斤猪肉、1818斤面粉、 727盒中华香烟或50瓶茅台酒。今天,你 瓶茅台酒 今天 你 取出这笔钱,连本带息835.82元,仅够 买420斤面粉、40多斤猪肉或1瓶茅台。 ——通货膨胀,就是这样疯狂吞噬着社会 财富!
工资存在种族、性别歧视 该结论是否可靠?
21 22
解释数据
解释数据
【30年前的1万相当于现在255万】北京 师范大学教授钟伟:从居民家庭人均收 入、居民人均储蓄着手,选取1981年、 1991年、 年 2001年和2007年四个时间点, 年四个时间点 对“万元户”财富的变迁进行测算。结 果是1981年的万元财富相当于当时人均 储蓄的200倍,折算到现在差不多是255 万元。今天的百万尚不及30年前的1万。
14
statistics的定义 (不列颠百科全书)
什么是统计学?
收集、处理、分析、解释数据并从数据中得 出结论的科学
statistics: the science of collecting, analyzing, presenting, and interpreting data.
Copyright 1994 1994-2000 2000 Encyclopaedia Britannica, Britannica In
人们经常要估计具有某一特征的总体的 比例是多少 公安交警部门可能要估计在汽车行驶时, 经常使用移动电话的人数比例 营销部门可能要估计喜欢某一种服装类 型的青少年的比例 政治家可能要估计支持他的选民比例 美国大选…
3
4
服务业管理
预测
很多城市的出租车都采用“承包额”方 法进行管理。出租车司机每月必须上缴 一定的承包额。假定司机每月必须上缴B 元(B待定),为了保证司机的每月的实 待定) 为了保证司机的每月的实 际收入,其营业额就应当在A元以上。 如何确定上缴额?
23
In 1899, G. Udny Yule investigated the causes of pauperism in England. Paupers were supported pp inside local poor-houses p or outside. Yule found that the change in pauperism was positively related to the change in the proportion treated outside of poor-houses. He then reported that welfare
7
产量分析
特殊产品公司生产在商店销售的昂贵而 不常见的礼品。公司研发部最新的产品 计划是有限版落地摆钟(limited edition grand-father d f th clock l k)。公司管理部门需 ) 公司管理部门需 要决定是否生产这个新产品,如果生产 的话要生产多少。 我们需要知道些什么信息?
25 26
描述统计 统计方法
统计方法 描述统计 推断统计 参数估计 假设检验
27
(descriptive statistics)
研究数据收集、整理和描 述的统计学分支 ¥ 内容 50
收集数据 整理数据 展示数据 描述性分析 描述数据特征 找出数据的基本规律
25 0
目的