商务统计学第一章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生成均匀分布的随机数
2014-9-22
源自文库
用Excel抽取简单随机抽样
【例】某 班级共有 30 名 学 生 ,他们的 名单如右 表 。 用 Excel 抽 出 一个由 5 个 学生构成 的随机样 本
2014-9-22
第1步:将30个学生的名单录入到Excel工作表中的一列 第2步:给每个学生一个数字代码,分别为1,2…,30 ,并按顺序排列,将代码录入到Excel工作表中
ˆ 3.698 0.04754 x y
当温度为 310F时,O型项圈发生事故的预计次数为 2.225次。结果显示连 接处的温度与O型项圈事故之间有一定的相关性。如果当时那些经理们看 到了回归的预测结果,也许推迟发射会成为其谨慎的选择
2014-9-22
美国印第安纳大学医学院临床儿科学教授保罗·温 切斯特对150万8岁至15岁孩子的考试成绩进行统 计,结果发现,相对其他季节出生的孩子,春天 出生的孩子英文和数学成绩明显要差。这名教授 认为,怀孕初期孕妇接触杀虫剂过多是阻碍胎儿 智力发育的重要因素之一。不过这一论点有待进 一步证明。
2014-9-22
统计的应用领域
在此次失事前,该航天飞机24次发射成功。将航天飞机送入太空的两个固 体燃料推进器由6只O型项圈密封。在几次飞行中,曾发生过O型项圈被腐 蚀或气体泄漏事故。这样的事故是及其危险的。前24次发射中有一次发动 机遭到了永久性破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变 量)及火箭连接处的温度(自变量)数据,进行线性回归得到的回归方程为
抽样调查得出总体数据的推断!!!!
第一章 统计和统计数据
1.1 统计及其应用领域
1.1.1 统计学研究什么 统计学研究的是来自各领域的数据,包括经济、金融、管理、环境、医学、 生物等,故有人称之为“寄生科学”。 1.1.2 统计的应用 1. 在各学科广泛使用 2. 误用和滥用?
什么是统计?
Statistics is the science of learning from data.
(American Statistical Association: http://www.amstat.org/careers/whatisstatistics.cfm)
5
首届国际《红楼梦》研讨会在美国 召开,威斯康辛大学讲师陈炳藻独 树一帜,宣读了题为《从词汇上的 统计论红楼梦作者的问题》的论文, 他从字、词出现频率入手,通过计 算机进行统计、处理、分析,对《 红楼梦》后 40 回系高鹗所作这一流 行看法提出异议,认为 120 回均系 曹雪芹所作。
误用和滥用?
基础概念
总体(population)—包含所研究的全部个体的结合 样本(sample)—从总体中抽取的一部分元素的集合 样本量(sample size)—构成样本的元素的数目
抽样方法
简单随机抽样(simple random sampling):从含有N个元素的总体中, 抽取 n 个元素组成一个样本,使得总体中的每个元素都有相同元素抽中。 系统抽样(systematic sampling)—也称为等距抽样。总体排序后,确 定一个起点,再按固定间隔抽取元素。 分层抽样(stratified sampling)—也称为分类抽样,在抽样之前先将元 素划分为若干层,然后从各个层中抽取一定数量的元素组成样本。 整群抽样(cluster sampling)—先将总体划分成若干群,然后以群作为 抽样单元从中抽取部分群组成一个样本,在对抽中的每个群中所包含的 所有元素进行观察。
例如,在全美 50 家最大公司的 CE0 中, 29% 的男性身高在 l 90cm 以上,而美国人口中只有2% 的男性达到这个高度。此外,在美国 《财富)排行榜上前500名GE0的平均身高为1 83cm,其中有30% 的人身高超过1 88cm,这比美国男人平均身高高1 3 cm(约1 75 cm),其中58%的人身高超过6英尺(约1 83 cm),而这种身高 的男性在美国总入口中仅占l 4.5%。而身高超过6英尺2英寸(约 1 88 cm)的人数,占该排行榜的3 0%,这种身高其实仅占美国总 入口的 3.9% 。由此可见,身高在财富分配中所占的优势十分明显。
变量的类型
分类变量(Categorical variables )(qualitative)—某种类别,男,女 顺序变量(rank variables) (qualitative)—有次序的变量,AAA,B 离散变量(discrete variables) (quantitative)——由自然数间隔 连续变量(continuous variables)(quantitative)——连续不断
用Excel抽取简单随机样本
的一列,与学生名单相对应(数值型数据直接抽取) 第3步:选择【工具】下拉菜单,并选择【数据分析】选项 ,然后在【数据分析】选项中选择【抽样】 第4步:在【抽样】对话框中的【输入区域】中输入学生代码 区域,在【抽样方法】中单击【随机】 。在【样本 数】中输入需要抽样的学生个数。在【输出区域】中 选择抽样结果放置的区域。【确定】后即得到要抽取 的样本
Why do I have to take a statistics course?
“We live in an information age. Computers allow us to collect and store information in quantities that previously would not even have been dreamed of. What is this information? It might be costs, values, sales volumes, measurements, ratings, distances, prices, percentages, counts, times, or market shares. But raw, undigested data stored on computer disks is of no use until we can start to make sense of it. Statistics is the human side of the computer revolution, an information science, the science (and art!) of extracting meaning from seemingly incomprehensible data. In your future life and career, you will need to be able to make good use of such information to make sound decisions.”
第2步:在复选框“函数分类”中点击【全部】选项,并在“函 数
名”中点击【RANDBETWEEN】选项,然后【确定】 第3步:在【Bottom】输入要返回的最小整数(本例为1) 在【Top】输入要返回的最大整数(本例为100) 单击【确定】即可得到一个随机数(要得到多个随机数 向下复制即可)
2014-9-22
结
束
第一章 统计和统计数据
推断统计包括参数估计和假设检验两大类。
参数估计——利用样本获得总体的特征 假设检验——利用样本判断某些总体假设是否正确
案例:小明的妈妈让小明去买一盒火柴,并叮嘱小明,一定要试试 火柴是否好用,小明回家后,高兴地告诉妈妈:火柴好用,我每根 都试过了.(1)小明利用的是哪类统计分析?(2)你认为小明采 取的方法是否合适,为什么?
商务统计学 business statistics
统计思维总有一天会像读与写一样成为一个 有效率公民的必备能力
什么是统计?
2013年广东省城镇非私营单位就业人员年平均工资53318元。 人一生吃掉的鸡只数1201。 人的心脏可以产生把血液喷出30尺高的压力。 把头撞墙一个小时可以消耗150卡热量。 超过80%的男性被女性评为低于平均水平;而40%女性被男性评为低于平均水平。 山东女性平均身高169公分为全国之首。
统计的应用领域
1986年1月28日清晨,载有7名宇航员的挑战者号进入发射 状态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电 视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中化 成碎片,机上的宇航员片骨未存 推动航天飞机进入太空的两个固体燃料发动机是由Thiokol 公司制造的。失事前一天晚上,Thiokol公司的经理们和国家航 空航天局就如期发射还是推迟发射产生了争执。天气预报发射 时的气温为310F。争执的结果采纳了Thiokol公司经理们的建: 按计划发射航天飞机。因为他们觉得没有确凿证据表明低温会 对固体燃料火箭推进器的性能产生影响
2014-9-22
抽取简单随机样本
几种常用的统计软件
典型的统计软件
SAS SPSS R MINITAB STATISTICA Excel ……
(Software)
STATISTICA
SAS SPSS
MINITAB Excel
2014-9-22
本章小节
统计学的含义 统计学的研究内容 统计的应用领域 统计数据的类型 获得统计数据的途径
比较:分层抽样 vs整群抽样
分层抽样
每个层内抽取个体
整群抽样
整群抽取/不抽取
各层差异大
群与群差异小
层内差异小
群内个体差异大
软件应用
用计算机生成随机数和 简单随机样本
用Excel生成个指定数之间的随机数
生成位于两个指定数之间的一个随机数(RANDBETWEEN函数)
第1步:在Excel表格界面中,直接点击【fx】命令
生成两个指定数之间的随机数
2014-9-22
用Excel0~1之间均匀分布的随机数
生成位于0~1之间的均匀分布随机数 (RAND函数) 第1步:在Excel表格界面中,直接点击【fx】命令 第2步:在“函数分类”中点击【全部】选项,并在“函数名”中点击 【RAND】选项,然后【确定】,单击【确定】即可得到一 个随机数(要得到多个随机数向下复制即可)
Answer from San José State University: http://www.sjsu.edu/statistics/why/)
第一章 统计和统计数据
1.1 统计及其应用领域 简单说,任何由数字表达的信息都适用统计的知识 1.1.1 统计学研究什么 1. 统计学 是收集、处理、分析、解释数据并从数据中得出结论的科学。 统计分析数据所用的方法大致分为: 描述统计(descriptive statistics)—数据收集、处理和描述的方法 推断统计(inferential statistics)—利用样本来推断总体
若要生成 a 与 b 之间的随机实数,请使用 RAND()*(b-a)+a 若要对结果四舍五入为整数,请使用ROUND(RAND()*(b-a)+a,0) 如果要使用函数 RAND 生成一随机数,并且使之不随单元格计算而改变,可以在编辑栏中输入 “=RAND()”,保持编辑状态,然后按 F9,将公式永久性地改为随机数
1
样本数量太小
2
样本选择有偏见
3
刻意隐瞒统计结论
1.2 怎样获得统计数据
1.2.1 变量和数据 变量(variable)—每次观察都会得到不同结果的某种特征 数据(data)—每次观察得到的结果 股票浦发银行的收盘价格 珠海市日降雨量 广东省日交通肇事总量
重要的术语-VIP