(06)第6章 假设检验(贾俊平)
应用统计学 第 6 章 假设检验
多大的P 值合适?
显著性检验的目的是要描述样本所提供不利于原假 设的证据有多强。P值就在做这件事。但是,要证明 原假设不正确,P值要多小,才能令人信服呢?这要 根据两种情况来确定 • • 原假设的可信度有多高?如果H0 所代表的假设 是人们多年来一直相信的,就需要很强的证据 (小的P值)才能说服他们 拒绝的结论是什么?如果拒绝H0而肯定H1 ,就 需要有很强的证据显示要支持H1 。比如,H1 代 表要花很多钱把产品包装改换成另一种包装,你 就要有很强的证据显示新包装一定会增加销售量 (因为拒绝H0要花很高的成本)
6. 用Excel进行检验
6.1
6.1.1 6.1.2 6.1.3 6.1.4
假设检验的基本问题
假设的陈述 两类错误与显著性水平 统计量与拒绝域 利用P值进行决策
假设的陈述
什么是假设? (hypothesis)
• 对总体参数的具体
数值所作的陈述 – 总体参数包括总体 均值、比例、方差 等 – 分析之前必须陈述
H0 : 30%
H1 : 30%
提出假设 (结论与建议)
1. 原假设和备择假设是一个完备事件组,而 且相互对立
– 在一项假设检验中,原假设和备择假设必 有一个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=‖总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不 同的假设(也可能得出不同的结论)
– 原假设为正确时拒绝原假设 – 第Ⅰ类错误的概率记为
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为错误时未拒绝原假设 – 第Ⅱ类错误的概率记为(Beta)
假设检验中的两类错误 (决策结果)
应用统计学 第六章 假设检验
v (s12
s12 n1
s22 n2
2
n1)2 (s22 n2 )2
n1 1
n2 1
(6-13)
31
第三节 两个总体参数的检验
第 六 章
假
设
检 验
这时,检验统计量t的计算公式为:
t (x1 x2 ) (1 2 )
s12 s22 n1 n2
10
第一节 假设检验的基本问题
第 六 章
假 设
(五) 根据样本数据计算检验统计量的值
检
验
在提出原假设和备择假设,选取适当显著性水平 和检验统计量以后,接下来就要根据样
本观测值计算检验统计量的值,具体计算方法将在本章第二节进行详细介绍。例如,例6-1中检
验统计量的值为:
z x 0 2.21 2 2.67
t x 0 (6-3)
s/ n
18
第二节 一个总体参数的检验
第 六 章
假
综上所述,不同情况下总体均值的检验统计量如表6-3所示。
设
检
验
19
第二节 一个总体参数的检验
第 六 章
二、总体比例的检验
假
设 检
在实际应用中,常常需要检验总体比例是否为某个假设值 0 。例如,检验某课程的
验 考试通过率、产品的合格率、种子的发芽率等,民意调查中也经常用到总体比例检验。
样本条件下,要求总体服从正态分布,且总体标准差 已知时,可以使用z统计量。当
总体标准差 已知时,z统计量的计算公式为:
z x 0 / n
(6-1)
15
第二节 一个总体参数的检验
第 六 章 假 设 检 验
16
统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法.推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1。
3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据.时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量.变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1。
7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学(第六版)贾俊平——_课后习题答案
第一章导论1.1 .1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000 个职工家庭的年人均收入。
1.3(1)总体是所有IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1. 什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料” 。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2. 比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3. 调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
统计学第四版答案(贾俊平)
请举出统计应用的几个例子:1、用统计识别作者:对于存在争议的论文,通过统计量推出作者2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域:1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用你怎么理解统计的研究内容:1、统计学研究的基本内容包括统计对象、统计方法和统计规律。
2、统计对象就是统计研究的课题,称谓统计总体。
3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
举例说明分类变量、顺序变量和数值变量:分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:1、定性数据的图示:条形图、帕累托图、饼图、环形图2、定量数据的图示:a、分组数据看分布:直方图b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图c、两个变量间的关系:散点图d、比较多个样本的相似性:雷达图和轮廓图直方图与条形图有何区别:1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
统计学(贾俊平)第五版课后习题答案(完整版)
统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学(第三版课后习题答案) 贾俊平版
区分指标与标志,总量指标分类、分配数列、上限不在内原则、各种平均数之间的关系、平均发展指标!计算可能考的公式有:计划完成情况相对指标、结构(比例/比较/强度/动态)相对指标、各种平均数算法、众数、中位数、四分位数、平均差、标准差、标准差系数、偏态和峰度、发展速度和增长速度、总指数(很重要)、平均指标指数、重要经济指数的编制(上证指数、工业产品产量总指数、农副产品收购价格指数)统计学(第三版课后习题答案) 贾俊平版2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
统计学第六版贾俊平第6章
统计学
第六版
2)分布
(图示)
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本
计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
2
2值
6 - 31
统计学
第六版
6.3 样本统计量的抽样分布
(两个总体参数推断时)
一. 两个样本均值之差的抽样分布 二. 两个样本比例之差的抽样分布 三. 两个样本方差比的抽样分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 17
x
X
统计学
第六版
中心极限定理
(central limit theorem)
X
的分 布趋 于正 态分 布的 过程
6 - 18
统计学
第六版
抽样分布与总体分布的关系
总体分布
(一个总体参数推断时)
一. 样本均值的抽样分布 二. 样本比例的抽样分布 三. 抽样方差的抽样分布
6-9
统计学
第六版
样本均值的抽样分布
6 - 10
统计学
第六版
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
6 - 11
3. 两个样本方差比的抽样分布,服从分子自由度 为(n1-1),分母自由度为(n2-1) F分布,即
S12 ~ F ( n1 1, n 2 1) 2 S1
统计学第四版答案(贾俊平)
第1章统计和统计数据指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么样本是什么样本量是多少(2)“月收入”是分类变量、顺序变量还是数值变量(3)“消费支付方式”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样(2)样本量是多少详细答案:(1)分层抽样。
(2)100。
第3章用统计量描述数据偏度极差26最小值15最大值41从集中度来看,网民平均年龄为24岁,中位数为23岁。
从离散度来看,标准差在为岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。
某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为分钟,标准差为分钟,第二种排队方式的等待时间(单位:分钟)如下:(1)计算第二种排队时间的平均数和标准差。
管理统计学第六章假设检验
拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
*均值的单尾 Z 检验
(2 已知)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布,可以用正态分布来
近似 (n30)
2. 备择假设有<或>符号 3. 使用z-统计量
z x 0 ~ N (0,1) n
均值的单尾 Z 检验
的某个假设
总体分布未知时的 假设检验问题
本章讨论参数假设检验 . 一个质量检验例子:
罐装可乐的容量按标准应在 350毫升和360毫升之间.
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢?
把每一罐都打开倒入量杯, 看看容量是否合于标准.
这样做显然 不行!
• 二、方法 • 方法1:总体方差已知时双侧检验、单尾(左尾、右尾)检验 • 方法2:总体方差未知时双侧检验、单尾(左尾、右尾)检验
方法1:总体方差已知时 的检验
*单样本均值的双尾 Z 检验
(2 已知)
• 1、假定条件
– 总体服从正态分布
– 若不服从正态分布, 可用正态分布来近似(n30)
• 2、原假设为:H0: =0;
= 0 ≠0
0 < 0
0 > 0
(二)双侧检验
1、定义:只强调差异而不强调方向性的检验称为双侧检验。
例:某种零件的尺寸,要求其平均长度为10厘米,大于或 小于10厘米均属于不合格。
建立的原假设与备择假设应为
H0: 1 10
H1: 1 10
2、双侧检验的显著性水平与拒绝域 如果统计量的值界于左、右临界值间,则H0成立;
第六章 假设检验《统计学》
六、假设检验一般步骤
1
根据具体问题的要求, 建立总体假设H0,H1 选择统计量 确定H0为真时的抽样分布 给定显著性水平α,当原假 设H0为真时,求出临界值。
2
3
4
计算检验统计量的数 值与临界值比较
• 假设检验的一般步骤: • (一)根据所研究问题的要求,提出原假设 H0和备 择假设H1 。 有三种类型的原假设和备择假设, 以总体均值的假 设检验为例加以说明。
假设检验的功效
• 检验效果的好与坏,与犯两类错误的概率有关。一个 有效的检验,首先是犯第一类错误的概率α 不能太大, 否则的话就经常产生弃真现象; • 另外,在犯第一类错误概率得到控制的条件下,犯取 伪错误的概率也要尽可能小,或者说不取伪的概率1β 应尽可能大。 1-β 越大,意味着当原假设不真实时, 检验判断出原假设不真实的概率越大,检验的判别能 力就越好; 1-β 越小,意味着当原假设不真实时,检 验结论判断出原假设不真实的概率越小,检验的判别 能力就越差。可见1-β 是反映统计检验判别能力大小 的重要标志,我们称之为检验功效或检验力,假设检 验的功效是指1-β ,其表示不犯第二类错误的概率, 即备择假设H1为真时,接受备择假设H1 (或者是拒绝 H0)的概率。因而增大犯第二类错误的概率也意味着降 低检验的功效。 •
例如,生产者在将产品出售给消费者之前要进行质量检验, 通常提出的原假设为 H0:产品是合格品,备择假设为 H1: 产品是不合格品。生产者总是担心把合格品误判为不合格 品,从而使合格品无法出厂,给企业造成损失,这时生产者 犯了第一类错误,第一类错误的概率α 就是生产者的风险; 消费者总是担心把不合格品误判为合格品,把不合格品当作 合格品购买,这时消费者犯了第二类错误,第二类错误的概 率β 就是消费者的风险。
贾俊平统计学第6章假设检验
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
《概率论》第六章假设检验
例1 某服务系统的相应时间服从正态分布,需求 其平均相应时间在0.5秒之内。若16次抽样测试得 到样本平均值为x=0.56秒,样本标准差为s=0.12秒, 该服务系统工作是否正常?(=0.05)
解:H0 : 0.5 n=16 =0.05 t1 1.753 t x 0 0.56 0.5 =2 >1.753 s n 0.12 16
因此否定H0 即该服务系统工作不正常
(二)未知方差2,关于期望的检验
1.检验假设(单边)H0 : 0 H1 : 0
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t (n 1),
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t1 (n 1),
P T t1 (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t t1 (n 1),则否定H0; 若t t1 (n 1),则接受H0.
因此这实际上需要比较第二个正态总体 的期望值是与第一个正态总体期望值相 等还是比它高?
这种作为检验对象的假设称为原假设, 通常用 H0表示。比如, 例2中的待检假设为:H0:Eξ=3140
如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H0成立 与否的方法是本章要介绍的主要内容。
P T t (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t<t (n 1),则否定H0; 若t>t (n 1),则接受H0.
(二)未知方差2,关于期望的检验
贾俊平统计学第六、七章课后习题答案
贾俊平统计学第六、七章课后习题答案6.1解:设每个瓶子的灌装量为X,X?为样本均值,样本容量为n。
由于总体X服从正态分布,样本均值X?也服从正态分布,且均值相同,标准差为σ√n =1√9=13所以P(|X??μ|≤0.3)=P(|X??μ|13≤0.313)=2Φ(0.9)?1=2?0.8159?1=0.6318 7.1(1)已知σ=500,n=15,x=8900,1-α=95%,Z2α=1.96x+Z2αnσ=8900+1.96×15500=(8647,9153)(2)已知σ=500,n=35,x=8900,1-α=95%,Z2α=1.96x+Z2αnσ=8900+1.96×35500=(8734,9066)(3)已知n=35,x=8900,s=500,由于总体方差未知,但为大样本,所以可用样本方差来代替总体方差。
置信水平1-α=90%,Z2α=1.645x+Z2αns=8900+1.645×35500=(8761,9039)(4)已知n=35,x=8900,s=500,由于总体方差未知,但为大样本,所以可用样本方差来代替总体方差。
置信水平1-α=99%,Z2α=2.58x +Z2αn s =8900+2.58×35500=(8682,9118)7.2已知n=36,x =3.3167,s=1.6093(1)当置信水平为90%时,Z 2α=1.645x +Z 2αn s =3.3167+1.645×366093.1=3.3167+0.4532=(2.88,3.76)(2)当置信水平为95%时,Z 2α=1.96x +Z 2αn s =3.3167+1.96×366093.1=3.3167+0.544=(2.80,3.84)(3)当置信水平为99%时,Z 2α=2.58Z2αn s =3.3167+2.58×366093.1=3.3167+0.7305=(2.63,4.01)7.3(1)已知总体服从正态分布,但σ未知,n=50为大样本,α=0.05,Z 2α=1.96,根据样本计算可知x =101.32,s=1.63x +Z 2αn s =101.32+1.96×5063.1=101.32+0.45=(100.87,101.77)(2)由所给样本数据可知样本合格率:p=5045=0.9p +Z2αnp p )1(-=0.9+1.9650)9.0-19.0(=0.9+0.08=(0.82,0.98)7.4由样本数据得x =16.13,σ=0.8706,置信水平1-α=99%,Z 2α=2.58x +Zαn σ=16.13+2.58×58706.0=16.13+0.45=(15.68,16.58)7.5、(1)n=44,p=0.51,置信水平为99%由题意,已知n=44,置信水平1-α=99%,因此检验统计量为:,代入数值计算,总体比例π的置信区间为(31.6%,70.4%) (2)n=300,p=0.82,置信水平为95%由题意可得知96.12=αZ检验统计量为:,代入数值计算,总体比例π的置信区间为(77.7%,86.3%) (3)n=1150,p=0.48,置信水平为90%由题意可得知检验统计量为:,代入数值计算,58.22=αZ np p Z P )1(2-±α)704.0,316.0(194.051.044)51.01(51.058.251.0=+=-??p p Z P )1(2-±α)863.0,777.0(043.082.0300)82.01(82.096.182.0=+=-?+645.12=αZ np p Z P )1(2-±α总体比例π的置信区间为(45.6%,50.4%)7.6、(1)由题意已知n=200,当置信水平为90%时,,检验统计量为代入数据计算可得:置信区间为(18.10%,27.90%) (2)当置信水平为95%时,96.12=αZ ,检验统计量为代入数据计算可得:置信区间为(17.17%,28.83%)7.7、由题意已知置信水平为99%,即1-α=99%,则,估计误差E=200,=1000504.0,456.0(024.048.01150)48.01(48.0645.148.0=+=-?+645.12=αZ np p Z P )1(2-±α%)90.27%,10.18(%90.4%23200%)231%(23645.1%23=±=-?±np p Z P )1(2-±α%)83.28%,17.17(%83.5%23200%)231%(2396.1%23=+=-?+58.22=αZ σ则,即应该取样本量为1677.8、(1)由题意可知n=50,p=32/50=0.64,α=0.05,96 .12=αZ 总体中赞成该项改革的户数比例的置信区间为,代入数据计算:即置信区间为(51%,77%)(2)如果小区管理者预计赞成的比例能达到80%,即π=0.80,估计误差不超过10%,即E=10%,α=0.05,96.12=αZ ,应抽取的样本量为即应该抽取62户进行调查7.9(1)x?=21,s=2,n=50,α=0.1χ0.12?2(50?1)=66.3387,χ1?0.12?2(50?1)=33.9303∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(50?1)×2266.3387≤σ2≤(50?1)×2233.9303即2.95≤σ2≤5.78.标准差的置信区间为1.72≤σ≤2.4 (2)x?=1.3,s=0.02,n=15,α=0.1167200100058.22222222≈?==E Z n σαnp p Z P )1(2-±α)77.0,51.0(13.064.050)64.01(64.096.164.0=±=-±621.0)80.01(80.096.1)1(22222=-?=-?=E Z n ππαχ0.12?2(15?1)=23.6848,χ1?0.12?2(15?1)=6.5706∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(15?1)×0.02223.6848≤σ2≤(15?1)×0.0226.5706标准差的置信区间为0.015≤σ≤0.029 (3)x?=167,s=31,n=22,α=0.1χ0.12?2(22?1)=32.6706,χ1?0.12?2(22?1)=11.5913∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(22?1)×312≤σ2≤(22?1)×312标准差的置信区间为24.85≤σ≤41.73。
《统计学》课后答案(第二版-贾俊平版)
第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域.本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念.本章各节的主要内容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支.3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法.12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称.22. 离散型变量:只能取可数值的变量.23. 连续型变量:可以在一个或多个区间中取任何值的变量.第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能.本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要内容和学习要点如下表所示。
管理运筹学 第6章 假设检验
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
-1.96
0
1.96
Z
第六章
假设检验
例3:根据以往的资料,某厂生产的产 品的使用寿命服从正态分布N(1020, 10 02)。现从最近生产的一批产品中随机 抽取16件,测得样本平均寿命为1080小 时。问这批产品的使用寿命是否有显著 提高(显著性水平:0.05)?
第六章
假设检验
• 2.已知某炼铁厂的铁水含碳量(%) 在正常情况下服从正态分布N(4.55, 0.112),今测得5炉铁水含碳量如下: • 4.28,4.40,4.42,4.35,4.37. • 若标准差不变,铁水的含碳量是否有 明显的降低?( =0.05)
第六章
6.3
假设检验
总体比率的假设检验
第六章
假设检验
一、假设检验(Hypothesis Testing)问题的提出
例1、某企业生产一种零件,以往的资料显示零 件平均长度为4cm,标准差为0.1cm。工艺改革后, 抽查100个零件发现其平均长度为3.94cm。问:工艺 改革后零件长度是否发生了显著变化? 例2、某厂有一日共生产了200件产品,按国家标 准,次品率不得超过3%才能出厂。现从该批产品中 随机抽取10件,发现其中有2件次品,问这批产品能 否出厂。
6.2.1 正态总体参数假设检验的步骤
第一步:建立原假设H0和备择假设H1。原假设应该 是希望犯第Ι类错误概率小的假设。 常用的假设形式 :
H H H
: , H : ( 双边备择假设) 0 0 1 0 : , H : ( 右单边备择假设) 0 0 1 0 : , H : ( 左单边备择假设) 0 0 1 0
统计学第四版问题详解(贾俊平)
第1章统计和统计数据1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第3章用统计量描述数据););=426.67;,,第五章1.23.4.5.6.7.5.8 (1)(3.02%,16.98%)。
(2)(1.68%,18.32%)。
5.9 详细答案:(4.06,24.35)。
5.10详细答案: 139。
5.11 详细答案: 57。
5.12 769。
第6章假设检验平看电,绝平,,绝,,绝在,,=100 =50=14.8 =10.4=0.8 =0.6对,,绝。
对设,。
假设检验-贾俊平
7 - 16
经济、管理类 基础课程
统计学
假设检验中的小概率原理
7 - 17
经济、管理类 基础课程
统计学
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的
事件发生的概率
2. 在一次试验中小概率事件一旦发生,我 们就有理由拒绝原假设
3. 小概率由研究者事先确定
决策:
拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
经济、管理类 基础课程
统计学
错误和 错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
7 - 22
经济、管理类 基础课程
统计学
影响 错误的因素
1. 总体参数的真值
随着假设的总体参数的减少而增大
2. 显著性水平
当 减少时增大
3. 总体标准差
当 增大时增大
▪ 建立的原假设与备择假设应为
H0: 1000 H1: 1000
7 - 36
经济、管理类 基础课程
统计学
单侧检验
(例子)
该批产品的平均使用寿命超过1000小时吗? (属于检验声明的有效性,先提出原假设)
提出原假设: H0: 1000 选择备择假设: H1: 1000
7 - 37
经济、管理类 基础课程
一个总体
均值
比例
方差
Z 检验
t 检验
Z 检验
(单尾和双尾) (单尾和双尾) (单尾和双尾)
2检验
(单尾和双尾)
7 - 48
经济、管理类 基础课程
统计学
均值的双尾 Z 检验 (2 已知)
应用统计-第06章-假设检验
计算 P值的一般表达式
应 用 统 计 第 六 章
19
左侧检验:H0:μ≥μ0,H1:μ<μ0 P值是当μ=μ0时,检验统计量小于或等于根据实际 观测样本数据计算得到的检验统计量的概率,即 P值=P(Z≤Zc|μ=μ0)。 右侧检验:H0:μ≤μ0,H1:μ>μ 0 P值是当μ=μ0时,检验统计量大于或等于根据实际 观测样本数据计算得到的检验统计量的概率,即 P值=P(Z≥Zc|μ=μ0); 双侧检验:H0:μ=μ0,H1:μ≠μ0 P值是当μ=μ0时,检验统计量大于或等于根据实际 观测样本数据计算得到的检验统计量的概率的两 倍,即 P值=2P(Z≥|Zc||μ=μ0)。
图6.1 显著性水平、拒绝域和临界值
置信水平(1–α)
应 用 统 计 第 六 章
17
拒绝域
α
拒绝域
拒绝域
α/2
临界值
α/2
o
(a)双侧检验
临界值
置信水平(1–α)
置信水平(1–α)
拒绝域
α
o 临界值 (b)左侧检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 -7
统计学
STATISTICS
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
... 因此我们拒
绝假设 = 50
... 如果这是总 体的假设均值
20
= 50
6 -8
H0
样本均值
统计学
STATISTICS
总体
☺☺ ☺
☺☺ ☺☺ ☺☺
6 -9
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比率 超过30%”。建立的原假设和备择假设 为
H0 : 30% H1 : 30%
6 - 15
统计学
STATISTICS
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
▪ 在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
6 - 12
统计学
STATISTICS
提出假设
(例题分析)
【例】一种零件的生产标准是直径应为10cm,为对生 产过程进行控制,质量监测人员定期对一台加工机 床检查,确定这台机床生产的零件是否符合标准要 求。如果零件的平均直径大于或小于10cm,则表 明生产过程不正常,必须进行调整。试陈述用来检 验生产过程是否正常的原假设和被择假设
▪ 指定为符号 =, 或
▪ 例如, H0 : 10cm
6 - 11
统计学
STATISTICS
备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
▪ H1 : <某一数值,或 某一数值 ▪ 例如, H1 : < 10cm,或 10cm
解:研究者想收集证据予以证明的 假设应该是“生产过程不正常”。 建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
6 - 13
统计学
STATISTICS
提出假设
(例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
作出决策 拒绝假设
别无选择!
抽取随机样本
☺均x =值20☺
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
1. 研究者想收集证据予以反对的假设
2. 又称“0假设”
3. 总是有符号 , 或 4. 表示为 H0
▪ H0 : = 某一数值
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
6 - 16
统计学
STATISTICS
双侧检验与单侧检验
统计学
STATISTICS
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
解:研究者抽检的意图是倾向于 证实这种洗涤剂的平均净含量并 不符合说明书中的陈述 。建立的 原假设和备择假设为
6 - 14 H0 : 500 H1 : < 500
500g
统计学
STATISTICS
提出假设
(例题分析)
【例】一家研究机构估计,某城市中家庭拥有汽车 的比率超过30%。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试 陈述用于检验的原假设与备择假设
错误
错误
正确
决策
实际情况 H0为真 H0为假
未拒绝H0
正确决策
(1 – )
第Ⅱ类错
误()
拒绝H0
第Ⅰ类错 正确决策
误() (1-)
6 - 22
统计学
STATISTICS
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
统计学
STATISTICS
第 6 章 假设检验
6.1 假设检验的基本问题 6.2 一个总体参数的检验 6.3 两个总体参数的检验
6 -1
统计学 假设检验在统计方法中的地位
STATISTICS
统计方法
描述统计
推断统计
参Байду номын сангаас估计
假设检验
6 -2
统计学
STATISTICS
学习目标
1. 假设检验的基本思想和原理 2. 假设检验的步骤 3. 一个总体参数的检验 4. 两个总体参数的检验 5. P值的计算与应用 6. 用Excel进行检验
左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : < 0 H1 : > 0
6 - 19
统计学
STATISTICS
两类错误与显著性水平
统计学
STATISTICS
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)
▪ 原假设为真时拒绝原假设
▪ 第Ⅰ类错误的概率记为
6 -3
统计学
STATISTICS
6.1 假设检验的基本问题
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
假设的陈述
统计学
STATISTICS
什么是假设?
(hypothesis)
对总体参数的具体数 值所作的陈述
▪ 总体参数包括总体均值、 比率、方差等
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
▪ 备择假设的方向为“<”,称为左侧检验 ▪ 备择假设的方向为“>”,称为右侧检验
6 - 18
统计学
STATISTICS
双侧检验与单侧检验
(假设的形式)
假设 原假设
单侧检验 双侧检验
▪ 分析之前必须陈述
我认为这种新药的疗效 比原有的药物更有效!
6 -6
统计学
STATISTICS
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验
3. 逻辑上运用反证法,统计上依据小概率 原理
• 被称为显著性水平
2. 第Ⅱ类错误(取伪错误)
▪ 原假设为假时未拒绝原假 设
▪ 第Ⅱ类错误的概率记为
(Beta)
6 - 21
统计学
STATISTICS
假设检验中的两类错误
(决策结果)
H : 无罪 假设检验就好像一场审判过程 0 陪审团审判
统计检验过程
H0 检验
裁决 无罪 有罪
实际情况
无罪
有罪
正确