管理定量分析第5章 假设检验
第5章 假设检验
计量经济学讲义
22
读者或许发现:前面讨论的置信系数( 1- a) 就是1减去“犯第一类错误的概率a”,因此, 95%的置信系数表示接受零假设犯第一类 错误的概率至多为5%。 简言之, 5%的置信水平与95%的置信系数 的意义相同。
2011-2-22
计量经济学讲义
23
2011-2-22
计量经济学讲义
0 0
2011-2-22
计量经济学讲义
21
假设检验的标准或古典方法是:给定某一 水平的a,比如0 . 0 1或0 . 0 5,然后使检 验的功效最大,也即使b最小。这个求解过 程很复杂,有兴趣的同学可以参阅有关参 考书。 需要指出的是:在实际中,古典方法仅仅 给出了a值,而没有过多考虑b值。
2011-2-22
24
2011-2-22
计量经济学讲义
25
显著性检验
2011-2-22
计量经济学讲义
26
显著性检验
显著性检验(test of significance approach) 是一种两者择一的假设检验,但它却是完 备的。 显著性检验是一种较为简洁的假设检验方 法。 我们仍通过P/E一例说明这种检验方法的一 些基本要点。
2011-2-22 计量经济学讲义 36
显著水平的选择与p值
2011-2-22
计量经济学讲义
37
显著水平的选择与p值
假设检验的古典方法的不足之处在于选择a 的任意性。虽然一般常用的a值有1%、5% 和1 0%,但是这些值并不是固定不变的。 前面指出,只有在检查犯第一类错误和第 二类错误后果的时候,才选择相应的a 。 在实践中,最好是用p值(即,概率值),p 值(p value)也称为统计量的精确置信水平。 它可定义为拒绝零假设的最低置信水平。
5假设检验
5.4.4影响检验功效的因素
• 以单组样本均数z检验为例
x x
z
0
0
x / n
1.总体参数间的差异;
2.个体差异(标准差);
3.样本含量n;
4.检验水准。
•上述四个因素中,总体参数的差异 、 总体标准差 、检验水准通常是相对固 定的,可以人为调整的因素主要是样本含 量n。所以在检验功效不够大的情况下, 可以通过增加样本含量提高检验功效。
• 例 若通过以往大规模调查,已知某 地婴儿出生体重均数为3.20kg,标准 差为0.39kg,今随机调查得25名难产 儿平均出生体重为3.42kg,问出生体 重与难产是否有关?假定难产儿出生 体重的标准差与一般儿童相同。
由于个体差异的存在,即使从同一总体中
严格的随机抽样, 也并不完全相同。
x1、x2、x3、x4、
n足够大,且和(1-)均不太小,如 n与n(1- )均5。
z p0 p
p0 0 (1 0 )
n
例 某地区随机抽取传染科工作人员150名,作 关于乙型肝炎的血清学检查,其中阳性者35名, 已知当地人群的阳性概率为17.00%,问当地传 染科工作人员的阳性概率是否高于一般人群的 阳性概率?
∣t∣≥t0.01/2 , P≤0.01 有高度统计学意义
表 z 值、p 值与差别的意义的关系
z值
P 值 差别的意义
∣z∣<z0.05/2 P>0.05 无统计学意义 ∣z∣≥z0.05/2 P≤0.05 有统计学意义 ∣z∣≥z0.01/2 P≤0.01 有高度统计学意义
5.3 单组样本资料的检验
如: x
=2.821
z
0
x
3.确定概率P。根据自由度和样本检验统计量, 确定概率P。
第5章 假设检验
两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真
–
H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm
–
备择假设
(alternative hypothesis)
第5章 统计假设检验练习题及答案
实验报告——第5章统计假设检验姓名杨秀娟班级人力10001 学号10120700121 【实验1】某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。
现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著)?【解】(1)数据和变量说明本题所用数据是:外企英语六级考试成绩样本该文件为11个样本,1个变量,如变量视图(2)操作方法(3)结果报告上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。
由上表可知,t= -0.442 , P=0.668, P>0.05,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。
【实验2】以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。
表5-20 培训前后销售业绩数据序号 1 2 3 4 5 6 7 8 9培训前67 70 74 97 74 88 82 71 85培训后78 67 78 98 76 87 86 78 95 【解】(1)数据和变量说明本文件有2个变量,9个数据(2)操作方法(3)结果报告由上表可知,P=0.04, P<0.05,不接受无效假设,有显著差异,所以该培训产生了显著效果。
【实验3】饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。
方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下:表5-21 方案一喂养数据序号 1 2 3 4 5 6 7 8 9 饲料1 33.1 33.1 26.8 36.2 39.4 30.8 33.2 31.4 28.7 饲料236.729.035.235.243.825.836.437.928.7方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下:表5-22方案二喂养数据序号 1 2 3 4 5 6 7 8 9 1011 甲队饲料1 29.7 26.7 28.9 31.1 31.1 26.8 26.3 39.5 33.4 33.1 28.6 乙队饲料228.728.329.332.231.130.136.236.830.0请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。
管理定量分析方法与技术课程设计
管理定量分析方法与技术课程设计一、课程背景管理定量分析方法与技术是管理学的一门基础课程,通过学习该课程,学生能够掌握管理科学基础知识和方法,了解计量经济学和运筹学等相关学科的基本概念和方法,具备管理信息系统和模型建立的基本能力。
同时,该课程涵盖了数据分析、量化决策等管理实践中常用的分析工具和技术,为学生今后从事管理工作奠定了基础。
二、课程目标1.掌握常用的管理定量分析方法和技术,了解其原理、优缺点和适用范围。
2.能够熟练运用数据分析和建模工具,为管理决策提供科学依据。
3.能够结合实际问题,运用相关方法求解,提供可行的解决方案。
4.了解和掌握应用情境下具体技术的操作方法。
三、课程内容第一章管理科学基础1.1 什么是管理科学 1.2 管理科学的意义和发展历程 1.3 管理科学与决策科学的关系第二章计量经济学2.1 计量经济学的基本概念和原理 2.2 假设检验和回归分析 2.3 时间序列分析和面板数据分析第三章运筹学基础3.1 运筹学的基本概念和模型 3.2 线性规划和整数规划 3.3 排队论和库存控制第四章数据分析和建模4.1 数据预处理和数据可视化 4.2 分类和聚类分析 4.3 数学建模方法与实践应用第五章量化决策5.1 决策分析和统计决策理论 5.2 多目标规划和组合优化 5.3 策略评估和决策支持系统四、考核方式1.平时成绩:作业和课堂参与度占比50%2.期末成绩:闭卷考试占比50%五、参考教材1.《管理科学学习手册》(第3版),崔凯等,北京大学出版社,2019年2.《计量经济学基础》(第5版),W.C.Gujarati等,机械工业出版社,2017年3.《运筹学(第3版)》(修订版),塞利姆等,机械工业出版社,2017年六、教学方法本课程采用课堂讲授、案例分析和实践操作相结合的方式进行教学。
在课堂上,老师将就每个章节的内容进行讲解,并通过实例分析和案例讨论帮助学生更好地理解和掌握知识点。
作业将结合课堂讲解和实践操作,旨在提高学生的学习兴趣和学习效果。
(05)第5章 假设检验1
临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
医学统计学第5章 假设检验思考与练习参考答案
第5章 假设检验思考与练习参考答案一、最佳选择题1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。
A.0.01α=B. 0.05α=C. 0.10α=D. 0.20α=E. 0.30α=2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t =3.24,t 0.05,v =2.086, t 0.01,v =2.845。
正确的结论是( E )。
A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是( A )。
A. 建立假设,选择和计算统计量,确定P 值和判断结果B. 建立无效假设,建立备择假设,确定检验水准C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误D. 计算统计量,确定P 值,作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。
A. 统计量t 越大,说明两总体均数差别越大B. 统计量t 越大,说明两总体均数差别越小C. 统计量t 越大,越有理由认为两总体均数不相等D. P 值就是αE. P 值不是α,且总是比α小5. 下列( E )不是检验功效的影响因素的是:A. 总体标准差σB. 容许误差δC. 样本含量nD. Ⅰ类错误αE. Ⅱ类错误β二、思考题1.试述假设检验中α与P 的联系与区别。
答:α值是决策者事先确定的一个小的概率值。
P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。
P ≤α时,拒绝0H 假设。
2. 试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
管理定量分析
1管理:顾名思义,既管又理,就是通过计划,组织,控制,激励和领导等环节来协调人力物力和财力资源,更好的达到组织目标的过程。
2决策:是为了按预期的目标去完成某项任务或解决某个问题,运用各种方法,在系统的分析了主客观条件之后,考虑到未来的状态,根据决策准则,对提出的各种可行性方案进行优选详比,选择合理方案的一个分析过程。
3管理和决策过程的三个阶段:第一个问题是形成阶段,包括认清和找出问题,找出解决问题的多种方案,确定目标和形成评价方案的准则,第二个阶段是分析问题阶段,包括评价选择最佳方案,第三个阶段是组织实施。
4管理定量分析:是指一种管理决策的重要方法,它从能刻画问题的本质的数据和数量关系入手,建立能反映事物本质特征的模型,运用各种数量方法对数据进行加工处理,获得解决问题的最佳的方案及形成对人们有用的信息。
5点估计:又称定量估计,他是用实际样本,指标数值代替总体指标数值,即总体平均数的点估计值就是样本均数,总体成数的点估计值就是样本成数。
6区间估计:是用样本指标和它的抽样极限误差构成的区间估计总体指标,并以一定的概率保证总体指标,将落在所估计的区间内。
7第一类错误(弃真错误):是指当原假设为真时而拒绝原假设。
α第二类错误(取伪错误):是指当原假设为假时而接受原假设。
β8检验的显著水平:就是小概率时间发生的概率,即假设检验中事先规定的犯第一类错误的概率。
取值一般有0.01,0.05,0.1等。
9相关关系:是指现象之间确实存在的,但关系不固定的相互依存关系。
10相关系数:是说明两个变量之间有无直线相关关系及相关关系密切程度的统计指标。
11相关表:根据总体单位的原始资料,将其中一个变量的数值按一定的顺序排列,同时列出与之对应的其他变量的数值,这样形成的表格即为相关表。
12相关图:也称散点图,是根据原始数据在直角坐标中绘制出两个变量相对应的观察值的所在点,从从这些点的分析情况观察分析两个变量间的关系。
13预测:是人们对未来要发生的的事物进行的估计及推测,是根据过去的历史及数据及现实的客观条件,运用科学的方法和逻辑推理手段,对其未来的情况进行推测估计和分析。
管理定量分析课程第8章:假设检验
判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
医学统计学课后案例分析答案:第5章 假设检验
第5章 假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的t 检验,随机抽取25名患者服用了新药,以常规药的疗效均值为0μ,进行t 检验,无效假设是0μμ=,对立假设是0μμ≠,检验水平α=1%。
结果t 值很大,拒绝了无效假设。
“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。
(2)你得到了无效假设为真的概率是1%。
(3)你绝对证明了总体均数不等的备择假设。
(4)你能够推论备择假设为真的概率是99%。
(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。
(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。
提示:就类似的问题,Haller 和Kruss (2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。
结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。
(见Statistical Science, 2005, 20(3):223-230.) 案例辨析 6个选择均不正确。
(1)可能犯Ⅰ类错误。
(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。
(3)可能犯Ⅰ类错误。
(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。
(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是P 。
(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-α=99%是指无效假设成立的条件下不犯错误的概率是99%。
正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为P。
案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。
第5章 t检验
思考题
1、什么条件下可能犯Ⅰ型错误,其与显著水 平又有何关系。 2、什么条件下可能犯Ⅱ型错误。 3、统计推断的结论是否绝对正确,为什么。
复习题
什么叫标准误(差) ? 什么是显著水平?实际中如何判断? t检验包括哪些基本步骤?
显著性检验
产 品
质量检查方法
每个体(X); 某个体(Xi); 样本(x1、x2、
例
按规定肉鸡平均体重≥3kg方可出售, 现从鸡群中随机抽取16只,平均体重 为2.8公斤,标准差为0.2公斤,问该批 鸡可否出售。
解: 1、提出无效假设与备择假设
H0: = 3,HA: <3
2、计算 t 值
x 经计算得: =2.8,S =0.2
S x =0.05
所以
x = (3-2.8)/0.05 t Sx
2、显著性检验目的、对象
通过样本研究其所代表的总体。例如,设长 白猪经产母猪产仔数的总体平均数为 1 , 大白 猪经产母猪产仔数的总体平均数为 2 ,试 验研 究的目的,就是要给 1 、 2 是否相同 做出推断。 由于总体平均数 1、 2未知 ,在进行显著性检验 x2 时只能以样本平均数 x1、 作为检验对象,更确 切地说,是以( x1 - x2)作为检验对象。
t检验判断标准示意图
图5-3 双侧检验
图5-4
单侧检验
根据 “小概率事件实际不可能性原理”否定 或接受无效假设,故接受或否定无效假设,都没 有绝对100%的把握。
Ⅰ型错误:H0成立,但否定了它,就是把非真 实差异错判为真实差异,即 H 0:1 为2 真,却 接受 H。 :
有极显著差异。
三、双侧检验与单侧检验
第5章 假设检验
总体比率的假设检验
在大样本情况下,样本比率近似服从正态分 布,即: (1 ) p ~ N(, ) n 将其标准化:
p Z= ~ N (0,1) (1 ) n
可用Z检验法对总体比率进行假设检验。
25
若采用双侧检验,即H0: = 0, H1: ≠ , 0 则临界值为-Z a/2和Z a/2, 当|Z |> Z a /2时,位于拒 拒绝区域,拒绝原假设;当|Z |≤ Z a /2时,位于接 受区域,接受原假设 0 若采用左侧检验,即H0: ≥ , H1: < ,则 0 临界值为-Z a, 当Z <-Z a 时,位于拒绝区域,拒 绝原假设;当Z ≥ -Z a 时,位于接受区域,接受原 假设 若采用右侧检验,即H0: ≤ , H1: > ,则 0 0 临界值为Z a, 当Z >Z a 时,位于拒绝区域,拒 绝原假设;当Z ≤ Z a 时,位于接受区域,接受原 假设
5
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否发生了显 著性的变化。在这个题目中,原假设和备择假设 该如何选取? 从样本可看出,研究者想证明的结论是零件的平 均长度发生了显著性的变化,因此备择假设确定 为: H1: ≠4cm,随之可确定原假设为: H0: =4cm,即所提的原假设和备择假设为: H0: =4cm, H1: ≠4cm
6
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否比以前偏 短。在这个题目中,原假设和备择假设该如何选 取? 从样本可看出,研究者想证明的结论是零件的平 均长度偏短,因此备择假设确定为: H1: < 4cm,随之可确定原假设为: H0: ≥4cm,即 所提的原假设和备择假设为: H0: ≥4cm , H1: <4cm
定量分析中的估计与假设检验
定量分析中的估计与假设检验摘要:本文阐述了定量分析的估计类型、置信区间与置信度,以及假设检验,研究了区间估计与假设检验的内在联系及其区别,探讨了这两种方法的范围及应注意的问题。
关键字:点估计;区间估计;假设检验0 引言数理统计是具有广泛应用的数学分支,而区间估计与假设检验问题在其中占有很重要的地位。
区间估计与假设检验作为两种重要的统计推断方法在农林科学、经济管理、医疗卫生、金融保险、证券投资、科学研究、工程技术、质量控制及国防研究、灾害防治等各方面应用日益广泛,其对决策的科学性的作用也为越来越多的人所认识。
这两种方法都是通过对具体事物的随机抽样所得样本数据,用数理统计学的方法进行统计分析并作出判断的,掌握它们之间的关系、各自的适用范围和应用条件以及应注意的问题对作出正确的统计推断至关重要。
在日常生活或工作中人们也不断地做各种各样的估计,例如一个违规乱穿马路的人,要估计垂直车道上的汽车离开路口的距离、速度,判断当时穿过马路有没有被车撞的可能,然后决定是立即过马路,还是等一等;如果立即过去,能不能慢慢走,还是要快快跑?管理工作中,需要事前做估计的事情也非常多,例如银行在贷款给某个企业的时候,对其还贷能力做出估计,然后决定是否给予贷款,贷给多少,还款期限,等等。
人们总是在分析“过去资料”对现实或未来影响的基础上做出估计。
简单的估计可以靠生活常识或经验,复杂的、受多因素影响的估计,特别是对那些信息不完全状况下的估计要依赖“统计推断”。
1、估计类型有两种类型的估计,分别是点估计和区间估计。
所谓点估计是估计某一个总体参数的具体值,例如:预计明年春运高峰火车旅客将达到1.85亿人次;今年八月份手机销量会增长10%,等等。
点估计看似很方便、很明确,但是,由于点估计要求精确,所以估计的结果只有两种可能性:或者正确或者错误,大多数情况下,要点估计绝对正确几乎是不可能的,而如果使用区间估计,正确率就会大大提高。
区间估计需要估计一个包含总体参数在内的区间,通常用区间的大小或者实际参数落在某个区间的概率两种方式表达区间估计的结果。
管理统计学 第2版 第五章 假设检验
原假设(null hypothesis)备择假设(alternative hypothesis)
原假设又称“0假设”,研究者想收集证据予以反对的假设,用H0表示 所表达的含义总是指参数没有变化或变量之间没有关系 最初假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 =, <= 或>= H0 : m = 某一数值 H0 : m 某一数值 H0 : m 某一数值
第五章 假设检验
本章学习目标 (1)了解假设检验的基本思想 (2)掌握各种条件下检验统计量的构建 (3)掌握列联表分析的原理和应用 (4)掌握应用SPSS软件进行T检验的程序步骤和报告分析
第五章 假设检验
什么是假设检验? (hypothesis test) 先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理 小概率是在一次试验中,一个几乎不可能发生的事件发生的概率 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
抽样分布
H0
临界值
临界值
a/2
a/2
拒绝H0
拒绝H0
1 -
置信水平
Region of Rejection
Region of Nonrejection
Region of Rejection
假设
双侧检验
原假设
H0 : m =m0
备择假设
H1 : m ≠m0
用统计量决策(左侧检验 )
2008年8月
备择假设也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 H1 :: m ≠某一数值 H1 :m >某一数值 H1 :m <某一数值
第5章假设检验课后习题解答
第5章假设检验课后习题解答第五章假设检验⼀、选择题1.单项选择题(1)将由显著性⽔平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性⽔平的1/2,这是( B )。
A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验(2)检验功效定义为( B )。
A.原假设为真时将其接受的概率B.原假设不真时将其舍弃的概率C.原假设为真时将其舍弃的概率D.原假设不真时将其接受的概率(3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着( C )。
A.存在试验误差(随机误差)B.存在条件误差C.不存在什么误差D.既有抽样误差,也有条件误差(4)得出两总体的样本数据如下:甲:8,6,10,7,8;⼄:5,11,6,9,7,10秩和检验中,秩和最⼤可能值是( C )。
A.15B.48C.45D.662.多项选择题(1)显著性⽔平与检验拒绝域的关系是( ABD )。
A.显著性⽔平提⾼(α变⼩),意味着拒绝域缩⼩B.显著性⽔平降低,意味着拒绝域扩⼤C.显著性⽔平提⾼,意味着拒绝域扩⼤D.显著性⽔平降低,意味着拒绝域扩⼤化E.显著性⽔平提⾼或降低,不影响拒绝域的变化(2)β错误( ACDE )。
A.是在原假设不真实的条件下发⽣的B.是在原假设真实的条件下发⽣的C.决定于原假设与实际值之间的差距D.原假设与实际值之间的差距越⼤,犯β错误的可能性就越⼩E.原假设与实际值之间的差距越⼩,犯β错误的可能性就越⼤⼆、计算题1.某牌号彩电规定⽆故障时间为10000⼩时,⼚家采取改进措施,现在从新批量彩电中抽取100台,测得平均⽆故障时间为10150⼩时,标准差为500⼩时,能否据此判断该彩电⽆故障时间有显著增加(α=0.01)?解:假设检验为H 0:µ0=10000,H 1:µ0<10000(使⽤寿命应该使⽤单侧检验)。
n =100可近似采⽤正态分布的检验统计量z α=0.01⽔平下的反查正态概率表得到临界值2.34到2.36之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性⽔平应先乘以2,再查到对应的临界值)。
第5章抽样估计和假设检验
第5章 抽样估计和假设检验
• §5.1.1 • 2.总体和样本 • 总体也称全及总体,指所要认识研究对象的全体。
它是由所研究范围内具有某种共同性质的全体单 位所组成的集合体。总体的单位数通常是很大的, 甚至是无限的,一般用N表示总体的单位数。 • 样本又称子样,它是从全及总体中随机抽取出来 的们作为代表这一总体的哪部分单位组成的集合 体,样本的单位数是有限的,相对值或标志属性 决定的。
• 1. 抽样平均误差的计算方法
• 样本平均数的抽样平均误差
• ⑴ 重复抽样: • ⑵ 不重复抽样:
x
2
nn
x
2 N n
n N 1 n
1 n N
第5章 抽样估计和假设检验
• 2. 样本比例的抽样平均误差
• ⑴ 重复抽样:
p
P
n
P(1 P) n
• ⑵ 不重复抽样: p
• §5.2.1 抽样分布 • 3. 样本方差的分布
• 当总体服从正态分布 N , 2 时,
n 1S 2 2
• 服从 2 分布(将在下一节中介绍),其中
样本方差为
s2 1 n n 1 i1
2
xi x
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 4. 样本比例的分布
• 总体中具有某种属性的单位数与总体全部单位数 之比称为总体的比例,记作。而样本中具有某种 属性的单位数与样本总数之比称为样本比例,记 作。
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 2. 样本均值的抽样分布
• 若 则从总总体服体从中均抽值取为出的,样方本差均为值仍2的然正服态从分正布,
态分布,即。
X
管理定量分析第5章假设检验精品PPT课件
• 也就是说,对总体的某个假设是真实的, 那么不支持这一假设的事件A在一次试验中 是几乎不可能发生的;要是在一次试验中 事件A竟然发生了,我们就有理由怀疑这一 假设的真实性,拒绝这一假设。
• 假设以下陈述为真: • 你打了某种疫苗P,就不会得某种流行病Q。 • 我们把这个先决条件表述如下: • 如果P 则非Q • 其中, • P表示打了疫苗P, • Q表示得流行病Q • 或者,更形式化一点:
• 而实际问题中有一些需要单侧检验。例如,工作的效率是 否低于某个值、缺勤率是否高于某个值、产品的是寿命是 否低于某个值等问题。
• 另一些则需要做双侧检验。例如,螺丝的长短、食品中某 种微量元素的添加剂量等问题。
案例二
• 食品药品监督管理局查扣了一批食盐,怀 疑其中的碘含量不符合标准。食盐中国家 标准碘含量是30mg/kg。随机抽取的10袋食 盐,所得碘含量数据如下表(碘含量单位 mg/kg),以95%的置信度检验这批食盐中 的碘含量是否合格。
第1袋 第2袋 第3袋 第4袋 第5袋 第6袋 第7袋 第8袋 第9袋 第 10 袋
X s.e.
30 38 35 33 37 32 30 35 30 30 33 0.97753
H0 :这批食盐的碘含量是 30 H1 :这批食盐的碘含量不是 30 构造统计量t X ~ t(n 1) s.e
经计算: t 3.069 由于是双侧检验问题,需要把 0.05分成 0.025,在 t 分布表中查找 0.025
引例2
• 假设我们需要评估一项针对青少年罪犯的 咨询项目的效果。从随机抽取的样本中, 你发现参与这个项目的青少年罪犯中有25 %的人在一年内又犯案了,那些没有参与 这个项目的青少年罪犯有40%的人在一年 内又犯案了。这15%的差异是否足以说明 这个项目是有成效的?
管理统计学:第5章_假设检验
2. 将检验统计量的值与 水平的临界值进行比较;
3. 作出决策:
双侧检验:|统计量的值|> 临界值,拒绝H0; 左侧检验:统计量的值 < -临界值,拒绝H0; 右侧检验:统计量的值 > 临界值,拒绝H0。
华南理工大学精品课程
4、利用P值进行决策
什么是P 值?
1. 如果原假设为真,所得到的样本结果会像实际观 测结果那么极端或更极端的概率。
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 : 500
华南理工大学精品课程
H1 : < 500
500g
例题分析
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过30%。为验证这一估计是否正确,该 研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。
2、有参数检验和非参数检验。 3、逻辑上运用反证法,统计上依据“小概率事
件原理”。
华南理工大学精品课程
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
... 因此我们 拒绝假设 = 50
20
华南理工大学精品课程
... 如果这是 总体的假设均 值
m = 50
H0
样本均值
假设检验的过程
拒绝H0
置信水平
1 -
临界值 H0 样本统计量
华南理工大学精品课程
显著性水平和拒绝域
抽样分布
置信水平
拒绝H0
1 -
H0
样本统计量
华南理工大学精品课程
临界值
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
30 38 35 33 37 32 30 35 30 30 33 0.97753
X
s.e.
H 0 :这批食盐的碘含量是 30 H1 :这批食盐的碘含量不是 30
X ~ t (n 1) 构造统计量 t s.e
经计算: t 3.069 由于是双侧检验问题,需要把 0.05 分成 所对应的 t 值以判断是否落入拒绝域。
案例二
• 食品药品监督管理局查扣了一批食盐,怀 疑其中的碘含量不符合标准。食盐中国家 标准碘含量是30mg/kg。随机抽取的10袋食 盐,所得碘含量数据如下表(碘含量单位 mg/kg),以95%的置信度检验这批食盐中 的碘含量是否合格。
第1袋 第2袋 第3袋 第4袋 第5袋 第6袋 第7袋 第8袋 第9袋 第 10 袋
假设检验中的两类错误
(决策结果)
H0: 无罪
假设检验就好像一场审判过程
统计检验过程
陪审团审判 裁决 实际情况 无罪 无罪 有罪 正确 错误 有罪 错误 正确 决策
பைடு நூலகம்
H0 检验 实际情况 H0为真 接受H0 拒绝H0 1- 第一类错 误() H0为假 第二类错 误(b) (1-b)
主讲人:刘兰剑
(二)第Ⅰ类错误与第Ⅱ类错误 第Ⅰ类错误 即原假设为真,而我们却作出了否定这 一假设的判断。 第Ⅱ类错误 即原假设为伪,而我们却作出了接受这 一假设的判断。
• 假设以下陈述为真: • 你打了某种疫苗P,就不会得某种流行病Q。 • 我们把这个先决条件表述如下: • 如果P 则非Q • 其中, • P表示打了疫苗P, • Q表示得流行病Q • 或者,更形式化一点: • if P then NOT Q • 然后,如果观察到你得了流行病Q,那么就可以推出你没有打疫苗 • P——这个推断只不过是上述前提条件的逆反命题而已。我们把以上 推理过程表述如下: • if P then NOT Q (先决条件) • Q (前提) • then NOT P (结论)
X ~ t (n 1) 构造统计量 t s.e
经计算: t 2.2739
查表可得,2.2739大于1.86,落入拒绝域,拒绝原假设,接受备择 假设,说明该各部门的平均缺勤率已经超过了0.18,需要采用新的 考核办法。
5.3均值之差的检验
一些管理问题: 校长想了解经过专门的阅读课程训练后,中学高年级的阅 读水平是否有所提高,他想对训练之前与之后的阅读水平 作一比较; 精神健康专家想了解某一类型的治疗方法是否比另一类型 的要好; 董事长想了解广告效果是否影响销售量,这可进行一项试 验,一些区域做广告而另一些区域不做广告。 • 这些情况是要了解两个样本是否有差别,采用技术就是均 值之差的检验
本章到此结束!
谢谢各位!
0.025 ,在 t 分布表中查找 0.025 2
查表可得,3.069大于2.27,落入拒绝域,拒绝原假设, 接受备择假设,说明该批食盐的碘含量超标。
案例三
• 某地区在各政府部门间进行了一次缺勤率 的调查,如果平均缺勤率高于0.18,政府将 考虑采用新的绩效考核办法,随机抽取的9 个政府部门的缺勤率数据如下表,在95% 的置信水平上推测总体的缺勤情况。
查 t 分布表,发现 t 2.0025 对应一个小于 0.05 的概率,因此,拒绝原假设 H 0 ,接 受备择假设 H1 。
据此可以推断,在95%的置信水平下,可以认为警察局的工作是 有显著效果的。
5.2单侧与双侧检验
• 案例一的原假设是警察局平均每天抓捕的网上逃犯人数没 有增加,我们在检验这个假设的过程中只需考虑t分布的 一侧,就是均值大于3的这一侧,因此,可以称其为单侧 检验。 • 而实际问题中有一些需要单侧检验。例如,工作的效率是 否低于某个值、缺勤率是否高于某个值、产品的是寿命是 否低于某个值等问题。 • 另一些则需要做双侧检验。例如,螺丝的长短、食品中某 种微量元素的添加剂量等问题。
第5章 假设检验
引例1
• 假设在某企业随机抽取的l00个新雇员的样 本中,你发现拥有大学本科文凭、无工作 经验的新雇用的女性管理人员的年平均工 资是30 000元,而那些拥有同样文化程度 也无工作经验的新雇用的男性管理人员的 年平均工资是32 000元。这2 000元的差异 是否足以说明存在性别歧视?
H0 为真
H0 为伪
主讲人:刘兰剑
否定 H0
接受 H0
第Ⅰ类错误 概率为α
第Ⅱ类错误 概率为β
错误和 b 错误的关系
和b的关系就像 翘翘板,小b就 大, 大b就小
你不能同时减 少两类错误!
b
主讲人:刘兰剑
影响 b 错误的因素
• 1. 总体参数的真值
– 随着假设的总体参数真值与统计量之间距离的 减少而增大
X s ~ t (n 1) ,其中, s.e. 构造统计量 t s.e n
第三步:确定显著性水平α
• 在这个例子中,我们选取α=0.05
第四步:计算统计量的值
X 4.5
3
s 2.36878
n 10
根据上述数据计算得: t 2.0025
第五步:根据计算结果作出拒绝或接受原假设的判断
两个样本均值之差的检验可以根据总体的方差相等于否, 分成如下三种情况用不同的方法进行检验: 第一,两个样本独立,方差不等 第二,两个样本独立,方差相等 第三,不独立样本(配对样本)
注意:两个样本均值之差的 t 分布自由度为 n1 n2 2
案例四
• 公务员局的办公室主任想了解一种新的招 聘方案是会减少聘用一个公务员所花费的 时间。 • 他抽了10个部门作为样本,计算了在采用 新方法前和采用新方法后,聘用一个公务 员所花的平均时间。数据如下(单位:小 时):
• 2. 显著性水平
当 减少时增大
• 3. 总体标准差
当 增大时增大
• 4. 样本容量 n
– 当 n 减少时增大
主讲人:刘兰剑
• 犯第一类错误的概率可以通过降低拒 绝原假设所要求的概率来降低。 • 减少第二类错误的方法之一是增大样 本容量。 • 在其他条件不变的情况下,样本容量 越大,均值的标准误(差)就越小,这 样,拒绝真实假设的可能性就越小。
假设检验的步骤
• • • • • 1) 提出原假设和备择假设; 2) 确定统计量; 3) 规定显著性水平α; 4) 计算统计量的值; 5) 根据计算结果作出拒绝或接受原假设的 判断。
案例一
• 公安系统近期开展了“清网行动”,目的是将多年潜逃的网上追逃的 罪犯捉拿归案。 • 在开展“清网行动”之前,某警察局平均每天抓到的网上逃犯人数是 3人(被捕人数的分布是正态分布)。 • 上级突然要对该警察局的“清网行动”的业绩进行检查,由于事先没 有通知,全面的统计该行动展开以来的所有被捕人数情况来不及,但 是,局长命令办公室主任必须马上拿出客观的依据向上级汇报,以说 明该局最近的工作力度很大,业绩明显。 • 办公室主任决定采用抽样推断的方法来解决这个问题。他认为,只要 现在平均每天抓到的网上追逃人员的数量大于3个,那就说明最近工 作业绩有改善。但是,在没有总体数据的情况下,如何证明现在的平 均抓捕人数大于3个了呢? • 办公室主任随机抽取了10天的抓捕人数,列表如下:
引例2
• 假设我们需要评估一项针对青少年罪犯的 咨询项目的效果。从随机抽取的样本中, 你发现参与这个项目的青少年罪犯中有25 %的人在一年内又犯案了,那些没有参与 这个项目的青少年罪犯有40%的人在一年 内又犯案了。这15%的差异是否足以说明 这个项目是有成效的?
• 假设检验的基本思想可以用小概率原理来 解释。 • 所谓小概率原理,就是认为小概率事件在 一次试验中是几乎不可能发生的。 • 也就是说,对总体的某个假设是真实的, 那么不支持这一假设的事件A在一次试验中 是几乎不可能发生的;要是在一次试验中 事件A竟然发生了,我们就有理由怀疑这一 假设的真实性,拒绝这一假设。
第 1 个部门 第 2 个部门 第 3 个部门 第 4 个部门 第 5 个部门 第 6 个部门 第 7 个部门 第 8 个部门 第 9 个部门
0.17 0.18 0.20 0.21 0.18 0.23 0.30 0.26 0.19 .2162 0.01592
X
s.e.
H 0 :各部门平均缺勤率低于 0.18 H1 :各部门平均缺勤率高于 0.18
第三种情况,不独立样本(配对样本)
部门 第 1 个部门 第 2 个部门 第 3 个部门 第 4 个部门 第 5 个部门 第 6 个部门 第 7 个部门 第 8 个部门 第 9 个部门 第 10 个部门 新方法采用前 36.4 49.2 26.8 32.2 41.9 29.8 36.7 39.2 42.3 41.9 37.64 6.71 2.12149 新方法采用后 32.2 45.2 31.3 27.1 33.4 29.0 24.1 38.2 38.0 37.2 33.57 6.23 1.96915 差值 4.2 4.0 -4.5 5.1 8.5 0.8 12.6 1.0 4.3 4.7 4.0 4.84 1.61176
X
s
s.e.
• 根据n-1即 9个自由度来计算t值,看均值是 否与0有显著差异:
t 值对应的概率小于 0.05,因此是显著的,因此我们拒绝原假设,接受备择假设。 不独立样本的 t 检验会产生最显著的结果,但这种方法只能用于配对样本。
注意:
• 第一,在本例中,为了演示总体方差不等、方差 相等,配对样本等三种不同情况下的假设检验方 法,我们使用了相同的一个案例,在实际问题中 ,一个案例一般只用以上三种方法中的一种处理 即可。 • 第二,同等条件下,独立样本方差不等的假设下t 值一般小于等方差假设下的t值,因此,在总体方 差未知的情况下,独立样本不等方差假设是最保 守的。。
第1天 第2天 第3天 第4天 第5天 第6天 第7天 第8天 第9天 第 10 天