【VIP专享】第五章 统计推断(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本步骤:
统计假设测验: 首先要对统计总体提出假设;
然后根据试验的数据去证明假设的正确与否? 这种方法也叫显著性测验,因为试验的结果在 习惯上用显著、极显著或不显著来表示。
*对统计总体的两个假设
1.无效假设(null hypothesis) 假设总体参数与某一指定值相等或假设两个总体 参数相等,即假设其没有效应,这一假设称为无效 假设,记作H0 2.对应假设 (alternative hypothesis) 无效假设相对应的另一统计假设,叫对应假设或 备择假设,记作HA。 H0和HA是对立的假设,如果接受H0就否定 HA,如 果否定H0就接受HA。
如何确切地证实假设是正确的还是错误的呢? 当然可以把全部产品逐个检验,这种研究全部总体 方法当然是很准确的,但往往是行不通的。
因此,我们不得不采用另一种方法,即研究样 本。也就是抽取样本进行检验,推断这批产品是 否合格。
如果通过测验证明假设与试验结果相符,则该 假设就被接受;反之,如果假设与试验结果不相 符,则该假设就被否定
为了确定这个偏误的程度和总体参数的所在,我 们可以进行区间估计。
wenku.baidu.com
区间估计: 是指以一定的概率保证总体参数位于某两 个数值之间。
如,某一水稻品种的亩产量 落在(700kg-800kg)区间的概率为95%。
二、统计假设测验的基本步骤
进行统计假设测验,首先要对统计总体提出假设,
统计假设(statistical hypothesis): 就是试验工作者提出有关某一总体参数的假设。
统计假设测验:就是根据某种实际需要,对未知 的或不完全知道的统计总体提出一些假设,然后由 样本的实际结果,经过一定的计算,做出在概率意 义上应当接受哪种假设的测验。
如,某地进行了两个水稻品种对比试验,在 相同条件下,两个水稻品种分别种植10个小区, 获得两个水稻品种的平均亩产量为:
x1 510 kg
x2 500 kg
x1 x2 10
我们能否根据 x1 x2 10 就判定这两个水稻
品种平均产量不同? 结论是,不一定。
参数估计(point setimate):
是指由样本统计数对总体参数做出点估计和区 间估计。
点估计:就是以统计数估计相应参数。 如以一个小麦品种的样本所得的平均产量作为总 体参数的估计值。但是点估计总是有一定偏误的。
就是根据抽样分布规律和概率理论,由样本结 果(统计数)来推断总体特征(参数)。
试验实践中所获得的资料,通常都是样本的结 果,而我们希望了解的却是抽得样本的总体。
因此,统计推断是科研工作中一个十分重要的 工具,对试验设计也有指导意义。
统计推断包括:统计假设测验(hypothesis test) 参数估计(parameter estimate)
假设新品种的总体平均数 等于原地方品种的总
体平均数 0 ,即 H0 : 0
假设新品种的总体平均数 0 500kg ,而样本平
均数 x 和 0 之间的差数 x 0 15kg 乃是随机误差;
在 H0 : 0 的假设下,我们就有一个具有平均数
0 500kg 、方差
2 x
324 / 9 36
(2)划接受区域和否定区域的方法
根据上章所述 x 和 u (x ) / x 的分布,我们知道:
x )] 0.025和P[x ( 1.96 x )] 0.025 P[x ( 1.96 x )] 0.025和P[x ( 1. ( 1.96 x ),( 1.96 x )
因此,在 x 的抽样分布中,落在 ( 1.96 x ),( 1.96 x ) 区间内的 x 有95%,落在这一区间外的 x 只有5%。
测验前提出无效假设的目的在于,可从假设的总 体里推论其平均数的随机抽样分布,从而算出某一 样本平均数指定值出现的概率,进而研究样本与总 体的关系,作为假设测验的理论依据。
无论是平均数,百分数,还是变异数的统计假设, 均应在试验前按研究目的提出。H0的形式和内容可 以多种多样,但必须遵循两个原则:
①有实际意义; ②据之可以算出因抽样误差而获得样本结果的概率。
【例5·1】
设一水稻地方品种一般亩产为500kg,方差为 324kg,现有一新品种对其抽查了 9个试验小区, 测得样本平均亩产为515kg,问:这样本是否从 亩产为500kg的总体中随机抽出的?差数15kg究 竟是抽样误差造成的? 还是确实有差异?
1.提出统计假设
无效假设必须是有意义的,即在假设的前提下可以 确定试验结果的概率的。
第五章 统计推断
5.1 统计假设测验的基本原理
一、统计推断的意义和内容
第四章我们学到从总体到样本的方向,即抽样分 布问题,讲述从理论分布中抽出的样本统计数的变 异特点。
本章将讨论从样本到总体的方向,就是从一个样 本或一系列样本结果去推断其总体结果,即统计推 断问题。
统计推断(statistical inference):
的x
分布,即
N(500,36);
据之才能算得因抽样误差而获得一个与 0 的500相kg
差≥15kg的 x 的概率。
对应假设:H :
A
0
则HA是假设样本不是从已知总体中随机抽出的。
2. 确定一个否定H0的概率标准
这个标准叫显著水平(significance level),记 做α。
α是人为定出的统计推断的小概率(显著)标准。 在生物学研究中常取α=0.05或α=0.01。
(1)计算概率的方法
在 H 0 : 0 的假设下可算得: 查附表2,
uu xx00 551155550000 22..55
xx
1188// 99
P(u 2.5) 20.0062 0.0124
在 0 500 的总体中,如以n=9作随机抽样,抽得 一个与500kg相差达15kg以上的的概率为0.0124。
显著水平的选择,应根据试验要求或试验结论的 重要性而定。
显著水平α对假设测验结论是有直接影响的,所 以应在试验开始前规定下来,在试验结果分析时不 能随意改变。
3.假设正确的前提下,研究样本平均数的抽样分布 算出试验所得的平均数出现的概率有多大,即算出
实得结果由抽样误差造成的概率。或者划出接受区域 和否定区域。二法选一即可。