田间试验与生物统计电子教材下载-样章
田间试验与生物统计电子教材下载-样章
![田间试验与生物统计电子教材下载-样章](https://img.taocdn.com/s3/m/51db2da3284ac850ad02421b.png)
事件A和B如果不能同时发生,则称事件A和B是互斥事件。例如设苹果的横径大于7.5cm为A事件,小于7.5cm为B事件,一个苹果横径不可能既大于7.5cm又小于7.5cm,说明事件A和B是互斥的。这一定义也可推广到多个事件A1、A2、A3、…、An。
(四)、对立事件
事件A和B如果不可能同时发生,但必发生其一,即A+B为必然事件,AB为不可能事件,则称事件A和B互为对立事件。上面的例子如果改为苹果的横径大于等于7.5cm为A事件,小于7.5cm为B事件,一个苹果横径不可能既大于等于7.5cm又小于7.5cm,但任意抽取一个苹果,事件A和B必发生其一,所以称事件A和B互为对立事件。
例6-13:对短枝红富士苹果进行生长期套袋处理试验,已知短枝红富士苹果可溶性固形物含量在当地经历年的测验,其平均数0=14.5%。采果后,随机抽取在生长期进行套袋处理的果实50个,测定其可溶性固形物含量,样本平均数 =13.8%、标准差s=2.1%。试分析短枝红富士苹果果实进行生长期套袋处理后,其可溶性固形物含量是否与未进行套袋的苹果存在显著性差异?我们可以假设生长期进行套袋处理的短枝红富士苹果果实的可溶性固形物含量的平均数等于未套袋苹果果实的平均数0,记为H0:0= 14.5%,而 -0=-0.7%是随机误差。
二、统计假设性测验的基本步骤
我们以平均数为例说明统计假设测验的基本步骤。
(一)首先对所研究的总体参数提出假设
我们把试验的结果往往看作为一个样本,若要了解这个样本所属总体与已知总体的关系,可以假设该样本所属总体与已知总体是相同的亦即该样本是从已知总体中随机抽取的,它们之间无本质的差异,这个假设称为无效假设。如以代表样本所属总体的平均数,0代表已知总体的平均数,则无效假设为-0=0(所以无效假设也叫零值假设),记作H0:0。下面通过一个具体的事例说明。
田间试验与生物统计 (5)
![田间试验与生物统计 (5)](https://img.taocdn.com/s3/m/fb719c9910a6f524cdbf8518.png)
第五章理论分布为了便于读者理解统计分析的基本原理,正确掌握和应用以后各章所介绍的统计分析方法,本章在介绍概率论中最基本的两个概念——事件、概率的基础上,重点介绍生物科学研究中常用的几种随机变量的概率分布——正态分布、二项分布、及样本平均数的抽样分布和t 分布。
第一节事件与概率一、事件(一)必然现象与随机现象在自然界与生产实践和科学试验中,人们会观察到各种各样的现象,把它们归纳起来,大体上分为两大类:一类是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生(或必然不发生)。
这类现象称为必然现象(inevitable phenomena)或确定性现象(definite phenomena)。
另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同。
这类在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象(random phenomena )或不确定性现象(indefinite phenomena)。
随机现象或不确定性现象,有如下特点:在一定的条件实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性;但在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的特定的规律性——频率的稳定性,通常称之为随机现象的统计规律性。
(二)随机试验与随机事件1、随机试验:通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或试验统称为试验(trial)。
而一个试验如果满足下述三个特性,则称其为一个随机试验(random trial),简称试验:(1)试验可以在相同条件下多次重复进行;(2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果;(3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果。
例如:在一定孵化条件下,孵化6枚种蛋,观察其出雏情况,它们都具有随机试验的三个特征,因此都是随机试验。
生物统计与田间试验:第一章 绪论
![生物统计与田间试验:第一章 绪论](https://img.taocdn.com/s3/m/67bf434fed630b1c59eeb5b2.png)
生物统计与田间试验
5、试验的规划与设计
•围绕检验假说而开展的试验,需要全面、仔细地 规划与设计。试验所涉及的范围要覆盖假说涉及 的各个方面,以便对待检验的假说作出无遗漏的 判断。
生物统计与田间试验
•注意:生物学试验中结果的“重演性”及比较试 验中的“唯一差异性原则”。
总体研究思路
The DNA Array Analysis Pipeline
Question Experimental Design
Array design Probe design
Sample Preparation Hybridization
Buy Chip/Array
Image analysis
片面、结果不可靠 费时、费事
单因素试验、多因素试验、综合性试验(pp.4)
单因素试验
【例】 研究
A1~ A5 共5个 不同品 种的产 量表现。
多因素试验
水平组合:指同一试验中各因素不同水平组合在一 起而构成的技术措施。
【例如】 研究不同品种在不同氮肥施用量下 的产量表现: 品种: A1、A2、A3 施氮等级: B1、B2
理论科学
实验科学
抽样调查
科学试验
✓理论科学研究主要运用推理,包括演绎和归纳的方法。 ✓实验科学研究主要通过周密设计的实验来探新。 ✓目的是发明、创造、发现新技术、新产品和新规律。
二、科学研究的基本过程和方法
(一) 科学研究的基本过程
1.对研究的命题形成一种认识或假说 2.根据假说涉及的内容安排相斥的试验或抽样调查 3.根据试验或调查资料进行推理,肯定或否定或修改假说,
二、教学目标及任务
生物统计与田间试验:第五章 统计假设测验
![生物统计与田间试验:第五章 统计假设测验](https://img.taocdn.com/s3/m/4b93fe62b52acfc789ebc9b2.png)
因此,在假设测验时需进行连续性矫正。
(1)在n<30,而 npˆ <5时这种矫正是必须的;经过连续性
矫正的正态离差u值或t 值,分别以uC 或 tC 表示。
npˆ 或 nqˆ<30但>5时进行连续性矫正。
第五章 统计假设测验 (显著性检验)
§5.1 统计假设测验的基本原理 §5.2 平均数的假设测验 §5.3 二项资料的百分数假设测验 §5.4 参数的区间估计
单个样本平均数的假设测验
1. 从总体方差已知的正态总体的抽样→ 样本 平均数为 正态分布→ u测验
2. 从未知总体抽样,只要n ≥ 30→ 样本平 均数服从 正态分布 → u测验
在分析试验结果时,只要假设两样本的总体差数的平
均数 d
1 2
0
,而不必假定两样本的总体方差
12和
2 2
相同。
类似单组设
计(单个平
均数)进行
分析
第三节 二项资料的百分数假设测验
许多生物试验的结果是用百分数或成数表示的,如结实率、 发芽率等,这些百分数系由计数某一属性的个体数目求得,属 间断性的计数资料.
3. 从正态总体的抽样,总体方差未知, n<30 → t分布 → t测验
两个样本平均数相比较的假设测验
由两个样本平均数的相差,以测验这两个样本所属 的总体平均数有无显著差异。
成组数据的平均数比较 测验方法
成对数据的比较
成组数据的平均数比较又依两个样本所属的总体方
差(
2 1
和
2 2
)是否已知、是否相等而采用不同的测验方法。
生物统计与田间试验:第二章 田间试验的设计与实施-2
![生物统计与田间试验:第二章 田间试验的设计与实施-2](https://img.taocdn.com/s3/m/726e31bdbed5b9f3f80f1c34.png)
阶梯式田间排列图
顺序排列设计可按品种成熟期、株高等排列,能 减少边际效应和生长竞争。
(二) 间比法设计(interval contrast design)
间比法设计的特点是,在一条地上,排列的第一个小 区和末尾的小区一定是对照(CK)区,每二对照区之 间排列相同数目的处理小区,通常是4或9个,重复2—4
二、田间试验的基本要求
(1) 试验目的要明确 (2) 试验条件要有代表性 (3) 试验结果要可靠 (4) 试验结果要能够重演 (5) 体现唯一差异原则
二、试验地的土壤差异
➢试验地的土壤差异来源
(1)由于土壤形成的基础不同,历史原因造成 土壤的物理性质与化学性质方面有很大差异;
(2)由于在土地利用上的差异,如种植不同作 物,以及在耕作、栽培、施肥等农业技术上的不一 致等。
4 5 ck 6 Ⅰ
6 ck 5 4 ck 3 2 ck 1 Ⅱ
1 ck 2 3 ck 4 5 ck 6 Ⅲ
例2,9处理(其中一个CK)的试验
Ⅰ 1 ck 2 3 ck 4 5 ck 6 7 ck 8
Ⅱ 3 ck 4 5 ck 6 7 ck 8 1 ck 2
前提?
1.将8头猪编号为1,2,3,….. ,8。
2.查随机数字表,如从pp352附表1的第40行开始, 可得4,9,0,8,3,8,6,7,2,1,5(弃 去0、9和重复的数字)。
3.可以将数字分配给3种饲料: 4,8,3, 6,7,2, 1,5
A
B
C
设计要点:将试验各处理随机分配到各供试单元。
1.3 什么是试验方案,如何制订一个正确的试 验方案?试结合所学专业举例说明之。
生物统计与田间试验:第一章 绪论
![生物统计与田间试验:第一章 绪论](https://img.taocdn.com/s3/m/67bf434fed630b1c59eeb5b2.png)
A3B1、A3B2
2. 水平(level) 因素内的不同状态或者数量等级称为水平。
处理因素必须是:①可控的;②在数量上或 质量上具有不同等级或水平。
例如,影响试验的因素有: 环境因素:气温、湿度、日照、雨量、地形、地质、 土壤肥力…… 栽培因素:品种、施肥、修剪、密度、灌溉、耕作…
因素 水平
水平数
以品种为研究问题
品种 a、b、c
3
以修剪为研究问题 修剪方式 重剪、轻剪 2
以施肥量为研究问题 施肥量 高、中、低 3
Expression Index Calculation
Normalization
Comparable Gene Expression Data
Statistical Analysis Fit to Model (time series)
Advanced Data Analysis
Clustering PCA Classification Promoter Analysis
总体研究思路
The DNA Array Analysis Pipeline
Question Experimental Design
Array design Probe design
Sample Preparation Hybridization
Buy Chip/Array
Image analysis
除需要比较的因素以外,其余的因 素必须保持在同一水平。
在试验条件相当的 情况下,重复试验 应得到相同的试验 结果。
科学研究的基本方法
1. 选题 2. 文献 3. 假说 4. 假说的检验 5. 试验的规划与设计
园艺作物田间试验与生物统计(课程标准)定稿
![园艺作物田间试验与生物统计(课程标准)定稿](https://img.taocdn.com/s3/m/b5fddc01f12d2af90242e616.png)
(10)《园艺作物田间试验与生物统计》课程标准课程名称园艺作物田间试验与生物统计课程代码5101052003适用专业园艺技术专业课程性质和任务田间试验园艺技术专业的主要专业基础课,是关于园艺和生物科学试验的设计,实施,试验数据的收集,整理和统计分析,以及统计分析结果的解释的一门科学。
本课程主要是运用数理统计原理和方法于园艺和生物科学研究,着重讲授园艺和生物科学研究中常用的试验设计和统计分析方法。
《田间试验与生物统计》作为园艺技术专业的一门专业基础课,又是本专业的主干课,其主要任务是使学生了解田间试验与统计分析的基本原理,掌握正确的田间试验方法并对试验结果作合理而有效的统计处理的基本技能,为进一步学习园艺作物遗传育种学、园艺作物生产学、植物保护学等专业课奠定理论课时36 讲课20 实验12 实训4天课程目标任务职业关键能力:1、科学严谨的态度和良好的职业道德,一丝不苟工作作风,吃苦耐劳、坚忍不拔的精神;2、对科学方法论有进一步的认识、通过观察探索分析事物本质及其规律的科学观认识;3、团队协作共事能力、求真务实,热爱农业科学事业。
职业专门能力:1、能够设计、实施园艺作物小区及田间试验方案;2、能够整理试验数据;3、具有统计分析知识及能力;4、具有科学搞写课程论文的知识及能力;知识目标:1、掌握立题,制定试验方案,选择田间试验设计类型,田间设施,观察记载,取样,收获,考种,整理资料等方面专业知识及技术.2、掌握统计分析,计算机软件的应用,搞写试验总结等知识和技术。
课时分配表教学内容学时数合计理论学时实验(实训)备注课程入门(绪论) 2 2园艺植物试验计划的拟定与试验的实施4 2 2 实训1天试验数据的采集与整理 6 4 2 实训1天理论分布与抽样分布 2 2试验方法设计 6 4 2 实训1天对比试验的方案设计与结果分析4 2 2实训0.5天随机试验的方案设计与结果分析4 2 2实训0.5天线性反应试验的方案设计与结果分析4 4试验总结与评价 4 2 2合计36 24 12 4天课程内容内容与要求:一、课程入门(绪论)【教学目标】。
【精编】田间试验与统计方法--第三章-统计数据的搜集与整理PPT课件
![【精编】田间试验与统计方法--第三章-统计数据的搜集与整理PPT课件](https://img.taocdn.com/s3/m/e875c6ebcc1755270622087d.png)
资料的整理方法
• 当观测值 (n≤30)时,不必分组,直接进行统计分析。 • 当观测值 (n>30)时,分成若干组后,制成次数分布表。
长 的 时 间 隧 道,袅
与统计方法--第三章-统计数据的搜
第一节 统计学常用术语
统计数据的不齐性 1、变异性是自然界存在的客观规律(生物体的变
异性主要由遗传因素、环境因素和发育噪音造成)。 2、生物学研究的对象都是很大的群体,不可能研
究全部对象,只能通过研究其中的一部分,来推断全 部对象。
总体和样本 p35
上述资料中,第一组的组限为67.5-82.5g。
(3)按照此法计算其余各组的组限,就可写出分组数列。
5. 数据归组、划线计数、做次数分布表
➢ 为了使恰好等于前一组上限和后一组下限的数据能确切归 组,约定将其归入后一组。 通常将上限略去不写。
➢ 例,表3.4中第一个观察值177应归于表3.6中第8组,组限 为172.5-187.5;……。依次把140个观察值都进行归组,即 可制成140行水稻产量的次数分布表(表3.6)。
(1)组距确定后, 首先要选定第一组的组中值。
在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近或 等于资料中的最小值为好。
以表3.4为例,选定第一组的中点值为75g,与最小观察值75g相等; 则第二组的中点值为75+15=90g,余类推。
(2)各组的中点值选定后,就可以求得各组组限。每组有 两个组限,数值小的称为下限(lower limit),数值大的称为上 限(upper limit)
【精编】田间试验与统计方法--第五章假设检验PPT课件
![【精编】田间试验与统计方法--第五章假设检验PPT课件](https://img.taocdn.com/s3/m/d54e3c1d7c1cfad6185fa797.png)
s
9.62
n
9
⑤ H0H。0的t0.0拒25=绝2.域30:6。因HA:μ≠μ0,故为双侧检验,当|t|>t0.025时拒绝
⑥ 穗结重论的:差因异|t是| >显t0.0著25的, 即。P < 0.05,所以拒绝零假设。喷药前后果
若规定α=0.01,t0.01/2=3.355,t < t0.005,因此喷药前后果穗重的 差异尚未达到“极显著”。
x1
x2
d1f d2f
n1 n2
tdf
x1 x2
s12
s
2 2
n1 n2
5.2.4 成对数据的显著性检验-成对数据t 检
验
• 建立无效假设和备择假设 Ho
:μ1= μ2
HA: μ1≠ μ2
• 决定假设测验的显著水平
α=0.05
• 计算统计数(处理均数间差异) 系随机误差所致的概率
• 统计推断
成对数据的统计分析
4、检验统计量
在σi已知时两平均数差的标准化变量:u
x1
x21 2
12 22
n1 n2
在H0:μ1=μ2下,检验统计量为:
u x1 x2
2 1
2 2
n1 n2
上式的分母称为平均数差的标准误差,记为 x1x2
5、相应于2中各备择假设之H0的拒绝域
① u > uα ② u <-uα ③ |u| > uα/2 6、得出结论并给予生物学解释
6、得出结论并给予解释
例已知豌豆籽粒重量服从正态分布N(377.2,3.32)在 改善栽培条件后,随机抽取9粒,其籽粒平均重为 379.2,若标准差仍为3.3,问改善栽培条件是否显著 提高了豌豆籽粒重量?
田间试验与生物统计 (3)
![田间试验与生物统计 (3)](https://img.taocdn.com/s3/m/36de7a86e87101f69f319518.png)
学 时: 32
选用教材: 霍志军 主 编
高职高专教育“十一五”规划教材
《田间试验与生物统计》
2007年,中国农业大学出版社
内 容: 介绍科学研究中常用的、基本的生 物统计方法:资料的整理; 平均数、 标准差与变异
系数; 常用概率分布;t — 检验;方差分析; 试验 结果统计分析等。
三观测记载表
第三章 田间试验实施
1-3田间试验的实施 Z1试验地的选择与培养 一、肥力变化规律
(一)差异原因: 1、是土壤性质差异。 2、是土壤利用的不同。 (二)表现形式: 1、是趋向式有规律。 2、是斑块状无规律。 二、试验地的选择
1、有代表性 2、肥力要均匀 3、地势平坦 4、位置适当
三、试验地的培养
1、匀地播种:按照相同的密度播种同一 品种的作物,并给以均匀一致的栽培管理 措施。
2、合理轮作:将整个试验区划分为几 个面积相等的大区,每年轮流在其中的一 个大区中设置试验,其余的进行匀地播种。
3、深耕:多施有机肥,压绿肥等也可 缓和差异
Z2计划的拟定 试验计划书:种植计划、田间种植图、观测记载 表 一、种植计划 1、试验的题目、地点、及时间 2、试验的目的、依据及其预期的效果 3、试验地区性土质、地形、地势、前茬及水利条 件等基本情况 4、供试处理及试验材料的名称 5、试验设计(包括小区排列和重复次数) 6、耕作栽培措施 7、田间观测、室内考种和分析测定的项目及方法
方 法: 用CAI课件教学,以课堂讲授为主
要 求:
了 解 基本原理;
熟练掌握 所介绍的几种生物统计方法,能
独立进行试验结果的统计分析;
熟练掌握 电子计算器的使用。
培养
严谨的治学态度 精细的治学作风 独立的自学能力
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计假设性测验是指试验者根据试验的目的或某种实际需要,对某一未知或不完全知道的总体参数提出一些假设,然后根据样本的实际结果经过计算作出在概率的意义上应当接受哪个假设的测验。例如上例中首先假设新品种的平均亩产量与地方良种一样,或者假设它比地方良种更好,这个假设称为统计假设。但是如何证实假设是正确的还是错误的呢?一种方法是检验整个总体材料,获得全部结果进行判断。这种研究总体的方法是很准确的,但对总体直接进行研究的这种方法实际上是不可能进行的。因此一般情况是通过研究样本来研究其所代表的总体,所以可以将这一新品种种植1-2年,每一年种植若干小区,取得其平均产量,然后由之来推断原来假设是否正确。如果通过测验,发现假设与试验结果相符,则接受假设;反之,如果假设与试验结果不符合,该假设就被否定。从而确定新品种的产量是否优于地方良种,为新品种的推广提供理论依据。
(二)、二项分布
二项分布(binomial distribution)是一种最重要的非连续性随机变量的分布,是一种与重复试验相联系的概率分布。
三、正态分布
正态分布(normal distribution)是连续性变数的理论分布,在生物统计学上占有极其重要的地位。首先,在生物和农业的研究中,许多试验和观察所获得的数据资料都服从正态分布规律。例如,在作物中,属于同一总体的各个个体之间通常是有变异的,如测量果树的生长量、产量等经济性状,这些数据分布是服从正态分布律的。因此可以用之来配合这些现象的样本分布,从而发现这些现象总体的理论分布。其次,在适当的条件下,它可以作为间断性变数的近似分布,这样就能够用正态分布来计算概率和进行假设测验。另外,虽然有些总体不做正态分布,但从总体中随机抽取出的样本统计数的分布,如即将介绍的样本平均数分布以及样本平均数差数分布,在样本容量适当大时仍然趋向于正态分布,因此,可以用正态分布来研究这些统计数的抽样分布。所以正态分布无论在理论还是在实践上均具有非常重要的意义。
二、二项分布
(一)、二项总体
在生物科学研究中,有些总体的各个个体的某种性状,只能发生非此即彼的两种结果,即观察值只有两类,用0,1表示,0和1为对立事件(有时虽然在实际上并不是只是“此”“彼”两种事件,但在一定意义上可以看作只有此”“彼”两种事件),这种由非此即彼事件构成的总体称为二项总体,又称为0、1总体。例如海棠种子播种后发芽与不发芽,就一粒种子而言,发芽与不发芽这两个事件只能实现其一,不会同时发生;植株的感病与不感病;花能否坐果;裂果与未裂果,喷施农药后害虫的死与活等等。这类变数均属非连续性变数,它们的概率分布也是不连续的。为研究方便,将二项总体中的“此”事件以变量“1”表示,其概率用p表示;将“彼”事件用变量“0”表示,其概率用q表示,其概率显然有p+q=1或1-p=q的关系。
(五)、完全事件系
若事件A1、A2、A3、…、An两两互斥,且每次试验结果必发生其一,则称事件A1、A2、A3、…、An为完全事件系。例如,如果苹果新梢的长度用x表示,设事件A1为x< 15cm,事件A2为15 <= x <= 35cm,事件A3为x> 35cm,那么,事件A1、A2、A3就构成完全事件系
2.2.3统计假设性测验
一、统计假设性测验
从抽样分布可知,同一总体中抽出的若干样本,各样本的统计数间存在差异,这种差异是用误差来表示的。在科学研究中,往往会遇到这样的问题,例如某地的甘蓝良种,多年种植的平均亩产量为2320kg(即总体的平均数= 2320kg),其标准差= 530kg ,若一个新品种经多点试验,其平均亩产量为2460kg(即样本平均数 = 2460kg),试问这一新品种有无应用价值?从数值的表面看,该新品种的平均产量优于地方良种,即2460-2320= 140kg是试验的表面效应,造成这种差异的原因有两个:一是试验处理效应(或品种的生产力不同);另一个是试验的误差。如果不经分析,就很难判断这种差异是由取样的偶然试验误差造成的,还是由于品种本身确实有差异。为了判明这种差异产生的原因,必须运用统计分析的手段,就是用统计假设性测验的方法加以推断。
(一)、加法定理:若事件A与事件B是互斥事件,其概率分别为P(A)和P(B),则事件A与B的和事件的概率等于事件不影响事件B发生的可能性,那么就称事件A和事件B相互独立。设事件A和事件B的概率分别为P(A)和P(B),则事件A和事件B同时发生或相继发生的事件概率等于两个独立事件的概率之乘积。
田间试验与生物统计电子教材下载-样章.doc
2.2统计假设
2.2.1概率及概率意义
一、事件发生的概率
在自然界或试验研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,每一种可能出现的情况或结果称为事件(event)。
对某一种事件来说,在一组条件实现下必然发生的,称为必然事件(certain event),常用U表示。例如,水在标准大气压下加热到100°C必然沸腾;任何物质在进行任何化学反应时,如果与周围环境没有物质交换,则物质的总质量保持不变。
显著水平的使用相当于在概率分布中划出一个界限,即将该分布划分成两个区域,一个是接受区域,是指试验结果的差异是因抽样误差造成的,因此应该接受无效假设;另一个区域是否定区域,是指试验结果的差异不是由随机误差造成的,应该否定无效假设。图6-6为5%显著水平u测验图示,该图表明在分布的两尾各有一个否定H0区域,其概率各为2.5%,接受区域的概率为95%。如果规定的显著水平为=0.01,则其两尾的否定H0区域各为0.5%。
二、事件间的关系及其概率的计算
在生产实践中,某一随机事件的发生并不是孤立的,许多随机事件之间存在一定的联系,下面介绍事件间的几种主要关系。
(一)、和事件
事件A与事件B至少有一件发生而构成的新事件称为事件A与事件B的和事件,用A+B表示。例如在调查某果园红富士苹果一年生枝条的生长量中,随机抽取一个枝条其长度是30cm以下为事件A,随机抽取一个枝条其长度在30 -45cm之间为事件B,则A+B为随机抽取一个枝条其长度是45cm以下的事件。事件间的和事件可以推广到多个事件:事件A1、A2、A3、…、An的和事件,记为A1+A2+A3+…+An。
(二)确定显著水平
确定显著水平(significance level)也就是要确定一个否定H0的概率标准,用表示,为一小概率。生物统计上常采用0.05和0.01两个等级作为测验试验结果的差异是否显著的概率标准,即=0.05或=0.01。
显著水平的确定是应用概率论中的“小概率事件实际不可能性原理”,这个原理指出,如果我们假设了一些条件,并在这个假设条件下能准确地计算出事件A的概率为很小,则在假设条件下的无数次独立的重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。如果在一次试验中,事件A恰恰发生了,则可合理地认为原来的假设不正确,应予否定,虽然这一推断属于错误的概率为。
和无效假设相对的另一个统计假设称为备择假设或相对假设,记作H0:0或H0:2。H0和HA应是对立事件。测验结果,如果接受无效假设当然否定备择假设;如果否定无效假设,则接受备择假设,说明实得的差异是由于总体参数不同造成的,并非随机误差所致。在进行统计假设测验时,应设置H0和HA。
提出无效假设的目的在于可以从假设的总体中推论其平均数的抽样分布,从而可以计算出某一平均数指定值出现的概率,这样可以研究样本和总体的关系,作为假设性测验的理论依据。
(三)、互斥事件
事件A和B如果不能同时发生,则称事件A和B是互斥事件。例如设苹果的横径大于7.5cm为A事件,小于7.5cm为B事件,一个苹果横径不可能既大于7.5cm又小于7.5cm,说明事件A和B是互斥的。这一定义也可推广到多个事件A1、A2、A3、…、An。
(四)、对立事件
事件A和B如果不可能同时发生,但必发生其一,即A+B为必然事件,AB为不可能事件,则称事件A和B互为对立事件。上面的例子如果改为苹果的横径大于等于7.5cm为A事件,小于7.5cm为B事件,一个苹果横径不可能既大于等于7.5cm又小于7.5cm,但任意抽取一个苹果,事件A和B必发生其一,所以称事件A和B互为对立事件。
二、统计假设性测验的基本步骤
我们以平均数为例说明统计假设测验的基本步骤。
(一)首先对所研究的总体参数提出假设
我们把试验的结果往往看作为一个样本,若要了解这个样本所属总体与已知总体的关系,可以假设该样本所属总体与已知总体是相同的,亦即该样本是从已知总体中随机抽取的,它们之间无本质的差异,这个假设称为无效假设。如以代表样本所属总体的平均数,0代表已知总体的平均数,则无效假设为-0=0(所以无效假设也叫零值假设),记作H0:0。下面通过一个具体的事例说明。
2.2.2二项分布与正态分布
一、重复试验的概率分布
在试验或调查中所获得的非连续性变数资料,其随机变量取得的数值为有限个或无穷个孤立的值。如调查富士苹果的色泽,按着色面积的大小分为5、4、3、2、1级来表示,那么5、4、3、2、1就为随机变量x的取值。对于随机变量x的每一个可能取得的值都对应一个概率,这种一对一构成的分布称为非连续性变数的概率分布。
必然事件和不可能事件的发生只要观察其一,就能推论其余的,对事件的发生有百分之百的预测性。
随机事件的发生虽然具有不确定性,但并不是无规律可循,无法预测的。其事件的发生在一定程度上是可以预测的,这种预测性是由该事件的概率(probability)来决定的,这种用来表示某一随机事件出现可能性大小的数值称为该事件的概率。对于一个随机事件而言,它发生可能性大小的度量是由它自身决定的,并且是客观存在的,那么,它发生可能的度量——概率究竟是多大呢?一般情况下,概率获得的途径有两种: