试验设计与数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体的理论分布。例如,我们无法知道某个玉米品种产
量的 和,因此不能像前面两个例子那样计算概率。
通常的做法是从总体中抽取一个样本,利用样本数 据计算出的样本统计量来对总体的有关参数进行估 计。
抽样分布
• 但样本统计量不是常数,而是随机变量。例如,样
本平均数 x 。因为在这次抽样中,算出的 x 可能为
34.5g,但在下一次抽样时,可能变成35.2g。随着抽 样不同,它发生随机变化。既然样本统计量是随机 变量,它们也会有相应的概率分布。
目录
• 第一章 绪论
• 第七章 试验设计
• 第二章 常用统计分布 • 第八章 非参数统计分析
• 第三章 参数估计
• 第九章 主成分分析和因子分析
• 第四章 假设检验
• 第十章 科技绘图
• 第五章 方差分析
• 第十一章 常用统计软件
• 第六章 回归分析
第三章 参数估计
3.1 抽样分布 3.2 区间估计
试验设计与数据分析
2008年2月修订 版本4.0 qblin@sxu.edu.cn
结束
• HOW WE TEACH IS ALSO WHAT WE TEACH, HOW WE LEARN IS ALSO WHAT WE LEARN.
• 我们教育的方式本身也是我们教育的内容; 我们学习的方式本身也是我们学习的内容。
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
X 概率公式 P(X)
0
C
0 5
p
0
q
50
0.59049
1 C15 p1q51 0.32805
2 C52 p2q52 0.07290
3 C35 p3q53 0.00810
4 C54 p4q54 0.00045
5 C55 p5q55 0.00001
概率分布图
( p q)5
1
样本观察值之和的概率分布
• 推广到一般情况,若某事件A在一次试验中出现的概
率为p,其对立事件出现的概率为q=1-p。做n次独 立试验,该事件出现x次的概率为:
P( X x) Cnx p xqnx
• 只要n和p的值确定了,X的概率分布就可以作出。
样本观察值之和的概率分布
n=2时
n=3时
n=4时
P(x=0)=(1) p0q2-0 P(x=0)=(1) p0q3-0 P(x=0)=(1) p0q4-0
P(x=1)=(2) p1q2-1 P(x=1)=(3) p1q3-1 P(x=1)=(4) p1q4-1
P(x=2)=(1) p2q2-2 P(x=2)=(3) p2q3-2 P(x=2)=(6) p2q4-2
先讨论 这个问题。
再讨论 这个问题。
概念:复置抽样和不复置抽样
• 抽样又分为复置抽样和不复置抽样。
复置抽样 将抽得的个体放回总体继续参加抽样。 不复置抽样 抽得的个体不放回总体参加后续的抽
样。 本章中,讨论抽样分布时,只考虑复置抽样的情况。
抽样分布
• 在大多数情况下,无法进行全面调查,难以作出总
样本观察值之和的概率分布
• 例 在2500粒种子中,有250粒属于A品种。则p=
250/2500=0.1,q=1-0.1=0.9。现连续用复置抽样
方法,抽取n=5粒种子,问其中含有x=2粒品种A的
概率是多少?
• 于是答案为
P( X 2) C52 0.120.952 0.0729
• X的所有可能值出现的概率如右表
• 从正态总体中抽样
• 样本平均数的概率分布 • 两个样本平均数之差的概率分布 • 样本方差的概率分布 • 两样本方差之比的分布
3.1.1 从二项总体中抽样
样本观察值之和的概率分布
• 若某事件A在一次试验中出现的概率为p,其对立事
件出现的概率为q=1-p。做n次独立试验,该事件可 能出现0, 1, 2, …, n次,这些次数可以被视为一个离散 型随机变量X。问其中刚好出现x次(即X=x)的概率 是多少。
编号 抽样结果
1
AAAAA
2
AAAAA
3
AAAAA
4
AAAAA
5
AAAAA
6
AAAAA
7
AAAAA
8
AAAAA
9
AAAAA
10
AAAAA
出现该结果的概率
ppqqq
p2q3
p2q5-2
pqpqq
p2q3
p2q5-2
pqqpq
p2q3
p2q5-2
pqqqp
pຫໍສະໝຸດ Baiduq3
p2q5-2
qppqq
p2q3
p2q5-2
3.1 抽样分布
• 统计学一个主要任务是研究总体和样本之间的关系 • 总体和样本之间的关系可以从两个方向进行研究:
⑴ 从总体到样本:即研究
从总体中抽出的所有可能样本的统计量的分布及其与 原总体的关系。即抽样分布的情况。
⑵ 从样本到总体:即研究
从总体中抽出的一个随机样本,并用样本统计量对总 体参数作出推断。即参数估计和假设测验。
• 请注意:这n次试验的结果可以看作是从二项总体中
抽取的一个容量为n样本。样本观察值只有0、1两种, 因此随机变量X的值刚好是样本中含有的“1”的观察值 个数,因此也就是样本观察值之和。为了更加直观易 懂,用具体例子来说明这个问题的解法。
样本观察值之和的概率分布
• 例 在2500粒种子中,有250粒属于A品种。则p=
250/2500=0.1,q=1-0.1=0.9。现连续用复置抽样 方法,抽取n=5粒种子,问其中含有x=2粒品种A的 概率是多少?
• 用复置抽样方法抽取n=5
粒种子,共有 C52 5!/(3!2!) =10种结果中有2粒为品种 A。每种结果中的5次抽样 互相独立,概率可以相乘。所有结果如下表所示。
P(x=3)=(1) p3q3-3 P(x=3)=(4) p3q4-3
P(x=4)=(1) p4q4-4
• 下面讨论从前面介绍的两个理论分布:二项分布和
正态分布中进行抽样后,用样本数据计算出的各种 统计量的概率分布。
抽样分布
• 从二项总体中抽样 • 样本观察值之和的概率分布 • 样本平均数的概率分布 • 二项分布的一种极限情况 ── 泊松分布 • 二项分布的另一种极限情况 ── 正态分布 • 二项分布的推广 ── 多项分布
qpqpq
p2q3
p2q5-2
qpqqp
p2q3
p2q5-2
qqppq
p2q3
p2q5-2
qqpqp
p2q3
p2q5-2
qqqpp
p2q3
p2q5-2
因为这些结果互不相容,概率可以相加。于是算 得“连续用复置抽样方法,抽取n=5粒种子,其 中含有x=2粒品种A”的概率为P( X 2) C52 p q2 52
相关文档
最新文档