统计推断的内容概要

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

s n
=
-
(
)=
置信区间上限值 = x + t (a/2, df)
s n
=
+
(
)=
New
样本大小对置信区间的影响--续
5.397
5.396 5.395 5.394
置信上限 = 5.3951英寸 置信下限 = 5.3943英寸
平均值的95% 置 信区间
目标值 = 5.394英寸
高度 (英寸)
5.393
z t
New
置信区间的公式(单样本)
不知道标准偏差时总体均值μ的置信区间一般遵守t分布
其中: x = 样本平均值 t = t表格中的t统计结果 a = a风险 df = 自由度 = n -1 s = 样本标准差 n = 样本中的数据容量
平均置信区 间的两侧公式
样本容量 T-值
5
2.78
10
2.26
(平均、方差、比率)在什么范围之内,可以用置信区间来表示. 置信度或样本容量变化,推断的值的范围也会发生变化. 我们通过置信区间的计算就可以断定研究的变量“X”是否发生了变动
?从 而确定它9是5%否置是信我区们间真正要关注的“关键的少数”?
95% 置信区间
总体的分布
n=30时的理论分布
5.392
n=10的95%置信区设间备3为5.3939-5.3955。 唯n一=3改0的变9的5%是置n信。区间为5.3943-5.3951。
n = 10 的95%置信区间为5.3939 - 5.3955.
New
n = 30的95%置信区间为 5.3943 - 5.3951.
唯一改变的是 n。 通过增加样本,可以证明设备3所制
20
2.09
30
2.05
100
1.98
1000
1.96
用所给出的有关部件的数据代入以上公式…
New
置信区间
计算利用设备3所生产的传输设备平均高度的置信区间
使用a=0.05(95%的置信区间)
x = 5.3947
-s = 0.00116 n = 10
df = n - 1 = 9
t(a/2,df)取自t表格。
区间下限 = x - t (a/2, df)
s n
t (0.025,9) = 2.262 =
-
(
)=
New
区间上限 =
x + t (a/2, df)
s n
=
+
(
)=
范例--续
设备3所制造部件的平均值是否在目标范围之内?
5.397
高度 (英寸)
5.396 5.395
置信区间上限值 = 5.3955英寸
sˆ = 0.00116
目标值 = 5.394英寸 设备 3
New
总体平均值的最可能的范围是多少?x(5.3947)与目标值(5.394) 之间的差异是由于偶然因素造成的吗?
置信区间
设备3所制造的所有部件的平均值最可能的取值范围是什么?
让我们来计算一下置信区间,以便找出该值!
单个平均值的置信区间
置信区间下限值

但是点推断值中没有误差的概念。

即,பைடு நூலகம்法知道样本中求出的推断值是否接近总体的真值。

■ 区间推断: 推断总体可能包括的期望区间

例)置信区间,置信水平

区间推断是完善点推断的短处,在点推断值上包括误差概念

是否还记得基础统计学中讲到总体和样本的
知识?
Stat > Basic Statistics > Display Descriptive Statistics
弯曲点


误 差
Sx = 平均的标准误差
Sx = 样本的标准偏差
n = 样本大小
0
10
20
30
标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大 小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上.
3. 区间推断
区间推断与点推断相比是引用误差概念的统计推断法,推断出总体特征 值
Calc > Random data > Normal
由1000个组成的样本保存在“数据 ”变量.
Calc > Random data > Sample from columns…
从总体中随机抽取的5个观察 值和30个观察值.然后反复进行 4次样本收集程序
现在求上述标本的点推断值 利用MINITAB的 Basic Statistics求标本的统计量.
n=2时的理论分布
举例(连续型数据)
洗衣机传动装置的总高度将影响制动性能。项目Y是总高度,目标值
=5.394,加工这种部件时所使用的固定架共有8个。
您想了解什么?
使用第三个固定架生产出的部件的平均 高度与目标值是否一致?
分析步骤:
1. 将数据绘制成图
2. 使用置信区间来确定所观测到的差异是
否真实。
3. 得出结论。
New
用图形来表示数据
设备3 的10 个
设备部3件中的1高0度个 部件的高度
5.394 5.394 5.393 5.394 5.394 5.395 5.396 5.397 5.395 5.395
高度 (英寸)
5.397
5.396
5.395
5.394
5.393
n =10 x = 5.3947
2. 误差产生的来源
不管大家观察的数据是一个测定值或统计推断的结果,都有可能是错误 的.
这是因为我们在总体中抽取样本的时候,希望观测值(平均,标准偏差…) 是与总体的特性值相同,但大部分都会发生一定的差异.有时这种差异会引 起错误的统计推断.
误差的根源 : 样本误差 / 样本偏移(层别)/测定误差/测定妥当性
样本误差
样本 1
样本
包括样本层别错误 样本 1
总体
样本 2 样本 3
总体
样本2 样本3
从总体任意取出样本的差异 引起的误差
样本的层别错误造成偏向一侧,因 样本选定引起的误差
统计只能涉及样本误差,其它误差的根源应用其它解决方法
样本误差
对某一个问题,为了分析现象,假设抽取了几个样本 - 从总体抽取的样本的观测值(平均,标准偏差…)是否相同? - 样本的大小变化时发生什么? 为加深大家的理解,做一下实习.
从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为 了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均 值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确.
随样本容量变化的平均标准误差(平均值的标准偏差)
平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好.
样本
信息分析
措施及行动
对事件的 结论
因此我们要注意的是:观察样本并非为得到样本的信息,其目的在于通过样本分析, 得到总体的信息,并对总体下恰当结论,采取相应措施。
点推断与区间推断
当我们不知道的总体的特征值,我们可以利用样本推断总体的方法有两 种.
■ 点推断: 推断为一个值

例) 平均,标准偏差,方差, 中位数,,,,,
统计推断的内容概要
主要内容
1. 统计推断 2. 误差的来源 3. 置信区间
1. 统计推断
统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结 果
推测出“总体可能是这样”结论,对总体下一个正确判断的行为, 即总体
是否发生了变动。而且,一般以推测总体平均值,总体的比率,总
体标
样本
准偏总差体等显示总体分布样本特征值的统计对 统程数 计序据 处称的 理为统计推断统。计推断
注意计算的 各个统计量 具有相当的 差异,确认因 样本的大小 的平均,标准 偏差的差异, 并说明理由
样本容量大小对推断值的影响
观察一下样本容量大小对推断(对均值的推断)有什么样的影响?

n=30时平均的理论分布
样本容量越大,平均
值的推断分散越小, n=2时平均的理论分布 推断的精确度越高。
样本均值的分布
平均值的95%置信 区间
5.394
置信区间下限值 = 5.3939 英寸
目标值 = 5.394英寸
5.393
设备3
设备3生产出的部件总体的平均值最有可能是5.3947 ,但实际值可能比该值大一点或小一点。
New
设备3所生产的部件的总体平均值最可能的取值范围为5.3939到5.3955。
举例--续
置信区间说明
利用图表分析方法中学习的上述菜单,在MINITAB中求点推断值与区
间推断值。
对总体的点推断值
-平均,标准偏差
-分散
-斜型,尖度
-最小,最大, Median
-四分位数
对总体区间推断值 -95%置信度总体平均值 - 的置信区间 -95%置信度下总体标准 偏差的置信区间 -95%置信度总体中位 数的置信区间
New
……使用不同的a值来计算置信区间
置信区间量化了数据的不定性。
样本大小对置信区间的影响
让我们取20个以上的样本(总数 n = 30),看一看对 95%的置信区间有何影响。
假设平均值和标准差保持不变:x = 5.3947 和 s = 0.00116 。
置信区间下限值 = x - t (a/2, df)
以这种方式构成的区间的95%是正确的(包含真正的总体平均值) 。
•目标值5.394包含在此区间内。
统计评价:没有证据证明设备3所制造部件的平均高度不在目标范围之内 。
实际评价:目标值刚好在置信区间内。计算时只用到10 个数据,并且 a=0.05。
•您可以使用置信区间来进一步调查设备3……
……获得更多样本(如果是实际的)并计算置信区间
1-a
置信区间上限值
a/2
a/2
New
x
(1-a)100%置信度,真正的总体均值包含在置信区间内。
New
我们将需要使用t分布
什么是t分布? 类似于正态分布(z)
正态分布(z):已知总体标准差,s
z=
(x - ) s/ n
t分布(t):估计的标准差, s
t = (x- - )/(s / n)
用于提供有关平均值的结论(置信区间)
置信区间随样本容量的 增加而减小。
造部件的平均高度不在目标范围内

相关文档
最新文档