统计学第八章ppt

合集下载

管理统计学-第八章

管理统计学-第八章
Forward:向前选择法。
Stepwise:逐渐进入法,根据Option对话框中设定旳 判据及方差分析成果,选择符合判据旳自变量与因 变量有关程度最高旳进入回归方程。根据Forward选 入自变量,根据Backward将模型中F值最小且符合 剔除判据旳变量剔除,反复。
WLS选项是存在异方差时,利用加权最小二 乘法替代一般最小二乘法估计回归模型参数。经 过WLS能够选定一种变量作为加权变量。
回归分析时变量旳设定
回归分析旳被解释变量必须是刻度级旳, 假如是顺序级旳,要用Numeric型旳来表达。 假如被解释变量是名义级旳,将用Logistic 回归等措施处理。
解释变量能够是刻度级、顺序级、名义级 旳变量,不论是什么级别旳数据,都必须 用Numeric型旳来表达。
一元线性回归分析
一元线性回归模型旳设定 一元线性回归模型旳求解 一元线性回归模型旳检验 一元线性回归模型旳SPSS实现
371 -.016
381 -.239**
390
364
.117*
1
Sig. (2-tailed)
.765
.000
.026
N
354
384
364
388
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
2 XY
X Y
X iYi
X Y n
X 2 X 2 Y 2 Y 2
n
n
2.样本有关系数
rxy
S
2 xy
Sx Sy

《概率论与数理统计》课件第八章 假设检验

《概率论与数理统计》课件第八章 假设检验
假设检验是统计学中一种重要的推断方法,其理论依据为小概率原理。小概率原理指的是,在一次试验中,小概率事件几乎不会发生。在假设检验中,如果原假设为真,那么出现小概率率性质的反证法,它允许我们在一定程度上接受或拒绝关于总体参数或分布的假设。假设检验在统计学中有着广泛的应用,尤其是在单个及两个正态总体的均值和方差的检验中。通过这些检验,我们可以根据样本数据对总体的特性进行推断,从而作出科学的决策。需要注意的是,任何检验方法都不能完全排除犯错误的可能性,但假设检验通过控制犯第一类错误的概率,即错误地拒绝真实假设的概率,来确保推断的可靠性。在实际应用中,我们还需要根据具体情况选择合适的显著性水平,以平衡犯两类错误的概率。

统计学基础(第六版)教学课件第8章

统计学基础(第六版)教学课件第8章

2009
呈现出一定的抛物
2008
趋势;管理成本则
2007
现一定的指数变化
2005
净利润呈现一定的
2006
2005
线性趋势;产量呈
净利润
《统计学基础》(第六版)
管理成本
第8章
8.3 时间序列预测的程序和方法
确定时间序列的成分
4000
年份
8 - 13
第8章
《统计学基础》(第六版)

8.3 时间序列预测的程序和方法
84
60
233
2007
2938
124
73
213

第2步,找出适合该时间序列的预测方法。
2008
3125
214
121
230
2009
3250
216
126
223
第3步,对可能的预测方法进行评估,以确定最
2010
3813
354
172
240

2011
4616
420
218
208
佳预测方案。
2012
4125
514
110.94
110.61
109.60
110.29
110.50
110.00
108.61

119.87
133.41
148.01
163.71
179.42
197.89
218.63)根据式(8.5)得:
ҧ =


− 1 × 100 =
0
9
27563
− 1 × 100 = 11.26%
2021/11/5

贾俊平版统计学课件 第8章

贾俊平版统计学课件  第8章

▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0

n

3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0

1

假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策


若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0

第八章 假设检验 (《统计学》PPT课件)

第八章  假设检验  (《统计学》PPT课件)
与其,为选取“适当的”的而苦恼,不如干脆 把真正的(P值)算出来。
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?

统计学第八章时间数列

统计学第八章时间数列

2020/1/19
增长速度growth rate 表明现象的增长程度
某现 基象 期报 水 告 平 报期 告 基的 期 期 基 增 水 水 期 长 平 平 发 水 量 展 平 1速
环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-1
2020/1/19
增 1长 的 % 绝 环 对 逐 比 期 增 1 值 增 0 长 0上 长 1速 0 期 量 0度 水平
n 1
n 1
(5)间隔不相等不连续时点的时点数列
2020/1/19
aa1 2a2t1a2 2a3t2an12 antn1 t1t2tn1
增长量和平均增长量 •增长量growth amount
总量指标报告期水平与基期水平之差,表明 该指标在一定时期内增加或减少的绝对数量。
社会经济现象以若干年为周期的 涨落起伏相同或基本相同的一种 波浪式的变动
随机变动(I)
客观社会经济现象由于天灾、人 祸、战乱等突发事件或偶然因素 引起是无周期性波动
2020/1/19
一般模型 加法模型
Y=T+S+C+I
乘法模型 Y=T×S×C×I
分解方法
加法模型 T=Y-(S+C+I)
乘法模型
2020/1/19
✓水平法(几何平均法)
n
X
n
Xi
i1
n
an a0
适用:水平指标的平均发展速度计算
2020/1/19
✓方程法(累计法)
a 0 x a 0 x 2 a 0 x 3 a 0 x n a i
xx2x3xnai a0
适用:侧重于考察中长期间的累计总量
平均增长速度 = 平均发展速度-100% 表明现象在一个较长时期中逐期平均增长变化的程度

统计学第八章

统计学第八章
19
8.1.3 两类错误
项目
没有拒绝H0
拒绝H0
H0为真
1-α(正确)
α(弃真错误)
H0为假
β(取伪错误)
1-β(正确)
假设检验中各种可能结果的概率
20
8.1.3 两类错误
α和β的关系: 1、 α和β的关系就像跷跷板, α小β就大, α大β就小。因为, 要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取 伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很 小。要使α和β同时变小,唯一的办法就是增大样本量。 α和β两者的 关系就像是区间估计当中可靠性和精确性的关系一样。 2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错 误原则。
一般来说,在研究问题的过程中,我们想要予以反对的那个结论, 我们就把它作为原假设。
比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过 30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本 进行检验。试陈述用于检验的原假设和备择假设。
解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有 汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择 假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确 定原假设。
6
8.1.2 假设的表达式
在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然 后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以, 在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。
如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现 实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论 的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但 并不说明他从来都没干过坏事。

统计学8ppt课件

统计学8ppt课件
原 理
商品销售量q(百件)
商品价格p(元)
33
8
32.5
9
26
11
27
12
25
12.5
23.5
13
21
14
16.5
16

17

合计 219.5

17 112.5
pq 264 292.5 286 324 312.5 305.5 294 264 255 2597.5
P2 64 81 121 144 156.25 169 196 256 289 1476.25


▪ 回归参数估计 ▪ 方程拟合效果评价 ▪ 回归参数的推断
第 八 章
返回本章首页

计 学
第二节 简单线性相关分析


➢ 一、散点图和相关表 ➢ 二、相关系数的测定与应用 ➢ 三、相关系数的密切程度
第 八 章

计 学
一、散点图和相关表


例:近年来国家教育部决定将各高校的后勤社会化。 某从事饮食业的企业家认为这是一个很好的投资机 会,他得到十组高校人数与周边饭店的季销售额的 数据资料,并想根据高校的数据决策其投资规模。
2
-2
3
-1
4
0
5
1
6
2
7
3
28
0
游客(万人) 100 112 125 140 155 168 180 980
t2
1
9
4
4
9
1
16
0
25
1
36
4
49
9
140
28
ty

统计学_第八章__时间序列分析

统计学_第八章__时间序列分析
第八章 时间序列分析
1978—2003年GDP和最终消费(亿元) 140000 120000 100000 80000 60000 40000 20000 0
年 份 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001
GDP 最终消费
4、二者关系 (1)各逐期增长量之和等于相应的累计增长量
an a0 (a1 a0 ) (a2 a1 ) (a3 a2 ) (an an1 )
(2)相邻两期的逐期增长量之和等于相应的 累计增长量;相邻两期的累计增长量之差等于 相应的逐期增长量
(二)平均增长量 1、概念 一段时期内平均每期增加或者减少的绝 对数量。或者说是逐期增长量的序时平均数。 2、计算公式
a0 a1 a 2 a n 或 a n 1
af a f

B、如果是间断时点数列,计算方法为: 『两个假设条件: 一是假设上期期末水平等于本期期初水平; 二是假设现象在间隔期内数量变化是均匀的。』 Ⅰ、间隔期相等的时点数列,采用“首尾(首末)折半 法”计算。 先计算各间隔期的平均数;然后再将这些平均数进行 简单算术平均。例如:
第一节
时间序列分析概述
一、时间序列的概念和作用
(一)、概念: 1、时间序列:将不同时间的某一统计指标数据按照 时间的先后顺序排列起来而形成的统计序列,也称时间 数列或动态数列。 2、基本构成要素(从形式上看): 一是时间顺序(现象所属的时间)。可以是年份、季 度、月份或其他任何时间,称时间要素(常用t表示); 二是不同时间的统计数据(现象在不同时间上的观察 值)。可以是绝对数、相对数、平均数,称数据要素 (常用小写的英文字母a、b、c表示)。

《统计学》第八章国民经济核算体系

《统计学》第八章国民经济核算体系

中国传统国民经济核算体系
❖ 中国传统国民经济核算体系是适应国家高度集中计划管 理的需要,在前苏联、东欧国家的MPS的基础上建立起 来的。
❖ 1951年,有关部门建立了农产品平衡表、工业生产资料 和消费品平衡表,后来,又扩大了这些平衡表的种类。
❖ 1952年国家统计局、各大行政区和各省市统计部门在全 国范围内进行了工农业总产值和劳动就业调查。后来, 在此基础上形成了工农业总产值核算,又逐步从工农业 总产值核算扩大到工业、农业、建筑业、交通运输业和 商业五大物质部门总产值核算。
价 值 运 动
流通 实现产品在 空间的转移
分配 包括初次分 配和再分配
社会总供给 销 售
使用
投资与 消费
购 买 社会总需求
社会再生产
如果总 供给与 总需求 实现平 衡,社 会再生 产就能 顺利实 现。
三、国民经济统计学
(一)、国民经济统计学的研究对象: 是以国民经济为整体,研究其数量
表现和数量关系的方法论的科学。
SNA:
第一时期:1665——1920年 初创阶段 第二时期:1920——1939年 发展较快,核算方法有了 较大的改进。
第三时期:1939——1953年 国民收入统计大有发展, 一是计算国民收入的国家大为增加,二是受到国际组织 的重视。
第四时期:1953——1968年 对原有的旧SNA加以补充 和拓展,建立五大核算和七大帐户的国民经济帐户体系。
MPS
采用限制性生产的概念,只 对五大物质生产部门的产品 进行核算,而把非物质生产 部门排除在外。
主要反映物质产品 的生产、交换和使 用的实物运动。
主要采用平衡 表法,侧重每 个平衡表内部 的平衡,但平 衡表之间的联 系不够严谨。

统计学第8章 时间序列分析

统计学第8章 时间序列分析

a n 1
a0
(二)增长速度(增减速度)
增长速度=
增减量 基期水平
报告期水平 基期水平 基期水平
报告期水平 基期水平 1
发展速度1
环比增长速度= an an1 an 1
an1
an1
=环比发展速度 - 100%
定基增长速度= an a0 an 1
a0
a0
=定基发展速度 - 100%
例题:
时间序列的构成要素与模型
(构成要素与测定方法)
时间序列的构成要素
长期趋势
季节变动
循环波动 不规则波动
线性趋势 非线性趋势
按月(季)平均法
移动平均法
二次曲线 指数曲线
趋势剔出法
半数平均法
修正指数曲线
最小平方法
Gompertz曲线 Logistic曲线
剩余法
线性趋势
一、移动平均法
(Moving Average Method)
移动平均法(趋势图)
200
汽 150

产 100

(万辆)50
产量 五项移动平均趋势值 五项移动中位数
0
1981
1985
1989
1993
1997
(年份)
图11-1 汽车产量移动平均趋势图
移动平均法特点
1、对原数列有修匀作用,移动项数越大,修匀 作用越强。
2、移动平均时,项数为奇数时,只需一次移动 平均,其平均值作为移动平均项中间一期; 当为偶数时,需再进行一次相邻两平均值的 移动平均。
年份
销售额 逐 期 增 减 量 环比发展速度 定基增长速
(万元) (万元)
(%)
度(%)

统计学第八章时间数列

统计学第八章时间数列
环比增长速度=逐期增长量/前一期水平
=(报告期水平-前一期水平)/前一期水平 =环比发展速度-1(或100%)
发展速度与增长速度
2、定基增长速度。 定基增长速度是报告期的累计增长量与 某一固定基期水平之比,说明现象在较 长时间内总的增长速度。公式如下:
定基增长速度=累计增长量/某一固定期水平 =报告期水平-某一固定期水平)/某一固定期 水平 =定基发展速度-1(或100%)
1、移动平均法。 移动平均法是对原时间数列逐项求 序时平均数,平均项数固定,并逐 项移动得出由这些平均数构成的新 数列,它可以消除某些因素及随机 因素的影响,显示出现象的长期趋 势。
测定长期趋势的方法
设时间数列的水平顺次为: a1,a2,a3, an 若取三项平均移动平均形成的新数 列为:
a1 a 2 a 3 a 2 a3 a 4 a2 , a3 , 3 3
第八章 时间数列
第一节 第二节 第三节 第四节 时间数列概述 时间数列的水平指标 时间数列的速度指标 动态数列的因素分析
第八章 时间数列
第一节 时间数列概述 一、时间数列的概念及作用 二、时间数列的种类 三、编制时间数列的原则
时间数列的概念及作用
一)时间数列的概念
时间数列亦称动态数列,是将反映某现象的 统计指标在不同时间上的数值,按时间先后 顺序排列而形成的一种数列;如:
动态数列影响因素及其分解 模型
3、循环变动(以C表示) 循环变动是指现象以若干年为一周 期,近乎规律性的盛衰交替变动。 如经济危机就是循环变动,每一循 环周期都要经历危机、萧条、复苏 和高涨四个阶段。
动态数列影响因素及其分解 模型
4、随机变动(以I表示) 随机变动亦称不规则变动或剩余变 动,是动态数列除了上述三种变动 之外剩余的一种变动,是偶然因素 引起的一种随机波动。如自然灾害、 战争等无法预见的因素引起的波动。

概率论与数理统计教程 第8章

概率论与数理统计教程 第8章
fe=nr
MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。

统计学原理第8章相关与回归分析

统计学原理第8章相关与回归分析
两个回归方程。() (9) 估计标准误差指的就是因变量的估计值yc与实际值y之间的平均误差程度。() (10) 在任何相关条件下,都可以用相关系数r说明变量之间相关的密切程度。() (11) 若变量x与y的相关系数r1=-0.8,变量p与q的相关系数r2=-0.92,由于r1>r2,因
此x与y间相关的程度比较高。()
27
同步练习
★ 判断题 (1) 根据结果标志对因素标志的不同反映,可以把现象间数量上的依存关系划分为
函数关系和相关关系。() (2) 正相关指的就是因素标志和结果标志的数量变动方向都是上升的。() (3) 相关系数是测定变量间相关密切程度的唯一方法。() (4) 只有当相关系数接近于1时,才能说明两变量之间存在高度相关系数。() (5) 若变量x的值减少,y的值也减少,说明变量x与y之间存在相关关系。() (6) 回归系数b和相关系数r都可以来判断现象之间相关的密切程度。() (7) 若回归直线方程为:yc=160-2.3x,则变量x与y之间存在负的相关关系。() (8) 回归分析中,对于没有明显因果关系的两个变量x与y,可以建立y依x和x依y的
D产量每增加1000件时,单位成本下降78元
E产品的产量随生产用固定资产价值的减少而减少
(4) 测定现象间有无相关关系的方法是()。
A编制相关表 B绘制相关图 C对客观现象作定性分析
D计算估计标准误系数时,()。
A相关的两个变量都是随机的
B相关的两个变量是对等的关系
C相关的两个变量一个是随机的,一个是可以控制的量
特点 在进行回归分析时,必须根据研究目的确定相关的变量中谁为自变 量,谁为因变量。 回归方程的作用在于由自变量的数值来估计因变量的值。一个回 归方程只能作一种推算或估计。 在回归分析中,因变量是随机的,自变量是可以控制的量。

统计学第八章 单因素方差分析(1)

统计学第八章 单因素方差分析(1)

称为处理平方 处理平方 和,记为 SSA
总平方和SST=处理平方和SSA+误差平方和SSe
即, ( y ij − y •• ) = n∑ ( y i • − y •• ) + ∑∑ ( y ij − y i• ) 2 ∑∑
2 i =1 j =1 i =1 i =1 j =1 a n 2 a a n
i =1 j =1
a
n
= n∑ ( y i• − y •• ) + 2∑ [( y i• − y •• )∑ ( y ij − y i• )] + ∑∑ ( y ij − y i • )
2 i =1 i =1 j =1 i =1 j =1
a
a
n
a
n
j =1
∑ ( y ij − y i • ) = 0
换句话说,采用两两t检验法,要进行45次t检验,程序太繁琐。
原因(2):检验的I 型错误增大,从而检验的 可靠性低
a = 2 时, H 0 只有一个,即
µ 1= µ 2
a = 3 时, H 0 有 3 个,即 µ 1= µ 2, µ 2= µ 3, µ 1= µ 3
a = 5时,H 0 有10个,即µ1=µ 2,µ 2=µ3, , µ 4=µ5 L
二、方差分析的几个概念
1、方差分析(analysis of variance):将试验数据的总变异分 解成不同来源的变异,从而评定不同来源的变异相对重要性 的一种统计方法。 2、试验指标(experiment index):为衡量试验结果的好坏或 处理效应的高低,在试验中具体测定的性状或观测的项目。 3、试验因素(experiment factor):试验中所研究的影响试验 指标的因素:单因素、双因素或多因素试验。 4、因素水平(level of factor):因素的具体表现或数量等级。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

σ2 Nn
(四)各种组织形式下的抽样平均误差 1、类型抽样
假设进行等比例简单随机抽样, 假设进行等比例简单随机抽样,则样本平均数 为和方差平均数分别为 1k 1n 1k 2 2 x = ∑ni xi = ∑ x j σ = ∑niσ i n i=1 n j=1 n i=1 1). 1).在重复抽样情况下 平均数的抽样平均误差: 平均数的抽样平均误差: x =
Z α / 2σ n= 2
2
2
2
2.总体方差已知,不重复抽样情形 总体方差已知,
NZ α / 2σ n= 2 N 2 + Z α / 2σ 2
2
(三)、估计成数时的样本容量 )、估计成数时的样本容量 在重复抽样情况下
2 Z α / 2 P(1 P) n= 2p
在不重复抽样情况下
NZ α / 2 P(1 P) n= 2 2 N p + Z α / 2 P(1 P)
( x tα / 2 S / n , x + tα / 2 S / n )
(三)、成数的区间估计 )、成数的区间估计 1.在重复抽样情况下,总体成数 P 的置信度为 在重复抽样情况下,
100(1 α )%
的置信区间
(x zα / 2 p , x + zα / 2 p )
2.在不重复抽样情况下,总体成数 P 在不重复抽样情况下, 的置信度为 100(1 α )% 的置信区间 N n N n ( x zα / 2 p , x + zα / 2 p ) N 1 N 1
x =
σ
n
(二)、平均数的抽样平均误差 1、重复抽样情形 、
x =
2
σ
n
σ
2
2、不重复抽样情形 、
n x = ≈ 1 n N 1 n N
σ N n
(三)、成数的抽样平均误差 1、重复抽样情形 、
P(1 P) p = = n n
2、不重复抽样情形 、
σ
ቤተ መጻሕፍቲ ባይዱ
P(1P) Nn P(1P) n p = = ≈ 1 n N1 n N1 n N
1 r 样本均值为 x = ∑ x i r i =1
1.平均数的抽样平均误差为 其中δ x2
1 r δ x2 = ∑ ( xi x ) 2 r i =1
r R 1 为平均数的群间样本方差, 为平均数的群间样本方差,即
x =
δ x2 R r
2.成数的抽样平均误差
p =
δ
Rr r R 1
2 p
2 为成数的群间样本方差, 其中δ p 为成数的群间样本方差,即
四、整群抽样
整群抽样也叫集团抽样, 整群抽样也叫集团抽样 , 是将总体全部 单位分为若干部分(每一部分称为一个群) 单位分为若干部分(每一部分称为一个群), 按随机原则从中不重复抽取部分群体,在每 按随机原则从中不重复抽取部分群体, 群中进行全面调查( 群中进行全面调查 (抽中群体的所有单位构 成样本) 成样本)。
三、机械抽样 机械抽样也叫等距抽样或系统抽样, 机械抽样也叫等距抽样或系统抽样, 它是先将总体单位按某一标志排队, 它是先将总体单位按某一标志排队,计 算出抽样间隔, 算出抽样间隔,并在第一个抽样间隔内 确定一个抽样起点, 确定一个抽样起点,然后按固定的顺序 和间隔来抽取样本单位。 和间隔来抽取样本单位。 机械抽样的方法及抽样起点的确定 (一)、按无关标志排队的等距抽样 (二)、按有关标志排队的等距抽样
(二)、两种类型的错误 )、两种类型的错误 原假设是成立的,检验结果是拒绝原假设, 原假设是成立的,检验结果是拒绝原假设,这 是一种错误的决策,属于“弃真错误” 是一种错误的决策,属于“弃真错误”,也称 第一类错误” 为“第一类错误”; 原假设是不成立的,检验结果是接受原假设, 原假设是不成立的,检验结果是接受原假设, 这又是一种错误的决策,它属于“取伪错误” 这又是一种错误的决策,它属于“取伪错误”, 也称为“第二类错误” 也称为“第二类错误”。
二、总体均值的检验
检验问题: 检验问题:H0: =0 H1:≠0 (0为已 知常数) 知常数) 总体方差已知情形( 检验 检验) (一)、总体方差已知情形(z检验) 通过样本计算统计量 x 0 z= σ/ n 如果 | z |> zα / 2 ,即若 z > zα / 2 或 z < zα / 2 即若 则拒绝H 否则,接受H 则拒绝H0,否则,接受H0
2
第五节 假设检验
一、假设检验基本概念
(一)、假设检验基本原理 假设检验的一般步骤: 假设检验的一般步骤: 第一步:确定原假设和备择假设; 第一步:确定原假设和备择假设; 第二步:明确检验统计量; 第二步:明确检验统计量; 第三步:根据显著性水平,确定拒绝域; 第三步:根据显著性水平,确定拒绝域; 第四步:计算检验统计量的数值; 第四步:计算检验统计量的数值; 第五步:给出判断结论。 第五步:给出判断结论。
H0
其中
~ N (0,1) )/n
四、假设检验与区间估计的关系
置信区间与假设检验的关系为: 置信区间与假设检验的关系为: 在内,则接受H 若置信区间包括0在内,则接受H0;若置信区 在内,则要拒绝H 接受H 间不包括0在内,则要拒绝H0,接受H1。
本章小结 抽样推断是按随机原则从总体中抽取一部分单位(称为样本),根据样本的信息 抽样推断是按随机原则从总体中抽取一部分单位(称为样本),根据样本的信息 ), 对总体的数量特征进行科学估计与推断的方法。 对总体的数量特征进行科学估计与推断的方法。 抽样推断包含了抽样调查和统计推断。抽样调查是一种非全面调查, 抽样推断包含了抽样调查和统计推断。抽样调查是一种非全面调查,它是按随机 原则从总体中抽出部分单位进行调查以获得有关的数据资料,目的是为了推断总体。 原则从总体中抽出部分单位进行调查以获得有关的数据资料,目的是为了推断总体。 统计推断是根据抽样调查所获得的样本信息, 统计推断是根据抽样调查所获得的样本信息,对总体的数量特征做出具有一定可靠程 度的估计和推断。 度的估计和推断。 抽样的组织方式主要有:简单随机抽样;类型抽样;机械抽样;整群抽样; 抽样的组织方式主要有:简单随机抽样;类型抽样;机械抽样;整群抽样;多阶 段抽样等。 段抽样等。 抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单 位的结构,而引起样本指标和总体指标之间的绝对离差。 位的结构,而引起样本指标和总体指标之间的绝对离差。抽样推断误差主要有两 种,一种是非抽样误差;另外一种为抽样误差,也叫随机误差。影响抽样误差的 一种是非抽样误差;另外一种为抽样误差,也叫随机误差。 因素主要有:总体各单位标志值的差异程度;抽样样本的单位数;抽样的方法。 因素主要有:总体各单位标志值的差异程度;抽样样本的单位数;抽样的方法。 常用的度量抽样误差的方式有三种:抽样实际误差、 常用的度量抽样误差的方式有三种:抽样实际误差、抽样平均误差和抽样极限误 差。 点估计是直接以样本统计量作为相应的总体参数的估计量。 点估计是直接以样本统计量作为相应的总体参数的估计量。区间估计是在一定的概率 保证下,由样本指标推断总体指标可能在的区间,这个区间称为置信区间。 保证下,由样本指标推断总体指标可能在的区间,这个区间称为置信区间。 假设检验则是先对总体的某些数量特征提出假设, 假设检验则是先对总体的某些数量特征提出假设,然后利用样本的信息对该假设正确 与否做出判断。假设检验分为两类:参数检验和非参数检验。 与否做出判断。假设检验分为两类:参数检验和非参数检验。
三、样本容量的确定
(一)、确定样本容量的意义 找出在规定误差范围内的最小样本容量, 找出在规定误差范围内的最小样本容量 , 这样确定的样本容量可以在保证满足误差要 求下, 求下,使得调查费用最小
(二)、估计均值时的样本容量 )、估计均值时的样本容量 1.总体方差已知,重复抽样情形 总体方差已知,
二、类型抽样
类型抽样也叫分类抽样、 类型抽样也叫分类抽样 、 分层抽 样 , 先将总体单位按一定标志进行分 类 ( 层 ) , 然后在各类( 层 ) 中按随 然后在各类 ( 机原则分别抽出一定的单位组成样本。 机原则分别抽出一定的单位组成样本 。
在各层分配样本单位数的方法: 在各层分配样本单位数的方法: (一)、比例分配法 (二)、奈曼最佳分配法 (三)、经济分配法
σ 2 N n
≈ n N 1
σ2
n 1 n N
2、机械抽样 、 机械抽样的平均误差可以用不重复简 单随机抽样的平均误差代替
3、整群抽样 假设将总体全部N 假设将总体全部N个单位划分成R群,从中随 抽中的群的所有单位组成样本。 机抽取r群,抽中的群的所有单位组成样本。 设被抽中的群的平均值为 xi , (i = 1,2, r )
第三节 抽样误差 一、抽样误差概述 (一)抽样误差概念
抽样误差是指由于随机抽样的偶然因素 使样本各单位的结构不足以代表总体各单位 的结构, 的结构, 而引起样本指标和总体指标之间的 绝对离差。 绝对离差。
二、抽样平均误差
(一)、抽样平均误差的概念 抽样平均误差就是样本指标的标准差。 抽样平均误差就是样本指标的标准差。
五、多阶段抽样
多阶段抽样是先将一个很大的总体划分 为若干个子总体,即一阶单位, 为若干个子总体 , 即一阶单位 , 再把一阶单 位划分为若干个更小的单位,称为二阶单位, 位划分为若干个更小的单位, 称为二阶单位, 照此继续下去划分出更小的单位, 照此继续下去划分出更小的单位 ,依次称为 三阶单位、四阶单位等。 三阶单位 、 四阶单位等 。 然后分别按随机原 则逐阶段抽样。 则逐阶段抽样。
二、抽样的若干基本概念
总体均值: 总体均值: 总体成数: 总体成数: P 总体方差: 总体方差: σ2 总体标准差: 总体标准差:σ 样本均值: 样本均值: x 样本成数: 样本成数:p 样本方差: 样本方差:S2 样本标准差: 样本标准差 S
第二节 抽样的组织方式
相关文档
最新文档