社会统计学第七章(一)
《统计学》-第7章-习题答案
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学例子——第七章例子整群抽样1
-
106
计算:
每分钟为一群,总体被分为: R = 24×60 = 1 440 群 r = 1 440÷144 = 10 样本平均数:
x 1010 101 公 斤 ) x (
r 10
组间方差:
δx
2
( x x)
r 1
2
106 11.78 况表:
样本编号
1 2 3 4 5 6 7 8 9 10
各群每袋平均重量 x
98 102 104 106 100 98 100 96 100 106
( x x)
-3 1 3 5 -1 -3 -1 -5 -1 5
( x x )2
9 1 9 25 1 9 1 25 1 25
合 计
1 010
δx R r 11.78 1440 10 (公斤) 1.082 r R 1 10 1440 1
2
μx
统计学例子第七章例子整群抽样1整群抽样例子整群抽样的例子统计学第七章课后答案统计学抽样方法统计学抽样调查统计学抽样统计学随机抽样统计学例子误用统计学方法的例子
整群抽样平均误差计算:
某水泥厂大量连续100公斤装水泥,一昼夜产量 为14 400袋。现每隔144分钟抽取1分钟的产量( 10袋为一群),共10群,全部检验。相关数据如 下,试求抽样平均误差。
第七章--统计指数
8240
Q1P1
1 kp
Q1P1
10400
8240
2160元
【例2】计算甲、乙两种商品旳销售量总指数
商品 名称
计量 单位
销售额
(万元) 基期 报告期
销售量比上年 增长(%)
甲 •件
20
25
10
乙 • 公斤 30
45
20
合计 — 50 70
——
K Q
Q1P0
Q1 Q0
Q0 P0
1.1 20 1.2 30 116%
到同度量 和权数 旳作用
基本编制原理
根据客观现象间旳内在联络,引入 同度量原因; 将同度量原因固定,以消除同度量 原因变动旳影响; 将两个不同步期旳总量指标对比, 以测定指数化指标旳数量变动程度。
一般编制原则和措施
⒈数量指标综合指数旳编制:
—采用基期旳质量指标作为同度量原因
KQ
Q1P0 Q0 P0
统计指数是研究社会经济现象数量关系旳变 动情况和对比关系旳一种特有旳分析措施。
指因为各个部分旳不同性质 而在研究其数量时,不能直 接进行加总或对比旳总体
从广义上讲,指数是指反应社会经济现象总体
数量变动旳比较指标;
从狭义上讲,指数是指反应复杂社会经济现象
总体数量变动情况和对比关系旳特殊相对数。
《统计学》第七章 统计指数
对象 指数
销售额 销售量 价格 指数 指数 指数
(总动态指数)
原因 指数
指数体系旳基本形式
⑴ 相对数形式:——对象指数等于各个 原因指数旳连乘积
Q1P1
Q0 P0
k PQ
Q1P0 Q0 P0
K Q Q1P1 Q1P0
统计学原理第七章 抽样调查
合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
电大 社会统计学 第七章 统计推断
(二)置信水平和置信空间
置信区间是在区间估计中,由样本统计量所构造的 总体参数的估计区间,它有估计量加减抽样误差构 成,我们将区间的最小值称为置信下限,区间的最 大值称为置信上限。 置信水平就是将构造置信区间的步骤重复很多次, 置信区间包含总体参数真值的次数所占的比例。
求置信区间的步骤
(四)区间估计
(三)样本均值抽样分布的特征
• 假设从容量N的总体中抽取容量为n的样本,其中总体的均值 为μ,方差为σ2,样本均值的数学期望为E( X ),方差为σ2x
三、样本比例的抽样分布
• 用π表示总体比例,用P表示样本比例。
第三节 参数估计
• 参数估计是统计推断的一个重要部分,它是用样本统计量推 断总体参数的过程。 • 参数估计可分为点估计和区间估计两种类型。 • 一、点估计 • 点估计就是直接用估计量作为总体参数θ的估计值。用样本均 值直接作为总体均值μ的估计值,用样本比例P直接作为总体 比例π的估计值,用样本方差直接作为总体方差的估计值 等。例如,随机样本的均值为6分,我们用6分直接作为总体 的估计值,认为这次考试总体平均分为6分,这就是点估计。
• 假设检验的基本思想可以用小概率原理解释。 • 小概率原理,就是在一次试验中小概率事件是几乎 不可能发生的。也就是说,如果我们对总体的某个 假设是真实的,那么极端值(不支持假设的事件) 是几乎不可能发生的。如果发生了,我们就有理由 怀疑这一假设的真实性,拒绝这一假设。
第四节 假设检验
• 二、虚无假设和替换假设
• (3)有效性。是指当总体参数的无偏估计不止一个统计量时, 标准差小的估计量更有效,标准差大的有效性就相对差。也 就是说,估计量与总体参数的离散程度也要较小。 • (4)充分性。是指一个容量为的样本统计量,是否充分反映 了全部个数据所反映总体的信息,这就是充分性。
社会统计学,卢淑华(第4版),第7,8章.pptx
假设检验的基本步骤
第1步:提出原假设和备择假设。 支持的命题为:备择假设 备择假设的对立面则为原假设 第2步:选择适当的检验统计量(test statistic) ,并 根据样本信息计算检验统计量的值
估计量-假设(H 0 )值 标准化检验统计量= 标准误差
第3步:选择显著性水平,确定临界值
总体参数的区间估计
用样本信息检验总体信息
第七章 假设检验 Hypothesis testing
一、假设检验的基本内容
(一)假设检验的基本思想 假设检验(hypothesis testing)是除参数估计之 外的另一类重要的统计推断问题。它的基本思想可以 用小概率原理来解释。所谓小概率原理,就是认为小 概率事件在一次试验中是几乎不可能发生的。也就是 说,如果对于总体的某个假设是真实的,那么不利于 或不可能支持这一假设的小概率事件A在一次试验中 几乎是不可能发生的,要是一次试验中事件A竟然发 生了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。
原假设 H0 原假设(null hypothesis)通常是研究 者想收集证据予以反对的假设,也称为 零假设,用表示。一般来说,原假设建 立的依据都是已有的、具有稳定性的, 从经验看,没有发生条件的变化,是不 会被轻易否定的。换句话讲,进行假设 检验的基本目的,就在于作出决策:接 受原假设还是拒绝原假设。
临界值计算 比较判断
由于 z 2.77 z 1.645
故不能拒绝原假设。
例6(P251) H0:μ≤20
右侧检验 H1:μ>20 假设设定
分析:正态总体,方差未知,小样本
统计量选择
统计量计算
23.5 20 t 3.5 s/ n 3/ 9
x 0
社会统计学(卢淑华),第七章
3、给出小概率 4、用样本统计量的观测值进行判断
例:某地收入水平调查状况如下:x 870 s 21 n 50 问:该地上报的平均收入为880元是否 可信?(显著性水平为 0.05)
(二)两类错误 1、弃真错误: 把一次观测中出现在拒绝域的小概率事件 当作对原假设的拒绝,此时会发生。犯错 误的大小为 2、纳伪错误:
在接受原假设时犯的错误,犯错误的概率 为 。 0 越小, 数值越大
2
拒绝 H 0 ;反之接受 2)单边检验
H
0
右侧:只有当样本计算统计量的值过大:
z z 才会落入拒绝域;如果 z z 接受。
左侧: pz z
三、假设检验的步骤不两类错误
其分布
0
3、假设检验的基本原理: 小概率原理: 1)小概率事件是在一次观察中是不可能出现的事 件。 2)如果在一次观察中出现了小概率事件,那么, 合理的想法是否定原有事件具有小概率的说法。 假设检验思想在统计学中的描述:经过抽样获得 一组数据(即样本):根据样本计算的统计量, 如果:原假设成立的条件下几乎不可能发生的, 就拒绝或否定原假设;如果在原假设成立的条件 下,根据样本计算的统计量发生的可能性不是 小,则接受。
第七章 假设检验的基本概念
一、统计假设 1、统计假设:
收集资料的范围仅是全体的一部分,是一 个随机样本,那么,这种和抽样手段联系 在一起,并且依靠抽样数据进行验证的假 设,即统计假设。
2、原假设和备择假设
1)原假设(虚无假设或解消假设)H 0 : 根据已有资料周密考虑后确定 2)备择假设(研究假设)H 1 : 原假设的逻辑对立假设 三种形式:单边(左、右) 双边
统计学 第 七 章 相关与回归分析
(一)回归分析与相关分析的关系
回归分析与相关分析是研究现象 之间相互关系的两种基本方法。
区别:
1、相关分析研究两个变量之间相关的 方向和相关的密切程度。但是相关分析不 能指出两变量相互关系的具体形式,也无 法从一个变量的变化来推测另一个变量的 变化关系。
2、按研究变量多少分为单相关和 复相关
单相关即一元相关,亦称简单相 关,是指一个因变量与一个自变量 之间的依存关系。复相关又称多元 相关,是指一个因变量与两个或两 个以上自变量之间的复杂依存关系。
3、按相关形式分为线性相关和非 线性相关
从相关图上观察:观察的样本点的 分布近似表现为直线形式,即观察点近 似地分布于一直线的两边,则称此种相 关为直线相关或线性相关。如果这些样 本点近似地表现为一条曲线,则称这种 相关为曲线相关或非线性相关(curved relationship).
不确定性的统计关系 —相关关系
Y= f(X)+ε (ε为随机变量)
在这种关系中,变量之间的关系值 是随机的,当一个(或几个)变量的值 确定以后,另一变量的值虽然与它(们) 有关,但却不能完全确定。然而,它们
之间又遵循一定的统计规律。
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)
之间的关系
▪ 商品销售额(y)与广告费支出(x)
▲相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。
▲相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。
例题1: 经验表明:商场利润额与 其销售额之间存在相关关系。下表为 某市12家百货公司的销售额与利润额 统计表,试计算其相关系数。
统计学 第七章 统计指数
④按指数化指标的性质不同分为: 数量指标指数: 数量指标指数:也称物量指数 例如:产量指数、销售量指数、结构影响指数
质量指标指数: 质量指标指数:
例如:价格指数、单位成本指数、固定构成指数 ⑤按其比较现象的特征不同: 时间指数: 时间指数:反映同类现象在不同时间的发展变动情况对比的相 对数 区域指数: 区域指数:反映同类现象在不同地区或不同单位之间对比的相 对数 计划完成指数: 计划完成指数:反映研究现象在同一单位或同一地区实际数 与计划数之间对比的相对数 ⑥按其在指数体系中所处的位置与作用不同: 现象总体指数: 现象总体指数:包括两个或两个以上因素同时变动的相对数 影响因素指数: 影响因素指数:只有一个因素变动,并从属于某一现象总体 指数的相对数
狭义理解: 反映复杂现象总体数量变动的相对数。 反映复杂现象总体数量变动的相对数。 复杂现象总体数量变动的相对数 狭义理解: 百科全书》 复杂现象总体是相对于简单现象总体而言的。 复杂现象总体是相对于简单现象总体而言的。 简单现象总体指总体的单位和标志值可以直接加 简单现象总体指总体的单位和标志值可以直接加 以总计,如某种产品产量、产品成本等; 以总计,如某种产品产量、产品成本等; 复杂现象总体指总体单位和标志值不能直接加以 复杂现象总体指总体单位和标志值不能直接加以 不同商品的价格。 总计,如不同产品的产量、不同商品的价格。
下标 1表示报告期, 表示基期 0
√
反映多种商品销售量变动的指数公式有: 反映多种商品销售量变动的指数公式有: ∑ q1 p0 ∑ q1 p1 ∑ q1 pn
∑q
0
p0
∑q
0
p1
∑q
0
pn
拉氏指数
帕氏指数
不变价指数
反映多种商品销售价格变动的指数公式有: 反映多种商品销售价格变动的指数公式有:
《统计学》-第七章-相关与回归分析
第七章 相关与回归分析(一)填空题1、相关关系按其相关的程度不同,可分为 、 和 。
2、相关系数的正负表示相关关系的方向,r 为正值,两变量是 ;r 为负数,两变量是 。
3、r=0,说明两个变量之间 ;r=+1,说明两个变量之间 ;r=-1说明两个变量之间 。
4、一元线性回归方程bx a y+=ˆ 中的参数a 代表 ,数学上称为 ;b 代表 ,数学上称为 。
5、 分析要根据研究的目的确定哪一个为自变量,哪一个为因变量,在这一点与 分析时不同。
6、相关关系按方向不同,可分为 和 。
7、完全线性相关的相关系数r 值等于 。
8、计算回归方程要注意资料中因变量是 的,自变量是 的。
9、回归方程只能用于由 推算 。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、相关分析研究的是( )A. 变量之间关系的密切程度B. 变量之间的因果关系C. 变量之间严格的相互依存关系D. 变量之间的线性关系2、相关关系是( )A 、现象间客观存在的依存关系B 、现象间的一种非确定性的数量关系C 、现象间的一种确定性的数量关系D 、现象间存在的函数关系3、下列情形中称为正相关的是( )A. 随着一个变量的增加,另一个变量也增加B. 随着一个变量的减少,另一个变量增加C. 随着一个变量的增加,另一个变量减少D. 两个变量无关4、当自变量x 的值增加,因变量y 的值也随之增加,两变量之间存在着( )A 、曲线相关B 、正相关C 、负相关D 、无相关5、相关系数r 的取值范围是( )A. B.C. 6、当自变量x 的值增加,因变量y 的值也随之减少,两变量之间存在着( )A 、曲线相关B 、正相关C 、负相关D 、无相关7、相关系数等于零表明两变量( )A. 是严格的函数关系B. 不存在相关关系C. 不存在线性相关关系D. 存在曲线相关关系8、相关系数r 的取值范围是( )A 、从0到1B 、从-1到0C 、从-1到1D 、无范围限制11<<-r 10≤≤r 11≤≤-r9、相关分析对资料的要求是( )A. 两变量均为随机的B. 两变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 自变量不是随机的,因变量是随机的10、相关分析与回归分析相比,对变量的性质要求是不同的,回归分析中要求( )A 、自变量是给定的,因变量是随机的B 、两个变量都是随机的C 、两个变量都是非随机的D 、因变量是给定的,自变量是随机的11、回归方程 中的回归系数b说明自变量变动一个单位时,因变量( )A. 变动b个单位 B. 平均变动b 个单位C.变动a+b 个单位 D. 变动a 个单位12、一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是( )A 、负相关B 、正相关C 、零相关D 曲线相关13、回归系数与相关系数的符号是一致的,其符号均可判断现象( )A. 线性相关还是非线性相关B. 正相关还是负相关C. 完全相关还是不完全相关D. 简单相关还是复相关14、配合回归方程比较合理的方法是( )A 、移动平均法B 、半数平均法C 、散点法D 、最小平方法15、在相关分析中不能把两个变量区分为确定性的自变量和随机性的因变量,在回归分析中( )A. 也不能区分自变量和因变量B. 必须区分自变量和因变量C. 能区分,但不重要D. 可以区分,也可以不区分16、价格愈低,商品需求量愈大,这两者之间的关系是( )A 、复相关B 、不相关C 、正相关D 、负相关17、按最小平方法估计回归方程 中参数的实质是使( )A. B. C. D. 18、判断现象之间相关关系密切程度的方法是( )A 、作定性分析B 、制作相关图C 、计算相关系数D 、计算回归系数19、在线性相关条件下,自变量的标准差为2,因变量的标准差为5,而相关系数为0.8,其回归系数为( )A. 8B. 12.5C. 0.32D. 2.020、已知某产品产量与生产成本有直线关系,在这条直线上,当产量为1000件时,其生产成本为50000元,其中不随产量变化的成本为12000元,则成本总额对产量的回归方程是( )A 、Y=12000+38XB 、Y=50000+12000XC 、Y=38000+12XD 、Y=12000+50000Xbx a y +=ˆbx a y +=ˆ∑=-最小值2)ˆ(y y21、已知,则相关系数为()A.不能计算 22、相关图又称( )A 、散布表B 、折线图C 、散点图D 、曲线图23、工人的出勤率与产品合格率之间的相关系数如果等于0.85,可以断定两者是( )A 、显著相关B 、高度相关C 、正相关D 、负相关24、相关分析与回归分析的一个重要区别是( )A 、前者研究变量之间的关系程度,后者研究变量间的变动关系,并用方程式表示B 、前者研究变量之间的变动关系,后者研究变量间的密切程度C 、两者都研究变量间的变动关系D 、两者都不研究变量间的变动关系25、当所有观测值都落在回归直线上,则这两个变量之间的相关系数为( )A 、1B 、-1C 、+1或-1D 、大于-1,小于+126、一元线性回归方程y=a+bx 中,b 表示( )A 、自变量x 每增加一个单位,因变量y 增加的数量B 、自变量x 每增加一个单位,因变量y 平均增加或减少的数量C 、自变量x 每减少一个单位,因变量y 减少的数量D 、自变量x 每减少一个单位,因变量y 增加的数量(三)多项选择题(在每小题备选答案中,至少有两个答案是正确的)1、直线回归方程 中,两个变量x 和y ( )A. 前一个是自变量 ,后一个是因变量B. 两个变量都是随机变量C. 两个都是给定的量D. 前一个是给定的量 ,后一个是随机变量E. 前一个随机变量 ,后一个是给定的量2、相关分析( )A 、分析对象是相关关系B 、分析方法是配合回归方程C 、分析方法主要是绘制相关图和计算相关系数D 、分析目的是确定自变量和因变量E 、分析目的是判断现象之间相关的密切程度,并配合相应的回归方程以便进行推算和预测3、相关分析的特点有 ( )A. 两个变量是对等的关系B. 它只反映自变量和因变量的关系C. 可以计算出两个相关系数D. 相关系数的符号都是正的E. 相关的两个变量必须都是随机的4、下列现象中存在相关关系的有( )A 、职工家庭收入不断增长,消费支出也相应增长B 、产量大幅度增加,单位成本相应下降C 、税率一定,纳税额随销售收入增加而增加D 、商品价格一定,销售额随销量增加而增加E 、农作物收获率随着耕作深度的加深而提高bx a y +=ˆ5、相关关系与函数关系的区别在于( )A. 相关关系是变量间存在相互存在依存关系,而且函数关系是因果关系B. 相关关系的变量间是确定不变的,而函数关系值是变化的C. 相关关系是模糊的,函数关系是确定的D. 两种关系没有区别6、商品流通费用率与商品销售额之间的关系是( )A 、相关关系B 、函数关系C 、正相关D 、负相关E 、单相关7、为了揭示变量x 与y 之间的相互关系,可运用( )A. 相关表B. 回归方程C.相关系数D. 散点图8、相关系数( )A 、是测定两个变量间有无相关关系的指标B 、是在线性相关条件下测定两个变量间相关关系密切程度的指标C 、也能表明变量之间相关的方向D 、其数值大小决定有无必要配合回归方程E 、与回归系数密切相关9、可以借助回归系数来确定( )A. 两变量之间的数量因果关系B. 两变量之间的相关方向C. 两变量之间的相关的密切程度D.10、直线回归方程( )A、建立前提条件是现象之间具有较密切的直线相关关系B 、关键在于确定方程中的参数a 和bC 、表明两个相关变量间的数量变动关系D 、可用来根据自变量值推算因变量值,并可进行回归预测E 、回归系数b=0时,相关系数r=011、可用来判断现象相关方向的指标有( )A. 相关系数B. 回归系数C. 回归参数aD. 协方差E. 估计标准误差 12、某种产品的单位成本y (元)与工人劳动生产率x (件/人)之间的回归直线方程Y=50-0.5X ,则( )A 、0.5为回归系数B 、50为回归直线的起点值C 、表明工人劳动生产率每增加1件/人,单位成本平均提高0.5元D 、表明工人劳动生产率每增加1件/人,单位成本平均下降0.5元E 、表明工人劳动生产率每减少1件/人,单位成本平均提高50元13、对于回归系数,下列说法中正确的有( )A. b 是回归直线的斜率B. b 的绝对值介于0-1之间C. bD. bE. b 满足方程组y S ⎪⎩⎪⎨⎧+=+=∑∑∑∑∑2xb x a xy x b na y14、相关关系的特点是()A、现象之间确实存在数量上的依存关系B、现象之间不确定存在数量上的依存关系C、现象之间的数量依存关系值是不确定的D、现象之间的数量依存关系值是确定的E、现象之间不存在数量上的依存关系15、回归方程可用于( )A. 根据自变量预测因变量B. 给定因变量推算自变量C. 给定自变量推算因变量D. 推算时间数列中缺失的数据E. 用于控制因变量16、建立一元线性回归方程是为了()A、说明变量之间的数量变动关系B、通过给定自变量数值来估计因变量的可能值C、确定两个变量间的相关程度D、用两个变量相互推算E、用给定的因变量数值推算自变量的可能值17、在直线回归方程中,两个变量x和y()A、一个是自变量,一个是因变量B、一个是给定的变量,一个是随机变量C、两个都是随机变量D、两个都是给定的变量E、两个是相关的变量18、在直线回归方程中()A、在两个变量中须确定自变量和因变量B、回归系数只能取正值C、回归系数和相关系数的符号是一致的D、要求两个变量都是随机的E、要求因变量是随机的,而自变量是给定的19、现象间的相关关系按相关形式分为()A、正相关B、负相关C、直线相关D、曲线相关E、不相关20、配合一元线性回归方程须具备下列前提条件()A、现象间确实存在数量上的相互依存关系B、现象间的关系是直线关系,这种直线关系可用散点图来表示C、具备一组自变量与因变量的对应资料,且能明确哪个是自变量,哪个是因变量D、两个变量之间不是对等关系E、自变量是随机的,因变量是给定的值21、由直线回归方程y=a+bx所推算出来的y值()A、是一组估计值B、是一组平均值C、是一个等差级数D、可能等于实际值E、与实际值的离差平方和等于0(四)是非题1、判断现象之间是否存在相关关系必须计算相关系数。
《统计学》第七章(抽样调查)
20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。
《社会统计学》全书目录
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展·社会统计学的对象与特点·社会统计的方法·社会统计工作的程序第二节社会统计学的几个基本概念总体与单位·标志与变量·指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料·静态资料与静态资料·全面调查与非全面调查·一般调查与专项调查·经常性调查与一次性调查第二节统计调查的组织形式普查·重点调查·典型调查·抽样调查第三节概念的操作化与测量概念的操作化·定类尺度·定序尺度·定距尺度·定比尺度第四节统计误差登记性误差·代表性误差·抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列与变量数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制对于离散变量·对于连续变量·组距和组数的确定·累计频数第四节统计图直方图·折线图·曲线图·累计顿数分布曲线·洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算·对于分组资料的算术平均数计算·算术平均数的性质第二节中位数对于未分组资料的中位数计算·对于分组资料的中位数计算·中位数的性质·其他分割法第三节众数对于未分组资料的众数计算·对于分组资料的众数计算·众数的性质第四节几何平均数、调和平均数及其他几何平均数·调和平均数·各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距·四分位差第二节平均差对于未分组资料A·D的计算·对于分组资料A·D的计算·平均差的性质第三节标准差对于未分组资科S的计算·对于分组资料S的计算·标准差的性质·标准分第四节相对离势变异系数·异众比率·偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件·事件之间的关系·先验概率·经验概率第二节概率的数学性质概率的数学性质·排列与样本点的计数·运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布·连续型随机变量的概率分布·分布函数·数学期望·变异数第七章假设检验第一节二项分布二项分布的数学形式·二项分布的讨论第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态曲线下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望与方差·关于超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质·关于泊松分布的近似第三节卡方分布(2 分布)卡方分布的数学形式·卡方分布的性质·样本方差的抽样分布第四节F分布F分布数学形式·F分布的性质·关于F分布的近似第九章参数估计第一节点估计无偏性·一致性·有效性第二节区间估计精确性和可靠性·抽样平均误差与概率度·区间估计的步骤第三节其他类型的置信区间σ未知,小样本总体均值的区间估计·总体成数的估计·总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差·分层抽样的抽样误差·整群抽样的抽样误差·等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素·确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验·大样本成数差检验第二节两总体小样本假设检验小样本均值差检验·小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验·一实验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计·σ12和σ22未知,对均值差的区间估计·大样本成数区间估计·配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”·符号检验与二项检验·简便检验·“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验·配对符号秩检验的步骤·符号秩检验的效力第三节秩和检验独立样本的秩和检验·秩和·秩和检验的具体步骤·U检验第四节游程检验独立样本的游程检验·游程·游程检验的具体步骤·差符号游程检验第五节累计频数检验独立样本的累计频数检验·累计频数检验的步骤·没有预测方向和已经预测方向·经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向·因果关系第二节定类变量的相关分析列联表·削减误差比例·λ系数·τ系数第三节定序变量的相关分析同序对、异序对、同分对·G amma系数·肯德尔等级相关系数·萨默斯(d系数)·斯皮尔曼等级相关系数·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归第十三章2 检验与方差分析第一节拟合优度检验问题的导出·拟合优度检验(比率拟合检验)·正态拟合检验第二节无关联性检验独立性、理论频数及自由度·关于频数比较和连续性修正·列联表的卡方分解·关系强度的量度第三节方差分析总变差及其分解·关于自由度·关于检验统计量F o的计算·相关比率·关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验·积差系数的检验·回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类·动态比较指标·动态平均指标第二节时间数列的趋势分析随手绘法·移动平均法·半数平均法·最小平方法第三节指数分析法动态指数及其分类·质量指标综合指数·数量指标综合指数·用与个体指数的联系来求综合指数·其他权数形式的质量和数量综合指数·指数体系和因素分析·静态指数。
统计学第七章课后题及答案解析
第七章 一、单项选择题1.按指数所包括的范围不同, 可以把它分为( )A.个体指数和总指数 B .数量指标指数和质量指标指数C.综合指数和平均指数 D.定基指数和环比指数2. 某集团公司为了反映所属各企业劳动生产率水平的提高情况 ,需要编制(A.质量指标综合指数B.数量指标综合指数C.可变构成指数D.固定构成指数3.在一般情况下,商品销售量指数和工资水平指数的同度量因素分别为( 商品销售量、平均工资水平 单位商品销售价格、职工人数 下列指数中属于数量指标指数的是 产品价格指数 产量指数 下面属于价格指数的是(B .商品销售量、职工人数D.单位商品销售价格、平均工资水平 )B .单位成本指数 D.劳动生产率指数5. A.工RQ 1 氓Q 1B -F 1Q 1ZFO Q OC.QZP0QoD E pQ oZP0Q O6. A.7. 某商品价格发生变化,现在的10%B. 90% 固定构成指数的公式是(100元只值原来的 C. 110%)90元,则价格指数为(D. 111%A. C.1. A. D.2. A. C. E.3. A. D.4.A. C. ZX i F i ZF iZX 1F 1ZF I... ZX P F O 1F0 D. ZX O F^ IXo F oIX 0F 1ZF iZFoIX 1F 0ZF O、多项选择题下列属于数量指标指数的有( 产量指数单位产品成本指数 下列表述正确的是( 综合指数是先综合后对比 平均数指数必须使用全面资料 固定构成指数受总体结构影响 同度量因素的作用有( 同度量作用 B.比较作用E. )B.销售量指数E.职工人数指数C.价格指数B .平均数指数是先对比后综合 D.平均数指数可以使用固定权数联系作用平衡作用c.权数作用对某商店某时期商品销售额的变动情况进行分析,其指数体系包括( 销售量指数B.销售价格指数总平均价格指数 D.销售额指数 E.个体指数若用某企业职工人数和劳动生产率的分组资料来进行分析时,该企业总的劳动生产率的A.C.4.A.C.变动主要受到()A.企业全部职工人数变动的影响B.企业劳动生产率变动的影响C.企业各类职工人数在全部职工人数中所占比重的变动影响D.企业各类工人劳动生产率的变动影响E.受各组职工人数和相应劳动生产率两因素的影响6.下列指数中,属于拉氏指数的有()' Q1P01 0 1 01 1 1 1P0Q0 P0Q1 C X Q0 P0 P0Q1 Q0 P1 7.某企业产品总成本报告期为183150元,比基期增长10%单位成本综合指数为104%则()A.总成本指数110%B.产量增长了5.77%C.基期总成本为166500元D.单位成本上升使总成本增加了7044元E.产量增产使总成本增加了9606元三、判断题1.综合指数的编制方法是先综合后对比。
统计学原理第七章_相关分析
各类相关关系的表现形态图
三、相关分析与回归分析
• (一)相关分析 • 是用一个指标(相关系数)来表明现象 之间相互依存的密切程度。 • (二)回归分析 • 是根据相关关系的具体形态,选择一个 合适的数学模型,来近似地表达变量之 间的平均变化关系。(高度相关)
• (三)相关分析与回归分析的联系
• 1. 它们有具有共同的研究对象。
n
(x x )(y y ) n
σx
(x x )
n
2
(x x ) n
(y y ) n
1
1
2
σy
(y y )
n
2
2
再代入到原公式中,得:
r σ
2 xy
σx y σ
( x x ) ( y y ) ( x x ) ( y y )
2
·· ·②
销售收入 (百万元)
40 30 20 10 0 0 20 40 60 80 100
广告费(万元)
钢材消费量与国民收入
2500
2000
1500
钢材消费量(万吨)
1000
500
0
(相关图)
0
500
1000
1500
2000
2500
3000
国民收入(亿元)
例子
表1 某企业产量与生产费用的关系
企业编号 1 2 3 4 5 6 7 8
量,哪个是因变量,变量都是随机的。
• 2. 回归分析是对具有相关关系的变量间
的数量联系进行测定,必须事先确定变
量的类型。通常因变量是随机的,自变
量可以是随机的,也可以是非随机的。
第二节 简单线性相关分析
统计学第七章、第八章课后题答案
统计学第七章、第⼋章课后题答案统计学复习笔记第七章参数估计⼀、思考题1.解释估计量和估计值在参数估计中,⽤来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本⽐例、样本⽅差等。
根据⼀个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)⽆偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的⽅差尽可能⼩。
对同⼀总体参数的两个⽆偏估计量,有更⼩⽅差的估计量更有效。
(3)⼀致性:是指随着样本量的增⼤,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道⼀些调查结果只给出百分⽐和误差(即置信区间),并不说明置信度,也不给出被调查的⼈数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查⼈数是负责任的表现。
这样则可以由此推算出置信度(由后⾯给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间95%仅仅描述⽤来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,⽆穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某⼀样本数据得到总体参数的某⼀个95%置信区间,就以为该区间以的概率覆盖总体参数。
5.简述样本量与置信⽔平、总体⽅差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信⽔平1-α、总体⽅差、估计误差E 之间的关系为与置信⽔平成正⽐,在其他条件不变的情况下,置信⽔平越⼤,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越⼤;与总体⽅差成正⽐,总体的差异越⼤,所要求的样本量也越⼤;与与总体⽅差成正⽐,样本量与估计误差的平⽅成反⽐,即可以接受的估计误差的平⽅越⼤,所需的样本量越⼩。
社会统计学第7章假设检验的基本概念
•小概率 原理:
如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件)在 一次试验中几乎不可能发生的;要是在一次试 验中A竟然发生了,就有理由怀疑该假设的真实 性,拒绝这一假设。
总体
抽样
(某种假设)
检验
(接受)
小概率事件 未发生
样本 (观察结果)
H0:μ≤μ0,H1:μ>μ0(右端检验)
右端检验与左端检验
右端检验:临界值和显
著性水平有如下的关系式:
P(Z>Z)= 左端检验:临界值和显著
性水平有如下关系式:
P(Z<-Z)=
注意:相同的情况下,
接受域
否定域
Z
一端检验比二端检验功效高些,
也就是说二端检验更难否定研
接受域
究假设。
否定域-Z
四、假设检验的检验规则
第七章
假设检验的基本概念
一、什么是假设检验
所谓假设检验,就是先成立一个关于 总体情况的假设,然后抽取一个随机样本, 以样本的统计值来验证对总体的假设。
假设检验的意义:由于我们难以完全 知道所关心的总体的数量特征与变化情况, 因此常常需要对其进行假设,而假设是否 成立,需要进行检验。
假设在社会科学中可以用于不同的层次。最高 层次是理论假设,而理论层次的假设一般是无法加 以直接验证的。为了能从理论上证实这些假设,必 须概念操作化,把理论假设转变为可操作的经验性 假设。再通过社会调查证明原有的假设是否合理。
显著性水平
显著性水平,一般是指在原假设成立
条件下,统计检验中所规定的小概率的标
准,即规定小概率的数量界线,常用的标
准有=0.10,=0.05或=0.01(即否定
统计学答案第七章
1 估量量的含义是指()。
A.用来估量整体参数的统计量的名称B.用来估量整体参数的统计量的具体数值C.整体参数的名称D.整体参数的具体数值2 在参数估量中,要求通过样本的统计量来估量整体参数,评判统计量的标准之一是使它与整体参数的离差越小越好。
这种评判标准称为()。
A.无偏性B.有效性C.一致性D.充分性3 依照一个具体的样本求出的整体均值的95%的置信区间()。
A.以95%的概率包括整体均值B.有5%的可能性包括整体均值C.必然包括整体均值D.要么包括整体均值,要么不包括整体均值4 无偏估量是指()。
A.样本统计量的值恰好等于待估的整体参数B.所有可能样本估量值的数学期望等于待估整体参数C.样本估量值围绕待估整体参数使其误差最小D.样本量扩大到和整体单元相等时与整体参数一致5 整体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。
A.样本均值的抽样标准差B.样本标准差C.样本方差D.整体标准差6 当样本量一按时,置信区间的宽度()。
A.随着置信系数的增大而减小B.随着置信系数的增大而增大C.与置信系数的大小无关D.与置信系数的平方成反比7 当置信水平一按时,置信区间的宽度()。
A.随着样本量的增大而减小B.随着样本量的增大而增大C.与样本量的大小无关D.与样本量的平方根成正比8 一个95%的置信区间是指()。
A.整体参数有95%的概率落在这一区间内B.整体参数有5%的概率未落在这一区间内C.在用一样方式构造的整体参数的多个区间中,有95%的区间包括该整体参数D.在用一样方式构造的整体参数的多个区间中,有95%的区间不包括该整体参数9 95%的置信水平是指()。
A.整体参数落在一个特定的样本所构造的区间内的概率为95%B.在用一样方式构造的整体参数的多个区间中,包括整体参数的区间比例为95%C.整体参数落在一个特定的样本所构造的区间内的概率为5%D.在用一样方式构造的整体参数的多个区间中,包括整体参数的区间比例为5%10 一个估量量的有效性是指()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
• 拒绝H0,接受H1。 我们要么作出了正确的判断, 要么所犯错误为显著度(p)。
这是研究者最想看到的情况:我们提出的研究假设 被证实了,即便犯错误,错误也很小。
21
(三)H0与真实情况不符合。不拒绝H0。 • 真实情况不是H0 假定的情况。但是样本值出现的 概率不小。没有办法根据小概率的原则拒绝H0 , 只好认为H0的情况是有可能真实的,此时,我们 会犯错误:乙种误差(β)。
6
例子:
研究假设H1:同意人数≠反对人数(P ≠ Q) 虚无假设H0 :同意人数=反对人数(P = Q) 随机样本的情况是p ≠ q。(n=10,r=9) 根据H0成立二项抽样分布: 得:p(9)=0.010 随机样本的情况在H0假设的总体中出现概率很小, 因此否定H0 ,转而认为H1可能正确。 结论:总体的情况是同意人数≠反对人数。
第三篇
统计推论:单变量与双变量
1
• 第五章:抽样与统计推论 • 第六章:参数值的估计
• 第七章:假设检定:均值与百分率
• 第八章:假设检定:两个变量的相关
2
第一节 基本知识
一、研究假设(H1)与虚无假设(H0) 二、否定域与显著度 三、一端检定与两端检定 四、甲种误差与乙种误差 五、参数检定法与非参数检定法
29
六、检定假设的步骤
一般步骤:
①根据研究假设(H1),写出虚无假设(H0)。 ②选择适当的检定法,并列举相关要求。 ③确定抽样分布,根据H0的假定成立抽样分布。 ④决定显著度,并依据H1的性质选择一端或两端假 定,从抽样分布中计算否定域的大小和位置。 ⑤根据样本资料计算检定值。从而做出决策(是否 拒绝H0),得出结论。
14
同样的显著度下, 两端检定比一端检定更难否定H0。
15
选择一端或两端检定的原则:
• 研究假设可以定出方向就使用一端检定,
如果H1:P>Q,则使用二项分布的右端 如果H1:P<Q,则使用二项分布的左端
• 不能定出方向则使用两端检定。 H Nhomakorabea:P ≠ Q
16
四、甲种误差和乙种误差
• 当我们用样本统计值来检验假设的时候,无论是 否接受H0,都可能犯错误。 • 如果我们否定H0 ,但是实际上H0是对的,那么我 们就会犯甲种误差(α)(又称第一类误差)。这个 可能性就是我们选择的显著度。
提问:能不能根据这个结果证明研究假设正确呢?
• 因为这个结果的出现, ①既可能因为总体情况就是如此, ②也可能是因为抽样误差造成的:总体中同意和不 同意的人数相同,但是我们抽取的样本中却不同。
5
假设检定的原理
• 假设检定的基本原则是直接检定H0,从而间接检 定H1。检定H0的目的是排除抽样误差的可能。 原理: ①根据H0成立抽样分布,检测随机样本的情况在这 种分布中出现的概率的大小。 ②如果概率较小则否定H0,转而认为H1可能正确; 如果概率不那么小,则不能否定H0,那么则认为 H1可能不正确。
3
一、研究假设和虚无假设
• 研究假设(H1):研究者提出来的假设。我们的 最终目的是要检验这个假设是否成立。 • 虚无假设(零假设)(H0):与研究假设对立的 假设,是我们直接进行检验的假设。我们通过检 验这个假设来间接检验研究假设。 • 检验虚无假设的目的是为了排除抽样误差。
4
例子:
• 研究假设H1:同意人数≠反对人数(P ≠ Q) • 随机样本的情况是p ≠ q。
• 纳伪的错误。
22
(四)H0与真实情况符合。不拒绝H0。 • 样本值在H0的总体出现的概率不小。样本有可能 就是在H0的总体中抽出的,因此接受H0 。我们据 此怀疑H1 ,就是正确的。 • 然而在总体未知的情况下,我们不知道总体的情 况是哪一种情况,接受H0,只能说明的H0总体中 可能抽出这样的样本, H1的总体中也能抽出这样 的样本,我们无法判断,样本更能代表哪一种总 体。
11
12
显著度(p):
• 否定域在整个抽样分布中所占的比例。 • 也就是在H0的抽样分布中,抽出现有样本的可能性。 • 社会学研究中常用的显著度是p ≦0.05,有时也使 用p ≦0.01。 • 显著度越小,越难否定H0,也就越难证明H1是正 确的。
13
三、一端检定和两端检定
• 在检定虚无假设时, 选择抽样分布的一 端作为否定域,叫 做一端检定(单尾 检定)。 • 选择抽样分布的两 端作为否定域,叫 做两端检定(双尾 检定)。
30
23
不拒绝H0, 要么正确,但是对总体仍然认识不清。 要么所犯错误未知(β)。
24
25
两种误差之间的关系
• 在样本量和统计方法确定的前提下,甲种误差和 乙种误差是对立的,成反比。 • 在研究时要减少否定正确(弃真)的可能性(甲 种误差)就会增加接受错误(纳伪)的可能性。
• 要完全消除两种误差的矛盾是不可能的,但是增 大样本量可以在一定程度上同时减少两种误差。
• 相反,如果我们不能否定H0 ,但是实际上H0是不 对的,我们所犯的错误称为乙种误差(β)(又称 第二类误差)。
17
真实情况:未知 研究假设H1 虚无假设H0
• 检验H0有四种结果: 考察①H0是否为真实情况(是与否), 和②对待H0的两种态度(拒绝和不拒绝)
18
假设检定的四种结果
(一)H0与真实情况不符合。拒绝H0。
9
二、否定域和显著度
这个事先选定的,用来否定H0的范围叫做否定域。
这个否定域占整个抽样分布的比例就是我们所说的 “小到这个程度”,这个比例叫做显著度(p)。
10
否定域(CR)
• 在抽样分布一端或者两端的小区域,如果样本的 统计值在此区域范围内,则否定虚无假设。 • 否定域是一端还是两端取决于研究假设的性质。
• 否定H0就是排除了抽样误差的可能。即:在H0假 定的总体中出现样本值的概率很小,我们根据小 概率原则否定了它,是正确的。
• 此时我们认为研究假设H1可能是正确的(反映了 总体的情况。)
19
(二)H0与真实情况符合。拒绝H0。 • 真实情况是H0 假定的情况。否定了H0 ,即样本 的值有可能恰巧从这样总体中抽出来的,概率虽 然很小,但还是发生了。否定了这种情况,我们 就会犯错:甲种误差。 • 在总体中抽出这样的样本的概率最大不会超过我 们选定的显著度。因此甲种误差最大值是显著度 (α≤p)。 • 弃真的错误。
• 非参数检定法(分布自由检定法) :这类统计
推论的方法不要求总体具备特殊条件。也不要求 定距变量,因此可以推论定类或者定序资料。 (χ²)
28
选择检定法的原则: • 总体如果具备某些条件,最好使用参数检定法, 这样检定力比较高。 • 总体如果不具备这些条件,最好使用非参数检定 法。 • 但只要样本量足够大,两类检定法的检定力都会 增大。
26
五、检定力:参数法和非参数法
统计法的检定力: 该统计法能够准确判断虚无假设正误的能力。
• 统计推论时,甲种误差的大小是确定的,因此检 定力的大小取决于乙种误差的大小:统计推论时 所犯的乙种误差越小,该统计法的检定力就越大。
27
• 参数检定法:这类统计推论的方法要求总体备
具某些条件。一般要求定距变量。(Z/t/F) 统计法要求总体具备的条件越多,检定力就越强。 但如果总体不符合这些条件,检定力就大大下降。
7
如果:n=10,r=7 那么,p(7)=0.117 • 我们有11.7%的可能性在H0假定的总体中抽出这 样的样本,这个概率并不太小,因此我们不能够 否定H0 ,因此要怀疑H1的正确性. • 结论:我们不能认为总体中同意人数≠反对人数 (P ≠ Q)
8
样本在H0的抽样分布下,出 现的概率要小到什么程度才能 否定H0呢?