袁卫《统计学》笔记和典型题(含考研真题)详解(方差分析与实验设计)【圣才出品】

合集下载

统计学

统计学

分组之后
图表
计算频数
形成频数分布表


例题:某生产车间50名工人日加工零件数如 下(单位:个) 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
累积的人口百分比
绝对公平线
基尼系数
1.
20世纪初意大利经济学家基尼根据洛伦茨曲线给出了衡量收入 分配平均程度的指标
A 基尼系数= A B
2.
3. 4. 5. 6. 7.
A表示实际收入曲线与绝对平均线之间的面积 B表示实际收入曲线与绝对不平均线之间的面积 A 如果A=0,则基尼系数=0,表示收入绝对平均 B 如果B=0,则基尼系数=1,表示收入绝对不平均 基尼系数在0 和1之间取值 一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在 0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成 极大的分配不公;基尼系数在0.4被认为是收入分配不公平的 警戒线,超过了0.4应该采取措施缩小这一差距。
分组步骤

袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)

袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)

第6章方差分析与实验设计

一、单项选择题

1.方差分析所要研究的问题是()。

A.各总体的方差是否相等

B.各样本数据之间是否有显著差异

C.分类型自变量对数值型因变量的影响是否显著

D.分类型因变量对数值型自变量的影响是否显著

【答案】C

【解析】方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所要研究的问题就是分类型自变量对数值型因变量的影响。

2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。

A.提高

B.降低

C.等于0

D.等于1

【答案】B

【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:

1-(1-α)6=0.265>0.05。方差分析则排除了错误累积的概率。

3.在单因素方差分析中,涉及的两个变量是()。

A.数值型变量

B.分类型变量

C.一个分类型自变量和一个数值型的因变量

D.一个数值型的自变量和一个分类型自变量

【答案】C

4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。

A.只包括随机误差

B.只包括系统误差

C.既包括随机误差,也包括系统误差

D.有时包括随机误差,有时包括系统误差

【答案】C

【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。

袁卫《统计学》(第3版)课后习题-概率、概率分布与抽样分布(圣才出品)

袁卫《统计学》(第3版)课后习题-概率、概率分布与抽样分布(圣才出品)

对其进行估计从而作出相应的决策,那就需要应用主观概率。
主观概率需要人们根据经验、专业知识、对事件发生的众多条件或影响因素进行分析,
以此确定主观概率。
3.概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)区别 概率密度函数只是给出了连续型随机变量某一特定值的函数值,这一函数值不是真正意 义上的取值概率,连续型随机变量在给定区间内取值的概率对应的是概率密度函数 f(x)曲 线(或直线)在该区间上围成的面积,这一特征恰恰意味着连续型随机变量在某一点的概率 值为 0,因为它对应的面积为 0。而分布函数 F 在 x 处的取值,就是随机变量 X 的取值落在 区间(-∞,x)的概率。 (2)联系
ຫໍສະໝຸດ Baidu
① F(x) = f (x)dx ;②若 f(x)在 x 处连续,则有 F(x) = f (x) 。 −
4.全概率公式与逆概率公式分别用于什么场合?
答:(1)全概率公式为:
n
n
P(A) = P(ABi ) = P(Bi )P(A| Bi )
i=1
i=1
其中 B1,B2,…, Bn 是互不相容的事件且 B1∪B2∪…∪ Bn =Ω,P(Bi)>0, i =1,
2.概率的三种定义各有什么应用场合和局限性? 答:(1)古典概率 古典概率的应用要求样本空间,即出现的结果是有限的并且是已知的。例如:已知一个 骰子掷出的点数是 1 至 6 点,两个骰子同时掷,出现的点数是 2 至 12 点等。机会游戏的很 多问题可以满足这些条件。但现实生活的实际问题样本空间或者出现的结果无限或者未知, 因而古典概率的应用具有较强的局限性。 (2)统计概率 统计概率通常是计算大量重复试验中该事件出现次数的比率。但有些试验是不能重复的。 例如:投资开设一家餐馆,那么要预测这家餐馆生存 5 年的概率,就不可能重复地将这家饭 馆开很多家。

袁方社会研究方法教程重排本笔记和考研真题详解

袁方社会研究方法教程重排本笔记和考研真题详解

袁方《社会研究方法教程》(重排本)笔记和考研真题详解目录

第一部分笔记及典型题(含考研真题)详解

第一篇社会研究原理与过程

第一章绪论——科学与社会研究

1.1复习笔记

1.2考研真题与典型题详解

第二章社会研究发展史

2.1复习笔记

2.2考研真题与典型题详解

第三章社会研究的方法论问题

3.1复习笔记

3.2考研真题与典型题详解

第四章社会研究的过程

4.1复习笔记

4.2考研真题与典型题详解

第五章社会研究的设计

5.1复习笔记

5.2考研真题与典型题详解

第六章测量

6.1复习笔记

第七章抽样

7.1复习笔记

7.2考研真题与典型题详解第二篇资料收集

第八章问卷法

8.1复习笔记

8.2考研真题与典型题详解第九章访问法

9.1复习笔记

9.2考研真题与典型题详解第十章量表与测验法

10.1复习笔记

10.2考研真题与典型题详解第十一章观察法

11.1复习笔记

11.2考研真题与典型题详解第十二章实验法

12.1复习笔记

12.2考研真题与典型题详解第十三章文献法

13.1复习笔记

第三篇资料分析

第十四章资料整理

14.1复习笔记

14.2考研真题与典型题详解第十五章资料的统计分析

15.1复习笔记

15.2考研真题与典型题详解第十六章变量分析的逻辑和策略

16.1复习笔记

16.2考研真题与典型题详解第十七章多元分析概论

17.1复习笔记

17.2考研真题与典型题详解第十八章路径分析

18.1复习笔记

18.2考研真题与典型题详解第十九章因素分析

19.1复习笔记

19.2考研真题与典型题详解第二十章社会网络分析

20.1复习笔记

第二十一章数理分析简介

21.1复习笔记

统计学(第四版)袁卫 庞皓 贾俊平 杨灿 统计学 第七章练习题参考解答

统计学(第四版)袁卫 庞皓 贾俊平 杨灿 统计学 第七章练习题参考解答

平方和的均值 (MSS)
来自回归(ESS) 65965
来自残差(RSS)
总离差(TSS)
66042
14
计算RSS、计算可决系数和修正的可决系数。 该回归分析中样本容量是多少?ESS和RSS的自由度是多少? 怎样检验x2和x3对y是否有显著影响?根据以上信息能否确 定x2和x3各自对y的贡献为多少?
练习题7.7参考答案
(1) 估计随机误差项的方差 ˆ 2 ei2 63170073 2429618.192
n 2 28 2
(2) 分析回归方程的拟合优度,并与第4题所建立的回归方程相比较
由Excel中回归结果得到: , R2 0.997832
与第4题回归模型的 相比,可决系数有所提高.
(3)检验各回归系数的显著性。
(1)该回归分析中样本容量是14+1=15 (2)计算RSS=66042-65965=77 (3) ESS和RSS的自由度:
ESS的自由度为 k-1=2, RSS的自由度为 n-k=15-3=12
(4)计算可决系数: R2 65965/66042=0.9988
修正的可决系数
R2 1 15 1 (1 0.9988) 0.9986 15 3
yˆ f 40.3720 0.7863xf 40.3720 0.7863 800 669.412 万元

统计学 袁卫 第四版4版 笔记和课后习题含考研真题详解答案解析

统计学 袁卫 第四版4版 笔记和课后习题含考研真题详解答案解析

-172-
-173-
-174-
-175-
-176-
-177-
-178-
-179-
-180-
-181-
-182-
-183-
-184-
-185-
-186-
-187-
-188-
-189-
-190-
-191-
-192-
-193-
-194-
-195-
-196-
-122-
-123-
-124-
-125-
-126-
-127-
-128-
-129-
-130-
-131-
-132-
-133-
-134-
-135-
-136-
-137-
-138-
-139-
-140-
-141-
-142-
-143-
-144-
-145-
-146-
-66-
-67-
-68-
-69-
-70-
-71-
-72-
-73-
-74-
-75-
-76-
-77-
-78-
-79-
-80-
-81-
-82-
-83-
-84-
-85-
-86-
-87-

《统计学》(第四版)袁卫 课后答案

《统计学》(第四版)袁卫 课后答案
〔1〕原假设和备择假设是一个完备事件组。〔2〕一般先确定备择假设。再确定原假设。〔3〕等号“=〞总是放在原假设上。〔4〕假设确实定带有一定的主观色彩。〔5〕假设检验的目的主要是收集证据来拒绝原假设。
2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为 。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为 。在其他条件不变时, 增大, 减小; 增大, 减小。
8.此题需先检验两总体的方差是否相等:
在5%的显著性水平下,
,不拒绝原假设
认为两总体方差是相同的。
〔1〕
即〔1.93,17.669〕
〔2〕
即〔0.27,19.32〕
11.大样本的情况
〔1〕90%置信度下
〔3.021%,16.979〕
〔2〕95%置信度下
〔1.684%,18.316%〕
12.解:由题可计算:
(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组
单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围〔区间〕作为一个组。
统计分组应遵循“不重不漏〞原那么

袁卫《统计学》配套题库【章节题库】第1章~第3章【圣才出品】

袁卫《统计学》配套题库【章节题库】第1章~第3章【圣才出品】

2.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔 50 名学生抽取一名学生进行调查,这种调查方法是( )。[山东大学 2017 研]
A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样 【答案】C
1 / 90
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
A.自填式问卷调查 B.面访式问卷调查 C.实验调查 D.观察式调查 【答案】A 【解析】自填式问卷调查是指在没有调查员协助的情况下,由被调查者自己填写,完成 调查问卷的调查方式,本题属于这种方式,A 项正确。
4.某城市进行私营企业消防设备安全检查,个体是( )。[浙江工商大学 2017 研] A.每一个私营企业 B.每个私营企业的消防设备 C.私营企业的每一个消防设备 D.私营企业的全部消防设备 【答案】C 【解析】总体是统计所需要研究的客观事物的全体,个体是组成总体的各个单位,是某 种事物。对某城市进行私营企业消防设备安全检查的对象是消防设备,因此个体为私营企业 的每个消防设备。
6.按照随机性原则,从研究现象的总体中抽取出一部分单位进行调查,从数量上对总 体进行推断,这种调查方式是( )。[浙江工商大学 2017 研]
A.重点调查 B.典型调查 C.统计报表 D.抽样调查 【答案】D
3 / 90
圣才电子书 十万种考研考证电子书、题库视频学习平台

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

各章练习题答案第2章统计数据的描述

2.1 (1)属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级家庭数(频率)频率%

A1414

B2121

C3232

D1818

E1515

合计100100

(3)条形图(略)

2.2 (1)频数分布表如下:

(2)某管理局下属40个企分组表

按销售收入分组(万元)企业数(个)频率(%)

先进企业良好企业一般企业落后企业11

11

9

9

27.5

27.5

22.5

22.5

合计40 100.0 2.3 频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)频数(天)频率(%)

25~30 30~35 35~40 40~45 45~50

4

6

15

9

6

10.0

15.0

37.5

22.5

15.0

合计40 100.0 直方图(略)。

2.4 (1)排序略。

(2)频数分布表如下:

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

合计100 100 直方图(略)。

2.5 (1)属于数值型数据。

(2)分组结果如下:

分组天数(天)

-25~-20 6

-20~-15 8

-15~-10 10

-10~-5 13

-5~0 12

0~5 4

5~10 7

合计60

(3)直方图(略)。

2.6 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

研究生-统计学讲义-第5讲-第5章-方差分析

研究生-统计学讲义-第5讲-第5章-方差分析
组均数 x j 之差的平方和(记为SS组内)来表示,
k nj
S组 S 内 (XijXj)2 (nj1)S2 j j1i1
显然SS组内的大小还与各样本例数 nj 的多少有关, 确切地说与自由度df组内(df组内=Σnj - k)有关,所以计算 组内方差,称为组内均方(within group mean square ,记为MS组内,MS组内=SS组内 / df组内=[Σ(nj -1)sj2 ]/ (Σnj -k)。
(1-α)m
总的检验犯第一类错误的概率为 :
1-(1-α)m
α值很小的时,1- (1-α)m ≈ m×α
以Pmin代表m次t检验中的最小 P 值,以P校正代表 校正P 值,当P校正≈ m×Pmin时,总的检验水准近似 是α。所以,当总检验水准为α时,进行多组间两两比 较须坚持P校正 = m×Pmin≤α作为判断具有统计学意 义的界值;换言之,只有 m 次 t 检验中的
(3) 各比较组总体方差相等(σ12=σ22=…=σk2),称为方 差齐性〔homogeneity of variance〕。方差分析的这一 应用条件主要是对完全随机设计资料而言,注意:无 重复数据的方差分析,如配伍设计、交叉设计、正交 设计的方差分析,因每个单元格子中只有一个观察数 据,不需考虑正态性和方差齐性的要求。
对照 组
14
10
12
16

袁卫《统计学》配套题库【课后习题】第4章~第6章【圣才出品】

袁卫《统计学》配套题库【课后习题】第4章~第6章【圣才出品】

第4章参数估计

思考题

1.简述评价估计量好坏的标准。

答:(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。

设总体参数为θ,所选择的估计量为∧θ,如果E (∧θ)=θ,则称∧

θ为θ的无偏估计量。

(2)有效性,指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。

(3)一致性,指随着样本量的增大,点估计量的值越来越接近被估总体的参数。即一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。2./2a z n

的含义是什么?答:z α/2是标准正态分布上侧面积为α/2时的z 值;/2

a z n 是估计总体均值时的边际误差,也称为估计误差或误差范围。

3.说明区间估计的基本原理。

答:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。

4.解释置信水平的含义。

答:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平,或称为置信系数。

5.解释置信水平为95%的置信区间。

答:抽取100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含。

6.简述样本量与置信水平、总体方差、允许误差的关系。

答:(1)样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;

(2)样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;

(3)样本量与允许误差的平方成反比,即允许误差越大,所需的样本量就越小。练习题

【精品】统计学 袁卫 第四版4版 笔记和课后习题含考研真题详解答案解析_1【上册】

【精品】统计学 袁卫 第四版4版 笔记和课后习题含考研真题详解答案解析_1【上册】

-96-
-97-
-98-
-99-
-100-
-101-
-102-
-103-
-104-
-105-
-106-
-107-
-108-
-109-
-110-
-111-
-112-
-113-
-114-
-115-
-116-
-36-
-37-
-38-
-39-
-40-
-41-
-42-
-43-
-44-
-45-
-46-
-47-
-48-
-49-
-50-
-51-
-52-
-53-
-54-
-55-
-56-
-57-
-58-
-59-
-60-
-61-
-62-
-63-
-64-
-65-
-66-
-67-
-68-
-69-
-70-
-71-
-72-
-73-
-74-
-75-
-76-
-77-
-78-
-79-
-80-
-81-
-82-
-83-
-84-
-85-
-86-
-87-
-88-
-89-
-90-

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

各章练习题答案第2章统计数据的描述

2.1 (1)属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级家庭数(频率)频率%

A1414

B2121

C3232

D1818

E1515

合计100100

(3)条形图(略)

2.2 (1)频数分布表如下:

(2)某管理局下属40个企分组表

按销售收入分组(万元)企业数(个)频率(%)

先进企业良好企业一般企业落后企业11

11

9

9

27.5

27.5

22.5

22.5

合计40 100.0 2.3 频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)频数(天)频率(%)

25~30 30~35 35~40 40~45 45~50

4

6

15

9

6

10.0

15.0

37.5

22.5

15.0

合计40 100.0 直方图(略)。

2.4 (1)排序略。

(2)频数分布表如下:

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

合计100 100 直方图(略)。

2.5 (1)属于数值型数据。

(2)分组结果如下:

分组天数(天)

-25~-20 6

-20~-15 8

-15~-10 10

-10~-5 13

-5~0 12

0~5 4

5~10 7

合计60

(3)直方图(略)。

2.6 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

统计与决策--袁卫

统计与决策--袁卫

统计与决策

袁卫中国人民大学副校长

第一部分绪论

同志们,同学们,大家好!下面我们一起学习统计与决策。这一部分共分3个单元,第一单元介绍统计的应用,我把它称为绪论;第二单元介绍描述统计,就是搜集数据、整理数据的一些基本知识;第三单元介绍如何应用统计方法来帮助我们进行管理,进行决策。

首先,我们看一下什么是统计。我们每一个人在做每一项工作时都会有自己对统计的认识,比如,我们经常在报刊上看到类似这样的消息:“思科公司(Cisco)在纳期达克周一收盘时的市值为5550亿美元”,这条信息就是一个统计分析的结果,就是经济管理统计的一项工作。再比如,“50家最大公司CEO的年均收入是930万美元”,这是2000年福布斯报道的一个消息,这又是一个统计,里边含有一个概念,即:什么是“平均收入”,它反映了什么样的问题,能够带给读者什么样的信息?再看第三个,“股票平均能够使75%的投资者盈利”,这样的一条信息又意味着什么?我们在国内的报刊上也经常看到这样一些信息,比如:股票的一个百分比。对于每一位投资者,当你进行投资选择的时候,这个百分比会有什么样的作用呢?

统计,简单地说就是搜集数据、整理数据、分析数据的一些简单方法。如果用更简单的方法给它下个定义,统计就是处理数据的一门科学。更简单地说,统计学就是数据的科学。由于现在任何一项工作在信息时代都有很多数据,我们在日常的工作和生活中都离不开数据,因而,统计离我们的生活很近很近。

下面我就分别介绍统计在经济管理中的一些主要应用,这里叫做统计在商务中的应用。

首先我举一个财务会计方面的例子。会计师事务所在对某公司进行审计的时候,并不是要对它的每一笔流水都进行核实,因为通常一个规模较大的公司,一年的经济往来会有几万、甚至几十万笔,如果对每一笔业务都做逐项核对,会花费大量的时间、精力、人力、物力。他们所做的工作是选择一个抽样的方式,从有效的应收帐款账目中抽取一小部分进行核实。但是,根据对这一小部分账目核实的结果,他们就能对这个公司整体的经济运行状况做出一个结论,即:这个公司在财务方面是否合法,是否遵守规章制度,是否有财经方面的问题。因此,从大量的数据中抽出一部分作为样本,并且通过对样本的分析和计算,就能够推断出总体,正是统计的科学性所在。

袁卫《统计学》(第3版)课后习题-国民经济统计基础知识(圣才出品)

袁卫《统计学》(第3版)课后习题-国民经济统计基础知识(圣才出品)
转移价值 c ,包括劳动手段转移价值(即固定资产折旧) c1 和劳动对象转移价值(即中间消耗) c2 ;②活劳动新创的价值,包括必要劳动价值 v 和剩余劳动价值 m 。
从实物形态看,社会生产活动的总成果即社会总产品可分为货物和服务两大类。 从核算和分析的角度看,国内总产出只是一个有关国民经济生产过程的“总周转量”指 标,它能够表明全社会生产活动的总规模,并能用于对国民经济各部门问的技术经济联系进 行投入产出分析,但是,它不能说明国民经济生产活动的最终成果。 (2)国内生产总值是用货币计量的由本国常住单位所创造的社会最终产品的总量,同 时又是全社会各常住单位所创造的增加值的总和。 从价值的角度看,在国民经济生产活动中的价值也可以分为两种:一种是中间消耗价值,
算折旧时也难以做到客观、统一。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
5.请判断以下论述正确与否,并说明理由。 (1)第三产业的所有部门都属于非物质生产部门。 【答案】× 【解析】所谓物质生产部门,在我国主要是指农业、工业、建筑业、运输邮电业和商业 这五个部门。第三产业是指凭借一定的物质技术设备,为生产和生活服务的部门。它包括四 个层次。第三产业中的第一层次和第二层次中的一部分应为物质生产部门。 (2)一国的国内生产总值总是小于国民可支配总收入。 【答案】× 【解析】国民可支配总收入=国内生产总值+来自国外的要素收入与经常转移收入净额, 来自国外净要素收入与来自国外经常转移净额都可能大于零,也可能小于零。故

统计学课后习题答案袁卫

统计学课后习题答案袁卫

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版

第1章绪论

1.什么是统计学?怎样理解统计学与统计数据的关系?

2.试举出日常生活或工作中统计数据及其规律性的例子。

3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求:

(1)描述总体;

(2)描述研究变量;

(3)描述样本;

(4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;

(2)研究变量:装满的油漆罐的质量;

(3)样本:最近的一个集装箱内的50罐油漆;

(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:

(1)描述总体;

(2)描述研究变量;

(3)描述样本;

(4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐”

(2)研究变量:更好口味的品牌名称;

(3)样本:1000名消费者品尝的两个品牌

(4)推断:两个品牌中哪个口味更好。

第2章统计数据的描述——练习题

●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
第 6 章 方差分析与实验设计
6.1 复习笔记 一、方差分析引论 1.方差分析及其有关术语 方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。 在方差分析中,所要检验的对象称为因素戒因子;因素的丌同表现称为水平戒处理;每 个因子水平下得到的样本数据称为观测值。 2.方差分析的基本思想和原理 组内误差:来自水平内部的数据误差。它反映了一个样本内部数据的离散程度,只含有 随机误差。 组间误差:来自丌同水平乊间的数据误差。这种差异可能是由于抽样本身形成的随机误 差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系 统误差的总和,它反映了丌同样本乊间数据的离散程度。 3.方差分析中的三个基本假定 (1)每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分 布总体的简单随机样本。 (2)各个总体的方差 σ2 必须相同,即对于各组观察数据,是从具有相同方差的正态总 体中抽取的。 (3)观测值是独立的。
2 / 40
圣才电子书
www.100xuexi.com
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
1 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
表 6-1 单因素方差分析的数据结构
3.方差分析中的多重比较
多重比较方法(例如最小显著差异方法)是通过对总体均值乊间的配对比较来迚一步检
验到底哪些均值乊间存在差异。最小显著差异方法(LSD)是由费希尔提出的,其迚行检验
的具体步骤为:
(1)提出假设:H0:μi=μj,H1:μi≠μj;
(2)计算检验统计量: xi x j ;
(3)计算 LSD,其公式为:
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应戒因子效应。其计算公式为:
k
SSA ni (xi x )2
i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响乊外,其他因素对
因变量的总影响。其计算公式为:
将 MSA 和 MSE 迚行对比,即得到所需要的检验统计量 F。当 H0 为真时,二者的比值
服从分子自由度为 k-1、分母自由度为 n-k 的 F 分布,即
F MSA F k 1, n k
MSE
(3)统计决策
若 F> F (k-1,n-k),则拒绝原假设 H0,表明 i ( i =1,2,…,k)乊间的差异
三、双因素方差分析 1.双因素方差分析及其类型 当方差分析中涉及两个分类型自变量时,称为双因素方差分析,包括: (1)无交互作用的双因素方差分析(又称为无重复双因素分析):两个因素对因变量 的影响是相互独立的; (2)有交互作用的双因素方差分析(又称为可重复双因素分析):两个因素搭配在一 起会对因变量产生一种新的效应。 2.无交互作用的双因素方差分析
是显著的,即所检验的因素对观测值有显著影响。
若 F< F (k-1,n-k),则丌拒绝原假设 H0,没有证据表明 i ( i =1,2,…,k)
乊间有显著差异,即这时还丌能认为所检验的因素对观测值有显著影响。
(4)方差分析表(如表 6-2 所示)
表 6-2 方差分析表的一般形式
误差来源
平方和 SS 自由度 df 均方 MS F 值
k ni
SSE
(xij xi )2
i1 j1
三个平方和乊间的关系为:
SST= SSA+ SSE
②计算统计量
均方:由于各误差平方和的大小不观测值的多少有关,为了消除观测值多少对误差平方
和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度。
三个平方和所对应的自由度分别为:
SST 的自由度为 n-1,其中 n 为全部观测值的个数;SSA 的自由度为 k-1,其中 k
P 值 F 临界值
组间(因素影响) SSA
k-1
MSA
MSA/MSE
组内(误差)
SSE
n-k
MSE
总和
SST
n-1
在迚行决策时,可以直接利用方差分析表中的 P 值不显著性水平 的值迚行比较。若
P< ,则拒绝 H0。
4 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
观测值
因素(i)
(j)
A1
A2

Ak
1
x11
x21

xk1
2
x12
x22

xk2
n
x1n
x2n

xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
LSD t / 2 (n k)
MSE
1 ni
1 nj
ቤተ መጻሕፍቲ ባይዱ
式中,k 是因素中水平的个数;MSE 为组内方差;ni 和 nj 分别是第 i 个样本和第 j 个样
本的样本量。
(4)根据显著性水平 作出决策:如果| xi x j |>LSD,则拒绝 H0;如果| xi x j | <LSD,则丌能拒绝 H0。
3 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
为因素水平(总体)的个数;SSE 的自由度为 n-k。
SSA 的均方(组间均方)MSA 为:
组间平方和 SSA
MSA
=
自由度 k 1
SSE 的均方(组内均方)MSE 为:
组内平方和 SSE
MSE
=
自由度 n k
观测值。从丌同水平中所抽取的样本量可以相等,也可以丌相等。
2.分析步骤
(1)提出假设
检验因素的 k 个水平(总体)的均值是否相等,需要提出假设为:
H0: 1 2 … i … k
自变量对因变量没有显著影响
H1:μi( i =1,2,…,k)丌全相等
自变量对因变量有显著影响
(2)构造检验的统计量
相关文档
最新文档