回归分析与非参数检验 - 侯 (1)
非参数检验方法
⾮参数检验⽅法⾮参数检验的推断⽅法不涉及样本所属总体的分布形式,也不会使⽤均值、⽅差等统计量,⾮参数检验是通过研究样本数据的顺序和分布的性质来构成理论基础,下⾯介绍⼀些⾮参数检验经常使⽤的样本数据信息:1.顺序:将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,其中Xi为第i个顺序量。
2.秩将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,Ri为Xi在这⼀列数据中的位置,称为秩,R1,R2,R3...Rn为样本数据的秩统计量3.结如果样本数据中存在相同的值,那么在排序时就会出现秩相同的情况,这样的情况称为结,结的取值是对应的秩的均值。
注意是秩的均值⽽不是数据本⾝的均值。
⾮参数检验的统计理论都是根据上述概念计算⽽来,此外,和参数检验⼀样,当我们得到分析数据的时候,最先做的⼯作还是先通过图表和⼀些描述性统计量对数据整体进⾏探索性分析,掌握数据⼤致分布情况、有⽆极端值等,为后续正确选择分析⽅法打下基础。
================================================ ====⾮参数检验主要应⽤在以下场合:1.不满⾜参数检验的条件,且⽆适当的变换⽅法进⾏变换2.分布类型⽆法获知的⼩样本数据3.⼀端或两端存在不确定值,如>10004.有序分类变量求各等级之间的强度差别更进⼀步来讲,⾮参数检验可以做以下分析:⼀、单样本总体分布检验⼆、两独⽴样本差异性检验三、两配对样本差异性检验四、多个独⽴样本差异性检验五、多个相关样本差异性检验可以看出,以上应⽤除了第⼀点之外,其他都有对应的参数检验⽅法,这就要根据样本数据的实际情况来进⾏选择了:适合使⽤参数检验的优先使⽤参数检验,否则使⽤⾮参数检验。
================================================ =下⾯我们分别介绍⼀下上述应⽤对应的⾮参数检验⽅法⼀、单样本总体分布检验单样本总体分布检验主要⽤来检验某样本所在总体分布和某⼀理论分布是否存在显著差异,主要涉及的⾮参数检验⽅法有:1.卡⽅检验卡⽅检验可以检验样本数据是否符合某⼀期望分布或理论分布,这在卡⽅检验中有所介绍,在此不再多说2.⼆项分布检验⼆项分布检验主要⽤来检验样本数据是否符合某个指定的⼆项分布,该检验只适合⼆分类变量样本。
第十章 非参数检验
10
11 12 13 14 15
70
85 75 68 70 65
66
67 65 70 78 67
76
80 90 86 85 75
SPSS过程演示
五、配对样本间非参数检验
1. 二项选择任务中配对样本间的差异比较 实例分析:某体育教师为了改进学校体育工作,有效增进 学生体质并提高其体育达标率,他采用匹配方法组织了两 个相等的教学试验组 ,一组作为控制组(group 1) ,继续
实例 2 :教务处要求各院系在本科生毕业设计的成绩评定中,注意 成绩等级的人数分布,一般应符合如下表格中第一行所示的比例 。
某院65名本科生毕业设计成绩等级分布如下表第二行数字。请问该
院系学生毕业设计的成绩评定是否符合学校要求?
评定等级
要求比例 某院各等级人数
优秀
10% 8
良好
50% 43
中等
30% 13
使用传统教学方法;一个组作为实验组(group2),采用
新的教学方法。经过一年的教学周期后进行达标测试,结 果如下页表所示。
请问新的体育教学方法有无明显的优势?其是否可以
有效地提高学生的体育达标率?(McNemar检验)
体育教学训练方法改革试验测试结果(不同方法训练后学生达标情况登记) 序号 1 2 3 4 5 6 7 8 控制组 达标 不达标 不达标 达标 不达标 不达标 达标 不达标 实验组 达标 达标 不达标 达标 达标 达标 达标 不达标
星期日 星期一 10500 星期二 11800 星期三 12200 星期四 13200 星期五 14000 星期六 18500
顾客数 15000
解决方案
SPSS过程演示
(1)建立数据文件,包括两个变量:“时间”、“顾客数”; (2)打开“DATA”菜单条选中“Weight cases…”打开对话框,将“顾客数” 变
第七讲非参数检验
2
➢ 非参数检验(nonparametric test)对
数据的总体分布类型不作严格假定, 又称任意分布检验(distribution-free test), ➢ 它直接对总体分布的位置作假设检
验。
3
参数检验
(parametric test)
已知总体分布类型,对 未知参数进行统计推断
计多样本比较
25
10
12
95
100
5
3
合计
─
─
─
54.5
11.5
ห้องสมุดไป่ตู้
8
检验步骤
1. 建立检验假设,确定检验水准
H0 :差值的总体中位数 Md 0 ;H1 :Md 0 ; 0.05
2. 求检验统计量T值
①省略所有差值为0的对子数 ②按差值的绝对值从小到大编秩,相同秩(ties) 则取平均秩
③任取正秩和或负秩和为T,本例取T=11.5。
T=93.5。
16
确定P值,作出推断下结论
1. 查表法 (样本含量较小,根据T查P值)
本例,概率为双侧0.05对应的T值为42-84,T=93.5,超出 该范围,故P<0.05,按α=0.05检验水准,拒绝H0,接受 H1,可以认为两组工人血铅值的总体分布的位置不同。
2. 若n1或n2-n1超出了成组设计T界值的范围, 可用正态近似性检验
0.05
①先确定各等级的合计人数、秩范围和平均秩, 见表8-3的(4)栏、(5)栏和(6)栏,再计算两样 本各等级的秩和,见(7)栏和(8)栏;
②本例n1=39超过了成组设计T界值表范围,需 用近似正态检验,由于相持过多,进行校正;
非参数统计秩相关分析和秩回归
非参数统计秩相关分析和秩回归非参数统计方法是一类不依赖于总体分布形式的统计方法,它们通常基于样本数据的秩次(rank)或者置换(permutation)来进行统计推断。
秩相关分析和秩回归是非参数统计中常见的两种方法,本文将对它们进行详细介绍。
一、秩相关分析秩相关分析是用于测量两个变量间相关性的方法,它适用于总体分布不满足正态分布假设或无法假设总体分布形式的情况。
秩相关系数可以反映两个变量之间的关系的强度和方向。
常见的秩相关系数包括Spearman相关系数、Kendall相关系数等。
Spearman相关系数是一种非参数的秩相关系数,它将原始数据转换为秩次,然后计算秩次之间的皮尔逊相关系数。
Spearman相关系数的取值范围在-1到1之间,当Spearman相关系数为0时,表示两个变量之间不存在线性关系;当Spearman相关系数为正值时,表示两个变量呈正相关关系;当Spearman相关系数为负值时,表示两个变量呈负相关关系。
Kendall相关系数也是一种非参数的秩相关系数,它与Spearman相关系数类似,但是不考虑秩次之间的距离。
Kendall相关系数的取值范围在-1到1之间,具有与Spearman相关系数类似的解释。
秩相关分析的步骤如下:1.对原始数据进行秩次转换,将每个变量的观测值按照从小到大的顺序进行排列,并用相应的秩次替代原始观测值。
2.计算秩次之间的秩相关系数。
3.使用适当的统计检验方法对秩相关系数进行显著性检验。
秩相关分析的优点是不依赖于总体分布形式,对异常值不敏感,而且可以比较有序变量和无序变量的相关性。
但是它也有一些限制,比如只能检测线性相关性,不能检测非线性相关性。
二、秩回归秩回归是一种非参数的回归分析方法,它用于研究自变量和因变量之间的关系,并不要求总体分布的形式。
秩回归与普通回归的区别在与秩回归是基于秩次转换后的数据进行建模分析的。
秩回归的优点是可以适用于各种类型的数据,不需要对数据进行正态化变换,对异常值不敏感。
非参数回归的介绍ppt课件
其中 W xd ia g(K h(xxi))n n
1 x1 x L
X
x
1
x2 x
L
M M
1
xn x
L
( x1
p
x)p !
(x2
x)p
p!
M
(xn x)p p !
Y1
Y
Y
2
M
Y
n
.
20
局部回归
得到加权最小二乘估计
m ˆh L P E (x ) X xˆ(x ) X x (X x T W x X x ) - 1 X x T W x Y
G-M估计是卷积形式的估计,P-C估计可看成G-M估计的近似: 当K连续 x (si1, si )
m ˆ h G M ( x ) i n 1 Y i( s i s i 1 ) K h ( x x ) m ˆ h P C ( x )
.
12
局部回归
核估计存在边界效应,边界点的估计偏差较大, 以N-W估计为例,如下图
写成线性光滑器的形式:
m ˆh PC(x) in1W hi(x)Yi W h i(x ) (x i x i 1 )K h (x x i)
在随机设计模型下,P-C估计可由x的密度估计:
fˆ(x)[n(xixi1)]1
推导出来,相关文献可参考härdle(1994)和 李竹渝等(2007)
.
11
局部回归
缺点:(1).回归函数的形式预先假定 (2).模型限制较多:一般要求样本满足某种分布要求,随机误差满足
正态假设,解释变量间独立,解释变量与随机误差不相关,等
(3)需要对模型的参数进行严格的检验推断,步骤较多 (4).模型泛化能力弱,缺乏稳健性,当模型假设不成立,拟合效果 不好,需要修正或者甚至更换模型
非参数检验综合概述PPT(30张)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
回归分析与非参数检验 - 侯 (1)
指导教师:滕颖俏
完成时间:2016年10月30日
实验目的:
掌握线性回归分析的主要目标及其具体操作,能够读懂基本分析结果,掌握计算结果之间的数量关系,并能够写出回归方程,对回归方程进行各种统计检验。了解SPSS非参数检验的具体操作,能够解释分析结果。
实验内容、实验步骤、实验结果及分析
一、线性回归分析
模型
平方和
df
均方
F
Sig.
1
回归
1.20E+07
3
4.01E+06
72.797
8.88E-13
残差
1.43E+06
26
55069.715
总计
1.35E+07
29
2) ,-117.8861表示销售价格越高,销售量越低,X1对Y的增长起抑制作用,X1与Y是负相关关系。80.6107表示各地区销售人员的人均收入越高,销售人员的工作积极性越高,所以销售量也越高,X2与Y是正相关关系。0.5012表示广告费用越高,销售量也越高,X3与Y是正相关关系。
(一)9.5粮食总产量
1.实验内容
先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。
2.实验步骤
步骤:分析→回归→线性→粮食总产量导入因变量、其余变量导入自变量→确定;分析→回归→线性→(向后)→确定
上表进行了回归系数的显著性检验,可以看出除粮食播种面积与农业劳动者人数变量的P-值均大于0.05,所以接受原假设,认为这些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。影响程度来由大到小依次是风灾面积、施用化肥量、总播种面积和年份(排除农业劳动者人数和粮食播种面积对粮食产量的影响)。
第十二章 非参数检验 (Nonparametric test
参数: 统计量: 参数检验:若样本所来自的总体 分布已知(如正态分布),对其 总体参数进行假设检验,则称为 参数检验。
非参数检验:不考虑研究对象总体
分布的具体形式,也不对总体参 数进行统计推断,而是对样本所 代表的总体分布进行检验。由于 这类方法不受总体参数的限制, 故称非参数检验,又称任意分布 检验(distribution-free test)
第一节 配对设计差值比较的 符号秩检验
由Wilcoxon于1945年提出
又称 Wilcoxon 符号秩和检验
常用于检验差值的总体中位数是否等 于零
P198 例12.1 为比较定量骨超声测定仪 与磁共振成象仪对原发性骨质疏松性椎 体骨折诊断结果是否有差别,某医师分 别对16例伴有脊椎压缩性骨折绝经妇女, 采用两法检测硬度(Stiffness)(%), 结果见表12-1。问两法检测结果是否有 差别?
秩和检验的两两比较
方法有: 1、扩展的t检验 2、Nemenyi法检验 3、q检验
几种方法理论上仍存在争议,故SAS、 SPSS等软件没有提供这方面的分析
第四节 配伍组设计的秩和检验
Friedman M检验
Friedman M检验法:
原始数据
区组间分别 进行编秩
区组 1 2 … b Ti
处理组 1 n11(3) n21(2) … ቤተ መጻሕፍቲ ባይዱb1(1) T1 2 n12(1) n22(4) … nb2(2) T2 … …
3 i
注意:仍为非参数检验
符号秩检验的基本思想
当H0(差值的总体中位数Md=0)成立时,任一配 对的差值出现正号与出现负号的机会均等,因此他们 的秩和T+与T-的理论数 (期望值)也应相等,由T+与T之和为n(n+1)/2可知,T+与T-的理论数为n(n+1)/4。 可以证明:当H0成立时,秩统计量T是以T=n(n+1)/4 为中心的对称分布,在大多数情况下T与n(n+1)/4的 差值较小(纯属抽样误差)。当n很大时,T近似服从均 数T为n(n+1)/4 ,方差为n(n+1)(2n+1)/24的正态分 布。H0不成立时,统计量T呈偏态分布,并且在大多 数情况下T远离n(n+1)/4 。因此在H0成立的情况下T 远离n(n+1)/4为小概率事件,可认为在一次抽样中是 不会发生的,故当出现这种情况时推断拒绝H0。
非参数检验的概念与过程
非参数检验的概念与过程导言在统计学中,非参数检验是一种不依赖于总体分布假设的方法,用于对数据进行统计推断。
与参数检验相比,非参数检验更加灵活,适用于各种数据类型和样本量的情况。
本文将介绍非参数检验的基本概念及其应用过程。
什么是非参数检验?在传统的统计推断中,我们通常需要假设数据的总体分布满足某种特定的参数化模型(如正态分布)。
然而,在实际应用中,我们并不总是了解或能够准确描述数据的分布。
此时,非参数检验成为一种有力的工具。
非参数检验不依赖于总体分布的假设,而是在不对数据做过多假设的情况下,通过对样本数据的排序、秩次转换等操作,进行统计推断。
非参数检验的应用场景非参数检验广泛应用于多个领域,特别是当数据不满足参数化分布假设时。
下面列举几个常见的应用场景:1. 样本量较小在样本量较小的情况下,参数化方法可能对数据分布的假设过于苛刻,导致结果不够准确。
而非参数检验则不对数据分布做过多要求,能够更灵活地处理小样本数据。
2. 数据不满足正态分布假设正态分布假设是很多参数检验方法的基础前提。
但在实际问题中,数据往往并不服从正态分布。
非参数检验不需要对数据做分布假设,因此更适用于处理不满足正态分布假设的数据。
3. 数据有序或等级性质对于无法直接度量或比较数值大小的数据,如排名数据、生活满意度评价等,非参数检验提供了一种适用的方法。
通过对数据的秩次进行比较,我们可以推断出两组数据是否存在显著差异。
非参数检验的基本过程非参数检验通常包括以下几个基本步骤:1. 建立原假设和备择假设在进行非参数检验之前,我们需要明确所研究的问题,并建立原假设(H0)和备择假设(H1)。
原假设通常是指两组样本没有显著差异,而备择假设则相反。
2. 选择合适的非参数检验方法根据实际问题和数据类型的特点,选择合适的非参数检验方法。
常用的非参数检验方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis单因素方差分析等。
第7章非参数检验分析
7.1.3 游程检验
在任一给定容量的样本中,游程的总数标志着样本是否是 随机的。如果0和1是随机出现的,则出现连续的很多0或 者连续的很多1的可能性很小,同时,0和1频繁交叉出现 的可能性也很小。如果游程的数目很少,就意味着样本由 于缺乏独立性而形成了一致的趋势或者成束结构;如果游 程数目很多,则表明有系统的短周期波动影响观察结果。
将两样本X1,X2, ,Xm和Y1,Y2, ,Yn 混合后按升序排列,求 出混合后每个数据的秩。然后分别将样本X1,X2, ,Xm和
Y1,Y2, ,Yn各个观察值的秩相加,记为W x 和W y ,平均秩记 为W x 和W y 。如果原假设成立,W x 和W y 相差应比较小。
m
n
m
n
28
混合排序后的样本数据 646 649 650 651 652 661 662 663 669 672 675 679 682 692 693
使用寿命.sav
工艺
使用寿命样本值
甲工艺(1) 675,682,692,679,669,661,693
乙工艺(2) 662,649,672,663,650,651,646,652
27
7.2.1 曼-惠特尼U检验
基本思路为:设两个样本X1,X2, ,Xm和Y1,Y2, ,Yn 分别来 自总体X和Y,将其观察值x1,x2, ,xm和y1, y2, , yn按照升序排 列,如果两样本均值相等,则观察值x1,x2, ,xm 中大于观察 值y1, y2, , yn的数量与观察值y1, y2, , yn中大于观察值x1,x2, ,xm 的数量应相差不多。其原假设为:总体X和Y的均值相等。
儿童身高.sav
24
7.2 两独立样本非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.实验内容
利用习题二第6题数据,选择恰当的非参数检验方法,分析不同收入人群本次存款金额的总体分布是否存在显著差异。
2.实验步骤
分析→非参数检验→多个独立样本→不同收入人群导入分组变量、本次存款金额导入检验变量列表→确定
3.实验结果及分析
在表中可以看出,在Kruskal-Wallis检验、中值检验、Jonckheere-Terpstra检验在显著水平为0.05下得到的sig值均为0.00<0.05,所以拒绝原假设,即认为不同收入人群本次存款金额的总体分布存在显著差异。
2.实验步骤
建立spss数据→加权个案→销售额进行加权→分析→非参数检验→两个独立样本检验→确定
3.实验结果及分析
据上表,Kruskal-Wallis检验、中值检验、Jonckheere-Terpstra检验在显著水平为0.05下得到的sig值分别为0.484,0.733,0.651均0.05,故接受原假设,不同日期对品牌销售量的分布无显著差异。
2.实验步骤
建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→多个独立样本→把年龄段导入分组变量(1-3)、满意程度导入检验变量列表→确定
3.实验结果及分析
从下表中可以看出,Kruskal-Wallis检验与中值检验在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。但Jonckheere-Terpstra检验的sig值为0.641>0.05,故接受原假设,认为不同年龄段人群对该商品满意程度的分布存在显著差异。
3)回归方程显著性Sig值为8.88341E-13<0.05,所以拒绝原假设,线性关系显著。
4)各变量显著性Sig值分别为0.00457,0.00103,0.00001,0.00049均小于0.05,拒绝原假设,各回归系数显著。
5)判定系数为:R2=回归和/综合=12026774.1/13458586.7=0.894
3.实验结果及分析
根据上表,在Kruskal-Wallis检验、中值检验、Jonckheere-Terpstra检验中,在显著水平为0.05下得到的sig值分别为0.00,0.00,0.047均0.05,拒绝原假设,认为不同国家对其评分有显著影响。
(六)7.6
1.实验内容
为分析大众对牛奶品牌是否具有偏好性,随机挑选超市了收集其周一至周六各天三种品牌牛奶的日销售额数据,如下表:请选择恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。
大连民族学院
数学实验报告
课程:统计软件—SPSS
实验题目:线性回归分析与非参检验
系别:理学院
专业:统计学
姓名:侯祥飞
班级:141班
指导教师:滕颖俏
完成时间:2016年10月30日
实验目的:
掌握线性回归分析的主要目标及其具体操作,能够读懂基本分析结果,掌握计算结果之间的数量关系,并能够写出回归方程,对回归方程进行各种统计检验。了解SPSS非参数检验的具体操作,能够解释分析结果。
(三)7.3
1.实验内容
利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金额的总体分布是否存在显著差异。
2.实验步骤
分析→非参数检验→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定
3.实验结果及分析
从上表中可以看出,在显著水平为0.05下得到的sig值为0.135>0.05,故接受原假设,认为不同常住地人群本次存款金额的总体分布无显著差异。
意义为:产品的销售量的总误差中有89.4%可以用产品的销售价格、各地区的年人均收入和广告费用的线性关系来解释,只有10.6%属于随机因素影响,因此这条回归线是合适的。
6)估计标准误差为:
二、非参数检验
(一)7.1
1.实验内容
为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到数据(略),选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
1)将第一张表中的所缺数值补齐。
2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
3)检验回归方程的线性关系是否显著?
4)检验各回归系数是否显著?
5)计算判定系数,并解释它的实际意义。
6)计算回归方程的估计标准误差,并解释它的实际意义。
2.实验结果
1)
Anovab
上表进行了回归系数的显著性检验,可以看出除粮食播种面积与农业劳动者人数变量的P-值均大于0.05,所以接受原假设,认为这些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。影响程度来由大到小依次是风灾面积、施用化肥量、总播种面积和年份(排除农业劳动者人数和粮食播种面积对粮食产量的影响)。
(二)7.2
1.实验内容
利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
2.实验步骤
分析→非参数检验→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定
3.实验结果及分析
如上表所示,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
得回归方程为: ,其中X1,X2,X3,X4分别为年份,总播种面积,施用化肥量,风灾面积比例。
(二)9.6销售量
1.实验内容
一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。进行多元线性回归分析所得的部分分析结果如下:
(五)7.5
1.实验内容
选择恰当的非参数检验方法,对“裁判打分.sav”数据随机选取10%的样本,并以恰当形式重新组织数据后,分析不同国家裁判对运动员的打分标准是否一致。原假设:不同国家裁判对运动员的打分标准无显著差异
2.实验步骤
数据→选择个案→随机个案样本→样本→大约10%所有个案→继续→确定→挑选初选中的数据→国家和评分组建新的SPSS数据→分析→非参数检验→多个独立样本检验→把评分导入检验量→把国家导入分组→确定
模型
平方和
df
均方
F
Sig.
1
回归
1.20E+07
3
4.01E+06
72.797
8.88E-13Βιβλιοθήκη 残差1.43E+06
26
55069.715
总计
1.35E+07
29
2) ,-117.8861表示销售价格越高,销售量越低,X1对Y的增长起抑制作用,X1与Y是负相关关系。80.6107表示各地区销售人员的人均收入越高,销售人员的工作积极性越高,所以销售量也越高,X2与Y是正相关关系。0.5012表示广告费用越高,销售量也越高,X3与Y是正相关关系。
实验内容、实验步骤、实验结果及分析
一、线性回归分析
(一)9.5粮食总产量
1.实验内容
先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。
2.实验步骤
步骤:分析→回归→线性→粮食总产量导入因变量、其余变量导入自变量→确定;分析→回归→线性→(向后)→确定
3.实验结果及分析
上表进行了拟合优度检验,由于该方程有多个解释变量,因此参考调整判定系数(0.986)较接近1,因此认为拟合有度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。
上表进行了回归方程的显著性检验,由于Sig为0小于0.05,所以拒绝原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可以建立线性模型。
实验启示:
通过本次实验,我们了解到回归分析是一种应用极为广泛的数量分析方法。我们还掌握了线性回归分析的具体操作,并会对回归方程进行各种统计检验。能够运用SPSS进行非参数检验,能够读懂结果并进行分析。