(精选)应用多元统计分析SAS作业第三章
使用SAS进行数据处理和分析
使用SAS进行数据处理和分析第一章:简介数据处理和分析是现代社会中重要的技能之一,它帮助我们从大量的数据中提取有用的信息,并做出科学决策。
SAS(Statistical Analysis System)是一种功能强大的统计分析软件包,广泛应用于各个领域的数据处理和分析任务中。
本文将介绍SAS的基本功能和常用技术,帮助读者了解如何使用SAS进行数据处理和分析。
第二章:SAS的基本操作SAS具有友好的图形用户界面和强大的命令行功能,可以满足不同用户的需求。
在本章中,我们将介绍SAS的基本操作,包括启动SAS软件、创建和保存数据集、导入和导出数据、运行SAS程序等。
通过学习这些基本操作,读者将能够掌握SAS的基本使用方法。
第三章:数据预处理数据预处理是数据分析的第一步,它包括数据清洗、数据变换、数据归一化等过程。
在本章中,我们将介绍如何使用SAS进行数据预处理,包括缺失值处理、异常值处理、去重、数据变换等技术。
通过学习这些技术,读者将能够清洗和准备好用于分析的数据。
第四章:基本统计分析统计分析是数据处理和分析的核心部分。
在本章中,我们将介绍SAS中常用的统计分析方法,包括描述统计分析、推断统计分析、多元统计分析、回归分析等。
通过学习这些统计分析方法,读者将能够对数据进行全面的分析,并得出科学的结论。
第五章:高级统计分析除了基本的统计分析方法外,SAS还提供了许多高级的统计分析技术,包括因子分析、聚类分析、判别分析、时间序列分析等。
在本章中,我们将介绍这些高级统计分析技术的基本原理和应用方法,帮助读者更好地理解和应用这些技术。
第六章:数据可视化数据可视化是数据分析中的重要环节,它能够帮助我们更直观地理解数据的特征和规律。
在本章中,我们将介绍SAS中常用的数据可视化技术,包括柱状图、折线图、散点图、箱线图等。
通过学习这些数据可视化技术,读者将能够使用图表和图形展示数据的特征和规律。
第七章:模型建立与评估在数据分析中,我们常常需要建立模型来解释和预测数据。
多元统计分析第三章假设检验与方差分析
多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。
统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。
参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。
3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。
备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
《统计分析与SPSS的应用》课后练习答案(第3章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000 之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000& 存款<5000& 常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据----------------- 分类汇总--- 性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
多元统计分析 第三章 习题
因子分析作业
一家公司正试图对其销售员工的质量做评估,并且正寻找一种考察或一系列测试,以期可以解释是否有创造良好销售额的潜能。
该公司已挑选了50个销售人员的随机样本,还已对每一个人就3项表现作了评估,销售增长、销售利润和新客户销售额。
这些测度量已被变为同一尺度,其中100表示“平均业绩”。
50个人中的每一个接受4项测试,分别测量创造力、机械推理、抽象推理和数学能力。
(数据见练习9.19)
a、假设对标准化变量有正交因子模型,求m=2和m=3个公因子的主成分解或极大似然解。
b、由a的解,求m=2和m=3的旋转载荷,解释m=2和m=3的因子解。
c、列出m=2和m=3的共同度和特殊方差,比较这些结果,此时你更愿意选择m 等于什么值,为什么?
d、设随机选取一个新的销售人员,得到测验分数)
,
,
110
98
'
x,用
105
(
,
20
35
,
18
15
,
,
加权最小二乘法和回归方法,计算这个销售人员的因子得分。
多元统计分析方法与应用练习册
练习册多元统计分析方法与应用南京财经大学第一章绪论一、填空题1.多元分析研究的是______________的统计总体。
2.多元统计中常用的统计量有:________、_________、__________和__________。
3.协方差和相关系数仅仅是变量间__________的一种度量,并不能刻画变量间可能存在的_____________。
二、简答题1.简述多元统计分析的作用。
2.简述矩阵A的特征根与特征向量的求法。
第二章多元线性回归一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成______________和____________两种类型。
2.总离差平方和可以分解为___________和__________两个部分,各自的自由度为________和________,其中_________在总离差平方和中所占比重越大,则线性回归效果越显著。
3.回归方程显著性检验时通常采用的统计量是_____________。
4.偏相关系数是指多元回归分析中,_______________________的相关系数。
5.最优回归方程是__________________________的回归方程。
6.偏回归平方和是指__________________________数值。
7.Spss中回归方程的建模方法有_________、__________、____________、_____________等。
二、简答题1.简述复相关系数与偏相关系数。
2.简述逐步回归分析方法的具体实施步骤。
三、计算题1.现收集了92组合金钢中的碳含量x 及强度y ,且求得:03.29415126.263019.07989.45,1255.0=====yy xy xx L L L y x(1)求y 关于x 的一元线性回归方程; (2)求y 与x 的相关系数;(3)列出对方程作显著性检验的方差分析表(4)在x=0.1时,求yˆ的点估计及置信度为0.95的置信区间 (5)在x=0.1时,求y 的概率为0.95的精确预测区间与近似预测区间。
应用多元统计分析课后答案
应用多元统计分析课后答案第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
医学统计学第四版各章例题SAS与STATA实现第三章
医学统计学(第四版)各章例题SAS/STATA 实现(第三章)例3J若果巾1999年18岁男生身咼服从均数为167. 7cm,标准岸为53cm 的正态分布。
从该 正态分布NU67 • 7,5 - 32)cm 总体中随机抽样100次即共抽取样本“二100个,每次样本含量川) 二10人得到每个样本均数Xj 及标准差S/如图3-1和下表3-1所示。
图3-1 1999年某市18岁男生身aN(1677 5. 32)抽样示意图表3-1 N(167 • 7 • 5. 32)总体中100个随机样本的乂 j. S 丿和95%CI («j=10)样木号乂 jSj9S%CZ样本号乂 JSj95%CZ1167.41 2. 74 165. 45 169.37 51 16&47 3・91 165, 67 17L27165. 566. 57 160. 86 170.26 52 165. 95 3・76 163. 26 168. 64 3 16S. 20 5. 36 164. 37 172. 03 53 168. 87 5. 77 164.74 173,00 4 166. 67 4.81 163. 24 170. 11 *54 169. 53 2. 07 16S. 05 171.00 5 164. 89 5.41 161. 02 168. 76 55 166. 10 5. 58 162. 11 170,10 6 166. 36 4. 50 16344 169.58 56 167. 20 4. 56 163. 94 17047 7 166. 16 4. 04 163. 27 169. 05 57 170. 50 7. 66 165. 02 175. 98 S 169.11 5. 71 165. 02 173. 19 58 166. 44 4.93 162. 91 169. 97 9 167. 178. 26 16L27 173. 08 59 16&68 4.52 16545 17L91 10 166. 13 5. 24 1623S 169. 87 60 16&40 6. 95 16343 173. 37 11 167. 71 6.42 163. 12 172.31 61 171. 21 630 166. 70 175. 72 12 16&68 5. 93 164. 44 172. 92 62 170. 33 4. 34 167. 23 173,44 13 166. 83 3. 69 16449 169.47 63 169. 03 7. 38 163. 75 17431 14 169. 62 4.81 166. 18 173. 06 64 16763 4.58 164. 36 170,90 15 166. 95 3. 64 16435 169. 56 65 16&66 3・33 166. 27 171.04 16170. 294.91166. 78173. 806616&842. 78166. 85170,83167.41, 165. 56,2. 74 = 6. 57 53610017 169. 20 5. 72 165. 11 173. 30 67 169. 31 5.31 165. 51 173. 11 1S 167. 65 2. 79 165. 65 169. 65 68 168. 46 4.81 16302 171.90 19 166. 51 5. 39 162. 65 170. 36 69 168. 60 5. 4S 164,68 172.52 •20163. 28 3. 19 16L00165. 5770 168.47 5. 05 164. 86 172,09 21 166. 29 4. 95 162.75 169. 84 71 165. 6S 5. 19 161.97 169. 40167. 65 5. 27 163S8 171.42 72 165. 68 8. 22 159. 80 171.5623 167. 64 4.61 16435 170. 94 73 168. 03 4.89 164. 53 171.5324 172.61 7. 74 167. 07 178.15 74 169. 37 5. 00 16579 172. 9425 166. 65 4. 12 163. 70 169. 59 75 169. 16 8. 36 163, 18 175,1426 165. 19 4.41 162. 04 168. 34 *76 171.27 4. 99 167.71174,8427 168. 80 7. 68 16331 174.30 77 16&36 4. 50 165, 14 171.5828 167如 2. 58 166.14 169. 83 78 168.50 3. 55 165, 96 171,0429 168.41 3.43 165. 95 170. 86 79 168. 08 5. 33 164. 27 171.9030 167. 75 7. 53 162.36 173. 13 80 165. 51 4.71 162.14 168. 88 ♦31 164. 25 4. 30 161. 17167. 33S1 167. 59 3. 73 164. 93 1702632 166. 42 5. 19 16271 170.13 *82 171. 12 4. 40 167. 98174, 2733 166. 90 4.41 163. 74 170. 05 83 165. 92 5. 11 162. 26 169.5834 166. 77 4. 34 163& 169& 84 16786 4. 44 164.69 171,0435 165. 77 5. 34 161.95 169.59 85 167. 43 6. 15 163. 03 171.8336 16442 6. 63 15938 168. 86 86 16790 6. 13 163. 51 172. 2837 169. 83 4. 20 166. 82 172. 84 87 167. 59 633 163. 06 172.1238 165. 16 4. 01 162. 29 168. 02 88 167. 744・60 16445 17L0339 166. 59 6. 20 1623 171.03 89 167. 408. 27 161. 49 173. 3240 165. 65 3. 56 163. 10 168. 20 90 167. 1S 6. 00 162. 89 171.4841 165. 72 4. 17 162.74 168.71 91 16643 3.87 163. 66 169,2142 166. 22 7. 44 1603 171.54 92 166. 62 4. 08 163. 70 169.5443 167.71 6. 12 163. 33 172. 09 93 166. 30 4.84 162. 83 169.7644 16725 5. 24 163. 50 170. 99 94 169. 70 5. 26 165. 94 1734545 165. 69 5.91 161.46 169. 92 95 169. 17 632 164. 65 173. 6946 169. 06 5. 65 165. 03 173. 10 96 167. 89 6. 07 163. 54 172. 2347 16&76 6. 14 16436 173. 15 97 167. 48 6. 03 163. 16 171.79 4S 16&64 4. 54 16539 171.89 98 169. 93 4.80 166. 50 173. 3749 167. 72 3. 82 164. 99 170. 45 99 16940 5. 57 16342 1733950 170. 39 4. 15 16742 173. 35 100 165. 69 5. 09 162, 06 16933*:表该样本资料算得的可信区间未包含已知总体均数167. 7cm例3 • 5某医生测量了36洛从事铅作业男性工人的血红蛋白含量,算得加均数为130. 83或L,标准差为25 - 74g/L.问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140gzL?⑴建立检验假设,确定检验水准Ho :严3=140g/L,即从事铅作业的男性工人平均血红蛋白含量与正常成年男性平均值H1: /岸MF140弓L 即从事铅作业的男性工人平均血红蛋白含量与正常成年男性平均值 不0=0. 05⑵讣算检验统il 嗤本例 «=36> 乂 =130 - 83g/L, 425 - 74g/L,“o=140g/L 。
应用多元统计分析SAS作业
,Cu5-9 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。
对每块岩石测定了Ag,Bi三种化学成分的含量,得到的数据如表1。
1 岩石化学(1)假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率取为相等,并假定两类样本的协方差阵相等);(2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为2.95,2.15和1.54,试判断该标本是含矿还是不含矿?问题求解1 使用广义平方距离判别法对样本进行判别归类用SAS软件中的DISCRIM过程进行判别归类。
SAS程序及结果如下。
data d59;input group x1-x3@@;cards;1 2.58 0.9 0.951 2.9 1.23 11 3.55 1.15 11 2.35 1.15 0.791 3.54 1.85 0.791 2.7 2.23 1.31 2.7 1.7 0.482 2.25 1.98 1.062 2.16 1.8 1.062 2.33 1.74 1.12 1.96 1.48 1.042 1.94 1.4 12 3 1.3 12 2.78 1.7 1.48;proc print data=d59;run;proc discrim data=d59 pool=yes distance list;class group;var x1-x3;run2还可知两个三元总体均值相等由输出结果可知,两总体间的广义平方距离为D。
=3.19774?=0.10时量总体的均,故在显着性水平,p=0.0756<0.10的检验结果:D=3.19774,F=3.10891 值向量有显着差异,即认为讨论这两个三元总体的判别问题是有意义的。
线性判别函数为:号样本错判为含矿。
判别结果为含矿的6号样本错判为不含矿;不含矿的13对给定样本判别归类2分别代入线性判别函数得:、2.15、1.54将Cu,Ag,Bi的含量数值2.9546.97888?44.67422,YY?。
sas应用多元分析课程设计
sas应用多元分析课程设计一、课程目标知识目标:1. 掌握SAS软件的基本操作和功能,理解多元分析的基本概念和原理;2. 学习并掌握常用的多元分析方法,如因子分析、聚类分析、判别分析等;3. 了解多元分析在实际问题中的应用场景,能运用所学知识解决实际问题。
技能目标:1. 能够运用SAS软件进行多元分析操作,熟练运用相关命令和函数;2. 能够根据实际问题选择合适的多元分析方法,并进行数据处理和分析;3. 能够对多元分析结果进行正确解读和评价,提出有效的数据见解。
情感态度价值观目标:1. 培养学生对数据分析的兴趣,激发主动学习和探索精神;2. 培养学生严谨的科学态度,注重数据真实性和分析客观性;3. 培养学生团队协作意识,提高沟通与交流能力。
课程性质:本课程为应用型课程,结合实际案例,强调理论与实践相结合。
学生特点:学生具备一定的统计学基础和计算机操作能力,对数据分析感兴趣。
教学要求:以学生为中心,注重培养实际操作能力和解决问题能力,鼓励学生积极参与讨论和思考。
在教学过程中,将课程目标分解为具体的学习成果,便于教学设计和评估。
二、教学内容1. SAS软件基础操作与功能介绍:包括数据导入、数据清洗、数据转换等基本操作,以及SAS编程语言的基本语法和常用函数。
教材章节:第一章 SAS软件概述与操作入门2. 多元分析基本概念与原理:讲解多元分析的基本思想、类型及其应用场景,如因子分析、聚类分析、判别分析等。
教材章节:第二章 多元分析概述3. 常用多元分析方法及SAS实现:a. 因子分析:介绍因子分析的原理、步骤及SAS实现方法。
教材章节:第三章 因子分析b. 聚类分析:讲解聚类分析的原理、方法及SAS操作。
教材章节:第四章 聚类分析c. 判别分析:阐述判别分析的原理、步骤及SAS应用。
教材章节:第五章 判别分析4. 实际案例分析与数据处理:结合实际问题,引导学生运用所学知识进行数据分析,提高解决实际问题的能力。
北师大应用多元统计分析作业——主成分分析
应用多元统计分析作业(一)——主成分分析 8‐1:用主成分分析方法探讨城市工业主体结构。
解:执行SAS程序代码:data dxiti81;input number x1-x8;cards;1 90342 52455 101091 19272 82 16.1 197435 0.1722 4903 1973 2035 10313 34.2 7.1 592077 0.0033 6735 21139 3767 1780 36.1 8.2 726396 0.0034 49454 36241 81557 22504 98.1 25.9 348226 0.9855 139190 203505 215898 10609 93.2 12.6 139572 0.6286 12215 16219 10351 6382 62.5 8.7 145818 0.0667 2372 6572 8103 12329 184.4 22.2 20921 0.1528 11062 23078 54935 23804 370.4 41 65486 0.2639 17111 23907 52108 21796 221.5 21.5 63806 0.27610 1206 3930 6126 15586 330.4 29.5 1840 0.43711 2150 5704 6200 10870 184.2 12 8913 0.27412 5251 6155 10383 16875 146.4 27.5 78796 0.15113 14341 13203 19396 14691 94.6 17.8 6354 1.574;proc princomp data=dxiti81 out=oxiti81;var x1-x8;run;proc sort data=oxiti81;by prin1;proc print;id number;var prin1;run;proc sort data=oxiti81;by prin2;proc print;id number;var prin2;run;proc sort data=oxiti81;by prin3;proc print;id number;var prin3;run;proc plot;plot prin2*prin1=number;run;proc cluster data=oxiti81 method=ave pseudo ccc outtree=tr81;var x1-x8;id number;proc tree data=tr81 horizontal graphics;run;结果分析:◆我们使用原始数据的相关系数矩阵计算特征根矩阵。
应用多元统计分析课后习题答案高惠璇
2 1 2 2 2 (1)第一次配方: 2 x12 2 x1 x2 x2 ( x1 x2 ) 2 x12
2 1 x1 2 1 1 1 1 1 因2 x 2 x1 x2 x ( x1 , x2 ) , 而 BB, 1 1 x2 1 1 1 0 1 0 y1 1 1 x1 x1 x2 2 2 2 2 令y , 则 2 x 2 x x x y y 1 1 2 2 1 2 y x x 1 0 2 1 2
类似地有
1 2 2 ( 2 x1 22 x1 65 x1 14 x1 49 ) 2
f 2 ( x2 )
X 2 ~ N (3,2).
f (x , x )dx
1 2 1
1 2 2
e
1 ( x2 3) 2 4
10
第二章
多元正态分布及参数的估计
1 e 2
1 2 ( 2 x1 22 x1 65) 2
e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
dx2 e
1 ( x1 7 ) 2 2
9
第二章
多元正态分布及参数的估计
1 ( x2 x1 7 ) 2 2
1 e e dx2 2 1 2 1 ( x 8 x 16 ) ( x2 x1 7 ) 2 1 1 1 1 2 e 2 e dx2 2 2 1 ( x1 4 ) 2 1 e 2 X1 ~ N (4,1). 2
u1 x1 4 令 u2 x2 3
应用多元统计分析SAS作业第三章
3-8假定人体尺寸有这样的一般规律,身高(X 1),胸围(X 2)和上半臂围(X 3)的平均尺寸比例是6:4:1,假设()()1,,X n αα=为来自总体()123=,,X X X X '的随机样本,并设()~,X N μ∑。
试利用表3.4中男婴这一数据来检验其身高、胸围和上半臂围这三个尺寸变量是否符合这一规律(写出假设H 0,并导出检验统计量)。
表3.4 某地区农村两周岁婴儿的体格测量数据解:设32,~(,),~(,)Y CX X N Y N C C C μμ'=∑∑。
121231233106,,,,,014C X X X μμμμμμμ⎛⎫-⎛⎫ ⎪== ⎪ ⎪-⎝⎭ ⎪⎝⎭其中,分别为 的样本均值。
则检验三个变量是否符合规律的假设为0212:,:H C O H C O μμ=≠。
检验统计量为21(1)1~(1,1)(3,6)(1)(1)n p F T F p n p p n n p ---+=--+==--,由样本值计算得:=(82,60.2,14.5)X ',及15840.2 2.5=40.215.86 6.552.5 6.559.5A ⎛⎫ ⎪ ⎪ ⎪⎝⎭, 2-1(1)()()()=47.1434T n n CX CAC CX ''=-,221(1)12=18.8574(1)(1)5n p F T T n p ---+=⨯=--,对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值:p =P {F ≥18.8574}=0.0091948。
因为p 值=0.0091948<0.05,故否定0H ,即认为这组男婴数据与人类的一般规律不一致。
在这种情况下,可能犯第一类错误·且犯第一类错误的概率为0.05。
SAS 程序及结果如下:proc iml ; n=6;p=3; x={78 60.6 16.5, 76 58.1 12.5, 92 63.2 14.5, 81 59 14, 81 60.8 15.5, 84 59.5 14};m0={0 0,0 0}; c={1 0 -6,0 1 -4}; ln={[6]1}; x0=(ln*x)`/n; print x0;mm=i(6)-j(6,6,1)/n; a=x`*mm*x; a1=inv(c*a*c`); a2=c*x0; dd=a2`*a1*a2; d2=dd*(n-1); t2=n*d2;f=(n+1-p)*t2/((n-1)*(p-1)); print x0 a d2 t2 f; p0=1-probf(f,p-1,n-p+1); fa=finv(0.95,2,4); print p0; run ;3-11表3.4给出15名两周岁婴儿的身高(X 1),胸围(X 2)和上半臂围(X 3)的测量数据。
应用多元统计分析SAS作业,DOC
5-9设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。
对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。
表1岩石化学成分的含量数据input groupx1-x3@@;cards;12.580.90.9512.91.23113.551.15112.351.150.7913.541.850.7912.72.231.312.71.70.4822.251.981.0622.161.81.06 22.331.741.1 21.961.481.04 21.941.41 231.31 22.781.71.48 ;procprint data =d59; run ;procdiscrim data =d59pool =yes distancelist ; )(),t t j Y X >由于1244.6742246.97888Y Y =<=,因此待判的样品判为不含矿。
5-10已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品(所有观测数据见表2)。
假定样本均来自正态总体。
表2判别分类的数据data d510;input x1-x4group@@; cards;6 -11.5 19 90 1 -11 -18.5 25 -36 3 90.2 -17 17 3 2 -4 -15 13 54 10 -14 20 35 20.5 -11.5 19 37 3 -10 -19 21 -42 30 -23 5 -35 1 20 -22 8 -20 3 -100 -21.4 7 -15 1 -100-21.5 15 -40 213 -17.2 18 2 2 -5 -18.5 15 18 1 10 -18 14 50 1 -8 -14 16 56 1 0.6 -13 26 21 3 -40 -20 22 -50 32二次判别函数判别由第一问SAS 运行结果可知三个总体的协方差阵不同,因此使用二次判别函数进行判别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3-8假定人体尺寸有这样的一般规律,身高(X 1),胸围(X 2)和上半臂围(X 3)的平均尺寸比例是6:4:1,假设()()1,,X n αα=L 为来自总体()123=,,X X X X '的随机样本,并设()~,X N μ∑。
试利用表3.4中男婴这一数据来检验其身高、胸围和上半臂围这三个尺寸变量是否符合这一规律(写出假设H 0,并导出检验统计量)。
解:设32,~(,),~(,)Y CX X N Y N C C C μμ'=∑∑。
121231233106,,,,,014C X X X μμμμμμμ⎛⎫-⎛⎫ ⎪== ⎪ ⎪-⎝⎭ ⎪⎝⎭其中,分别为 的样本均值。
则检验三个变量是否符合规律的假设为0212:,:H C O H C O μμ=≠。
检验统计量为21(1)1~(1,1)(3,6)(1)(1)n p F T F p n p p n n p ---+=--+==--,由样本值计算得:=(82,60.2,14.5)X ',及15840.2 2.5=40.215.86 6.552.5 6.559.5A ⎛⎫ ⎪ ⎪ ⎪⎝⎭, 2-1(1)()()()=47.1434T n n CX CAC CX ''=-,221(1)12=18.8574(1)(1)5n p F T T n p ---+=⨯=--,对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值: p =P {F ≥18.8574}=0.0091948。
因为p 值=0.0091948<0.05,故否定0H ,即认为这组男婴数据与人类的一般规律不一致。
在这种情况下,可能犯第一类错误·且犯第一类错误的概率为0.05。
SAS 程序及结果如下:proc iml ; n=6;p=3;x={78 60.6 16.5, 76 58.1 12.5, 92 63.2 14.5, 81 59 14, 81 60.8 15.5, 84 59.5 14 };m0={0 0,0 0}; c={1 0 -6,0 1 -4}; ln={[6]1}; x0=(ln*x)`/n; print x0;mm=i(6)-j(6,6,1)/n; a=x`*mm*x; a1=inv(c*a*c`); a2=c*x0; dd=a2`*a1*a2; d2=dd*(n-1); t2=n*d2;f=(n+1-p)*t2/((n-1)*(p-1)); print x0 a d2 t2 f; p0=1-probf(f,p-1,n-p+1); fa=finv(0.95,2,4); print p0; run ;3-11表3.4给出15名两周岁婴儿的身高(X 1),胸围(X 2)和上半臂围(X 3)的测量数据。
假设男婴的测量数据()()1,,6X αα=L 为来自总体()13,N μ∑()的随机样本;女婴的测量数据()()1,,9Y αα=L 为来自总体()3,N μ∑(2)的随机样本,试利用表3.4中的数据检验(1)(2)0:(0.05)H μμα==。
解:检验假设(1)(2)(1)(2)01::H H μμμμ=≠,。
取检验统计量为2+1(3,6,9)(2)n m p F Tp n m n m --====+-,由样本值计算得:=(82,60.2,14.5)=(7658.47613.5)X Y '',,,,1215840.2 2.5=40.215.86 6.552.5 6.559.519645.134.5=45.115.7611.6534.511.6514.5A A ⎛⎫ ⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪ ⎪ ⎪⎝⎭,,进一步计算得:2112(2)()'()()=1.4754793D n m X Y A A X Y -=+--+-,225.3117256,nm T D n m==+ 21 1.498179(2)n m p F T n m p+--==+-。
对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值:p =P {F ≥1.498179}=0.2692616。
因为p 值=0.2692616>0.05,故接收0H ,即认为男婴和女婴的测量数据无显著性差异。
在这种情况下,可能犯第二类错误,且犯第二类错误的概率为=0.0268093β。
SAS 程序及结果如下:proc iml ; n=6;m=9; p=3; x={ 78 60.6 16.5 , 76 58.1 12.5 , 92 63.2 14.5 , 81 59 14 , 81 60.8 15.5 , 84 59.5 14 } ; print x; ln={[6] 1} ;x0=(ln*x)/n; print x0; mx=i(n)-j(n,n,1)/n; a1=x`*mx*x; print a1; y={ 80 58.4 14 , 75 59.2 15 , 78 60.3 15 , 75 57.4 13 , 79 59.5 14 , 78 58.1 14.5 , 75 58 12.5 , 64 55.5 11 , 80 59.2 12.5 } ;print y; lm={[9] 1} ; y0=(lm*y)/m; print y0; my=i(m)-j(m,m,1)/m; a2=y`*my*y; print a2; a=a1+a2; xy=x0-y0; ai=inv(a); print a ai;dd=xy*ai*xy`; d2=(m+n-2)*dd; t2=n*m*d2/(n+m) ;f=(n+m-1-p)*t2/((n+m-2)*p); fa=finv(0.95,p,m+n-p-1); beta=probf(f,p,m+n-p-1,t2); print d2 t2 f beta; pp=1-probf(f,p,m+n-p-1); print pp; quit ;3-12地质勘探中,在A,B,C 三个地区采集了一些岩石,测量其部分化学成分,其数据见表3.5。
假定这三个地区掩饰的成分遵从()3,(1,2,3)(0.05)i i N i μα∑==()。
(1)检验不全01231123:=:,,H H ∑=∑∑∑∑∑;不全等;(2)检验(1)(2)(1)(2)01::H H μμμμ=≠;;(3)检验(1)(2)(3)()()01::,i j H H i j μμμμμ==≠≠;存在使; (4)检验三种化学成分相互独立。
(1)检验假设01231123:=:,,H H ∑=∑∑∑∑∑;不全等,在H 0成立时,取近似检验统计量为2()f χ 统计量:()()*4=121ln d M d ξλ-=--。
由样本值计算三个总体的样本协方差阵:1(1)(1)(1)(1)11()()11111110.243081=0.642649.2855240.014060.020520.00452n S A X X X Xn n ααα='==----⎛⎫ ⎪- ⎪ ⎪⎝⎭∑()(), 1(2)(2)(2)(2)23()()12211116.30461= 4.756710.672230.05570.23880.006675n S A X X X Xn n ααα='==----⎛⎫ ⎪- ⎪ ⎪-⎝⎭∑()(),1(3)(3)(3)(3)33()()13311112.97141=0.63370.342140.00010.002950.001875n S A X X X Xn n ααα='==----⎛⎫ ⎪ ⎪ ⎪-⎝⎭∑()()。
进一步计算可得12310.0018318,0.0000942,0.0011851,0.0000417,10S A S S S ===== 24.52397,0.433333,12,M d f ===(1)=13.896916d M ξ=-。
对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值:p =P {ξ≥13.896916}=0.3073394。
因为p 值=0.3073394>0.05,故接收0H ,即认为方差阵之间无显著性差异。
proc iml ; n1=5;n2=4;n3=4; n=n1+n2+n3;k=3;p=3; x1={47.22 5.06 0.1, 47.45 4.35 0.15, 47.52 6.85 0.12, 47.86 4.19 0.17, 47.31 7.57 0.18 };x2={54.33 6.22 0.12, 56.17 3.31 0.15, 54.4 2.43 0.22,52.62 5.92 0.12};x3={43.12 10.33 0.05, 42.05 9.67 0.08, 42.5 9.62 0.02, 40.77 9.68 0.04 };xx=x1//x2//x3; /*三组样本纵向拼接*/ mm1=i(5)-j(5,5,1)/n1; mm2=i(4)-j(4,4,1)/n2; mm=i(n)-j(n,n,1)/n; a1=x1`*mm1*x1;print a1;a2=x2`*mm2*x2;print a2;a3=x3`*mm2*x3;print a3;tt=xx`*mm*xx;print tt;/*总离差阵*/a=a1+a2+a3;print a;/*组内离差阵*/da=det(a/(n-k));/*合并样本协差阵*/da1=det(a1/(n1-1));/*每个总体的样本协差阵阵*/da2=det(a2/(n2-1));da3=det(a3/(n3-1));m=(n-k)*log(da)-(4*log(da1)+3*log(da2)+3*log(da3)); dd=(2*p*p+3*p-1)*(k+1)/(6*(p+1)*(n-k));df=p*(p+1)*(k-1)/2; /*卡方分布自由度*/kc=(1-dd)*m; /*统计量值*/print da da1 da2 da3 m dd df;p0=1-probchi(kc,df); /*显著性概率*/print kc p0;quit;(2)提出假设(1)(2)(1)(2)01::H H μμμμ=≠,。
取检验统计量为2+1(3,6,9)(2)n m p F Tp n m n m --====+-,由样本值计算得:1=(47.472.5.604,0.144)=(54.38,4.47,0.1525)X X ''()(2),, 120.24308=0.642649.285520.014060.020520.004526.3046= 4.756710.67220.05570.23880.006675A A ⎛⎫⎪- ⎪ ⎪⎝⎭⎛⎫⎪- ⎪ ⎪-⎝⎭,,进一步计算得:211112(2)()'()()=60.666995D n m X X A A X X -=+--+-()(2)()(2),22134.81554,nm T D n m==+ 2132.098939(2)n m p F T n m p+--==+-。