因素分析法的计算例题多因素分析法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因素分析法的计算例题多因素分析法研究
多因素分析法研究
WTT为大家整理的相关的多因素分析法研究资料,供大家参考选择。
多因素分析
研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括:
多元线性回归(multiple linear regression) 判别分析(disoriminant analysis) 聚类分析(cluster analysis) 主成分分析(principal ponent analysis) 因子分析(factor analysis) 典型相关(canonical correlation) logistic 回归(logistic regression) Cox 回归(COX regression)
1、多元回归分析(multiple linear regression)
回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。
全模型法其数学模型为:ebbbb++++=ppxxxyL22110
式中 y 为因变量, pxxxL21, 为p个自变量,0b为常数项,pbbbL21,为待定参数,
称为偏回归系数(partial regression coefficient)。pbbbL21,表示在其它自变量固定不变的情况下,自变量Xi 每改变一
个单位时,单独引起因变量Y的平均改变量。多因素分析法研究
e为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分
例如:1、现有20名糖尿病病人的血糖(Lmmoly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2m)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。
逐步回归分析(stepwise regression analysis)
在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。
一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程较理想的方法之一是逐步回归分析(stepwise regression analysis)
基本原理:按这个自变量在方程中对因变量作用的大小,由大到小依次引入方程。每引入一个自变量都要对回归方程中每一个已引入的(包括刚被引入的)自变量的作用作统计意义检验,若发现一个或几个已被引入的自变量的作用无统计学意义时,即行剔除。每剔除一个自变量后,也要对留在回归方程中的自变量逐个作统计学意义检验。如果发现方程中还存在作用无统计学意义的自变量时,也予以剔除,直至没有自变量可引入,也没有自变量可从方程中剔除为止。
最优方程应是:ebbb+++=ppxxyL110
对y有显著性作用的自变量全部到回归方程中。凡是对y没有显著性作用的自变量都不被引入方程。多因素分析法研究例如:
1、讨论中学生的肺活量的影响因素,观察了10名女中学生的体重(X1, kg)、胸围(X2, cm)、胸围之呼吸差(X3, cm)及肺活量(Y, ml)。
2、某研究协作组调查煤矿工人II期高血压患者40例,同时调查了工作面的污染程度(X1 )、井下工作时间(X2)、每人的体重(X3)、吸烟年限(X4)、饮酒年限(X5)和收缩压(y),欲分析影响煤矿工人II期高血压患者收缩压高低的主要因素。
3、为探讨影响差等生学习成绩的因素,某儿科医生调查了某学校六年级各班倒数第五名以内学生的平均成绩(y),并测定了智
商(X1 )、血清铁(X2)、血清酮(X3)、日均热卡(X4)、日均食入蛋白量(X5)、头围(X6 )和月人均收入(X7)
2、判别分析(discriminant analysis)
根据已掌握的一批分类明确的样品,制定出一个分类标准用以判断以后新样品的归类。在医学研究中经常遇到根据某病人的各种症状、体征、化验结果等来判定病人患的什么疾病,如:根据骨科的X光片的各种特征判断病人属于何种骨瘤?体育选材中根据运动员的体形、运动成绩、生理指标、心理素质指标、遗传因素判断是否选入运动队继续培养等。
判别分析在医学领域的主要用途是:
1、疾病诊断:用判别分析的方法诊断疾病又称为计量诊断。包括临床诊断、X线诊断、心电图诊断、超声波诊断、脑电图诊断等。
2、疾病预报:流行病预报、某些疾病(心肌梗死、中风)的早期预报。
3、预后估计:某些疗法的疗效估计,某些恶性肿瘤患者的生存期估计等。
4、疾病的病因学估计:研究引起疾病的原因,并分析其主要影响因素。多因素分析法研究
判别分析:要求Y变量二分类或多分类的属性变量。分别用Fisher和Bayes准则进行计算。
同时根据样本中个体的症状、体征选用多元逐步判别分析的
方法,来判断病人患的什么疾病。其判别函数为:
Z = b1x1 + b2x2 + b3x3 .....+ bkxk
对判别函数在实际应用中的判别能力要进行检验。
判别临界值:()()[]2121
0/nnbnanYyy+úû
且:
所以:若 Y>Y0 判为A类;若 Y<Y0 判为B类。可以计算各指标的贡献率,进行回代检验其符合率。多因素分析法研究例如:
1、有健康人10名,心肌梗死病人6名,分别进行心电图检
查得到三个指标X1、X2、X3 。建立这两类人的判别式,以次判别新的就诊患者是否为心肌梗死病人。
2、对正常人和白血病人进行血清学方面的研究,用高分辨核磁共振谱仪分析α峰形,以α峰的高度(X1)和峰腰(X2)的宽度作为观察指标,采集了13名白血病人和11名献血员作为
健康人的血清的α峰形。
3、现有已知分类的健康人11人,硬化症患者7人,冠心病
患者5人,这23人的心电图的5个指标测量数据,建立判别方程。
3、 logistic 回归分析