典型相关分析的实例
典型案例分析的法律效果(3篇)
第1篇一、引言典型案例分析是法律实践中的一种重要方法,通过对具体案例的深入剖析,揭示法律在实践中的应用和效果,对于提高法律实践水平、推动法治建设具有重要意义。
本文将以几个典型案例为切入点,探讨典型案例分析的法律效果。
二、典型案例一:张三诉李四侵权案1. 案例背景张三与李四系邻居,因土地纠纷产生矛盾。
张三认为李四侵占其土地,遂向法院提起诉讼。
2. 案例分析本案中,法院根据《中华人民共和国物权法》等相关法律法规,认定李四侵犯了张三的物权,判决李四返还侵占的土地。
3. 法律效果(1)维护了当事人的合法权益。
本案判决结果保护了张三的物权,使其免受李四的侵权行为侵害。
(2)强化了法律权威。
本案判决体现了法律的公正性和严肃性,增强了人民群众对法律的信任。
(3)促进了法治观念的普及。
本案的审理过程和判决结果,使当事人及其周围群众认识到法律的重要性和必要性,提高了法治观念。
三、典型案例二:王某诉某公司劳动合同纠纷案1. 案例背景王某与某公司签订劳动合同,合同约定王某在公司工作三年。
合同到期后,公司未与王某续签劳动合同,王某遂向法院提起诉讼。
2. 案例分析本案中,法院根据《中华人民共和国劳动合同法》等相关法律法规,认定某公司未依法与王某续签劳动合同,判决公司支付王某经济补偿金。
3. 法律效果(1)保障了劳动者的合法权益。
本案判决结果保障了王某的劳动权益,使其在离职后获得相应的经济补偿。
(2)规范了用人单位的用工行为。
本案判决对用人单位起到了警示作用,促使用人单位依法签订和履行劳动合同。
(3)促进了劳动关系的和谐稳定。
本案的审理结果有助于维护劳动者与用人单位之间的合法权益,促进劳动关系的和谐稳定。
四、典型案例三:李某诉某房地产开发公司合同纠纷案1. 案例背景李某与某房地产开发公司签订购房合同,合同约定李某购买某小区一套住房。
购房后,李某发现房屋存在质量问题,遂向法院提起诉讼。
2. 案例分析本案中,法院根据《中华人民共和国合同法》等相关法律法规,认定某房地产开发公司提供的房屋存在质量问题,判决该公司承担相应的违约责任。
典型相关分析[五篇模版]
典型相关分析[五篇模版]第一篇:典型相关分析相关分析的类型典型相关分析:用于探究一组解释变量与一组反应变量时间的关系。
典型相关分析函数:cancor(x,y,xcenter=T,ycenter=T)x 为第一组变量数据矩阵 y为第二组变量数据矩阵xcenter表示第一组变量是否中心化 ycenter表示第二组变量是否中心化自编典型相关函数:cancor.test(x,y,plot=T)x为第一组变量数据矩阵 y为第二组变量数据矩阵 plot为是否绘制典型相关图例1:d11.1 生理指标与训练指标之间的典型相关性。
生理指标:体重(x1)、腰围(x2)、脉搏(x3);训练指标:引体向上次数(y1)、起坐次数(y2)、跳跃次数(y3)。
> X<-read.table(“clipboard”,header=T)> R<-cor(X)> R x1 x2 x3 y1 y2 y3 x1 1.0000 0.8702-0.36576-0.3897-0.4931-0.22630 x2 0.8702 1.0000-0.35289-0.5522-0.6456-0.19150 x3-0.3658-0.3529 1.00000 0.1506 0.2250 0.03493 y1-0.3897-0.5522 0.150651.0000 0.6957 0.49576 y2-0.4931-0.6456 0.22504 0.6957 1.0000 0.66921 y3-0.2263-0.1915 0.03493 0.4958 0.6692 1.00000 > R11<-R[1:3,1:3];R12<-R[1:3,4:6];R21<-R[4:6,1:3];R22<-R[4:6,4:6] > A<-solve(R11)%*%R12%*%solve(R22)%*%R21 #A=(R11)-1 R12(R22)-1 R21 > ev<-eigen(A)$values #特征值 > sqrt(ev)#典型相关系数[1] 0.79561 0.20056 0.07257以上过程是一步一步计算的,接下来我们使用R自带的典型相关函数:> xy<-scale(X)#数据标准化> ca<-cancor(xy[,1:3],xy[,4:6])#典型相关分析> ca$cor #典型相关系数[1] 0.79561 0.20056 0.07257 > ca$xcoef #x的典则载荷[,1] [,2] [,3] x1-0.17789-0.43230 0.04381 x2 0.36233 0.27086-0.11609 x3-0.01356-0.05302-0.24107 > ca$ycoef #y的典则载荷[,1] [,2] [,3] y1-0.08018-0.08616 0.29746 y2-0.24181 0.02833-0.28374 y3 0.16436 0.24368 0.09608典型变量的系数载荷并不唯一,只要是它的任意倍数即可,所以每个软件得出的结果并不一样,而是相差一个倍数。
典型相关分析在STATA中的实现和案例
第14章 典型相关分析主成分分析和因子分析只涉及一组变量的相关关系,而典型相关分析则是研究两组变量之间的相关关系。
为了研究两组变量),,,(1var 21r x x x list 和),,,(2var 21s y y y list 之间的相互关系,采用类似于主成分分析的方法,将两组变量合成有代表性的综合指标,通过研究这两组综合指标间的相互关系,来代替这两组变量间的相互关系,这些综合指标就称为典型变量,典型变量之间的相关系数就称为典型相关。
在实际问题中,两组变量之间具有相关关系的问题很多,例如几种主要产品如猪肉、牛肉、鸡蛋的价格(作为第一组变量)和相应这些产品的销量(作为第二组变量)具有相关系数;投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)具有相关关系等。
典型相关分析研究变量之间整体的线性关系,它是将每一组变量作为一个整体来进行研究,而不是分析每一组变量内部的各个变量。
所研究的两组变量可以是一组变量为自变量,而另一组变量为因变量的情况,两组变量也可以处于同等的地位,但典型相关分析要求两组变量至少是间隔尺度的。
典型相关分析是借助于主成分分析的思想,对每一组变量分别寻找线性组合,使生成的新的综合变量能代表原始变量大部分的信息,同时,与由另一组变量生成新的综合变量的相关程度最大,这样一组新的综合变量称为第一对典型相关变量,同样的方法可以找到第二对、第三对……使得各对典型相关变量互不相关,典型相关变量之间的简单相关系数称为典型相关系数。
典型相关分析就是用典型相关系数衡量两组变量之间的相关性。
设两组变量varlist1和varlist2的相关系数矩阵为:C B B A ' 典型相关系数的平方即是对11' BC A B V 或1'1 A B BC W 进行特征值分解,而对应的左侧向量即是两组变量的典型变量的线性组合。
典型相关分析实例
典型相关分析实例
典型相关分析研究的是两组变量之间的关系,如{x1, x2, x3}和{y1, y2, y3}两组变量之间的关系。
具体来说,变量间的相关关系可以分为以下几种:
两个变量间的线性相关关系,可用简单相关系数。
一个变量与多个变量之间的线性相关关系,可用复相关系数。
多个变量与多个变量间的相关关系,使用典型相关关系
典型相关分析在研究两组变量间的线性相关关系时,将每一组变量作为一个整体进行分析。
它采用类似于主成分分析(PCA)的方法,在每一组变量中都选择若干个有代表性的综合指标,这些综合指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大。
简单地说,对于{x1, x2, x3}和{y1, y2, y3}两组变量,我们先求出能体现x和y最大相关性的一对变量u1,v1:u1是{x1, x2, x3}的线性组合,v1是{y1, y2, y3}的线性组合。
然后再类似的求第二、第三对典型相关变量,然后我们就得到两组典型相关变量{u1,u2,u3}和{v1,v2,v3}。
三对典型相关变量是彼此不相关的,它们反应了变量组x和y之间的相关关系。
数据分析经典案例
数据分析经典案例在当今信息爆炸的时代,数据分析已经成为各行各业不可或缺的一部分。
通过对大数据的挖掘和分析,我们可以发现隐藏在其中的规律和趋势,为企业决策提供有力支持。
下面,我们将介绍几个经典的数据分析案例,希望能够为大家提供一些启发和思路。
首先,让我们来看一个关于销售数据的案例。
某电商平台在进行销售数据分析时,发现某款产品在某个城市的销量异常突出。
经过深入分析,他们发现这个城市正好是该产品的生产基地,而且该产品在当地有着较高的知名度和口碑。
基于这一发现,电商平台加大了对该城市的市场投入,取得了良好的销售业绩。
其次,我们来看一个关于用户行为数据的案例。
某社交平台在进行用户行为数据分析时,发现一部分用户在注册后很快就流失了。
经过分析,他们发现这部分用户在注册后没有完善个人资料,也没有添加好友或关注其他用户。
基于这一发现,社交平台加强了对新用户的引导和培养,提高了用户的黏性和留存率。
再次,让我们来看一个关于市场营销数据的案例。
某餐饮连锁品牌在进行市场营销数据分析时,发现在某个时间段推出的优惠活动效果非常显著。
经过分析,他们发现这个时间段正好是周末和节假日,而且该活动针对的是家庭消费群体。
基于这一发现,餐饮连锁品牌调整了营销策略,将更多的资源投入到周末和节假日的促销活动中,取得了更好的市场效果。
最后,让我们来看一个关于产品研发数据的案例。
某科技公司在进行产品研发数据分析时,发现一项新技术在市场上受到了较大的关注和需求。
经过分析,他们发现这项新技术可以满足市场对高效能产品的需求,而且具有较高的技术壁垒。
基于这一发现,科技公司加大了对这项新技术的研发投入,推出了更多基于该技术的产品,取得了良好的市场反响。
通过以上几个经典案例的介绍,我们可以看到数据分析在不同领域的应用和作用。
无论是销售数据、用户行为数据、市场营销数据还是产品研发数据,都可以通过深入分析发现其中的规律和趋势,为企业决策提供有力支持。
因此,数据分析已经成为企业不可或缺的利器,希望大家能够重视数据分析,在实践中不断提升数据分析能力,为企业的发展贡献力量。
07典型相关分析报告
典型相关分析专题§9.1 引言典型相关分析是研究两组变量之间相关关系的一种统计分析方法,它能够真正反映两组变量之间的相互线性依赖关系。
例如,F. V. Waugh (1942)研究了美国1921年至1940年每年牛肉、猪肉的价格与按人口平均的牛肉和猪肉的消费量之间的相互关系,可归结为研究这两组变量之间的相互依赖关系。
采用典型相关分析,可由第一组变量构造一种价格指数,由第二组变量构造一种消费量指数,这两种指数分别为这两组变量的典型变量,而后研究这两种指数间的相互关系。
又如,在工厂里常常要研究产品的q 个质量指标(q y y y ,,,21 )与原材料的p 个质量指标p x x x ,,,21 之间的相关关系,这也是需采用典型相关分析来解决的问题。
一般地,为研究两组变量p x x x ,,,21 和q y y y ,,,21 之间的相关关系,常采用类似于主成分的思想,找出第一组变量的某个线性组合p p x a x a x a u +++= 2211,并找出第二组变量的某个线性组合q q y b y b y b v +++= 2211,于是我们把研究两组变量之间相关的问题化为研究两个变量u 与v 之间的相关问题,希望使u 与v 的相关达到最大。
我们称这种相关为典型相关,基于这种原则的分析方法称为典型相关分析。
§9.2 总体典型相关一、典型相关的定义及导出 设⎪⎪⎪⎪⎪⎭⎫ ⎝⎛p x x x 21和⎪⎪⎪⎪⎪⎭⎫ ⎝⎛q y y y 21是两组变量,且)0()(11>∑=x V ,)0()(22>∑=y V , 12),cov(∑=y x ,即有⎪⎪⎭⎫ ⎝⎛∑∑∑∑=⎪⎪⎭⎫ ⎝⎛22211211y x V 其中'∑=∑1221典型相关分析研究的是,x 的线性函数x a u '=与y 的线性函数y b v '=之间的相关关系,其中⎪⎪⎪⎪⎪⎭⎫⎝⎛=p a a a a21和⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=q b b b b 21我们先来计算一下u 与v 的相关系数b a b y x a y b x a v u 12),cov(),cov(),cov(∑'='=''= (9.2.1)a a a x V a x a V u V 11)()()(∑'='='=b b b y V b y b V v V 22)()()(∑'='='=(9.2.2)所以,u 与v 的相关系数为bb a a ba v V u V v u v u 221112)()(),cov(),(∑'∑'∑'==ρ(9.2.3)由于对任意非零常数1k 和2k ,有),()()(),cov()()(),cov()()(),cov(),(2121212121v u v V u V v u v V u V k k v u k k v k V u k V v k u k v k u k ρρ====因此,为避免不必要的结果重复,我们常常限定u 与v 均为标准化的变量,即附加约束条件1)(=u V ,1)(=v V(9.2.4)这等价于约束条件111=∑'a a ,122=∑'b b(9.2.5)于是,我们的问题归结为在约束条件(9.2.4)式或(9.2.5)式下,求p R a ∈和q R b ∈,使得b a v u 12),(∑'=ρ(9.2.6)达到最大。
3个介绍典型相关分析的案例
Example 1: 测量25个家庭中长子的头长和头宽,与次子的头长和头宽的相关性SET1=长子头长长子头宽/SET2=次子头宽次子头长/.结果:分别给出两组变量内部的相关系数组一相关系数Correlations for Set-1长子头长长子头宽长子头长 1.0000 .7346长子头宽 .7346 1.0000组二相关系数Correlations for Set-2次子头宽次子头长次子头宽 1.0000 .8393次子头长 .8393 1.0000第一组与第二组变量之间的相关系数Correlations Between Set-1 and Set-2次子头宽次子头长长子头长 .7040 .7108长子头宽 .7086 .6932典型相关系数Canonical Correlations1 .7892 .054维度递减检验结果(降维检验)Test that remaining correlations are zero:Wilk's Chi-SQ DF Sig.1 .377 20.964 4.000 .0002 .997 .062 1.000 .803标准化典型系数—第一组Standardized Canonical Coefficients for Set-11 2长子头长-.552 -1.366长子头宽-.522 1.378第一组典型变量的未标准化系数Raw Canonical Coefficients for Set-11 2长子头长-.057 -.140长子头宽-.071 .187第二组典型变量的标准化系数Standardized Canonical Coefficients for Set-21 2次子头宽-.538 1.759次子头长-.504 -1.769第二组典型变量的未标准化系数Raw Canonical Coefficients for Set-21 2次子头宽-.080 .262次子头长-.050 -.176典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第一组Canonical Loadings for Set-11 2长子头长-.935 -.354长子头宽-.927 .375交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第一组原始量Cross Loadings for Set-11 2长子头长-.737 -.019长子头宽-.731 .020典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第二组Canonical Loadings for Set-21 2次子头宽-.962 .274次子头长-.956 -.293交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第二组原始量Cross Loadings for Set-21 2次子头宽-.758 .015次子头长-.754 -.016Redundancy Analysis: (冗余分析)(第一组原始变量总方差中由本组变式代表的比例)Proportion of Variance of Set-1 Explained by Its Own Can. Var.Prop VarCV1-1 .867CV1-2 .133(第一组原始变量总方差中由第二组的变式所解释的比例)Proportion of Variance of Set-1 Explained by Opposite Can.Var.Prop VarCV2-1 .539CV2-2 .000(第二组原始变量总方差中由本组变式代表的比例)Proportion of Variance of Set-2 Explained by Its Own Can. Var.Prop VarCV2-1 .920CV2-2 .080(第二组原始变量总方差中由第一组的变式所解释的比例)Proportion of Variance of Set-2 Explained by Opposite Can. Var.Prop VarCV1-1 .572CV1-2 .000------ END MATRIX -----s1_cv001:第一组的第一个典型变量;s2_cv001:第二组的第一个典型变量Example 2: 测量15名受试者的身体形态以及健康情况指标这两组变量之间的关系. 第一组身体形态变量=年来,体重,胸围和每日抽烟量.第二组健康状况变量=脉搏,收缩压,舒张压.SET1=年龄体重抽烟量胸围/SET2=脉搏收缩压舒张压/ .结果:分别给出两组变量内部的相关系数组一相关系数Correlations for Set-1年龄体重抽烟量胸围年龄 1.0000 .7697 .5811 .1022体重 .7697 1.0000 .8171 -.1230抽烟量 .5811 .8171 1.0000 -.1758胸围 .1022 -.1230 -.1758 1.0000组二相关系数Correlations for Set-2脉搏收缩压舒张压脉搏 1.0000 .8865 .8614收缩压 .8865 1.0000 .7465舒张压 .8614 .7465 1.0000第一组与第二组变量之间的相关系数Correlations Between Set-1 and Set-2脉搏收缩压舒张压年龄 .7582 .8043 .5401体重 .8572 .7830 .7171抽烟量 .8864 .7638 .8684胸围 .0687 .1169 .0147典型相关系数Canonical Correlations1 .9572 .5823 .180维度递减检验结果(降维检验)Test that remaining correlations are zero: Wilk's Chi-SQ DF Sig.1 .054 29.186 12.000 .0042 .640 4.459 6.000 .6153 .967 .331 2.000 .848标准化典型系数—第一组Standardized Canonical Coefficients for Set-11 2 3年龄-.256 -1.130 1.060体重-.151 -.113 -2.215抽烟量-.694 1.067 1.212胸围-.189 .051 .027第一组典型变量的未标准化系数Raw Canonical Coefficients for Set-11 2 3年龄-.031 -.139 .130体重-.019 -.014 -.280抽烟量-.058 .089 .101胸围-.071 .019 .010第二组典型变量的标准化系数Standardized Canonical Coefficients for Set-21 2 3脉搏-.721 -.191 -2.739收缩压-.171 -1.265 1.751舒张压-.142 1.514 1.259第二组典型变量的未标准化系数Raw Canonical Coefficients for Set-21 2 3脉搏-.121 -.032 -.461收缩压-.021 -.155 .215舒张压-.021 .227 .189典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第一组Canonical Loadings for Set-11 2 3年龄-.795 -.592 .062体重-.892 -.117 -.412抽烟量-.933 .309 .014胸围-.075 -.238 .195交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第一组原始量Cross Loadings for Set-11 2 3年龄-.761 -.344 .011体重-.854 -.068 -.074抽烟量-.893 .180 .002胸围-.072 -.139 .035典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第二组Canonical Loadings for Set-21 2 3脉搏-.995 -.008 -.103收缩压-.916 -.304 .262舒张压-.891 .406 .206交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第二组原始量Cross Loadings for Set-21 2 3脉搏-.952 -.005 -.019收缩压-.876 -.177 .047舒张压-.852 .236 .037Redundancy Analysis: (冗余分析)(第一组原始变量总方差中由本组变式代表的比例)Proportion of Variance of Set-1 Explained by Its Own Can. Var.Prop VarCV1-1 .576CV1-2 .129CV1-3 .053(第一组原始变量总方差中由第二组的变式所解释的比例)Proportion of Variance of Set-1 Explained by Opposite Can.Var.Prop VarCV2-1 .527CV2-2 .044CV2-3 .002(第二组原始变量总方差中由本组变式代表的比例)Proportion of Variance of Set-2 Explained by Its Own Can. Var.Prop VarCV2-1 .874CV2-2 .086CV2-3 .041(第二组原始变量总方差中由第一组的变式所解释的比例)Proportion of Variance of Set-2 Explained by Opposite Can. Var.Prop VarCV1-1 .800CV1-2 .029CV1-3 .001------ END MATRIX -----s1_cv001:第一组的第一个典型变量;s2_cv001:第二组的第一个典型变量;s1_cv002:第一组的第二个典型变量;s2_cv002:第二组的第二个典型变量;Example 3:研究X1X2人口出生与X3X4X5教育程度、生活水平等的相关度X1 多孩率X2 综合节育率X3 初中及以上受教育程度的人口比例X4 人均国民收入比例X5 城镇人口比例结果:第一组变量相关系数Correlations for Set-1X1 X2X1 1.0000 -.7610X2 -.7610 1.0000第二组变量相关系数Correlations for Set-2X3 X4 X5X3 1.0000 .7712 .8488X4 .7712 1.0000 .8777X5 .8488 .8777 1.0000第一组与第二组变量之间的相关系数Correlations Between Set-1 and Set-2X3 X4 X5X1 -.5418 -.4528 -.4534X2 .2929 .2528 .2447典型相关系数Canonical Correlations1 .5782 .025维度递减检验结果(降维检验)Test that remaining correlations are zero: Wilk's Chi-SQ DF Sig.1 .666 10.584 6.000 .1022 .999 .017 2.000 .992标准化典型系数—第一组Standardized Canonical Coefficients for Set-11 2X1 -1.319 .797X2 -.486 1.463第一组典型变量的未标准化系数Raw Canonical Coefficients for Set-11 2X1 -.131 .079X2 -.091 .275_第二组典型变量的标准化系数Standardized Canonical Coefficients for Set-21 2X3 .997 -.261X4 .292 2.075X5 -.274 -1.743第二组典型变量的未标准化系数Raw Canonical Coefficients for Set-21 2X3 .086 -.023X4 .000 .002X5 -.017 -.107典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第一组Canonical Loadings for Set-11 2X1 -.949 -.316X2 .517 .856交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第一组原始变量Cross Loadings for Set-11 2X1 -.548 -.008X2 .299 .022典型负载系数(结构相关系数:典型变量与原始变量之间的相关系数)第二组Canonical Loadings for Set-21 2X3 .990 -.140X4 .821 .344X5 .829 -.143交叉负载系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)—第二组原始变量Cross Loadings for Set-21 2X3 .572 -.004X4 .474 .009X5 .479 -.004。
学术研究中的典型相关分析方法
学术研究中的典型相关分析方法一、引言典型相关分析是一种广泛应用于社会科学和生物统计学领域的统计方法,主要用于研究两个或多个变量之间的关系。
典型相关分析能够从大量数据中提取出有用的信息,帮助研究者更好地理解研究对象之间的相互作用。
本文将详细介绍典型相关分析的基本原理、步骤和应用,为学术研究提供有益的参考。
二、典型相关分析的基本原理典型相关分析是一种用于探索多个变量之间关系的方法。
它通过寻找一组代表性变量,来反映原始变量之间的相关关系。
这些代表性变量通常被称为主成分或典型变量,它们能够反映原始变量的绝大部分信息。
通过分析典型变量之间的关系,可以推断出原始变量之间的潜在关系。
典型相关分析的基本原理可以概括为以下三个步骤:1.数据的降维:通过主成分分析或类似的方法,将原始数据从多个维度降至少数几个典型变量。
2.寻找代表性变量:根据典型变量的方差贡献和相关性,选择最重要的几个典型变量。
3.解释原始变量之间的关系:通过分析典型变量之间的关系,推断出原始变量之间的潜在关系。
三、典型相关分析的步骤典型相关分析通常包括以下步骤:1.准备数据:收集并整理需要进行分析的数据,确保数据的质量和准确性。
2.降维:使用主成分分析、独立成分分析或其他降维方法,将数据从多个维度降至少数几个典型变量。
3.确定典型变量:根据方差贡献和相关性,选择最重要的几个典型变量。
4.统计分析:使用适当的统计方法,如线性回归、相关系数等,分析典型变量之间的关系,并解释其意义。
5.结果解释:将典型变量之间的关系与原始变量之间的相关性进行比较,推断出原始变量之间的潜在关系。
四、典型相关分析的应用典型相关分析在许多领域都有广泛的应用,包括但不限于社会学、心理学、生物学和医学。
以下是一些典型相关分析的应用实例:1.研究社会现象:在研究社会现象时,典型相关分析可以用于探索人口统计学特征(如年龄、性别、教育水平等)与行为、态度和价值观之间的关系。
通过分析典型变量,可以更深入地了解社会现象的内在机制。
典型相关分析及其应用实例
摘要典型相关分析是多元统计分析的一个重要研究课题.它是研究两组变量之间相关的一种统计分析方法,能够有效地揭示两组变量之间的相互线性依赖关系.它借助主成分分析降维的思想,用少数几对综合变量来反映两组变量间的线性相关性质.目前它已经在众多领域的相关分析和预测分析中得到广泛应用.本文首先描述了典型相关分析的统计思想,定义了总体典型相关变量及典型相关系数,并简要概述了它们的求解思路,然后深入对样本典型相关分析的几种算法做了比较全面的论述.根据典型相关分析的推理,归纳总结了它的一些重要性质并给出了证明,接着推导了典型相关系数的显著性检验.最后通过理论与实例分析两个层面论证了典型相关分析的应用于实际生活中的可行性与优越性.【关键词】典型相关分析,样本典型相关,性质,实际应用ABSTRACTThe Canonical Correlation Analysis is an important studying topic of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual line dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis and forecasted analysis.This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up their solution method briefly. After it I go deep into discuss some algorithm of the sample canonical correlation analysis thoroughly. According to the reasoning of the Canonical Correlation Analysis, sum up some of its important properties and give the identification, following it, I infer the significance testing about the canonical correlation coefficient. According to the analysis from the theories and the application, we can achieve the possibility and the superiority from canonical correlation analysis in the real life.【Key words】Canonical Correlation Analysis,Sample canonical correlation,Character,Practical applications目录前言 (1)第1章典型相关分析的数学描述 (2)第2章典型变量与典型相关系数 (3)2.1 总体典型相关 (3)2.2 样本典型相关 (4)2.2.1 第一对典型相关变量的解法 (4)2.2.2 典型相关变量的一般解法 (8)2.2.3 从相关矩阵出发计算典型相关 (9)第3章典型相关变量的性质 (11)第4章典型相关系数的显著性检验 (15)第5章典型相关分析的计算步骤及应用实例 (18)5.1 典型相关分析的计算步骤 (18)5.2 实例分析 (19)结语 (26)致谢 (27)参考文献 (28)附录 (29)前言典型相关分析(Canonical Correlation Analysis ,CCA)作为多元统计学的一个重要部分,是相关分析研究的一个主要内容.典型相关分析不仅其方法本身具有重要的理论意义,而且它还可以作为其他分析方法,如多重回归、判别分析和相应分析的工具,因此在多元分析方法中占有特殊的地位.典型相关的概念是在两个变量相关的基础上发展起来的.我们知道,两个随机变量的相关关系可以用它们的简单相关系数来衡量;一个随机变量与一组随机变量之间的相关关系可以用复相关系数来衡量.但考虑一组随机变量与另一组随机变量的关系时,如果运用两个变量的相关关系,分别考虑第一组每个变量和第二组中每个变量的相关,或者运用复相关关系,考虑一组变量中的每个变量和另一组变量的相关,这样做比较繁琐,抓不住要领.因此,为了用比较少的变量来反映两组变量之间的相关关系,一种考虑的思路就是类似主成分分析,考虑两组变量的线性组合,从这两个线性组合中找出最相关的综合变量,通过少数几个综合变量来反映两组变量的相关性质,这样便引出了典型相关分析.典型相关分析的基本思想是首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止.有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数.典型相关分析是由Hotelling于1936年提出的.就目前而言,它的理论己经比较完善,计算机的发展解决了典型相关分析在应用中计算方面的困难,成为普遍应用的进行两组变量之间相关性分析技术.如在生态环境方面,用典型相关理论对预报场与因子场进行分析,实现了短期气象预测;借助典型相关,分析了植被与环境的关系;在社会生活领域,应用典型相关分析了物价指标和影响物价因素的相关关系等等.第1章 典型相关分析的数学描述一般地,假设有一组变量p X X X ,,,21 与另一组变量q Y Y Y ,,,21 ,我们要研究这两组变量之间的相关关系,如何给两组变量之间的相关性以数量的描述.当q p ==1时,就是我们常见的研究两个变量X 与Y 之间的简单相关关系,其相关系数是最常见的度量,定义为:)()(),(Y Var X Var Y X Cov xy =ρ当1≥p ,1=q (或1,1=≥p q )时,p 维随机向量'21),(p X X X X =,设),(~1∑⎥⎦⎤⎢⎣⎡+μp N Y X ,⎥⎦⎤⎢⎣⎡∑∑∑∑=∑22211211,其中,11∑是第一组变量的协方差阵,12∑是第一组与第二组变量的协方差阵,22∑是第二组变量的协方差阵.则称221211121∑∑∑∑=-R 为Y 与p X X X ,,,21 的全相关系数,全相关系数用于度量一个随机变量Y 与另一组随机变量p X X X ,,,21 的相关系数.当1,>q p 时,利用主成分分析的思想,可以把多个变量与多个变量之间的相关化为两个新的综合变量之间的相关.也就是做两组变量的线性组合即X X X X U p p '2211αααα=++= Y Y Y Y V q q '2211ββββ=++=其中,'21),,,(p αααα =和'21),,,(q ββββ =为任意非零向量,于是我们把研究两组变量之间的问题化为研究两个变量V U 与之间的相关问题,希望寻求α,β使U ,V 之间最大可能的相关,我们称这种相关为典型相关,基于这种原则的分析方法就是典型相关分析.第2章 典型变量与典型相关系数2.1 总体典型相关设有两组随机变量'21),,,(p X X X X =,'21),,,(q Y Y Y Y =,分别为维维和q p 随机向量,根据典型相关分析的思想,我们用X 和Y 的线性组合X 'α和Y 'β之间的相关性来研究两组随机变量X 和Y 之间的相关性.我们希望找到βα和,使得)(‘Y X ',βαρ最大.由相关系数的定义)()(),(),(''''''Y Var X Var Y X Cov Y X βαβαβαρ=易得出对任意常数d c f e ,,,,均有),(])(,)([''''Y X d Y c f X e βαρβαρ=++这说明使得相关系数最大的Y X '',βα并不唯一.因此,为避免不必要的结果重复,我们在求综合变量时常常限定1)('=X Var α , 1)('=Y Var β于是,我们就有了下面的定义:设有两组随机变量'21),,(p X X X X =,'21),,(q Y Y Y Y =,q p +维随机向量⎥⎦⎤⎢⎣⎡Y X 的均值向量为零,协方差阵0>∑(不妨设q p ≤).如果存在'1111),,(p ααα =和'1111),,(q βββ =,使得在约束条件1)('=X Var α ,1)('=Y Var β下,),(m ax ),('''1'1Y X Y X βαρβαρ=则称Y X '1'1,βα是Y X ,的典型相关变量,它们之间的相关系数称为典型相关系数;其他典型相关变量定义如下:定义了前1-k 对典型相关变量之后,第k 对典型相关变量定义为:如果存在'1),,(pk k k ααα =和'1),,(qk k k βββ =,使得 ⑴ Y X k k '',βα和前面的1-k 对典型相关变量都不相关;⑵ 1)('=X Var k α ,1)('=Y Var k β; ⑶ Y X k k ''βα和的相关系数最大,则称Y X k k ''βα和是Y X ,的第k 对(组)典型相关变量,它们之间的相关系数称为第k 个典型相关系数(p k ,,2 =).2.2 样本典型相关以上是根据总体情况已知的情形进行,而实际研究中,总体均值向量μ和协方差阵∑通常是未知的,因而无法求得总体的典型相关变量和典型相关系数,首先需要根据观测到的样本数据阵对∑进行估计. 2.2.1 第一对典型相关变量的解法设总体'11),,,,,(q p Y Y X X Z =,已知总体的n 次观测数据为:1)()()()(⨯+⎥⎥⎦⎤⎢⎢⎣⎡=q p t t t Y X Z (n t ,,2,1 =), 于是样本数据阵为)(212122221222211121111211q p n nq n n np n n q p q py y y x x x y y y x x x y y y x x x +⨯⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡若假定),,(~∑+μq p N Z 则由参考文献【2】中定理2.5.1知协方差阵∑的最大似然估计为'1)()()()(1∑=--∧--=∑nt t t Z Z Z Z n其中-Z =∑=nt t Z n 1)(1,样本协方差矩阵S ∧∑=为:⎥⎦⎤⎢⎣⎡=22211211S S S SS 式中∑=----=nj j j X X X X n S 1'11)()(1'112)()(1-=---=∑Y Y X X n S j nj j =21S ∑=----nj j j X X Y Y n 1')()(1 '122)()(1-=---=∑Y Y Y Y n S j nj j ∑=-=n j j X n X 11, ∑=-=nj j Y n Y 11令j j X U 'α=,j j Y V 'β=,则样本的相关系数为∑∑∑=-=--=-----=nj jnj jj nj j j j V VU UV V U U V U r 1212'1)()()()(),(又因为:-===-====∑∑∑X X n X n U n U n j j n j j n j j '1'1'1111ααα-===-====∑∑∑Y Y n Y n V n V n j j n j j n j j '1'1'1111ββββαββαα12''''1'''1)()(1)()(1S Y Y X X n V V U U n S j n j j j n j j V U jj =--=--=-=--=-∑∑ αααααα11''''1'''1)()(1)()(1S X X X X n U U U U n S j n j j j n j j U U jj =--=--=-=--=-∑∑ββββββ22''''1'''1)()(1)()(1S Y Y Y Y n V V V V n S j n j j j n j j V V jj =--=--=-=--=-∑∑ 所以ββααβα22'11'12'),(S S S V U r j j =由于j U ,j V 乘以任意常数并不改变他们之间的相关系数,即不妨限定取标准化的j U 与j V ,即限定j U 及j V 的样本方差为1,故有:1==j j j j V V U U S S (2.2.1) 则 βα12'),(S V U r j j = (2.2.2) 于是我们要求的问题就是在(2.2.1)的约束条件下,求p R ∈α,q R ∈β,使得式(2.2.2)达到最大.这是条件极值的问题,由拉格朗日乘子法,此问题等价于求α,β,使)1(2)1(2),(22'11'12'----=∧∧ββμααλβαβαϕS S S(2.2.3) 达到最大.式中,∧λ,∧μ为拉格朗日乘数因子.对上式分别关于α,β求偏导并令其为0,得方程组:⎪⎪⎩⎪⎪⎨⎧=-=∂∂=-=∂∂∧∧0022211112βμαβϕαλβαϕS S S S (2.2.4)分别用'α,'β左乘方程(2.2.4)得⎪⎩⎪⎨⎧====∧∧∧∧μββμαβλααλβα22'21'11'12'S S S S 又 ='12')(βαS αβ21'S 所以 ∧∧===λβααβμ'12'21')(S S也就是说,∧λ正好等于线性组合U 与V 之间的相关系数,于是(2.2.4)式可写为:⎪⎩⎪⎨⎧=-=-∧∧0022211112βλααλβS S S S 或 022211211=⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡--∧∧βαλλS S S S(2.2.5) 而式(2.2.5)有非零解的充要条件是:022211211=--∧∧S S S S λλ (2.2.6)该方程左端是∧λ的q p +次多项式,因此有q p +个根.求解∧λ的高次方程(2.2.6),把求得的最大的∧λ代回方程组(2.2.5),再求得α和β,从而得出第一对典型相关变量.具体计算时,因∧λ的高次方程(2.2.6)不易解,将其代入方程组(2.2.5)后还需求解q p +阶方程组.为了计算上的方便,我们做如下变换:用12212-S S 左乘方程组(2.2.5)的第二式,则有12212-SS α21S -02212212=-∧βλS S S 即 12212-S S α21S =βλ12S ∧又由(2.2.5)的第一式,得 αλβ1112S S ∧= 代入上式: 12212-SS α21S 0112=-∧αλS(0)1122112212=-∧-αλS S S S (2.2.7)再用111-S 左乘式(2.2.7),得(111-S12212-SS 0)221=-∧αλp I S (2.2.8)因此,对∧2λ有p 个解,设为22221p r r r ≥≥≥ ,对α也有p 个解.类似地,用11121-S S 左乘式(2.2.5)中的第一式,则有011111211211121=--∧-αλβS S S S S S (2.2.9)又由(2.2.5)中的第二式,得βλα2221S S ∧= 代入到(2.2.8)式,有 11121(-SS 12S 0)222=-∧βλS再以122-S 左乘上式,得0)(21211121122=-∧--βλq I S S S S (2.2.10)因此对2∧λ有q 个解,对β也有q 个解,因此2∧λ为111-S 12212-S S 21S 的特征根,α是对应于2∧λ的特征向量.同时2∧λ也是1211121122S S S S --的特征根,β为相应特征向量.而式(2.2.8)和(2.2.10)有非零解的充分必要条件为:⎪⎪⎩⎪⎪⎨⎧=-=-∧--∧--002121112112222112212111q p I S S S S I S S S S λλ (2.2.11)对于(2.2.11)式的第一式,由于011>S ,022>S ,所以0111>-S ,0122>-S ,故有:2112212111S S S S --2121221221221112111S S S S S S ----= 而2121221221221112111S S S S S S ----与2111211222122122111----S S S S S S 有相同的特征根.如果记=∧T 12212111--S S S则 2111211222122122111----S S S SS S='∧∧T T类似的对式(2.2.11)的第二式,可得 ∧∧----=T T SS SSS S'21221221112111212122而'∧∧T T 与∧∧T T '有相同的非零特征根,从而推出(2.2.8)和(2.2.10)的非零特征根是相同的.设已求得'∧∧T T 的p 个特征根依次为: 022221>≥≥≥∧∧∧p λλλ则T T '的q 个特征根中,除了上面的p 个外,其余的p q -个都为零.故p 个特征根排列是021>≥≥≥p λλλ ,, 1210λλλλ-≥-≥≥-≥->- p p ,因此,只要取最大的1λ,代入方程组(2.2.5)即可求得相应的1αα=,1ββ=.令U =X '1α与Y V '1β=为第一对典型相关变量,而1'112'1),(λβα==S V U r 为第一典型相关系数.可见求典型相关系数及典型相关变量的问题,就等价于求解'∧∧T T 的最大特征值及相应的特征向量. 2.2.2 典型相关变量的一般解法从样本典型相关变量的解法中,我们知道求典型相关变量和典型相关系数的问题,就是求解'∧∧T T 的最大特征值及相应的特征向量.不仅如此,求解第k 对典型相关变量和典型相关系数,类似的也是求'∧∧T T 的第k 大的特征值和相应的特征向量.下面引用参考文献【2】中定理10.1.1 来得出样本典型相关的一般求法.设总体的n 次观测数据为:1)()()()(⨯+⎥⎥⎦⎤⎢⎢⎣⎡=q p t t t Y X Z (n t ,,2,1 =) 不妨设q p ≤,样本均值为0,协方差矩阵S 为:⎥⎦⎤⎢⎣⎡=22211211S S S SS 0> 记2122122111--∧=SS ST ,并设p 阶方阵'∧∧T T 的特征值依次为022221>≥≥≥∧∧∧p λλλ (p i i ,,1,0 =>λ);而p l l l ,,,21 为相应的单位正交特征向量.令 kk l S2111-∧=α,∧--∧=k k k S S αλβ211221则X U k k '∧=α,Y V kk '∧=β为Y X ,第k 对典型相关变量,'k ∧λ为第k 典型相关系数. 由上述分析不难看出,典型相关系数∧i λ越大说明相应的典型变量之间的关系越密切,因此一般在实际中忽略典型相关系数很小的那些典型变量,按∧i λ的大小只取前n 个典型变量及典型相关系数进行分析. 2.2.3 从相关矩阵出发计算典型相关以上我们从样本协方差阵S 出发,导出了样本典型相关变量和样本典型相关系数.下面我们从样本相关阵R 出发来求解样本典型相关变量和样本典型相关系数.设样本相关阵为)(ij r R =,其中jj ii ij ij s s s r /=,ij s 为样本协方差阵S 的i 行j 列元素.把R 相应剖分为⎥⎦⎤⎢⎣⎡=22211211R R R R R 有时,Y X 和的各分量的单位不全相同,我们希望在对各分量作标准化变换之后再做典型相关.记)(1X E =μ,)(2Y E =μ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=pp s s D 00111⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=++++q p q p p p s s D ,1,1200则 111111D R D S =,222222D R D S = 212112D R D S =,121221D R D S =, 对Y X 和的各分量作标准化变换,即令)(111*μ-=-X D X ,)(212*μ-=-Y D Y现在来求*X 和*Y 的典型相关变量*'*X i α,*'*Y i β,m i ,,2,1 =. **11111111X X S D S D R --==**11222222Y Y S D S D R --== **11112212X Y S D S D R --== **11221121Y X S D S D R --==于是1121122121111112112112221212121111111112112212111)()(---------------==DS S S S D D S D D S D D S D D S D R R R R因为 2112212111S S S S --i i i r αα2= 1121122121111---D S S S S D )()(121i i i D r D αα= 所以 2112212111R R R R --*2*i i i r αα= 式中*i αi D α1=,有111'1111'*11'*===i i i i i i S D R D R αααααα同理: 1211121122R R R R --*2*i i i r ββ= 式中*i βi D β1=,有122'2222'*22'*===i i i i i i S D R D R ββββββ,由此可见*i α,*i β为**,Y X 的第i 对典型系数,其第i 个典型相关系数为i r ,在标准化变换下具有不变性.第3章 典型相关变量的性质根据典型相关分析的统计思想及推导,我们归纳总结了典型相关变量的一些重要性质并对总体与样本分别给出证明.性质1 同一组的典型变量互不相关 ⅰ总体典型相关设Y X 与的第i 对典型变量为X U i i 'α= ,Y V i i 'β=,m i ,,2,1 =则有 0),(=j i U U ρ 0),(=j i V V ρ m j i ≤≠≤1 证明详见参考文献【5】. ⅱ样本典型相关设Y X 与的第i 对典型变量为X U i i 'α= ,Y V i i 'β=,m i ,,2,1 =因为 '111i i U U i i S S αα==,'221i iVV i i S S ββ==,m i ,,2,1 = '11(,)0i j i j U U i j r U U S S αα===,m j i ≤≠≤1'22(,)0i ji j VV i j r V V S S ββ===,m j i ≤≠≤1 表明由X 组成的第一组典型变量m U U U ,,,21 互不相关,且均有相同的方差1;同样,由Y 组成的第二组典型变量m V V V ,,,21 也互不相关,且也有相同的方差1.性质2 不同组的典型变量之间的相关性ⅰ总体典型相关i i i V U ρρ=),( m i ,,2,1 =0),(=j i V U ρ m j i ≤≠≤1 证明详见参考文献【5】. ⅱ样本典型相关i i i i i r V U r S ),(12'==βα, m i ,,2,1 ='1211''22111222(,)0,1i j i j U V i ji j j i j r U V S S S S S r i j mαβαβαα--=====≤≠≤表明不同组的任意两个典型变量,当j i =时,相关系数为i r ;当j i ≠时是彼此不相关的.记'21),,,(m U U U U =,'21),,,(m V V V V =,则上述性质可用矩阵表示为 ,UU m VV m S I S I ==UV S =Λ或 mm IU S I V Λ⎛⎫⎛⎫= ⎪ ⎪Λ⎝⎭⎝⎭其中12(,,...,)m diag r r r Λ=性质3 原始变量与典型变量之间的关系 求出典型变量后,进一步计算原始变量与典型变量之间的相关系数矩阵,也称为典型结构.下面我们分别对总体与样本进行讨论.ⅰ总体典型相关的原始变量与典型变量的相关性详见参考文献【2】. ⅱ样本典型相关 记m p ij m A ⨯==)(),,,(21αααα m q ij m B ⨯==)(),,,(21ββββ=S ⎥⎦⎤⎢⎣⎡22211211S S S S =⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛++++++++++++++++q p q p p q p p q p q p q p p p p pp p q p p p p pp p q p p p s s s s s s s s s s s s s s s s ,1,,1,,11,1,11,1,1,1,11,1111则A S X A X A X X n S n i i XU11'''1)()(1=--=-=-∑ B S X B X B X X n S n i i XV12'''1)()(1=--=-=-∑ A S X A X A Y Y n S n i i YU21'''1)()(1=--=-=-∑ B S Y B Y B Y Y n S n i i YV22'''1)()(1=--=-=-∑所以利用协方差进一步可以计算原始变量与典型变量之间的相关关系.若假定原始变量均为标准化变量,则通过以上计算所得到的原始变量与典型变量的协方差阵就是相关系数矩阵.1(,)pi j ik k r X U s α==∑,1(,)qi j i p k k r X V s β+==∑p i ,,2,1 = , m j ,,2,1 =,1(,)pi j i p k kjk r Y U s α+==∑,1(,)qi j i p p k kjk r Y V s β++==∑q i ,,2,1 = , m j ,,2,1 =性质4 设Y X 和分别为维维和q p 随机向量,令d X C X +='*,h Y G Y +='*,其中C 为p p ⨯阶非退化矩阵,d 为p 维常数向量,G 为q q ⨯阶非退化矩阵,q h 为维常数向量.则:ⅰ对于总体典型相关有:⑴ **Y X 和的典型相关变量为*'*)(X a i 和*'*)(Y b i ,其中i i a C a 1*-=,i i b G b 1*-=(p i ,,2,1 =);而i i b a 和是Y X 和的第i 对典型相关变量的系数.⑵ ],[])(,)[(''*'**'*Y b X a Y b X a i i i i ρρ=,即线性变换不改变相关性. 证明详见参考文献【2】.ⅱ对于样本典型相关有:⑴ **Y X 和的典型相关变量为*'*)(X a i 和*'*)(Y b i ,其中i i a C a 1*-=,i i b G b 1*-=(p i ,,2,1 =);而i i b a 和是Y X 和的第i 对典型相关变量的系数.⑵ ],[])(,)[(''*'**'*Y b X a r Y b X a r i i i i =,即线性变换不改变相关性. 证明:⑴ 设**Y X 和的典型相关变量分别为*'*)(X a U i =,*'*)(Y b V i =由于 i i a C a 1*-=,i i b G b 1*-=d X C X +='*,h Y G Y +='*所以 d C a X a d X C C a d X C a C U i i i i '1''''1'''1)()()()()(---+=+=+=h G b Y b h Y G G b h Y G b G V i i i i '1''''1'''1)()()()()(---+=+=+=即有i i b a 和是Y X 和的第i 对典型相关变量的系数. ⑵ 由⑴的证明可知*'*)(X a U i =d C a X a i i '1'')(-+= *'1'''*)()(h G b Y b Y b V i i i -+==由于d C a i '1')(-与h G b i '1')(-都是常数,所以],[])(,)([])(,)[('''1'''1''*'**'*Y b X a r h G b Y b d C a X a r Y b X a r i i i i i i i i =++=-- 即有线性变换不改变相关性.性质5 简单相关、复相关和典型相关之间的关系当1==q p , Y X 与之间的(惟一)典型相关就是它们之间的简单相关;当Y X q p 与时或,11==之间的(惟一)典型相关就是它们的复相关.复相关是典型相关的一个特例,而简单相关又是复相关的一个特例.从第一个典型相关的定义可以看出,第一个典型相关系数至少同)(Y X 或的任一分量与)(X Y 或的复相关系数一样大,即使所有这些复相关系数都很小,第一个典型相关系数仍可能很大;同样,从复相关的定义也可以看出,当1=p (或1=q )时,)()(X Y Y X 或与或之间的复相关系数也不会小于)()(X Y Y X 或与或的任一分量之间的相关系数,即使所有这些相关系数都很小,复相关系数仍可能很大.第4章 典型相关系数的显著性检验设总体Z 的两组变量'21),,,(p X X X X =,'21),,,(q Y Y Y Y =,且'),(Y X Z =),(~∑+μq p N ,在做两组变量X ,Y 的典型相关分析之前,首先应该检验两组变量是否相关,如果不相关,则讨论两组变量的典型相关就毫无意义. 1.考虑假设检验问题:0H :021====m ρρρ1H :m ρρρ,,,21 至少有一个不为零其中{}q p m ,m in =.若检验接受0H ,则认为讨论两组变量之间的相关性没有意义;若检验拒绝0H ,则认为第一对典型变量是显著的.上式实际上等价于假设检验问题0H :0),(12=∑=Y X Cov , 1H :012≠∑用似然比方法可导出检验0H 的似然比统计量||||||2211S S S =Λ其中q p +阶样本离差阵S 是∑的最大似然估计,且S =⎥⎦⎤⎢⎣⎡22211211S S S S ,11S ,22S 分别是11∑,22∑的最大似然估计.该似然比统计量Λ的精确分布已由霍特林(1936),Girshik (1939)和Anderson (1958)给出,但表达方式很复杂,又不易找到该分布的临界值表,下面我们采用Λ的近似分布.利用矩阵行列式及其分块行列式的关系,可得出:||·||||21122121122S S S S S S --==|S S S S |·|S |·||21-12212-1111122-I p S所以)1(001001||212212112212111∧=--∏-=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛=-I =Λipi p p S S S S λλλ其中∧2iλ是∧∧'TT 的特征值(2122122111--∧=S S S T ),按大小次序排列为∧21λ≥∧22λ≥≥ 02>∧pλ,当1>>n 时,在0H 成立下Λ-=ln 0m Q 近似服从2f χ分布,这里pq f =,)1(211++--=q p n m ,因此在给定检验水平α之下,若由样本算出的20αχ>Q 临界值,则否定0H ,也就是说第一对典型变量1∧U ,1∧V 具有相关性,其相关系数为1∧λ,即至少可以认为第一个典型相关系数1∧λ为显著的.将它除去之后,再检验其余1-p 个典型相关系数的显著性,这时用Bartlett 提出的大样本2χ检验计算统计量:∏=∧∧∧∧-=---=Λpi ip22223221)1()1()1)(1(λλλλ则统计量11ln )]1(212[Λ++---=q p n Q近似地服从(1-p )(1-q )个自由度的2χ分布,如果21αχ>Q ,则认为2∧λ显著,即第二对典型变量2U ,2V 相关,以下逐个进行检验,直到某一个相关系数k ∧λ检验为不显著时截止.这时我们就找出了反映两组变量相互关系的1-k 对典型变量.2.检验)(0k H : ),,2(0p k k ==λ当否定0H 时,表明Y X ,相关,进而可以得出至少第一个典型相关系数01≠λ,相应的第一对典型相关变量11,V U 可能已经提取了两组变量相关关系的绝大部分信息.两组变量余下的部分可认为不相关,这时0≈k λ),,2(p k =,故在否定0H 后,有必要再检验)(0k H ),,2(p k =,即第k 个及以后的所有典型相关系数均为0),,3,2(p k =.为了减少计算量,下面我们采用二分法来减少检验次数,取检验统计量为∑=∧-++---=p ki i k q p k n Q )1ln()]1(21[2λ它近似服从)1)(1(+-+-k q k p 个自由度的2χ分布.在检验水平α下,若)]1)(1[(2+-+->k q k p Q k αχ,则拒绝0H ,即认为第k 对典型相关系数在显著性水平α下是显著的,否则不显著.从第2个典型相关系数到第p 个典型相关系数,共1-p 个数,所以根据二分法的原理,将它们分为一个区间[]p ,2,然后先检验第⎥⎦⎤⎢⎣⎡-21p 个典型相关系数即中位数,当021=⎥⎦⎤⎢⎣⎡-p λ时,即认为第⎥⎦⎤⎢⎣⎡-21p 个典型相关系数不相关,否定原假设,接着检验⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-21,2p ;若当021≠⎥⎦⎤⎢⎣⎡-p λ时,则检验⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-p p ,21.如此划分区间依次检验下去,由数学分析上的区间套定理,一定存在第k 个数),,3,2(p k =,使得01≠-k λ,而0=k λ.以上的一系列检验实际上是一个序贯检验,检验直到对某个k 值0H 未被拒绝为止.事实上,检验的总显著性水平已不是α了,且难以确定.还有,检验的结果易受样本容量大小的影响.因此,检验的结果只宜作为确定典型变量个数的重要参考依据,而不宜作为惟一的依据.第5章 典型相关分析的计算步骤及应用实例5.1 典型相关分析的计算步骤设)()1(,,n X X 为取自正态总体的样本(实际上,相当广泛的情况下也对),每个样品测量两组指标,分别记为'1),,(p X X X =,'1),,(q Y Y Y =,原始资料矩阵为:)(212122221222211121111211q p n nq n n np n n q p q py y y x x x y y y x x x y y y x x x +⨯⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡第一步 计算相关矩阵R ,并将R 剖分为⎥⎦⎤⎢⎣⎡=22211211R R R R R 其中11R ,22R 分别为第一组变量和第二组变量之间的相关系数矩阵,'2112R R =为第一组与第二组变量之间的相关系数.第二步 求典型相关系数及典型变量首先求2112212111R R R R A --∧=的特征根∧2iλ,特征向量)(1i D ∧α;1211121122R R R R B --∧=的特征根∧2iλ,特征向量)(2i D ∧β.)()(111)(i i D D ∧-∧=⇒αα,)()(212)(i i D D ∧-∧=ββ写出样本的典型变量为 X U ’)1(1∧∧=α,Y V ’)1(1∧∧=βX U ’)2(2∧∧=α,Y V ’)2(2∧∧=βX U p p ’)(∧∧=α,Y V p p ’)(∧∧=β第三步 典型相关系数的显著性检验 首先,检验第一对典型变量的相关系数,即0H :0^1=λ,1H :0^1≠λ它的似然比统计量为∏=-=---=Λpi i p1^2^2^22^211)1()1()1)(1(λλλλ则统计量11ln )]1(212[Λ++---=q p n Q给定显著性水平α,查表得2αχ,若21αχ>Q ,则否定0H ,认为第一对典型变量相关,否则不相关.如果相关则依次逐个检验其余典型相关系数,直到某一个相关系数^k λ),,2(p k =检验为不显著时截止.5.2 实例分析例1:某康复俱乐部对20名中年人测量了三个生理指标:体重)(1x 、腰围(2x )、脉搏(3x )和三个训练指标:引体向上(1y )、起坐次数(2y )、跳跃次数(3y ).数据如附录1:解:记'321),,(x x x X =,'321),,(y y y Y =,其中样本容量20=n .附录1中的数据用SPSS 统计软件计算得六个变量之间的相关矩阵如下:n Sig.(2-tailed) .113 .127. .526 .340 .884 N 20 20 20 202020 Y1Pearson Correlatio n -.390 -.552(*) .1511 .696(**).496(*)Sig.(2-tailed) .089 .012.526 . .001 .026 N 20 20 20202020Y2PearsonCorrelatio n -.493(*)-.646(**).225 .696(**) 1 .669(**)Sig.(2-tailed) .027 .002.340 .001 . .001 N 20 20 20 202020 Y3Pearson Correlatio n -.226 -.191 .035.496(*) .669(**)1Sig.(2-tailed) .337 .419.884 .026 .001 . N 20 2020202020** Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at the 0.05 level (2-tailed).即样本相关矩阵为:11R =⎪⎪⎪⎭⎫ ⎝⎛--1353.0366.01870.0122R =⎪⎪⎪⎭⎫ ⎝⎛1669.0496.01696.01'2112R R ==⎪⎪⎪⎭⎫⎝⎛------035.0225.0151.0192.0646.0552.0226.0493.0390.0于是特征方程 022112212111=---λR R R R用Matlab 求得矩阵2112212111R R R R --的特征值分别为0.6630、0.0402和0.0053,于是 797.01=λ,201.02=λ,073.03=λ下面我们进行典型相关系数的显著性检验,先检验第一对典型变量的相关系数,欲检验:0H :01=λ , 1H :01≠λ 它的似然比统计量为)1)(1)(1(2322211λλλ---=Λ=3504.0)0053.01)(0402.01)(6330.01(=--- 255.163504.0ln 5.15ln )]333(2120[11=⨯-=Λ++--=Q查2χ分布表得,919.16)9(205.0=χ,因此在05.0=α的显著性水平下,)9(205.01χ≥Q ,所以拒绝原假设0H ,也即认为第一对典型相关变量是显著相关的.然后检验第二对典型变量的相关系数,即进一步检验:0H :02=λ , 1H :02≠λ它的似然比统计量为9547.0)0053.01)(0402.01()1)(1(23222=--=--=Λλλ)4(488.9745.09547.0ln 08.16ln ])333(21120[205.02212χλ=<=⨯-=Λ+++---=-Q 所以无法否定原假设0H ,故接受0H :02=λ,即认为第二对典型相关变量不是显著相关的.由以上检验可知只需求第一对典型变量即可. 于是求797.01=λ的特征向量∧*1α,而∧*1β∧-=*12112211αλR R ,解得 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=∧059.0579.1775.0*1α, ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=∧716.0054.1350.0*1β, 因此,第一对样本典型变量为*3*2*1*1059.0579.1775.0x x x u -+-= *3*2*1*1716.0054.1350.0y y y v +--=Y X 与第一对典型变量的相关系数为797.01=λ,可见两者的相关性较为密切,即可认为生理指标与训练指标之间存在显著相关性.例2:为了研究某企业不同部门人员工作时间的关系,随机选取25个企业进行入户调查,达到25个被访企业业务部门和技术部门经理每月工作时间和员工每月工作时间(单位为小时),具体数据如附表2分析:设业务部门经理和员工每月工作时间为(21,X X ),技术部门经理和员工每月工作时间为(21,Y Y ),利用典型相关分析研究企业业务部门和技术部门人员工作时间的关系.解:样本容量为25=n ,2=p ,2=q 分别为随机变量Y X 与的维数.⑴ 标准化随机变量'21),(X X X =与'21),(Y Y Y =.根据样本均值i x -与标准差ii S ,依照公式iiiki ki S x x x --=*,对数据标准化.⑵ 求解⎪⎪⎭⎫⎝⎛Y X 的相关矩阵R ,并将其分块⎪⎪⎭⎫⎝⎛=yy yxxy xx R RR R R . 将数据输入SPSS 软件求得相关系数矩阵如下:Correlations** Correlation is significant at the 0.01 level (2-tailed).所以样本相关矩阵⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=1834.0705.0705.01693.0711.01735.01R 分块后2222⎪⎪⎭⎫ ⎝⎛=yy yx xy xx R RR R R ⑶ 求解⎪⎪⎭⎫ ⎝⎛==----534949.0538840.0538840.0544309.011111yx yy xy xx R R R R M 的两个非零特征根,解得两个非零特征根为6218.021=λ,0029.022=λ.⑷ 进行相关系数的显著性检验,取r m ≤个显著性检验不为0的特征根.Y X 与第一对典型变量的相关系数为7885.01=λ,Y X 与第二对典型变量的相关系数为0537.02=λ.先检验第一对典型变量的相关系数,假设01H :01=λ(即第一对典型变量不相关),由典型相关系数的值可得3771.0)1)(1(22211=--=Λλλ计算统计量97.203771.0ln )5.224(ln )]1(21)1[(11=-=Λ++---=q p n Q 对于给定的显著性水平05.0=α488.9)4()1)(1(97.20205.021==+-+-≥=χχαm q m p Q所以否定零假设.01H :01=λ,即第一对典型变量是显著相关的.然后检验第二对典型变量的相关系数,假设02H :02=λ(即第二对典型变量不相关),由典型相关系数的值可得9971.0)1(222=-=Λλ 计算统计量05945.09971.0ln )5.224(ln )]1(21)2[(22=-=Λ++---=q p n Q 对于给定的显著性水平05.0=α841.3)1()1)(1(05945.0205.022==+-+-≤=χχαm q m p Q所以无法否定假设.02H :02=λ,即第二对典型变量不是显著相关的.由以上检验可知,只需求第一对典型变量即可.⑸ 求1=m 个显著性检验不为0的特征根21λ的特征向量1l ,而11111l R R m yx yy -=λ,解得'1)521548.0,55216.0(=l ,'1)538134.0,504018.0(=m .⑹ 求出r 对典型相关变量X l u j j '=,Y m v j j '=,.,,2,1m j = 根据上面求得的特征向量11m l 和,得第一对典型相关变量为⎩⎨⎧+==+==21'1121'11538134.0504018.0521548.055216.0Y Y Y m v X X X l u Y X 与第一对典型变量的相关系数为7885.01=λ,可见其相关性较为密切.⑺ 由于21'11521548.055216.0X X X l u +==,与业务部门经理和员工每月工作时间都成正比,而且系数差不多,所以u可以解释为业务部门人员工作时间.同1理v可以解释为技术部门人员的工作时间.可见一个企业技术部门和业务部门人1员月工作时间存在显著的相关性.典型相关分析是一种采用类似主成分分析的做法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),通过研究两组的综合指标之间的关系来反映两组变量之间的相关关系.在实际中,只须着重研究相关关系较大的那几对典型相关变量.本文首先根据典型相关分析的统计理论,初步探讨了总体典型相关变量和典型相关系数,然后重点讨论了样本典型相关分析,以及它们的一系列性质与显著性检验,并做了相应的实例分析.通过实例分析,我们进一步明确了典型相关分析是研究两组变量之间相关性的一种降维技术的统计分析方法.而复相关是典型相关的一个特例,简单相关是复相关的一个特例.第一对典型相关包含有最多的有关两组变量间相关的信息,第二对其次,其他对依次递减.各对典型相关变量所含的信息互不重复.并且经标准化的两组变量之间的典型相关系数与原始的两组变量间的相应典型相关系数是相同的.本文是在我的指导老师吴可法教授的精心指导和悉心关怀下完成的,在我的学习生涯和论文工作中无不倾注着老师的辛勤汗水和殷切关怀.吴老师宽厚的人格、敏捷的思维、严谨的治学态度、渊博的知识、积极向上的人生态度、平易近人的师长风范和两年来的谆谆教导,使我深受启迪,并永远铭记在心.从吴老师身上,我不仅学到了扎实的专业知识和技能,更学到了做人的道理,这些教诲必将成为惠及一生的宝贵财富.在此谨向吴老师致以最衷心的感谢和美好的祝愿!论文期间,我得到了许多老师和同学的帮助,本人在这里对他们致以衷心的感谢.我还要感谢我的家人,是他们的理解、支持和鼓励,使我的学习能够顺利进行.最后衷心感谢在百忙之中评审论文和参加答辩的各位专家、教授!。
相关性分析案例
相关性分析案例《相关性分析案例:探寻隐藏在数据背后的关系》嗨,朋友!今天我想跟你唠唠相关性分析这事儿。
这就像是在一堆乱麻里找线头,一旦找着了,那可是能把你从迷雾里拽出来呢!我有个朋友小明,他呀,打算开一家奶茶店。
但是他很纠结,不知道店铺应该开在哪里才好。
是商场呢?还是学校附近?还是街边某个角落?这就像是他站在一个三岔路口,不知道走哪条路才能通向成功。
这时,相关性分析就大有用场啦。
小明先是收集了很多数据,比如说不同区域的人流量、年龄分布,还有各个地点周围别的奶茶店的销量等等。
他发现了一个特别有趣的现象。
在学校附近的区域,人流量中的年轻人占比和奶茶店销量之间好像有着千丝万缕的联系。
就像江湖中的侠客和他的佩剑,形影不离。
他统计的数据表明,如果一个区域年轻人比例越高,那那里奶茶店的销量就蹭蹭往上涨,这就像是有只无形的手在推动着。
哎呀,这可把小明高兴坏了,就像饿了几天突然见到满桌大餐一样。
还有个例子呢!我表姐是做服装生意的。
她一直在思索衣服的颜色和销量之间有没有什么奥秘。
她把过去几年里卖出衣服的颜色和对应的销售数量都记了下来。
结果她那眼珠都快瞪出来了,黑色衣服的销量好像跟季节特别有关系。
在冬季的时候,黑色衣服就像被施了魔法一样,特别畅销。
她跟我说这个事儿的时候,兴奋得就像个孩子发现了糖果宝藏,“哇塞,原来真的有关系啊!”这就好比夜空中最亮的星星和黑暗的夜晚,两者相得益彰。
冬季人们往往为了保暖会选择深色系衣物,而黑色就占据了头把交椅,怪不得销量那么好。
从这些例子里啊,我就明白了一个事儿。
相关性分析就像是一把神奇的钥匙,能打开通往成功决策的大门。
它让我们看到那些表面上看起来毫不相干的东西之间的内在联系。
无论是开奶茶店还是卖衣服,找到这些相关性就能够更精准地把握商机。
所以我觉得呀,相关性分析这玩意儿,就像黑暗里的一盏明灯,谁要是掌握了它,那在做事情的时候就像顺风顺水的小船儿,能比别人走得更远一些呢。
这就是我关于相关性分析案例的一些小感悟啦。
07典型相关分析报告
典型相关分析专题§ 9.1引言典型相关分析是研究两组变量之间相关关系的一种统计分析方法,它能够真正反映两 组变量之间的相互线性依赖关系。
例如,F. V. Waugh ( 1942)研究了美国1921年至1940年每年牛肉、猪肉的价格与按 人口平均的牛肉和猪肉的消费量之间的相互关系, 可归结为研究这两组变量之间的相互依赖关系。
采用典型相关分析, 可由第一组变量构造一种价格指数,由第二组变量构造一种消费量指数,这两种指数分别为这两组变量的典型变量, 而后研究这两种指数间的相互关系。
又如,在工厂里常常要研究产品的q 个质量指标(y 1,y 2,…,y q )与原材料的p 个质量指标X 1,X 2,…,X p 之间的相关关系,这也是需采用典型相关分析来解决的问题。
一般地,为研究两组变量X 1,X 2,…,X p 和y 1,y 2,…,y q 之间的相关关系,常采用类似于 主成分的思想,找出第一组变量的某个线性组合u = a 1x 1• a 2x 2亠 亠a px p,并找出第二组变量的某个线性组合 v =b 1y 1 • b 2y 2………b q y q ,于是我们把研究两组变量之间相关的问题化为研究两个变量 u 与v 之间的相关问题,希望使 u 与v 的相关达到最大。
我们称这种 相关为典型相关,基于这种原则的分析方法称为典型相关分析。
§ 9.2总体典型相关一、典型相关的定义及导出 设V(x) = ^11( 0),V(y) = -2( 0),y y -21 -22其中匕21 =爲2典型相关分析研究的是,x 的线性函数u =ax 与y 的线性函数v =by 之间的相关关系,-12 yy 也11 孔12由于对任意非零常数 k 1和k 2,有(a —12b) ' (-:: —112—1^22 ■)(—11—12记m 为112的秩,则其中cov(u,v) =cov(ax,by) =a cov(x,y)b =a Z 12b(921V(u) = V(ax)二aV(x)a =aEna V(v)二V(by)二 bV(y)b 二 b [22b(922所以,u 与v 的相关系数为cov(u,v) a Z 12b⑴“八,V(ub,V(v) . ^i11^. bi22b(923cov(k 1u,k 2v)(k 1u,k 2v)_ V(k 1u) .. V(k 2v)k 1k 2 cov(u, v)cov( u, v)因此,为避免不必要的结果重复, 也、V(u)、V(v)、V(u) . V(v),(u,v)我们常常限定u 与v 均为标准化的变量,即附加约束条件V(u) =1,V(v) =1(924)这等价于约束条件a E^a =1 ,b 322b 二 1(925)已 我们的问题归结为在约束条件( 疋,9.2.4 )式或(9.2.5 )式下,求 a • R p 和 b R q ,使得(926 )达到最大。
典型相关分析SPSS例析
典型相关分析典型相关分析(Canonical correlation )又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。
典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关,而不是两个变量组个别变量之间的相关。
典型相关与主成分相关有类似,不过主成分考虑的是一组变量,而典型相关考虑的是两组变量间的关系,有学者将规则相关视为双管的主成分分析;因为它主要在寻找一组变量的成分使之与另一组的成分具有最大的线性关系。
典型相关模型的基本假设:两组变量间是线性关系,每对典型变量之间是线性关系,每个典型变量与本组变量之间也是线性关系;典型相关还要求各组内变量间不能有高度的复共线性。
典型相关两组变量地位相等,如有隐含的因果关系,可令一组为自变量,另一组为因变量。
典型相关会找出一组变量的线性组合**=i i j j X a x Y b y =∑∑与 ,称为典型变量;以使两个典型变量之间所能获得相关系数达到最大,这一相关系数称为典型相关系数。
i a 和j b 称为典型系数。
如果对变量进行标准化后再进行上述操作,得到的是标准化的典型系数。
典型变量的性质每个典型变量智慧与对应的另一组典型变量相关,而不与其他典型变量相关;原来所有变量的总方差通过典型变量而成为几个相互独立的维度。
一个典型相关系数只是两个典型变量之间的相关,不能代表两个变量组的相关;各对典型变量构成的多维典型相关,共同代表两组变量间的整体相关。
典型负荷系数和交叉负荷系数典型负荷系数也称结构相关系数,指的是一个典型变量与本组所有变量的简单相关系数,交叉负荷系数指的是一个典型变量与另一组变量组各个变量的简单相关系数。
典型系数隐含着偏相关的意思,而典型负荷系数代表的是典型变量与变量间的简单相关,两者有很大区别。
重叠指数如果一组变量的部分方差可以又另一个变量的方差来解释和预测,就可以说这部分方差与另一个变量的方差之间相重叠,或可由另一变量所解释。
多元统计典型相关分析实例
多元统计典型相关分析实例第一篇:多元统计典型相关分析实例1、对体力测试(共7项指标)及运动能力测试(共5项指标)两组指标进行典型相关分析Run MATRIX procedure:Correlations for Set-1 X1 X2 X3 X4 X5 X6 X7 X1 1.0000.2701.1643-.0286.2463.0722-.1664 X2.2701 1.0000.2694.0406-.0670.3463.2709 X3.1643.2694 1.0000.3190-.2427.1931-.0176 X4-.0286.0406.3190 1.0000-.0370.0524.2035 X5.2463-.0670-.2427-.0370 1.0000.0517.3231 X6.0722.3463.1931.0524.0517 1.0000.2813 X7-.1664.2709-.0176.2035.3231.2813 1.0000Correlations for Set-2 X8 X9 X10 X11 X12 X8 1.0000-.4429-.2647-.4629.0777 X9-.4429 1.0000.4989.6067-.4744 X10-.2647.4989 1.0000.3562-.5285 X11-.4629.6067.3562 1.0000-.4369 X12.0777-.4744-.5285-.4369 1.0000两组变量的相关矩阵说明,体力测试指标与运动能力测试指标是有相关性的。
Correlations Between Set-1 and Set-2 X8 X9 X10 X11 X12 X1-.4005.3609.4116.2797-.4709 X2-.3900.5584.3977.4511-.0488 X3-.3026.5590.5538.3215-.4802 X4-.2834.2711-.0414.2470-.1007 X5-.4295-.1843-.0116.1415-.0132X6-.0800.2596.3310.2359-.2939 X7-.2568.1501.0388.0841.1923 上面给出的是两组变量间各变量的两两相关矩阵,可见体力测试指标与运动能力测试指标间确实存在相关性,这里需要做的就是提取出综合指标代表这种相关性。
采用经验分析法的成功案例
采用经验分析法的成功案例今儿个我就跟你们唠唠一件特有意思的事儿,这事儿啊,就是咱小区门口那家小小的早餐摊儿,通过经验分析法,那生意是做得红红火火的。
咱小区门口这条街啊,人来人往的,早上那更是热闹得很。
各种早餐摊儿一个挨着一个,什么煎饼果子、油条豆浆、小笼包啥的,应有尽有。
这其中就有一家不起眼的馄饨摊儿,摊主是一对老夫妻,咱就叫他们老张头和李婶儿吧。
刚开始的时候啊,这馄饨摊儿生意一般般。
老张头每天早上就闷头包馄饨、煮馄饨,李婶儿在旁边招呼客人。
可是来吃的人总是稀稀拉拉的,老张头就有点着急了,整天唉声叹气的。
有一天,老张头和李婶儿坐在摊儿前,一边收拾东西,一边琢磨这事儿。
老张头挠挠头说:“哎,李婶儿,你说咱这馄饨味道也不差啊,咋就没人来吃呢?”李婶儿白了他一眼说:“你就知道埋头包馄饨,也不看看人家别的摊儿是咋做的。
”这时候,旁边卖油条的老王头凑过来了,笑着说:“老张啊,我看啊,你们得分析分析。
你看你们这馄饨,虽然味道不错,但是样子不太吸引人呐。
人家现在都讲究个卖相,你这馄饨看着普普通通的,谁有胃口啊?”老张头一听,觉得有点道理,点了点头。
李婶儿也接话茬儿说:“还有啊,咱这价格也得琢磨琢磨。
你看对面那家小笼包,虽然贵点儿,但是人家那分量足啊,咱这馄饨的分量要是能再多点儿,价格稍微调一调,说不定客人就多了。
”老张头和李婶儿听了老王头和李婶儿的话,就开始行动起来了。
老张头特意去买了一些漂亮的餐具,把馄饨盛得漂漂亮亮的,还在馄饨上撒了点葱花、香菜啥的,看着就特别有食欲。
李婶儿呢,把价格稍微调整了一下,分量也加足了。
这一改啊,效果还真不错。
第二天早上,来吃馄饨的人就比以前多了一些。
老张头和李婶儿可高兴了,忙得不亦乐乎。
过了几天,老张头又发现了一个问题。
有些客人吃完馄饨后,总是皱着眉头说:“这馄饨啊,就是缺了点啥味儿。
”老张头又开始琢磨了。
他把以前客人的反馈都记下来,仔细分析了一番。
他发现很多客人都喜欢吃辣,但是他之前准备的辣椒不太够味儿。