第十二章 多变量分析方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
2
3
4
5
距离 0.04 0.09 0.10
0.29
10
2、判别分析法及其应用


判别分析法是用于判别样本所属类型的 一种多变量统计分析方法 作用于在已知被研究对象已分成若干类 的情况下,确定新的被研究者究竟属于 已知类型中的哪一类。
11

判别分析法的基本原理 判别分析是根据样本数据,确定判别系数
(x
v 1 m r 1
m
iv
xi )( x jv x j )
m
( xiv xi ) 2 ( x jv x j ) 2
v 1
5

在聚类分析中对样本进行分类有两种分 类方法:


逐项分类法——先将所有的研究样本作为一 个或几个大类,然后逐渐分解成多类直至单 个样本。 系统分类法——先从各单个样本开始,然后 之间的按最小距离或最大关联度进行归类。
1,X 11,X 12, X 1n 1,X ,X , X 21 22 2n X n p 1,X n1,X n 2, X nn
b ( X ' X ) 1 X ' Y

相关系数的计算式:
26
二元线性回归分析模型

预测公式: Yˆ b
x x2 x1 x2
2 1 2 2 2 1 2 2 1 2
2
1
1 2
2
2
b2
x1
x x2 x1 x2
x Y x x xY
1 2
b0 Y b1 x1 b2 x2
27
年份
X1i 人均年收 入(千元 16 17 16 18 20 23 27 29 29 31 226 22.6
Sxx=1744.5
Syy=1035101
Sxy=41944.64
22
2500 2000 1500 1000 500 0 0 20 40 60 80 100
23

判断相关性 相关系数
r
i
X X Y Y X X Y Y
t 2 i t

S xy S xx S yy
2
n n 如果下季度广告费的支出为80万元时,则产品的销售额为: ˆ Y a bX 344 .27 24 .04 * x 344 .27 24 .04 * 80 2267 .(万元) 5
i
Y b X
1658 24 .04 * 54 .64 344 .27

0
b1 X 1 b2 X 2 e
式中:
Y nb b x b x xY b x b x b x x x Y b x b x x b x x xY x x x Y b
0 1 1 2 2 1 0 1 1 2 1 2 2 0 2 1 1 2 2 2 1 1 2 2 2
20
回归系数的计算式如下:
b
x y
i 1 m i i 1
m
i
nx y
xi2 nx 2
a y bx

此外,两变量之间的相关程度如何,利用相关性分析。一般情况下针对 等量尺度问题的相关系数计算式如下: 1 r 1
r
(x
i 1 i
m
i
x )( yi y )
8

其中5位顾客的调查结果如下:
顾客 1 2 3 4 5 饮用量(瓶) 20 18 10 4 4 态度 7 10 5 5 3
9

聚类分析的步骤: 1、数据变换 2、计算各样本之间的距离 3、类别合并 4、聚类分析图 1
d ij xi x j yi y j

两目标之间的距离 两目标的关联系数
4

两目标之间的距离的 计算公式:
d ( xiv x jv ) 2
2 ij v 1
m
式中:d ij — —目标i与j之间的距离 xiv,x jv — —变量v对应目标i和j的值 m — —变量的个数

两目标的关联系数通 r ij 常使用相关系数来计 算:
1
2 3 4
9
7 10 8
8
6 7 4
7
6 8 5
5
6 7 购买者平均值
9
8 7 8.2857
9
6 5 6.4286
3
7 6 6.00
非购买者组
1
2 3 4 5
4
3 6 2 1 3.20
4
6 3 4 2 3.80
4
6 3 5 2 4.00
15
非购买者平均值
b P -1 D - 0.016 - 0.00023 5.08571 0.05101 - 0.016 0.04481 - 0.00911 2.62857 - 0.00023 - 0.00911 0.04058 2.0000 0.21692 0.01820 0.05604 Y 0.21692 X1 0.01820X 2 0.05604X 3 购买组 Y 0.21692 8.29 0.01820 6.43 0.05604 6 2.25 非购买组 Y 0.21692 3.2 0.01820 3.8 0.05604 4 0.987
第十二章 多变量分析方法及其应用
1
多变量分析方法在市场研究中应用的 作用
1、简化数据结构,选择变量子集 合 2、对数据进行分类处理、分类研 究、构造分类模式 3、构造模型
2
1、聚类分析方法及其应用

聚类分析的作用:将一些变量、目标、 公司等进行分类组合
3


聚类分析的基本方法原理——就是测量 研究目标之间的相似性,根据相似的程 度将研究目标进行分类。 测量研究目标之间的相似性的方法通常 有两种:

置信区间
s
Y Yˆ
n m 1
2

26613 54.38 11 1 1

90%的置信度,置信区间:上限:2267.5+54.39*1.86=2368.8 万元 24 下限:2267.5-54.39*1.86=2166.33万元
多元线性回归分析


多元回归分析处理因变量与多个影响因素 (自变量)的相关性关系。 其线性模型为:
16
Y Y购,该被调查者属于购买者组 Y Y非购,该被调查者属于非购买者组
17
3、回归分析方法及其应用

回归分析是处理自变量x1,x2,x3,…… xn与因变量y之间相关关系的方法,它从 定量的角度寻找变量之间的因果关系, 从而判断某些因素的变化对其他因素的 影响。
18

回归分析法的步骤:
yi yc则第i个研究对象为 组 1 yi yc则第i个研究对象为2组
12

判别函数的确定步骤:
1、计算两组平均值之差D(Xi) 2、计算两组数据的离差矩阵Ai,共方差矩阵 Si=Ai’Ai 3、计算两组资料的联合共方差矩阵P=S1+S2 4、计算P的逆矩阵P-1 5、计算判别系数b= P-1 D 6、求判别函数的临界值Y=b1X1+b2X2+b3X3 7、判别函数的检验 13
6
例——系统分类法之最短距离法

最短距离法是将距离 最短的两个目标或类 别组合在一起。
d ij min d kl
பைடு நூலகம்
7

某啤酒公司对顾客饮用习惯和态度进行 调查。其中有两个问题如下:


“您每月大约喝多少瓶啤酒?” “您对‘饮酒是人生的快乐’这句话的看法 如何?”

同意10 9 8 7 6 5 4 3 2 1 不同意
2618.44 2312.57 178.17 468.77 6925.41 75.59 5862.11 955.55 5215.01 818.63 1183.03 26613.27
平均
54.64
1657.91
3143.72
2842762.64
94395.27
1657.9
2419.42419. 4 S=54.38
X2i 汽车 价格 13 13 13 13 13 12 12 11 9 8 117 11.7
Yi 汽车销量 (千) 20 20 30 30 40 40 60 90 120 130 580 58 250.8 212.8 184.8 128.8 46.8 -7.2 8.8 204.8 396.8 604.8 2032 203.2
1、从一组原始数据出发,确定变量之间的定 量关系,即确定模型的具体形式和模型参数 的估计值。 2、对这些等量关系式的可信程度进行统计检 验 3、从影响因变量的许多变量中判断和选择最 重要的影响因素 4、利用模型进行预测
19
一元一次线性回归分析
y a bx
式中: a , b — —回归系数 x , y — — x , y变量的历史数据
yi b1 x1i b2 x2i b j x ji 式中:yi — —第i个研究对象的判别值 x ji — —第i个研究对象在第j个因素(j= , 3,n)上的观察值 1 2, b j — —第j个因素的比重或判别系数

然后根据所收集到的资料计算出判别临界值yc 作为判别研究对象属于两组之中哪一组的标准。

41944 .36 1744 .545 *1035101
0.987
2


从散点图和相关系数表明企业广告费支出与产品销售额之间存在强线 性相关关系。可用一次线性相关分析法进行预测。 ˆ 2.预测方程: Y a bX
b a n X i Yi X i Yi n X i2 X i 11 * 1038348 601 * 18237 24 .04 11 * 34581 601 * 601
L1 y
L2 y L11 L12 L21 L22
-49.4 -49.4 -36.4 -36.4 -23.4 -5.4 0.6 -22.4 -167.4 -266.4 -656.0 -65.6 43.56 31.36 43.56 21.16 6.76 0.16 19.36 40.96 40.96 70.56 318.4 31.84 -8.58 -7.28 -8.58 --5.98 -3.38 0.12 1.32 -4.48 -17.28 -31.08 -85.2 -8.52 -8.58 -7.28 -8.58 --5.98 -3.38 0.12 1.32 -4.48 -17.28 -31.08 -85.2 -8.52 1.69 1.69 1.69 1.69 1.69 0.09 0.09 0.49 7.29 13.69 30.1 3.01
2
r 0.7, 强相关 0.3 r 0.7,中度相关 r 0.3, 弱相关
(x
i 1
m
x )
(y
i 1
m
i
y )2
21
【例】某企业研究企业广告支出费对产品销售额的影响,现获得最 近11个季度有关的统计资料如下表,试分析企业广告支出对销售额 有无显著影响,如果企业下季度准备广告支出80万元,估计企业的 销售额为多少?
1261 1306 1680 1520 1343 1483 1623 1780 1907 2104 2230 18237
1296 1764 3025 2304 2025 2209 2500 3721 4624 5184 5929 34581
1590121 1705636 2822400 2310400 1803649 2199289 2634129 3168400 3636649 4426816 4972900 31270389
45396 54852 92400 72960 60435 69701 81150 108580 129676 151488 171710 1038348
1209.83 1354.09 1666.65 1498.35 1426.22 1474.31 1546.44 1810.91 1979.22 2075.39 2195.60 18237.0
y b0 b1 x1 b2 x2 bn xn
25
用矩阵表示为:

Y Xb
b0 b1 . b p1 . . bn 1
式中:
Y1 Y2 . Y n 1 . . Yn

远东企业公司发展了一种新产品,该公 司在新产品未大量上市前,为安全起见, 将新产品的样品寄给了十二个国家的进 口代理商,要求对该产品给予评估。评 估的因素有三:式样、包装及耐久性。 评分表采用10分制,每一进口代理商并 被要求说明是否愿意购买,调查结果如 下:
14
产品特性 式样 包装 耐久性
购买者组
序号 自变量X 因变量Y X2 Y2 XY 预测值 预测值的 误差 51.17 -48.09 13.35 21.65 -83.22 8.69 76.56 -30.91 -72.22 28.61 34.40 误差的平方
1 2 3 4 5 6 7 8 9 10 11 合计
36 42 55 48 45 47 50 61 68 72 77 601.0
相关文档
最新文档