葡萄酒价格影响因素分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
葡萄酒价格影响因素分析
一、研究背景
随着中国经济的快速发展们生活水平的提高,越来越多的人追求生活的质量,随着人们消费观念的转变,葡萄酒在我国的销量快速增长,成为拉动国际葡萄酒增长的新的市场,但由于葡萄酒一直很少关注中低端市场,我们作为大学生,最求时尚,消费理念开放,我们迫切需要了解葡萄酒市场。
本报告中我们从波尔多葡萄酒行业协会收集了葡萄酒价格和生长期间的降雨量、气温、酿制年份,以波尔多葡萄价格为主要研究对象,探究葡萄酒价格的主要影响因素,并探究葡萄酒价格和其影响因素存在着什么联系。
其中Y为波尔多葡萄酒的价格与1961年葡萄酒价格之比的自然对数,
X1为收获季节的降雨量;
X2为收获前一年冬季的降雨量;
X3为种植季节的平均温度;
X4为酿制年份到1989年的年数。具体数据表一所示:
二、描述性分析
表二:葡萄酒描述性分析结果
Descriptive Statistics
N Range Minimum Maximum Mean Std. Deviation Variance 葡萄酒价格指数28 2.29 -2.29 .00 -1.3907 .63511 .403 收获季节降雨量28 454.00 376.00 830.00 597.1071 134.52119 18095.951 前一年冬季降雨量28 254.00 38.00 292.00 148.4286 70.62810 4988.328 温度28 2.67 14.98 17.65 16.4264 .69091 .477 酿制年份28 27.00 4.00 31.00 17.5000 8.22598 67.667 酿制时间28 27.00 1958.00 1985.00 1971.5000 8.22598 67.667 Valid N (listwise) 28
由表二可知我们的数据属于年度数据,酿酒时间从1958年到1985年,该品
种的葡萄酒的年份为五年到三十一年,收获季节平均降雨量和前一年冬季平均降
雨量分别为134.52119毫米、70.62810毫米,葡萄酒价格指数从-2.29到0不等。
表三:各解释变量与被解释变量散点图
从上图我们可以看出,各解释变量lnX与被解释变量Y之间存在一定的线性关系,
因此我们可以考虑建立线性回归模型。
三、实证分析
本研究主要采用多元线性回归的方法,探究葡萄酒价格的影响因素,建立多
元线性模型,并对模型进行检验。
1、模型建立
设变量y与一般变量X1,X2,X3,X4线性模型为:
Y=β0+β1X1+β2X2+β3X3+β4X4+μ
其中β0是回归常数,β1,…β4为回归系数,y为被解释变量(因变量),X1,X2,X3,X4为解释变量(自变量),μ为随机误差项,显著性水平a=0.05.
2、拟合优度检验
3、回归方程的显著性检验(F检验)
表五:多元回归分析(二)
ANOVA b
Model Sum of Squares df Mean Square F Sig.
1 Regression 7.428 4 1.857 12.333 .000a
Residual 3.463 23 .151
Total 10.891 27
a. Predictors: (Constant), 前一年冬季降雨量, 酿制年份, 温度, 收获季节降雨量
b. Dependent Variable: 葡萄酒价格指数
此表进行回归方程显著性检验。由表可知F检验的观测只为12.333,对应的概率p值近似为噢。小于显著性水平0.05,应拒绝回归方程显著性检验零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系显著,可建立线性模型。
4、回归系数显著性检验(t检验)
表六:多元回归分析结果(三)
Coefficientsa
由表六可知,除了收获季节降雨量t检验的概率p值大于显著性水平,其他变量均小于显著性水平,说明该模型存在问题,应重新建立模型。
5、多重共线性诊断
由表六可知该模型的容忍的均为0.9左右,接近于1,说明模型的多重共线性很弱;又各个变量方差膨胀因子均小于10,说明各解释变量间不存在多重共线性
6、残差分析
图一:多元回归分析的残差累计概率图
表七:标准化残差的非参数检验结果
One-Sample Kolmogorov-Smirnov Test
Standardized
Residual N 28
Normal Parameters a,b Mean .0000000
Std. Deviation .92295821 Most Extreme Differences Absolute .115
Positive .115
Negative -.111 Kolmogorov-Smirnov Z .609
Asymp. Sig. (2-tailed) .852
a. Test distribution is Normal.
b. Calculated from data.
图一中:
数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验(表七)概率p值为0.852大于显著性水平,表明标准化参禅与标准正态分布不存在显著差异,可以认为残差满足线性模型的前提要求。
图二:多元回归分析的残差图
图二中,随着标准化预测值的变化,残差点在0线周围随机分布,方差并没有明显的增大或减小的趋势,所以可以为模型没有明显的异方差。
另外通过观察数据窗口的库克距离(表八),库克距离均小于1,认为没有异常值
表八:库克距离
0.60089 0.08542 0.20162 0.05488 0.0204 0.093 0.05404
0.03214 0.07555 0.03117 0.03979 0.0004 0.035 0.02054
0.12565 0.01187 0.02031 0.01235 0.048 0.004 0.00616
0.00014 0.00246 0.01501 0.00165 0.0124 0.005 0.00015