北航数理统计第二次大作业-数据分析模板
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计第二次大作业材料行业股票的聚类分析与判别分析
2015年12月26日
材料行业股票的聚类分析与判别分析摘要
1 引言
2 数据采集及标准化处理
2.1 数据采集
本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。
表2.1 各变量的符号说明
自变量符号
每股收益(单位:元)X1
净资产收益率(单位:%)X2
每股经营现金流(单位:元)X3
主营业务收入同比增长率(单位:%)X4
净利润同比增长率(单位:%)X5
流通股本(单位:万股)X6
每股净资产(单位:元)X7
表2.2 30支股票的财务指标
股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856
杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030
2.2 数据的标准化处理
由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。
表2.2 经Z标准化后的数据
ZX1ZX2ZX3ZX4ZX5ZX6ZX7
武钢股份-0.75239 -0.53220 -0.29872 -1.43273 0.09044 1.80057 -0.36699 宝钢股份-0.06111 -0.04951 1.27419 -0.54909 0.16571 3.36895 0.82983 山东钢铁-0.80301 -0.24299 -0.10597 -0.79447 0.20551 0.89442 -0.90801 北方稀土-0.22597 0.11777 0.81009 0.89669 0.18178 -0.15036 -0.76605 杭钢股份-1.88333 -1.57819 0.42654 -1.49278 -4.05172 -0.49232 -0.36516 抚顺特钢0.16826 0.76673 0.01953 -0.52124 0.56444 -0.42031 -1.04806 盛和资源-0.39460 -0.06362 -0.61107 -0.16012 0.18419 -0.60318 -1.11250 宁夏建材-0.35035 -0.19764 0.36273 -0.86452 0.14636 -0.58170 1.45398 宝钛股份-1.07056 -0.50398 -0.80334 -0.54517 -2.95236 -0.59357 1.25341 山东药玻0.80777 0.28101 1.71089 0.38199 0.20293 -0.63640 1.38197 国睿科技0.71984 0.91284 -0.74363 0.24276 0.20405 -0.65850 -0.28706 海螺水泥 2.86486 0.66293 1.70219 -0.46903 0.18110 0.29076 2.89275 华建集团0.18186 1.03578 -1.20920 0.44290 0.19091 -0.61395 -0.91879 福耀玻璃 1.81896 1.18694 1.21907 0.25581 0.20318 -0.20393 0.59641 宁波富邦-1.10238 -3.77801 -1.10126 0.23493 0.20350 -0.66703 -1.37450 马钢股份-1.43327 -1.42905 0.38635 -0.85147 -0.16304 0.77834 -0.62837 亚泰集团-0.40820 -0.18857 -0.03017 -0.92891 0.15890 -0.23075 0.00091 博闻科技0.99028 1.43483 -0.42553 -0.37897 1.54862 -0.64168 -0.51569 新疆众和-0.31477 -0.14424 -1.75368 2.82453 0.27823 -0.54131 0.18198 西部黄金-0.18577 0.14800 -0.07102 0.77399 0.20748 -0.66895 -0.69342 中国铝业-0.66851 -0.54329 0.07908 -0.29587 0.23714 1.67341 -0.73317 明泰铝业0.31144 0.22055 -2.04864 0.13486 0.20867 -0.59916 1.02450 金隅股份0.10926 0.09257 0.28316 -0.33807 0.17401 0.07068 0.78075 松发股份0.54630 0.45635 -0.78398 -0.09356 0.18924 -0.69472 0.52151 方大集团-0.19127 0.32132 -1.04876 1.80862 0.20494 -0.59607 -0.96906 铜陵有色-0.40820 -0.12610 0.74611 0.23971 0.17829 1.66843 -1.02134 鞍钢股份-0.82181 -0.43748 0.89950 -1.08946 0.09252 0.82323 0.68295 中钢国际 1.19044 1.20709 -0.92392 -0.52429 0.40688 -0.59788 -0.09131 中材科技 1.51410 0.78587 1.74074 2.17408 0.34050 -0.60107 0.82084 中南重工-0.14788 0.18427 0.29875 0.91888 0.21760 -0.57591 -0.62231
3 聚类分类
3.1 聚类分析概述
3.2 聚类分析输出结果
本文中使用系统聚类的Ward’s method(最小离差平方和法),度量方法采用