概率统计统计描述案例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C2
木材、家具
2
C3
造纸、印刷
16
C4
石油、化学
130
C5
橡胶、塑料
10
C6
金属、非金属
96
0.36 2.86 23.21 1.79 17.14
C7
机械、仪表、设备
151
26.96
C8
通讯、电子
C9
其他
合计Biblioteka 519.1111
1.96
560
100.00
从该表中可以知道上市公司的行业结构。1999年 560个制造业上市公司中,传统产业占了较大比重。
三.数据整理与描述
四.编制按各财务指标的频数分布表
1. 将数据顺序排列。 2. 计算描述统计指标。 3. 分析描述统计指标——比较平均数、众数、中位数的大小;偏度系数的大小、方
向等。 4. 确定组数和组距 5. 整理成频数分布和直方图(或其他图形),显示总体分布特征。
2)制造业公司主要财务指标的分布
净资产收益率是评价净资产盈利能力的综合指标,他代表了 总体的或行业的盈利水平。从统计资料看到:
1999年度,制造业的总体净资产收益率19%。
8%的公司亏损,与每股收益分析的结论一致;并且有两个公 司净资产为负数,以资不抵债。
34%的公司净资产收益率在0.1%~8%之间;48%的公司在 0.8%~16%之间。
6669.48 4120.16 4 12217.4 8 1.49E+0 8 11.3334 4 2.48557 2 112886. 5 -
净利润分布呈右偏态。以 6500万元为组距,可分 17组。 分组后3.25亿元以上各 组不仅频数少,而且有两 组频数为0。这种情况下 可考虑合并这些组,因为 合并后的数列并未影响总 体特征的描述。将亏损 1.3亿元以下的公司合并 为一组,3.25亿元以上 的公司合并为一组,组数 减少到9组.见表2—3和 图2—2。
数据的初步分析——制造业上市公司行业 结构
根据《上市公司分类指引》,制造业分为 10个行业种类,编码为C0、C1、C2、…、 C9。
从上述资料经计数整理后即可得到如表1的 频数分布表。
表1
制造业上市公司行业分布
代码
行业分类
上市公司数
比重(%)
C0
食品、饮料
48
8.57
C1
纺织、服装、皮毛
45
8.04
560
频率(%)
37.32 34.29 11.43 5.89 3.21 2.68 0.71 0.36 0.71 1.07 0.36 0.18 0.54 0.18 1.07
100.00
频数
从图表中可 250 以知道,制造 业中,总资产 200 8866亿元, 平均规模在15 150 亿元左右。 82%的上市公 100 司总姿产在 22.5亿元以下,50 100亿元以上 的只有1%。 0
13
2.32
16
2.86
17
3.04
表2—3 560家上市 公司净利润分布
合计
560
100.00
频数
350
图2—2 560家上市公 300
司净利润分布
250
200
150
100
50
0 -13000 -6500 0
6500 13000 19500 26000 32500 其他
1
从整理后的净利润的资料我们注意到:
净利润分组(万元)
频数 (个)
频 率 (%)
-13000以下 -13000~-6500 -6500~0 0~6500 6500~13000 13000~19500 19500~26000 26000~32500 32500以上
14
2.50
10
79
22
3.93
332
59.29
112
20.00
24
4.29
确定组数为10组, 组距=2/10=0.2,极 值用开口组处理。见 表2—4 和图2—3。
每股收益描述统计 1
分组
频数 (个)
频率(%)
频数
—0.6以下
14
2.50
-0.6~-0.4 6
1.07
250
-0.4~—0.2 13
2.32
-0.2~0
13
2.32
200
0~0.2 0.2~0.4
197
35.18
(3)每股收益分布数列和直方图
样本均值 中位数 标准差 样本方差 峰值 偏度 区域 最小值 最大值 求和 计数
0.199427 0.2225 0.273352 0.074721 6.75641 -1.51182 2.632 -1.28 1.352 111.6792 560
从描述统计指标看, 均值、中位数比较接 近,偏度系数也不很 大。
由总资产描述统计2 表看出,均值14.5亿 元,中位数9.5亿元, 标准差15亿元,此时 的标准差和偏度系数 都降低了,说明数据 间的差异小了。但仍 呈右偏态。
考虑以7.5亿元为 组距,由于100亿元 以上只有6家,将105 亿元以上并为一组, 组数=15。分组后频 数分布及直方图如表2 和图一所示。
表2 560家上市公司总资产分组统计
分组(亿元)
7.5 以下 7.5~15 15.~22.5 22.5~30 30~37.5 37.5~45 45~52.5 52.5~60 60~67.5 67.5~75 75~82.5 82.5~90 90~97.5 97.5~105 105以上
合计
频数
209 192 64 33 18 15 4 2 4 6 2 1 3 1 6
(1)总资产分布数列和直方图 总资产描述统计1
样本均 15,831
值
5.1
中位数 9,5296.
标准差 9
样本方 21,229
差
1.3
峰值 4.51E+
偏度
10
极差 30.190
最小值 77
最大值 4.7051
从描述统计1看, 560家公司的总资产呈 高度偏态。总资产最 大值和最小值相差近 200倍。
8%的公司净资产在16%~32%的高水平上。
4、数据整理和分析的客观评价
01
整理频数分布的时候借助于描 述指标的判断, 使统计整理工 作有了着眼点当面对纷繁的、 大量的原始数据, 总体的分布 及数据的分布特征根本无从得 知. 因此编制数据的频数分布 从那里着手呢? 根据的是什么 呢? 当然是数据总体的几个主 要特征值:样本均值、中位数 、极差、样本方差、偏度等.
2
制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。
3
制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利 润只有6500万元。79%的上市公司净利润在70万~1.3亿元之间。
4
年净利润在4.5亿元以上的公司有16个,不足总数的3%,但它们的净利润占到制造业 全行业的25.5%,充分体现了大型国企确实是国民经济的脊梁。
15750000000 332702505000000000 450000 525000 667050000000 750000 825000 1099570050000000000
其他
(2)净利润频数分布和直方图
净利润描述统计
样本均 值
中位数 标准差 样本方 差 峰值 偏度 极差 最小值 最大值 求和 计数
本案例研究的总体范围确定为截止2000年4月30日如期公布年报的制造业560家上市公司。
本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。共选有8个财务指标: 总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。其中, 前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。
将6个总资产100亿 和7个2亿元以下的数 据作为极值舍去,计 算得到描述统计2。
总资产描述统计2
样本 均值
中位 数
标准 偏差
样本 方差
峰值 偏度 极差 最小 值
14,464 0.7 9,5410 .48 14,942 4.9 2.23E +10 9.9163 75 2.8852 38 95,526
231
41.25
0.4~0.6
60
10.71
150
0.6~0.8
19
3.39
0.8~1.0
6
1.07
1.0以上
1
0.18
100
合计
560
100.00
表2—4 560家上市公司每
50
股收益分组统计
0 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
图2—3 560家上市公司每 股收益分布
02
应用统计软件,这些特征值很 容易得到. 掌握了这些特征值, 对分组的组数、组距的确定才 有了依据. 所以案例提出的方 法, 解决了整理频数分布的可 操作性问题。
同时注意到,频数分布的编制没有固定 的模式, 因此不是唯一的, 采用不同的 组距、组限, 就有不同的分布数列. 如 何评价哪一个数列最恰当或者最确切反 映总体分布特征是一个值得研究的问题。
上市公司年报数据分析
本案例以沪深股市制造业上市公司为对象,介绍了数据总 体的统计处理过程.
数据整理是统计分析的基础工作,在总体规模很大,数据 量浩瀚、分布未知的情况下,如何对总体数据进行整理分 类,描述总体分布及进一步分析总体各特征间的相互关系 是对总体正确认识的关键。
0 10 02 3
上市公司年报财务数据统计分析的对象