《数据、模型与决策》习题解答 (2)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章习题(P46)

14.某天40只普通股票的收盘价(单位:元/股)如下:

29.625 18.000 8.625 18.500

9.250 79.375 1.250 14.000

10.000 8.750 24.250 35.250

32.250 53.375 11.500 9.375

34.000 8.000 7.625 33.625

16.500 11.375 48.375 9.000

37.000 37.875 21.625 19.375

29.625 16.625 52.000 9.250

43.250 28.500 30.375 31.125

38.000 38.875 18.000 33.500

(1)构建频数分布*。

(2)分组,并绘制直方图,说明股价的规律。

(3)绘制茎叶图*、箱线图,说明其分布特征。

(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。

解:(1)将数据按照从小到大的顺序排列

1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 3

2.25, 3

3.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。

(2)将数据分为6组,组距为10。分组结果以及频数分布表。为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。

根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。

频率分布直方图

从频率直方图和累计频率直方图可以看出股价的规律。股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。

累积频率分布直方图

(3)将原始数据四舍五入取到整数。

1,8 ,8 ,9 ,9 ,9 ,9 ,9 ,9 ,10 ,11 ,12 ,14 ,17 ,17 ,18 ,18 ,19 ,19 ,22 ,24 ,29 ,30 ,30 ,30 ,31 ,32 ,34 ,34 ,34 ,35 ,37 ,38 ,38 ,39 ,43 ,48 ,52 ,53 ,79

以10位数为茎个位数为叶,绘制茎叶图如下

由数据整理,按照从小到大的准许排列为:)40()39()2()1(x x x x ≤≤⋯≤≤

最小值25.1)1(=x ,下四分位数()

03125.11375.114

3

1041341)11()10(=⨯+⨯=⨯+=x x Q l ,中位数()9375.22225.24625.2121)21()20(=+=+=

x x M e ,上四分位数()

)30()29(34

1

x x Q u +⨯= 3125.3425.3541

3443=⨯+⨯=

,最大值375

.79)40(=x ,四分位数间距

28125.2313=-=Q Q IQR ,375.792344.695.1)40(3=<=+x IQR Q ,

因此可以做出箱线图为:

茎叶图的外部轮廓反映了样本数据的分布状况。从茎叶图和箱线图可以看出其分布特征:中间(上下四分位数部分)比较集中,但是最大值是奇异点。数据分布明显不对称,右拖尾比较长。

(4)现用原始数据计算常用的描述性统计量 样本均值:421875.2540/875.101640

1

40

1

===

∑=i i

x

x

样本方差:196.26340391240122

=⎪⎪⎭

⎫ ⎝⎛⨯-=∑

=x x s i i

样本标准差:2233.16196.2634039124012==⎪⎪⎭

⎫ ⎝⎛⨯-=

=x x s i i 用分组数据计算常用的描述性统计量:9756

1

='∑=k k

k x f

339256

1

2='∑=k k

k x f

样本均值:375.2440/97540

1

6

1

=='=

∑=k k

k x f

x

样本方差:4968.260403912612=⎪⎪⎭

⎫ ⎝⎛

⨯-'=∑

=x x f s k k

k 样本标准差:1399.164968.260403912612==⎪⎪⎭

⎫ ⎝⎛⨯-'=

=x x f s k k k 与用原始数据计算的结果差别不大。

此外,可以用Excel 中的数据分析直接进行描述性统计分析,结果如下:

补充习题:

1. 测量血压14次,记录收缩压,得样本如下:

121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。 2. 根据列表数据

3. 调查30个中学生英语成绩,得样本如下:

54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81, 81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99

把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图 补充习题答案

1. 测量血压14次,记录收缩压,得样本如下:

121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。 解:排序:

109 112 115 119 120 121 123 125 125 125 126 126

128

130

均值:

1

n

i

i x

x n

==

∑= 121.71

方差:2

2

2

2

1

1

()

1

1

n

n

i

i

i i x x x

nx

s n n ==--=

=

--∑∑= 37.76

中位数:1

2

202

n n

x x m -+=

= 124

众数:m e = 125 极差:R=x n -x 1= 21

相关文档
最新文档