统计学计算例题包括答案.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算题例题及答案:
1、某校社会学专业同学统计课成绩如下表所示。
社会学专业同学统计课成绩表
学号成绩学号成绩学号成绩101023761010377510105270 101024911010387010105388 101025871010397610105493 101026781010409010105562 101027851010417610105695 101028961010428610105795 101029871010439710105866 101030861010449310105982 101031901010459210106079 101032911010468210106176 101033801010478010106276 101034811010489010106368 101035801010498810106494 101036831010507710106583要求:
( 1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。
(2)考成行适当分,制数分布表,并算累数和累率。答案:
(1)考成由低到高排序:
62, 66, 68, 70, 70, 75,76, 76,76, 76, 76, 77, 78, 79,
80, 80, 80, 81, 82, 82,83, 83,85, 86, 86, 87, 87, 88,
88, 90, 90, 90, 91, 91,92, 93,93, 94, 95, 95, 96, 97,
众数: 76
中位数: 83
平均数:
=( 62+66+⋯⋯ +96+97 )÷42
=3490÷42
=83.095
(2)
按成向上累向下累
数率 (%)
分数率(%)数率(%) 60-6937.14337.14342100.000 70-791126.1901433.3333992.857 80-891535.7142969.0482866.667
90-991330.95242100.0001330.952
2、为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:
方差分析表
变差来源SS df MS F Sig.
回归A B C D0.000残差205158.07E F——总计1642866.6711———要求:
(1)计算上面方差分析表中 A 、 B 、C、 D、 E、 F 处的值。
(2)商品销售量的变差中有多少是由价格的差异引起的?
(3)销售量与价格之间的相关系数是多少?
答案:
( 1)方差分析表:
变差来源SS df MS F Sig.
回归1437708.6011437709.6070.0780.000残差205158.071020515.81——
总计1642866.6711———
(2)
即商品销售量的变差中有86.6%是由价格引起的。
(3)
3、某公司招聘职员时,要求对职员进行两项基本能力测试。已知, A 项测试中平均分
数为 90 分,标准差是12 分; B 考试中平均分数为200 分,标准差为25 分。一位应试者在
A 项测试中得了 102 分,在
B 项测试中得了 215 分。若两项测试的成绩均服从正太分布,该位
应试者哪一项测试更理想?
答案:
该测试者在 A 项测试中比平均分高出 1 个标准差,而在 B 项测试中比平均分高出0.6个标准差。因而,可以说该测试者 A 项测试比较理想。
4、某公司欲了解广告费用x 对销售量y 的影响,收集了20 个地区的数据,并对x、 y 进行线性回归分析,得到:方程的截距为364,回归系数为 1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。要求:
(1)写出广告费用 y 与销售量程 x 之间的线性回归方程。
(2)假如广告费用投入 50000 元,根据回归方程估计商品销售量。
(3)计算判定系数 R2,并解释它的意义。
答案:
(1) y=364+1.42x
(2)当 x=50000 时, y=364+1.42×50000=71364
(3)
=1602708.6 ÷(1602708.6+40158.07)
=1602708.6 ÷1642866.67
=0.97556
表明在商品销售量的总变差中,有 97.6%可以由回归方程解释,说明回归方程的拟合程度
很高。
5、为估计每个网络用户每天上网的平均时间是多少,抽取了225 个网络用户的简单随机样本,得到样本均值为 6.5 个小时,样本标准差为 2.5 个小时。
( 1)试用 95%的置信水平,计算网络用户每天平均上网时间的置信区间。
( 2)在所调查的225 个网络用户中,年龄在20 岁以下的用户为90 个。以 95%的置信水平,计算年龄在20 岁以下的网络用户比例的置信区间。
注:
答案:
( 1)已知:
网络用户每天平均上网时间的95%的置信区间为:
即( 6.17, 6.83)( 2 分)
( 2)样本比例:
年龄在 20 岁以下的网络用户比例的95%的置信区间为:
即( 33.6%, 46.4%)
6、某企业使用 3 种方法组装一种新的产品,为确定哪种方法生产效率最高,
随机抽取 30 名工人,并指定每人使用其中的一种方法。通过对每个工人生产的产品数
进行分析得到下面的方差分析表。请完成方差分析表。
变差来源SS df MS F Sig.
组间2100.000组内3836——总计29———
答案:变差来源SS df MS F Sig.
组间4202210 1.4780.000组内383627142.07——