复旦大学社会统计学习题集
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复旦大学社会统计学习题集
第一部分 统计描述 Ⅰ 比例、比率、百分比、统计图表 Ⅱ 集中趋势和离散趋势
第二部分 统计推断 Ⅲ 分布与概率Ⅳ 抽样 Ⅴ 参数估计和假设检验(单样本) Ⅵ 双样本和多样本的假设检验 Ⅶ 两变量间的相关的测量和假设检验
简单线性回归 曲线和二元线性方程(附加题)
第三部分 补充习题
第二部分 统计推断 Ⅲ 分布与概率
1、 什么是概率? 2、 事件互不相容与相互独立这两个概念之间有何不同? 3、 频率分布和概率分布有何区别和联系? 4、 试述正态分布的性质与特点? 5、 试述正态分布、t 分布、卡方分布和 F 分布的定义及常见用途。 6、 超几何分布与二项分布有何区别和联系? 7、 试述 x2 分布,t 分布和 F 分布的性质。它们之间有何联系? 8、 试述大数定律和中心极限定理的基本思想。 9、 某地区回族占全体居民的 6%,今随机抽取 10 位居民,问其中有 2 名回民的概率试多少? 10、 一个口袋里装有 10 只球,分别编上号码 1……10,随机地从这个口袋中取 3 只球,
你认为这种算法有没有问题?
9、据统计,有一家出版公司去年的单位生产成本增加了 12%,而产品的销售价格只增
加了 8%,所以该公司声称其去年的利润减少了 4%。你对此说法有何意见?
Ⅱ 集中趋势和离散趋势
1、 试举例说明变量测量层次划分的意义。
2、 为什么低层次的变量不能用高层次变量的集中值和离散值。
3、 试说明算数平均数、几何平均数、中位数和众数这 4 个集中量数的特点。
发生这种情况的概率是多少? 13、 某工厂总体的 10%是技术人员,求 7 人委员会中 4 人是技术人员的概率。 14、 设某股民在股票交易中,每次判断正确的概率是 60%,该股民最近作了 100 次交
易。求至少有 50 次判断正确的概率。 15、 已知 N 件产品中有 M 件不合格,今从中随机地抽取 n 件。试求:(1)n 件中恰好
生产率
群体领导类型
合计
民主
自由
专断
高
37
36
13
86
中
26
12
71
109
低
24
20
29
73
合计
87
68
113
268
a 向哪个方向计算百分比更适宜?为什么? b 计算百分比并简略总结资料。 c 在每一组中,高对低的生产率的比率是多少,三个比率是否可以足够概括资料?请 解释。 5、某一街区中工人对农民的比率是 8/5,农民的比率是多少?假如工人对知识分子的比 率是 8/5,是否可以用同样方法获得知识分子的比例?为什么? 6、设一城市 1960 年有人口 153468,1970 年为 176118,1960 年到 1970 年间的增长率 是多少? 7、某一地区有 12160 个男人和 11913 个女人,其性比率是多少(每 100 个女性中对应 的男性数)?
试求:(1)最小号码是 5 的概率;(2)最大号码是 5 的概率。 11、 工人中吸烟的比例为 0.5%,某车间有工人 300 名。求以下概率:(1)全不吸烟。
(2)一人吸烟;(3)二人吸烟;(4)三人吸烟。 12、 假设某年龄组中自杀率是 0.003,在一随机抽取的同龄组的 1200 人中,竟无人自杀。
44
61
78
214
合计
114
115
143
137
509
试求:
a,在总体样本中经常参加者的百分比是多少? b,一年级对四年级的比率是多少? c,经常参加者中一二年级对三四年级的比率是多少? d,四年级中不参加活动者的比例是多少?不经常参加者中四年级的比例是多少? e,一二年级中不经常参加活动者的人数是否多于三四年级(用%)。 4、社会心理学家研究工业生产率与群体领导之间的关系。以下资料表明三个领导群组 中个人的生产率水平:
60
d 组距不变,频数加倍。
10、下表是一批 25-35 岁社会志愿者对象的年龄分布:
年龄 x(岁)
人数 f
25
22
26
23
27
35
28
42
…
…
34
20
35
34
2
合计
280
又知道这批人的年龄平方和为 253004,年龄加权算术平均数为 29.88,求: (1) 这批人年龄的第一四分位数:(提示,注意年龄的变量类型) (2) 这批人年龄的方差; (3) 这批人年龄的标准差系数。
4、 中位值和均值在实际中一定存在吗?均值永远是定距变量最合理的集中值吗?
5、 统计关系是否意味着因果关系?
6、 名词解释:数学期望、边际分布、匹配样本。
7、 一组 10 个男孩和一组 7 个女孩参加代数考试,男孩的平均分是 84,中位数是 74,女孩
的中位数和平均数相等,均为 79。老师认为男孩比女孩的成绩考的好,是否正确?为什
组距
频数
若在下列情况下,指出平均值和中位数所受的影响
10-19
7
(增大、减小,保持不变)。
20-29
16
a 最后一个组距扩大到 50-69,频数不变。
30-39 40-49 50-59 合计
21
b 每一组组距增加 10,频数不变。
12
C 组距不变,将 20-29 组的频数减 2 并加在下一组
4
的频数中。
么?你怎样解释男孩组平均值和中位数之间的差别?
8、 第一组 50 个领导人的平均年龄是 21.6,第二组 100 个领导人的平均年龄是 62.3。第三
组 435 个领导人的平均年龄为 44.7,问三组平均年龄是多少?若上述平均值改作中位数,
能否用同样方法求得三个领导人总的中位数?为什么?
9、 下列假设资料是 60 个国家中农民家庭的百分比分布。计算平均值和中位数。
内部资料 2007 年 4 月 20 日
第一部分 统计描述
Ⅰ 比例、比率、百分比、统计图表
1、 分布和统计表、统计图的关系如何? 2、 频次和频率有何不同? 3、 设下面的表格表示某大学参加社会活动和学生年级之间的关系:
参加教会
级别
合计
活动
一年级
二年级
三年级
四年级
经常
83
71
82
59
259
不经常
31
1
8、某国 1992 年的 GDP 为 10 亿美元,本来预估计次年的 GDP 会达到 11 亿美元,可结
果却只达到 10.5 亿美元。在一次国家经济会议上,负责经济的官员称,那一年的 GDP 目标
实现率为 95.4%,其计算公式为(实现的 GDP/预定的 GDP)*100%=10.5/11.0*100%=95.4%
第一部分 统计描述 Ⅰ 比例、比率、百分比、统计图表 Ⅱ 集中趋势和离散趋势
第二部分 统计推断 Ⅲ 分布与概率Ⅳ 抽样 Ⅴ 参数估计和假设检验(单样本) Ⅵ 双样本和多样本的假设检验 Ⅶ 两变量间的相关的测量和假设检验
简单线性回归 曲线和二元线性方程(附加题)
第三部分 补充习题
第二部分 统计推断 Ⅲ 分布与概率
1、 什么是概率? 2、 事件互不相容与相互独立这两个概念之间有何不同? 3、 频率分布和概率分布有何区别和联系? 4、 试述正态分布的性质与特点? 5、 试述正态分布、t 分布、卡方分布和 F 分布的定义及常见用途。 6、 超几何分布与二项分布有何区别和联系? 7、 试述 x2 分布,t 分布和 F 分布的性质。它们之间有何联系? 8、 试述大数定律和中心极限定理的基本思想。 9、 某地区回族占全体居民的 6%,今随机抽取 10 位居民,问其中有 2 名回民的概率试多少? 10、 一个口袋里装有 10 只球,分别编上号码 1……10,随机地从这个口袋中取 3 只球,
你认为这种算法有没有问题?
9、据统计,有一家出版公司去年的单位生产成本增加了 12%,而产品的销售价格只增
加了 8%,所以该公司声称其去年的利润减少了 4%。你对此说法有何意见?
Ⅱ 集中趋势和离散趋势
1、 试举例说明变量测量层次划分的意义。
2、 为什么低层次的变量不能用高层次变量的集中值和离散值。
3、 试说明算数平均数、几何平均数、中位数和众数这 4 个集中量数的特点。
发生这种情况的概率是多少? 13、 某工厂总体的 10%是技术人员,求 7 人委员会中 4 人是技术人员的概率。 14、 设某股民在股票交易中,每次判断正确的概率是 60%,该股民最近作了 100 次交
易。求至少有 50 次判断正确的概率。 15、 已知 N 件产品中有 M 件不合格,今从中随机地抽取 n 件。试求:(1)n 件中恰好
生产率
群体领导类型
合计
民主
自由
专断
高
37
36
13
86
中
26
12
71
109
低
24
20
29
73
合计
87
68
113
268
a 向哪个方向计算百分比更适宜?为什么? b 计算百分比并简略总结资料。 c 在每一组中,高对低的生产率的比率是多少,三个比率是否可以足够概括资料?请 解释。 5、某一街区中工人对农民的比率是 8/5,农民的比率是多少?假如工人对知识分子的比 率是 8/5,是否可以用同样方法获得知识分子的比例?为什么? 6、设一城市 1960 年有人口 153468,1970 年为 176118,1960 年到 1970 年间的增长率 是多少? 7、某一地区有 12160 个男人和 11913 个女人,其性比率是多少(每 100 个女性中对应 的男性数)?
试求:(1)最小号码是 5 的概率;(2)最大号码是 5 的概率。 11、 工人中吸烟的比例为 0.5%,某车间有工人 300 名。求以下概率:(1)全不吸烟。
(2)一人吸烟;(3)二人吸烟;(4)三人吸烟。 12、 假设某年龄组中自杀率是 0.003,在一随机抽取的同龄组的 1200 人中,竟无人自杀。
44
61
78
214
合计
114
115
143
137
509
试求:
a,在总体样本中经常参加者的百分比是多少? b,一年级对四年级的比率是多少? c,经常参加者中一二年级对三四年级的比率是多少? d,四年级中不参加活动者的比例是多少?不经常参加者中四年级的比例是多少? e,一二年级中不经常参加活动者的人数是否多于三四年级(用%)。 4、社会心理学家研究工业生产率与群体领导之间的关系。以下资料表明三个领导群组 中个人的生产率水平:
60
d 组距不变,频数加倍。
10、下表是一批 25-35 岁社会志愿者对象的年龄分布:
年龄 x(岁)
人数 f
25
22
26
23
27
35
28
42
…
…
34
20
35
34
2
合计
280
又知道这批人的年龄平方和为 253004,年龄加权算术平均数为 29.88,求: (1) 这批人年龄的第一四分位数:(提示,注意年龄的变量类型) (2) 这批人年龄的方差; (3) 这批人年龄的标准差系数。
4、 中位值和均值在实际中一定存在吗?均值永远是定距变量最合理的集中值吗?
5、 统计关系是否意味着因果关系?
6、 名词解释:数学期望、边际分布、匹配样本。
7、 一组 10 个男孩和一组 7 个女孩参加代数考试,男孩的平均分是 84,中位数是 74,女孩
的中位数和平均数相等,均为 79。老师认为男孩比女孩的成绩考的好,是否正确?为什
组距
频数
若在下列情况下,指出平均值和中位数所受的影响
10-19
7
(增大、减小,保持不变)。
20-29
16
a 最后一个组距扩大到 50-69,频数不变。
30-39 40-49 50-59 合计
21
b 每一组组距增加 10,频数不变。
12
C 组距不变,将 20-29 组的频数减 2 并加在下一组
4
的频数中。
么?你怎样解释男孩组平均值和中位数之间的差别?
8、 第一组 50 个领导人的平均年龄是 21.6,第二组 100 个领导人的平均年龄是 62.3。第三
组 435 个领导人的平均年龄为 44.7,问三组平均年龄是多少?若上述平均值改作中位数,
能否用同样方法求得三个领导人总的中位数?为什么?
9、 下列假设资料是 60 个国家中农民家庭的百分比分布。计算平均值和中位数。
内部资料 2007 年 4 月 20 日
第一部分 统计描述
Ⅰ 比例、比率、百分比、统计图表
1、 分布和统计表、统计图的关系如何? 2、 频次和频率有何不同? 3、 设下面的表格表示某大学参加社会活动和学生年级之间的关系:
参加教会
级别
合计
活动
一年级
二年级
三年级
四年级
经常
83
71
82
59
259
不经常
31
1
8、某国 1992 年的 GDP 为 10 亿美元,本来预估计次年的 GDP 会达到 11 亿美元,可结
果却只达到 10.5 亿美元。在一次国家经济会议上,负责经济的官员称,那一年的 GDP 目标
实现率为 95.4%,其计算公式为(实现的 GDP/预定的 GDP)*100%=10.5/11.0*100%=95.4%