卢淑华:《社会统计学(第四版)》课后习题详解.pdf
社会统计学(第四版)课后习题详解

社会统计学(第四版)课后习题详解导读:就爱阅读网友为您分享以下“社会统计学(第四版)课后习题详解”资讯,希望对您有所帮助,感谢您对 的支持!《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、50 25 200 525(元)40 25M0 400 200 516.28(元)25 18Md 40025 10 200 400.00(元)1575 65Q3 600 200 690.91(元) 22Q Q3 Q1 690.91 400 290.91(元)Q1 2002 nb2ii ( nibi)2NN225.66(元)25260032760000 100 5092400 50924 100100四、(1)极差R=1529-65=1464(百元)(2)将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529 10 1 2.7543 (10 1)Q3的位置 8.254Q1 92 (106 92) 0.75 102.5(百元)Q1的位置Q3 174 (185 174) 0.25 176.75(百元)四分互差Q 176.75-102.5 74.25(百元)(3)百元) 10五、 x2i ( xi)2 N267422495204 .64 421.92(80 0.810020P(B) 0.210012P(B/A) 0.158012P(A/B) 0.62012P(AB) 0.1210040P(C) 0.410032P(C/A) 0.48012P(/) 0.158032 P(AC) 0.32 100P(A)六、4157P(B) 151P(AB) 10P(AB)115P(A/B) 0.214P(B)107P(AB)115P(B/A) 0.375P(A)104P(A)P(A B) P(A) P(B) P(AB)七、471 0.63315151010 (1)10口井皆产油的概率为:P( 10) C10 0.3100.70 0.00000590(2) 10口井皆不产油的概率为:P( 0) C100.300.710 0.0282501(3)该公司赢利的机会为:P( 2) 1 C100.300.710 C100.310.79 0.85069八、444P(x 2) e 8 2.71828 0.14652!九、1.371.3701.371.3711.37P(0 x 1) P(x 0) P(x 1) e e 0.60220!1!十、0.10.10 0.1 10.1(Z) ( 1) 1 (1) 1 0.8413 0.1587Z投资人投资于此种股票保证不亏的概率为:1 0.1587 0.8413。
社会统计学(卢淑华)-第三章

接上例。某天,随机抽出一份表格,发现有错 误,办公室主管想知道由第一、第二、第三个 工作人员所造成的概率是多少?
第二节 概率分布、均值不方差
一、概率分布:
随机现象一共有多少种结果,以及每种结果伴随的概率。
1、离散型随机变量及其概率分布——分布列
概率分布:P X i Pi
例1:10人中,女性3人,抽3人,女性人数的概率分布。
③ 求[ E()]2P·( =xi)
④ 2=
5、方差的性质
① 常数的方差为0
② D(+C)= D()
③ D(C·)=DC2 ·()
④ 两个独立变量
D(+ )= D()+D( )
推广n个
例题
12名学生,3女,9男。任抽一人,如为女 生,则不放回,再抽一人,直到抽到男生 为止,求,抽到男生以前已抽出的女生人 数的数学期望与方差。
PAB PA P B A 或 PAB PB P A B
推论: PA1 A2 An PA1 AP1 A2PAn A1 A2 An
例题1
某城市中,有60%的家庭订阅日报,有80% 的家庭有电视机,假定这两个事件是独立 的,随机抽出一个家庭,发现既订日报又 有电视机的概率?
答案
PAi
B
PAi
• PB PB
Ai
其中
n
PB
i 1
PAi • PB Ai
全概例:
有三个工作人员被指定复制某种表格。某一人 复制了这种表格的40%,第二人复制了35%, 第三人复制了23%,第一人的错误率为0.04, 第二人的错误率为0.06,第三人的错误率为 0.03。随机抽一份表格,这份表格有错误的概 率为多少?
集
社会统计学(卢淑华),第十章

调查过程不应给被调查者带来身体或心理 上的伤害,避免涉及敏感或隐私问题。
数据处理与分析中的伦理问题
数据真实性
在处理和分析数据时,应确保数 据的真实性和完整性,避免篡改
、伪造或选择性使用数据。
数据安全性
采取必要的技术和管理措施, 确保数据的安全存储和传输, 防止数据泄露、损坏或丢失。
数据分析的客观性
报告统计结果时,应提供足够的信息 和数据支持结论,避免选择性报告或 隐瞒不利结果。
避免过度解读
在解释统计结果时,应避免过度解读 或夸大其意义,以免误导读者或产生 不必要的恐慌。
尊重被调查者的权益
在报告统计结果时,应注意保护被调 查者的隐私和权益,避免泄露个人信 息或造成不必要的伤害。
THANK YOU
社会问题调查
通过问卷调查、访谈、观察等方 法收集数据,了解社会问题的现
状、原因和影响。
社会问题分析
运用统计分析方法对调查数据进 行处理和分析,揭示社会问题的
本质和规律。
社会问题解决方案
基于分析结果,提出针对性的解 决方案和建议,为政府和社会各
界提供参考。
社会政策的制定与评估
社会政策制定
01
运用统计数据和分析结果,为政府制定社会政策提供科学依据
04
因子分析
一种通过降维技术,将多个相关变量简化为少数几个 综合变量的统计分析方法。
05
聚类分析
一种根据样本或变量之间的相似性或距离,将其分为 不同类别的统计分析方法。
02
描述性统计方法
频数分布与图形表示
频数分布表
将数据进行分类,并统计各类别出现的次数,形成 频数分布表,以直观展示数据的分布情况。
SAS是一款高级统计分析软件 ,具有强大的数据处理、分析 和可视化功能,适用于大规模 数据处理和复杂统计分析。
(完整word版)卢淑华 《社会统计学》讲义

社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学(卢淑华),第四章

4、二点分布是二项分布的特殊情况
.
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质
1)P(=0)>0 P(=1) >0
2)P(=0)+ P(=1)=q+p=1
3)二点分布的期望与方差
n x
P x m• N m
Cn N
(x=0,1,……)
当N很大,n较小时,超几何分布近似二项分 布。
.
第六节 泊松分布
一、公式:
P
x • e
x!
它是二项分布(n,p)的极限分布,只有一
个参数λ 。
.
二、泊松分布的性质
1、泊松分布为离散型随机变量分布,取值为0和一切正整 数。X=0,1,2,……
E()=0 ·q+1 ·p=p
D()= E(2) ( E)2=02 ·q+12 ·p p2= p p2
7、二分变量中取值0和1 只表示定类变量的编码,这种变
量又称虚拟变量。
.
第二节 排列不组合
一、排列
1、重复排列:
R
m n
n
n
2、非重复排列:
Pm
n nn1
3、全排列
P n n! n
.
n mn
.
第五节 超几何分布 1、适用条件:小群体研究 2、例: 设小组共有10名成员,7男3女。从中任
抽3名,求其中男性人数的概率分布。
.
超几何分布的概念及公式
设总体性质共分为两类:A类和非A类。总体总 数N。A类共有m个,从中任抽n个(nN-m), 则n中含有A类个数“”的概率分布为
统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
社会统计学(卢淑华)-第一章

资料的对象 3)要把握统计分析的前提是否满足:资料的信度和效度;
资料收集的科学性;资料在总体中的分布。
统计分析中常见的错误
社会统计学
社会统计学以德国为中心;克里斯首创 认为社会统计学是一门社会科学,研究
社会变动与规律性 研究对象是社会总体而不是个体,大量
观察、研究内在联系,才能揭示其规律 性。
社会统计学的两大流派
❖ 社会指标学派 ❖ 描述统计学派
社会指标
用来测定某一社会要素状态的统计量。 社会指标举例:
检验;定类-定距:方差分析;
定序变量
初级定量测定 除类别、属性之分外,还有等级、秩序
之分 如:教育程度;社会经济地位 定序-定序:等级相关
定距变量
除定类、定序外,取值之间有标准化的 量度
可进行加减运算,但不能进行乘除运算 典型例子:智商测定 定距-定距:回归与相关
定比变量
除定类、定序、定距之特征外,取值可 构成一个有意义的比例
有一个绝对固定的、非任意的零点 可进行乘除运算 绝大多数经济变量可进行定比测定 如:年龄;收入;
知识回顾 Knowledge Review
祝您成功!
联合国有关组织规定: 若低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.6以上表示收入差距悬殊。
二、社会学不社会统计学
1、社会学研究的重要环节 ▲课题---了解课题---假设---术语---问卷---调查---校核---统计
社会统计学 课后习题答案[31页]
![社会统计学 课后习题答案[31页]](https://img.taocdn.com/s3/m/84c3ea0dce2f0066f4332292.png)
分组 5~7 8~10 11~13 14~16 17~19 20~22
组中值 6 9
12 15 18 21
频次 1 2 3
16 4 4
累计 1 3 6
22 26 30
累计百分比% 3.33
10.00 20.00 73.33 86.67 100.00
(3)频数分布的直方图和箱体图如下。
2
(4)10.5年的受教育年限在第3百分位分数上。
答:这是一项观察研究,因为它既没有控制一些条件进行实验设计,也没有 给出抽样的方法和样本的规模。
6. 略。
第二章
四、思考与练习 (一)思考题 略。 (二)练习题 1. 被调查者的受教育年限如下 (年): 18 14 16 6 16 17 12 14 16 18 14 14 16 9 20 18 12 15 13 16 16 21 21 9 16 20 14 14 16 16 要求回答:(1)将数据分组,使组中值分别为6,9,12,15,18,21;(2)对 分组数据做频数分布表; (3)做出频数分布的直方图和箱体图; (4)10.5年的 受教育年限在第几百分位数上。 答:(1)数据可分为6组,分别是5~7、8~10、11~13、14~16、17~19、 20~22。 (2)频数分布表见下表:
7
80场而胜8场, 而 剩 下 20 场 与 平 手 打 个 全 胜, 结 果 胜 率 为 28%。 问 谁 更 有 实 力?试用辛普森悖论讨论这一问题。
答:乙选手更有实力。 辛普森悖论指的是由分组数据得到的某些结论,一旦将分组数据合并为总体 时,却得到相反的结论。为了避免辛普森悖论的出现,就需要斟酌各分组的权 重,并乘以一定的系数去消除因分组数据基数差异而造成的影响。 9. 统计一下世界各国人均拥有的电视机台数和民众的预期寿命,你会发现 二者之间存在很强的正相关关系,这是否能够说明看电视会延长人们的预期寿 命?如果是这样,我们能否运一些电视机到博兹瓦纳,以帮助延长那里的民众预 期寿命? 答:看电视不会延长人们的预期寿命;人均拥有电视机台数多的国家经济比 较富裕,富裕国家的人们预期寿命长是因为他们有良好的营养条件、干净的水以 及较好的医疗资源。 10. 一项对美籍墨西哥裔9~12岁女童身体质量指数 (BMI)的研究显示, 女童的 BMI指数与体育锻炼、饮食和看电视之间具有相关关系 (狉=-0.18), 而较强的相关关系存在于女童和母亲的 BMI之间,能否认为女童的肥胖症来自 遗传? 答:不完全是。BMI高的母亲很有可能给女儿做了少锻炼、过量饮食和长时 间看电视的坏榜样,导致女童也有这些坏习惯,从而遗传因素的影响和环境的影 响混杂在一起。因此我们无法说清楚母亲和女儿的 BMI之间的相关性有多少来 自遗传因素。 (二)练习题 1. 求11个初中生在一年级与二年级的几何成绩的积距相关。
社会统计学课后题答案(卢淑华)

《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、)(28.516200182525400)(5252004025504000元元=´++==´-+=M M d )(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==´-+==´-+=Q Q Q Q Q )(66.225509245092410050924001001005260032760000)(2222元====-=-=åås s N N b n b n i i i i i i 四、(1)极差R=1529-65=1464R=1529-65=1464(百元)(百元)(2)将数据从小到大排序:)将数据从小到大排序:65 92 106 118 122 135 148 174 185 65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===´-+==´-+==+´==+=Q Q (3))(92.42164.178017101026742495204)(222百元==-=-=ååNNx x i i s五、五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、六、633.010*******)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=´===´=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P x(2) 10口井皆不产油的概率为:02825.07.03.0)0(1010===C P x(3)该公司赢利的机会为:85069.07.03.07.03.01)2(911101010=--=³C C P x八、八、1465.071828.28!24)2(4442=´====--e x P l 九、九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==££=--e ex P x P x P l 十、十、。
社会统计学,卢淑华(第4版),第7,8章.pptx

假设检验的基本步骤
第1步:提出原假设和备择假设。 支持的命题为:备择假设 备择假设的对立面则为原假设 第2步:选择适当的检验统计量(test statistic) ,并 根据样本信息计算检验统计量的值
估计量-假设(H 0 )值 标准化检验统计量= 标准误差
第3步:选择显著性水平,确定临界值
总体参数的区间估计
用样本信息检验总体信息
第七章 假设检验 Hypothesis testing
一、假设检验的基本内容
(一)假设检验的基本思想 假设检验(hypothesis testing)是除参数估计之 外的另一类重要的统计推断问题。它的基本思想可以 用小概率原理来解释。所谓小概率原理,就是认为小 概率事件在一次试验中是几乎不可能发生的。也就是 说,如果对于总体的某个假设是真实的,那么不利于 或不可能支持这一假设的小概率事件A在一次试验中 几乎是不可能发生的,要是一次试验中事件A竟然发 生了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。
原假设 H0 原假设(null hypothesis)通常是研究 者想收集证据予以反对的假设,也称为 零假设,用表示。一般来说,原假设建 立的依据都是已有的、具有稳定性的, 从经验看,没有发生条件的变化,是不 会被轻易否定的。换句话讲,进行假设 检验的基本目的,就在于作出决策:接 受原假设还是拒绝原假设。
临界值计算 比较判断
由于 z 2.77 z 1.645
故不能拒绝原假设。
例6(P251) H0:μ≤20
右侧检验 H1:μ>20 假设设定
分析:正态总体,方差未知,小样本
统计量选择
统计量计算
23.5 20 t 3.5 s/ n 3/ 9
x 0
社会统计学(卢淑华),第二章

计量资料频数表的编制
计量资Байду номын сангаас频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料,
编制频数表有利于进一步的统计分析、且频
数表本身也具有统计描述的作用.
编制频数表的步骤
编制频数表的步骤
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限,
续例
计量资料频数分布表
118 例 13 岁女孩身高(cm)资料频数表。 身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~ 159~162 合计 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
*
144.9 145.5 139.3 146.2 145.2 155.2 148.7 148.7 137.5 146.7 152.3 149.5
152.2 149.5 144.8 146.8 146.8 138.9 139.5 153.2 143.5 139.2 141.8 147.5
145.0 141.1 147.5 142.3 148.9 140.9 140.6 146.5 150.0 142.6 150.8 140.3
%
20.0 27.6 52.4 100.0
干部 工人 农民 总数
二、统计表
统计表的制作 要注意的问题: 1、标题、内容简明 2、统计栏数多时,要加编号 3、数字填写要求:位数对准,同栏数字、小数位 要一致,相同数字不可以写“同上”,无数字栏 用 “—”,缺资料“…” 4、表中数字用同一单位时,标在右上角 5、表的左右两端不封闭 判断 练习:分别制作定类、定序、定距变量统计表 注意:统计表的分组科学性问题
社会统计学,卢淑华(第4版),第2章.pptx

家庭结构 核心家庭
直系家庭 联合家庭
频次 1050
720 110
百分比(%) 49.30
33.80 5.16
其他
总数
250
2130
11.74
100.00
多选项二分法
a 样本1 样本2 样本3 样本4 样本5 √ × √ √ √ b √ × × √ √ c √ √ × × × d × √ √ × × e √ √ √ √ √
Me=“乙”
(三)组距式分组
• ①首先确定中位数组;②使用公式 • 下限公式: f S m 1 Me L 2 i fm
• 上限公式:
Me U
f
2
S m1 fm
i
公式中各字母含义
• • • • U:中位数组的上限; L:中位数组的下限; fm:中位数组的频数; Sm-1:向上累计时中位数组前一组的累计频数, 即中位数前一组所对应的向上累计频数; • Sm+1:向下累计时中位数组后一组的累计频数 即中位数后一组所对应的向下累计频数; • i:中位数组的组距。
(二)定距数据
1、未分组资料(spss版本)
Q1位置=(n+1)/4; Q2位置=(n+1)/2; Q3位置=3(n+1)/4 表2.10 Q1位置=(n+1)/4=25.25; Q2位置=(n+1)/2=50.5; Q3位置=3(n+1)/4=75.75
Q1=x(25)+0.25× [x(26)-x(25)]=1.37+0.25 ×[1.37-1.37]=1.37 Q2=x(50)+0.5× [x(51)-x(50)]=1.4+0. 5 ×[1.41-1.4]=1.405 Q3=x(75)+0.75× [x(76)-x(75)]=1.44+0.75 ×[1.44-1.44]=1.44
社会统计学(卢淑华),第二章-24页文档资料

组中心值。
看一看,这是一个什么东东?
90
80
70
60
50
东部
40
西部
30
北部
20
10
0 第一季度 第二季度 第三季度 第四季度
四、频数统计
cf↑:向上累计。小于某一数字的频数 cf↓:向下累计。大于某一数字的频数
年龄 人数
cf↑
146.4 150.6 140.5
141.2 140.9 139.9
138.5 146.2 146.8 142.3 150.9 145.5
138.5 160.8 * 139.9 154.6
145.2 155.2 148.7 148.7
146.8 138.9 139.5 153.2
148.9 140.9 140.6 146.5
偶数时:中位值=中间位置左右两位数的平均值为中位 值。
2)根据频次分布求中位值
未分组资料:
首先确定中位值的位置( 利用cf ↑ ),第二步找中位值。 分组资料 : 四步求值 方法 1、找50%区间 2、找上界U、下界L;U%—L% 3、求累计50%的变量值X
151.8 150.7 144.5 132.5
145.6 148.6 142.9 146.8
144.6 137.5 143.5 150.0 143.5 146.5
143.7 146.7 139.2 142.6 143.5 131.5 138.9 152.3 141.8 150.8 146.3 142.5
要一致,相同数字不可以写“同上”,无数字栏 用 “—”,缺资料“…” 4、表中数字用同一单位时,标在右上角 5、表的左右两端不封闭 判断 练习:分别制作定类、定序、定距变量统计表
社会统计学课后题答案

社会统计学课后题答案《社会统计学》答案“社会统计学”第六章习题答案⼆、解答:75.0=x 20.0=S 05.095.01=-=α 96.12=αt代⼊式(6.22)置信区间为:[]7892.0,7108.010020.096.175.0,10020.096.175.0=+?-四、解答:5.4=x 5=S 05.095.01=-=α 96.12=αt代⼊式(6.22)置信区间为:[]48.5,52.3100596.15.4,100596.15.4=+?-五、解答:60.0?=p 40.0?1?=-=p q 10.090.01=-=α 65.12=αt代⼊式(6.33)置信区间为:[]6572.0,5428.020040.060.065.160.0,20040.060.065.160.0=+??-第⼋章单总体假设检验⼀、解答:H 0:u=2.5 H 1:u<2.564.311.04.011.05.21.21001.15.2-=-=-=-=x z65.1-=-αzz =-3.64<-1.65,故拒绝原假设。
408.00024.002.01004.06.06.062.0==?-=z65.1=αzz =0.408<1.65,故不能拒绝原假设。
三、解答:(1)H 0:u=75% H 1:u ≠75%5.21000.20.75-0.8z ==96.12/=αzz =2.5>1.96,故应拒绝原假设。
(2) 如果拒绝了⾷品费⽤占总收⼊的⽐例为75%的说法,则可能犯错误的概率为α,即0.05。
四、解答:H 0:u=55000 H 1:u ≠55000 n=6 67.60466=x∑=362800i x ∑=022*********i x71.461056362800022043600001)(222=-=--=∑∑n n x x S i i90.2671.46105500067.60466=-=-=n S u x t57.2)5(025.0=t 0690.2=t >57.2)5(2=αt 06,故应拒绝原假设。
社会统计学习题卢淑华

社会统计学习题卢淑华1、P58习题⼗五(1)试作频率统计表,直⽅图和折线图(2)试求均值和标准差2、P59习题⼗六设以下是七⼗⼆名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直⽅图和折线图(2)试求众值、中位值和均值,并做简单讨论。
3、P59习题⼗七设以下是1209名抽烟者年龄的统计(见下表)(1)试作频率统计表、直⽅图和折线图(2)试求四分互差。
4、P72例10某年级共有学⽣⼀百名,其中来⾃⼴东省的有⼆⼗五名,来⾃⼴西省的有⼗名,问任抽⼀名,来⾃两⼴的概率是多少?5、P73例12根据某市职业代际流动的统计,服务性⾏业代际向下流动的概率为0.07,静⽌不流动的概率为0.85,求服务性⾏业代际向上流动的概率是多少?6、P75例13为了呀⽜⽗代⽂化程度对⼦代⽂化程度的影响,某⼤学统计出学⽣中⽗亲具有⼤学⽂化程度的占30%,母亲具有⼤学⽂化程度的占20%,⽽⽗母双⽅都具有⼤学⽂化程度的占10%,问学⽣中任抽⼀名,⽗代⾄少有⼀名具有⼤学⽂化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进⾏了调查,发现旅游者处于游览名胜的概率为0.219;处于异族⽂化的吸引占0.509;⽽两种动机兼⽽有之的占0.102.问旅游动机为游览名胜或为异族⽂化吸引的概率是多少?8、P76例16根据统计结果,在⾃然⽣育情况下,男婴出⽣的概率为22/43;⼥婴出⽣的概率为21/43.某单位有两名孕妇,问两名孕妇都⽣男婴的概率是多少?两名孕妇都⽣⼥婴的概率是多少?其中⼀名孕妇⽣男婴、⼀名孕妇⽣⼥婴的概率是多少?9、P77例17某居民楼共⼗⼆户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共⼆⼗户,其中直系家庭为两户,问访问第⼆户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户⼀千户,其中核⼼家庭占60%,问访谈中散户都是核⼼家庭的概率是多少?12、P83例2210⼈抓阄,其中共有2张球票,问第2个⼈抓到球票的概率?13、P85例23设出⼝商标为Made in China的产品,其中有50%为上海⼚的产品;30%为北京⼚得产品;20%为天津⼚的产品。
社会统计学(卢淑华),第十二章

2、最小二乘法 设总体中抽取一样本,围绕n个观测点画 一条直线 y a bx ,与各点都比较接近 的直线为最佳。要求:各点到待估直线 的铅直距离之和为最小。利用微分学中 求极值的原理,求得: Lxy a y bx b Lxx 将a、b代入线性回归方程:
yˆ a bx
r为相关系数;PRE( r2)系数为判定系数。 主意二者的区别?
4、相关系数的检验 H 0:P 0
t 1 n2
2
: H P0
1
tn 2
用
进行直接检验:
1)根据 公式计算样本的 值 2)给出显著性水平 和k=n-2,按附表查出相 应的临界相关系数 3)比较 与 的大小 如果 ,则x与y之间存在线性相关关系, 在显著性水平 下显著
例:以下是子代和父代受教育年限的抽 样调查:
父代 子代 2 4 6 8 10
4
5
8
7
9
求:回归直线、相关系数,是否有推论
意义? 0.05
5、相关系数 的检验与回归系数 的 检验的关系: 如果通过了 的检验也必然导致 (F检 验)检验的通过。实际上,F公式与 r 公式有对应关系:
1 1 2 i n
E y i x i
4、要求随机变量 yi 是统计独立的
以上假定用两组数据结构来表达: 1)随机变量 yi 是独立的,且有: 均值:E yi xi D 方差: yi 2 2)yi 与 xi 有如下关系: yi xi i i 是随机变量,它们相互独立,且有