社会统计学习题 卢淑华

合集下载

社会统计学(卢淑华)_第六章

社会统计学(卢淑华)_第六章
第六章 参数估计
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q 2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n

样本方差
S 2 的方差
:D2 S

4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
第五节 正态总体的区间估计
一、置信度、置信区间
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为

Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)

置信区间与置信度的关系:

社会统计学(卢淑华)-第三章

社会统计学(卢淑华)-第三章
逆概例:
接上例。某天,随机抽出一份表格,发现有错 误,办公室主管想知道由第一、第二、第三个 工作人员所造成的概率是多少?
第二节 概率分布、均值不方差
一、概率分布:
随机现象一共有多少种结果,以及每种结果伴随的概率。
1、离散型随机变量及其概率分布——分布列
概率分布:P X i Pi
例1:10人中,女性3人,抽3人,女性人数的概率分布。
③ 求[ E()]2P·( =xi)
④ 2=
5、方差的性质
① 常数的方差为0
② D(+C)= D()
③ D(C·)=DC2 ·()
④ 两个独立变量
D(+ )= D()+D( )
推广n个
例题
12名学生,3女,9男。任抽一人,如为女 生,则不放回,再抽一人,直到抽到男生 为止,求,抽到男生以前已抽出的女生人 数的数学期望与方差。
PAB PA P B A 或 PAB PB P A B
推论: PA1 A2 An PA1 AP1 A2PAn A1 A2 An
例题1
某城市中,有60%的家庭订阅日报,有80% 的家庭有电视机,假定这两个事件是独立 的,随机抽出一个家庭,发现既订日报又 有电视机的概率?
答案
PAi
B
PAi
• PB PB
Ai
其中
n
PB
i 1
PAi • PB Ai
全概例:
有三个工作人员被指定复制某种表格。某一人 复制了这种表格的40%,第二人复制了35%, 第三人复制了23%,第一人的错误率为0.04, 第二人的错误率为0.06,第三人的错误率为 0.03。随机抽一份表格,这份表格有错误的概 率为多少?

社会统计学(卢淑华),第十章

社会统计学(卢淑华),第十章

调查过程不应给被调查者带来身体或心理 上的伤害,避免涉及敏感或隐私问题。
数据处理与分析中的伦理问题
数据真实性
在处理和分析数据时,应确保数 据的真实性和完整性,避免篡改
、伪造或选择性使用数据。
数据安全性
采取必要的技术和管理措施, 确保数据的安全存储和传输, 防止数据泄露、损坏或丢失。
数据分析的客观性
报告统计结果时,应提供足够的信息 和数据支持结论,避免选择性报告或 隐瞒不利结果。
避免过度解读
在解释统计结果时,应避免过度解读 或夸大其意义,以免误导读者或产生 不必要的恐慌。
尊重被调查者的权益
在报告统计结果时,应注意保护被调 查者的隐私和权益,避免泄露个人信 息或造成不必要的伤害。
THANK YOU
社会问题调查
通过问卷调查、访谈、观察等方 法收集数据,了解社会问题的现
状、原因和影响。
社会问题分析
运用统计分析方法对调查数据进 行处理和分析,揭示社会问题的
本质和规律。
社会问题解决方案
基于分析结果,提出针对性的解 决方案和建议,为政府和社会各
界提供参考。
社会政策的制定与评估
社会政策制定
01
运用统计数据和分析结果,为政府制定社会政策提供科学依据
04
因子分析
一种通过降维技术,将多个相关变量简化为少数几个 综合变量的统计分析方法。
05
聚类分析
一种根据样本或变量之间的相似性或距离,将其分为 不同类别的统计分析方法。
02
描述性统计方法
频数分布与图形表示
频数分布表
将数据进行分类,并统计各类别出现的次数,形成 频数分布表,以直观展示数据的分布情况。
SAS是一款高级统计分析软件 ,具有强大的数据处理、分析 和可视化功能,适用于大规模 数据处理和复杂统计分析。

(完整word版)卢淑华 《社会统计学》讲义

(完整word版)卢淑华 《社会统计学》讲义

社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。

研究对象:概括而言是指社会现象的数量方面。

2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。

3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。

4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。

5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。

构成总体的每一个个体称为总体单位,简称单位或个体。

3个基本特征:大量性、同质性和变异性。

(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。

可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。

(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。

一个完整的统计指标由两部分构成:指标名称和指标数值。

在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。

指标体系就是一系列有内在联系的统计指标的集合体。

二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。

社会统计学(卢淑华)-第三章

社会统计学(卢淑华)-第三章
A=该家庭订一份日报
B=该家庭有电视机 P(A)=0.60 P(B)=0.80 P(AB)=0.60*0.80=0.48
例题2
对同一目标进行3次射击,第一、二、三、 次射击命中的概率分别是:0.3,0.4,0.6,求 在这三次射击中恰有一次命中的概率。
答案
Ai=第i次射击命中 A=恰有一次命中 P(A)
x2
Px1 x2 x dx x1
概率密度 x 存在以下性质:
1)x 0
2)
xdx 1
3、分布函数
1)定义:F(x)=P( x) 意义:随机变量从最远的起点(- )到所研究的x点所有概率的总和。
2)对于离散型随机变量,则:依据概率的加法定理:例
F x P x P xi
1、离散型随机变量
方差:D E E 2 x E 2 Pi
ii
2、连续型随机变量
方差:D
x
E
2
xdx
标准差 : D
3、方差和标准差都反映了随机变量的可能值密集在数学 期望周围的程度。方差值越小,密集程度越高;反之则方
差值较大。
4、计算过程
① 利用公式求 E()=
② 求[ E()]2
例2:两名孕妇,生女婴的概率分布。
性质:1) Pk 0
2) PK 1 K 1
分布列表明全部概率在各可能取值之间的分布规律,全面描叙离散随机变量
的统计规律
2、连续型随机变量及其概率分布 ——概率密度函数
概率密度

x
P
lim
x 0
x
x 2
x
x
x
2
任意两点(X1,X2)之间的概率为:
三种情况:
1、不可能事件Ø 概率 P()=0 2、必然事件S 概率 P(S)=1 3、必然与不可能之间E 概率 0 P(E) 1

社会统计学课后题答案(卢淑华)

社会统计学课后题答案(卢淑华)

《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、)(28.516200182525400)(5252004025504000元元=´++==´-+=M M d )(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==´-+==´-+=Q Q Q Q Q )(66.225509245092410050924001001005260032760000)(2222元====-=-=åås s N N b n b n i i i i i i 四、(1)极差R=1529-65=1464R=1529-65=1464(百元)(百元)(2)将数据从小到大排序:)将数据从小到大排序:65 92 106 118 122 135 148 174 185 65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===´-+==´-+==+´==+=Q Q (3))(92.42164.178017101026742495204)(222百元==-=-=ååNNx x i i s五、五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、六、633.010*******)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=´===´=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P x(2) 10口井皆不产油的概率为:02825.07.03.0)0(1010===C P x(3)该公司赢利的机会为:85069.07.03.07.03.01)2(911101010=--=³C C P x八、八、1465.071828.28!24)2(4442=´====--e x P l 九、九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==££=--e ex P x P x P l 十、十、。

社会统计学(卢淑华),第十一章

社会统计学(卢淑华),第十一章
向的修正,并分别给出了d yx 和 d xy 两个
系数。
d yx
ns nd ns nd n y
d
xy
ns nd ns nd nx
d yx :仅考虑在y方向的同分对 d xy :仅考虑在x方向的同分对
.
三、s值检验
H0: s 0
H1: s 0
统计量:
S
z —N(0,1)
Se
s ns nd
Y\x
10
1
12
4
32
2
22
4
23
4
32
2
12
1
12
5
.
4、 Gamma系数的PRE性质:
PRE ns nd ns nd 与G系数相同
5、当定序变量只有两种等级 G
n1 n4 n3 n2
不计符号时(方向)与Q系数相同
.
三、 Gamma系数的检验
H0: r0
H1: r0
统计量:
z G 1 G2
ns nd n
.
例:在某地选取409名已婚男人,研究他们对 母亲的感情会否影响他们对婚姻的适应,并问 是否有总体推论价值。
婚姻适应
丈夫对母亲的感情
平淡 不错 良好 很好

32 41 26 28 127
一般
28 47 41 22 138
很好
15 69 61 59 204
75 157 128 109 409
.
每对父子(女)作为一个观测单元,将其等 级写成一个集合:如(1,2)
将等级差平方后求和 其极值会是怎样?
.
r 1、相关系数 s
以等级差的平方和为基础来讨论等级相关。

社会统计学(卢淑华),第十二章

社会统计学(卢淑华),第十二章
年次 x 91 92 93 94 95 96 97 98 116 129 137 146 144 165 182 198
y
104 115 124 131 132 145 158 172
建立回归方程,并进行F检验 0.05
第四节 相关

一、相关系数
(线性相关)
i i

1、协方差:
x x y y Covx, y n1
2 E i 0
D
5、处于检验的需要,要求y值的每一个子 总体都满足正态分布。

二、回归方程的检验 1、原假设:x与y不存在线性关系

H : 0
0

H : 0
1

2、线性回归的平方和分解 1)总偏差平方和:反映观察值 值 y 的总分散程度。
y 围绕均
i
TSS

它是总体线性回归方程 y x 的最佳 估计方程
例:妇女受教育的年限不家务劳劢时间调查资料
妇女 A B C D E F G H I

教育年限 2 2 3 3 4 4 4 6 8 36
劳动小时 5 4 4 3 1 1 0 0 0 18
xy 10 8 12 9 4 4 0 0 0 47
x
F
r n 2 1r
2
2
F 1, n 2
RSS r 即:RSS r 2TSS TSS 2 2 TSS ESS r TSS r F (n 2) 2 ESS (1 r )TSS 1 r2 n2 n2
2




6、相关与回归的比较 1)相同点:都是研究变量之间的非确定 性关系,而且都是研究其中的线性关 系。 2)不同点: ①回归是研究变量之间的因果关系,但 相关不一定具有因果关系。 ②相关系数是双向对称的,回归直线是 非对称的。

社会统计学(卢淑华),第七章

社会统计学(卢淑华),第七章



3、给出小概率 4、用样本统计量的观测值进行判断
例:某地收入水平调查状况如下:x 870 s 21 n 50 问:该地上报的平均收入为880元是否 可信?(显著性水平为 0.05)


(二)两类错误 1、弃真错误: 把一次观测中出现在拒绝域的小概率事件 当作对原假设的拒绝,此时会发生。犯错 误的大小为 2、纳伪错误:
在接受原假设时犯的错误,犯错误的概率 为 。 0 越小, 数值越大
2
拒绝 H 0 ;反之接受 2)单边检验

H
0
右侧:只有当样本计算统计量的值过大:
z z 才会落入拒绝域;如果 z z 接受。

左侧: pz z
三、假设检验的步骤不两类错误
其分布
0



3、假设检验的基本原理: 小概率原理: 1)小概率事件是在一次观察中是不可能出现的事 件。 2)如果在一次观察中出现了小概率事件,那么, 合理的想法是否定原有事件具有小概率的说法。 假设检验思想在统计学中的描述:经过抽样获得 一组数据(即样本):根据样本计算的统计量, 如果:原假设成立的条件下几乎不可能发生的, 就拒绝或否定原假设;如果在原假设成立的条件 下,根据样本计算的统计量发生的可能性不是 小,则接受。
第七章 假设检验的基本概念
一、统计假设 1、统计假设:

收集资料的范围仅是全体的一部分,是一 个随机样本,那么,这种和抽样手段联系 在一起,并且依靠抽样数据进行验证的假 设,即统计假设。
2、原假设和备择假设
1)原假设(虚无假设或解消假设)H 0 : 根据已有资料周密考虑后确定 2)备择假设(研究假设)H 1 : 原假设的逻辑对立假设 三种形式:单边(左、右) 双边

社会统计学卢淑华

社会统计学卢淑华

1 A至多出现m次的概率
C p q m
P0 m
x
x nx
n• •
x 0
2 A至少出现m次的概率
C p q n
P mn
x
x
nx
n• •
x m
3 A出现次数不少于a不大于b的概率
C p q b
Pa b
x
x nx
n• •
x a
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
例题
已知某校有5%的学生是贫困生,随机抽 出50人,求下列情况的概率:
1、至多2位贫困生 2、至少1位贫困生

设贫困生数为X,则X~b 50,0.05 , n很大,p很小,近似服从泊松分布,
λ =50*0.05=2.5 1、查累积泊松分布表,p x≤2 =0.5438 2、p x≥1 =1-p x=0 =0.9179
第四讲
二项分布及其它离散型随机变量的分布
第一节 二点分布
1、贝努里试验 指只有两个可能结果的随机试验, 在现实生活中许多随机现象只有两种结果, 如,男-女;出现-不出现;合格-不合格等, 关注的结果---“成功”;另一结果—“失败”
2、n重贝努里试验 如果试验在相同的条件下重复n次,并且每次 的试验结果相互独立,则称n重贝努里试验,
第五节 超几何分布
1、适用条件:小群体研究 2、例: 设小组共有10名成员,7男3女,从中任
抽3名,求其中男性人数的概率分布,
超几何分布的概念及公式
设总体性质共分为两类:A类和非A类,总体总 数N,A类共有m个,从中任抽n个 nN-m , 则n中含有A类个数“”的概率分布为
C C x
n x

社会统计学,卢淑华(第4版),第2章.pptx

社会统计学,卢淑华(第4版),第2章.pptx

家庭结构 核心家庭
直系家庭 联合家庭
频次 1050
720 110
百分比(%) 49.30
33.80 5.16
其他
总数
250
2130
11.74
100.00
多选项二分法
a 样本1 样本2 样本3 样本4 样本5 √ × √ √ √ b √ × × √ √ c √ √ × × × d × √ √ × × e √ √ √ √ √
Me=“乙”
(三)组距式分组
• ①首先确定中位数组;②使用公式 • 下限公式: f S m 1 Me L 2 i fm
• 上限公式:
Me U
f
2
S m1 fm
i
公式中各字母含义
• • • • U:中位数组的上限; L:中位数组的下限; fm:中位数组的频数; Sm-1:向上累计时中位数组前一组的累计频数, 即中位数前一组所对应的向上累计频数; • Sm+1:向下累计时中位数组后一组的累计频数 即中位数后一组所对应的向下累计频数; • i:中位数组的组距。
(二)定距数据
1、未分组资料(spss版本)
Q1位置=(n+1)/4; Q2位置=(n+1)/2; Q3位置=3(n+1)/4 表2.10 Q1位置=(n+1)/4=25.25; Q2位置=(n+1)/2=50.5; Q3位置=3(n+1)/4=75.75
Q1=x(25)+0.25× [x(26)-x(25)]=1.37+0.25 ×[1.37-1.37]=1.37 Q2=x(50)+0.5× [x(51)-x(50)]=1.4+0. 5 ×[1.41-1.4]=1.405 Q3=x(75)+0.75× [x(76)-x(75)]=1.44+0.75 ×[1.44-1.44]=1.44

社会统计学课后题答案(卢淑华)

社会统计学课后题答案(卢淑华)

《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。

社会统计学(卢淑华),第二章

社会统计学(卢淑华),第二章
第二讲
单变量统计描述
一、分布
(xi ni) x的要求: n:频次分布 (1)完整性 (2)互斥性 P:概率分布 %:百分比分布 如: 性别 xi 人数ni 5 男 6 女
例:某校学生的父亲职业
职业
n
110 152 228 550
p
0.200 0.276 0.524 1.000
N
2

2)根据频次分布: 例:

1 N ni xi2 ( ni xi )2 N
判断:学校对最喜爱体育项目调查:
项目名称 球类 田径 游泳 赛车 人数 150 100 60 70 百分比 60 30 20 20
判断:学生成绩变化调查
开学初 成绩 好 中 差 % 10 80 10 提高 60 80 75 期末 下降 10 10 10 不变 30 10 15
三、统计图


圆瓣图。反映所占比例;使用于定类; 条形图。定类:离散长条;定序:紧挨 长条或离散长条;宽度无意义; 直方图。紧挨长条;宽度有意义;适用 于定距;高度:频次密度=频次/组距 折线图。直方图顶点中心相连;要计算 组中心值。
计量资料频数表的编制
计量资料频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料,
编制频数表有利于进一步的统计分析、且频
数表本身也具有统计描述的作用.
编制频数表的步骤
编制频数表的步骤
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限,
六、标志变异指标

测定离散趋势,考察资料的分散特征 Nfm 1、异众比率
0

非众值的比例越小,则众值的代表性越大。例 2、极差 R=观察最大值-观察最小值 例

社会统计学(卢淑华),第二章-24页文档资料

社会统计学(卢淑华),第二章-24页文档资料
于定距;高度:频次密度=频次/组距 折线图。直方图顶点中心相连;要计算
组中心值。
看一看,这是一个什么东东?
90
80
70
60
50
东部
40
西部
30
北部
20
10
0 第一季度 第二季度 第三季度 第四季度
四、频数统计
cf↑:向上累计。小于某一数字的频数 cf↓:向下累计。大于某一数字的频数
年龄 人数
cf↑
146.4 150.6 140.5
141.2 140.9 139.9
138.5 146.2 146.8 142.3 150.9 145.5
138.5 160.8 * 139.9 154.6
145.2 155.2 148.7 148.7
146.8 138.9 139.5 153.2
148.9 140.9 140.6 146.5
偶数时:中位值=中间位置左右两位数的平均值为中位 值。
2)根据频次分布求中位值
未分组资料:
首先确定中位值的位置( 利用cf ↑ ),第二步找中位值。 分组资料 : 四步求值 方法 1、找50%区间 2、找上界U、下界L;U%—L% 3、求累计50%的变量值X
151.8 150.7 144.5 132.5
145.6 148.6 142.9 146.8
144.6 137.5 143.5 150.0 143.5 146.5
143.7 146.7 139.2 142.6 143.5 131.5 138.9 152.3 141.8 150.8 146.3 142.5
要一致,相同数字不可以写“同上”,无数字栏 用 “—”,缺资料“…” 4、表中数字用同一单位时,标在右上角 5、表的左右两端不封闭 判断 练习:分别制作定类、定序、定距变量统计表

社会统计学(卢淑华),第九章

社会统计学(卢淑华),第九章

双边: A
B
D0

3、统计量:
Z
xA xB D 0

4、拒绝域:
n n
2 A A
2 B B

单右:z z ; 单左:z z ; 双边:z z 2
二、大样本总体成数差检验
二项总体A与B,其总体成数分别为:
A:PA; B:PB。
A
B


nA、nB 足够大,PA 、PB 趋向正态分布。
大样本成数差检验的步骤

1、原假设 H 0 :P A PB D0

2、备择假设:H 1
单边:P P D 或 P P D
A B 0
A B 0

双边:PA PB D0

3、统计量: 4、拒绝域:
z
PA PB Do
xA xB u A uB t 1 1 s nA nB
2

~ tnA nB 2

3、小样本二总体方差比的检验

设有两总体A与B,满足正态分布:
2 总体A:N A , A2 总体B:N B , B


从两总体中分别独立各抽取一个随机样本,
总体A:S A2 ;nA 总体B:S B2 ;nB 根据抽样分布的讨论有

一、样本总体均值差检验 两个总体:A与B 参数为A: A , A2 B: B , B2 样本容量足够大(≥50), 大样本均值差检验的步骤: 1、原假设 H :
0 A


xA ,xB 趋向正态分布。


D0 B

2、备择假设:H 单边:

社会统计学习题 卢淑华

社会统计学习题 卢淑华

1、P58习题十五(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。

(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。

3、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)(1)试作频率统计表、直方图和折线图(2)试求四分互差。

4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为,静止不流动的概率为,求服务性行业代际向上流动的概率是多少6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为;处于异族文化的吸引占;而两种动机兼而有之的占.问旅游动机为游览名胜或为异族文化吸引的概率是多少8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少两名孕妇都生女婴的概率是多少其中一名孕妇生男婴、一名孕妇生女婴的概率是多少9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、P58习题十五人数户数0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。

(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。

(3)试求四分互差和标准差。

婚龄人数1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 13、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)年龄人数21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89(1)试作频率统计表、直方图和折线图(2)试求四分互差。

4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少?6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少?8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少?9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少?12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率?13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。

设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。

问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少?14、P99例27已知随机变量的概率分布为ξ13.4 13.5 13.6 13.7 13.8P(ξ=Xi)0.05 0.15 0.60 0.15 0.05求σ²=?15、P106习题三某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。

(1)只定人民日报的(2)至少订以上一种报纸的(3)只订以上一种报纸的(4)以上两种报纸都不订的16、P107习题6根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?17、P107习题7问卷调查中,首先问“您是否结婚?”如果回答是未婚,将跳过以下问题不问。

如果回答是已婚,则进一步询问“您是否有孩子”设未婚概率为0.4;已婚中有孩子的概率为0.8.问访问中回答有孩子的概率是多少?18、P107习题8某产品由甲乙两家乡镇企业生产,其中甲厂提供95%的产品,乙厂提供5%的产品。

甲厂产品的合格率为95%;乙厂产品的合格率为70%。

现抽得一件事次品的情况下,问来自甲厂得概率是多少?19、P107习题12居民楼共有十二户居民,其中有九户为干部,三户为工人。

现从中任抽一户,若抽到的是工人户,则不放回再抽一户,直到抽到干部户为止。

求在抽到干部户以前已抽出的工人户的概率分布、均值µ和方差σ²。

20、P119例8根据生命表,年龄为60岁的人,可望活到下年的概率为p=0.95.设某单位年龄为60岁的人共有十人。

问:(1)其中有9人活到下年概率为多少?(2)至少有9人活到下年的概率是多少?21、P110例9某中学平均升学率为70%,设随机抽查六名学生。

问(1)其中有四名升学的概率是多少?(2)至少有四名升学的概率是多少?22、P123例10设公司对某经理候选人进行民意调查,结果公司有三分之一员工表示赞成;三分之一员工表示反对;其余为不表态。

问如果任抽三名,其调查结果的概率分布如何?23、P130例14某兄弟民族学习班共有成员十名,其中回族三名,维吾尔族无名,蒙古族两名,求任访四名,其各族人数的概率分布?24、P133例15设在填写居民证1000张卡片中共发现300个。

为每张居民正出现错字的概率分布如何?25、P137习题1某地区回族占全体居民人数的6%,今随机抽取十名,问其中恰有两名是回族的概率是多少?26、P137习题2在一百箱出口商品中,有十箱为乡镇企业的产品,问第三次才抽到箱中是乡镇企业产品的概率是多少?(假定是非重复抽样)27、P137习题3工人中吸烟的比例为0.5%,某车间有工人300名,求以下概率:(1)全不吸烟(2)一人吸烟(3)二人吸烟(4)三人吸烟28、P137习题4某民族地区,汉族占50%,回族占30%,蒙古族占20%。

求任抽四名中汉、回人数的概率分布?29、P137习题5某车间共有四十名工人,其中妇女有十名。

今任抽五名进行访问,问被访中至少有四名妇女的概率是多少?30、P137习题6十户人家中有五户参加了才财产保险,三户参加了人寿保险;其余为参加任何保险。

求随机抽查四户中参加财产保险户数、人寿保险户数的概率分布?31、P154例11已知ξ~N(0,1),求满足P(׀ξ׀≥λ)=0.05中之λ值。

32、P155例12根据统计,北京市初婚年龄服从正态分布。

其均值为25岁,标准差为5岁,问25岁到30岁之间的结婚的人,其百分数是多少?33、P157例13已知k=9,α=0.025,求满足下式P(χ²<χ²1-α)=α中之χ²1-α值34、P162例14某地进行了电话费用的情况调查。

电话费用的分布不清楚。

但直到平均电话费用为80元,标准差为10元。

问60-100元之间的概率是多少?35、P175例16某地区少数民族占0.5%。

今作10^4人的随机抽查,求少数民族不多于70人的概率36、P177习题1已知随机变量ξ满足正态分布ξ~ N(50,5²),求P(ξ>61)=?37、P178习题2接上题,求P(44≤ξ≤55)=?38、P178习题3已知Z满足标准正态分布N(0,1),求以下各α情况下,P(׀Z׀>λ)=α中的λ值。

(1)当α=0.1(2)当α=0.05(3)当α=0.0139、P178习题4根据调查,儿童智商分布为N(100,10²),某幼儿园共有儿童100人,问智商在110-120之间的儿童共有多少人?40、P178习题5共有5000个同龄人参加人寿保险,设年死亡率为0.1%。

参加保险的人在年初应缴纳保险费1000元,死亡时家属可领10万元,求保险公司一年内从这些保险的人中,获利不少于400万元的概率?41、P184例1根据抽样调查,以下是八名同学社会统计学考试得分学生成绩A B C D E F G H 707172 74 7476777842、P185例2工会为了了解春游期间需租用几辆公共汽车,在公司一万名员工中进行了共一百的假单随机抽样调查。

统计结果,其中有二十名愿意外出春游。

设每辆可载乘客五十名,问估计要预租多少辆公共汽车?43、P202例4为了对某企业职工闲暇时间进行研究。

根据一次样本你(n=33)的调查,平均每天看电视时间为:X=0.96(小时)S=0.47(小时)试求企业职工平均每天看电视时间的区间估计(置信度取95%)。

假定看电视时间ξ满足正态分布N(µ,σ²),其中σ²是未知。

44、P207例5设某企业女员工从事家务劳动时间服从正态分布N(µ,0.66²)。

根据三十六人的随机抽样调查,每天平均从事家务劳动时间X为:X=2.65小时,求µ的双侧置信区间(置信度取0.95和0.99两种)45、P208例6设某社区受教育程度服从正态分布N(µ,σ²),σ²未知。

根据二十五人的随机抽样调查,平均受教育年限X和S为:=11.5年,S=3.6年,求µ的双侧置信区间(1-α=0.99)46、P210例7设某村平均家庭购买化肥的支出服从正态分布。

现根据十户指出的抽样调查,得数据:578;572;570;568;572;570;570;596;584;572.求方差σ²和标准差σ的置信区间(1-α=0.95)47、P211例8设某区受教育程度的总体分布、方差都不知道。

根据五十人的抽样调查结果,平均受教育年限X及标准差S为:X=11.5年,S=3.6年,求置信度为0.99的µ的双侧置信区间。

48、P214例9设根据某地一百户的随机抽查,其中有六十户拥有手机,求该地拥有手机成数p的置信区间(置信度为0.95)49、P216、例10为理解甲、乙里那个地中学毕业生成绩的差别,两地做了抽样调查,结果有:甲地X1=520(分);S1=40(分);n1=800(名)乙地X2=505(分);S2=50(分);n2=1000(名),求置信度为0.95两地平均成绩差的区间估计。

50、P218、例11甲乙两地各作1000户抽样调查,其中甲地拥有汽车为825户;乙地拥有汽车为760户。

求置信度为0.95两地汽车拥有成数差的置信区间。

52、P221习题2根据居民区一百户闲暇时间的抽样调查,居民用于看电视时间占总闲暇时间的比例,平均为75%,比例的标准差为20%。

求看电视时间占居民总闲暇时间的比例的区间估计(置信度为95%)53、P221习题3接上题,如果置信度改为99%,求区间估计值?并与上题结果比较之。

51、P221习题1设X1,X2,X3为简单随机抽样的三个观测值,如果采用如下不等全的平均值X’=2/5 X1+2/5 X2+1/5 X3,作为总体均值的点估计值,试说明它将比采用等权的平均值X=1/53X1+1/3 X2+1/3 X3作为总体均值的点估计值要差。

相关文档
最新文档