社会统计学(卢淑华),第六章精编版
社会统计学(卢淑华)_第六章
![社会统计学(卢淑华)_第六章](https://img.taocdn.com/s3/m/3d5f000c2e3f5727a5e962ac.png)
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q 2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n
样本方差
S 2 的方差
:D2 S
4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
第五节 正态总体的区间估计
一、置信度、置信区间
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为
Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)
置信区间与置信度的关系:
社会统计学----教材
![社会统计学----教材](https://img.taocdn.com/s3/m/d74126135f0e7cd184253651.png)
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展•社会统计学的对象与特点•社会统计的方法•社会统计工作的程序第二节社会统计学的几个基本概念总体与单位•标志与变量•指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料•静态资料与静态资料•全面调查与非全面调查•一般调查与专项调查•经常性调查与一次性调查第二节统计调查的组织形式普查•重点调查•典型调查•抽样调查第三节概念的操作化与测量概念的操作化•定类尺度•定序尺度•定距尺度•定比尺度第四节统计误差登记性误差•代表性误差•抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”•频数(或次数)分布数列•品质数列与变量数列第二节统计表统计表的格式、内容与种类•统计表的制作规则第三节变量数列的编制对于离散变量•对于连续变量•组距和组数的确定•累计频数第四节统计图直方图•折线图•曲线图•累计顿数分布曲线•洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算•对于分组资料的算术平均数计算•算术平均数的性质第二节中位数对于未分组资料的中位数计算•对于分组资料的中位数计算•中位数的性质•其他分割法第三节众数对于未分组资料的众数计算•对于分组资料的众数计算•众数的性质第四节几何平均数、调和平均数及其他几何平均数•调和平均数•各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距•四分位差第二节平均差对于未分组资料A•D的计算•对于分组资料A•D的计算•平均差的性质第三节标准差对于未分组资科S的计算•对于分组资料S的计算•标准差的性质•标准分第四节相对离势变异系数•异众比率•偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件•事件之间的关系•先验概率•经验概率第二节概率的数学性质概率的数学性质•排列与样本点的计数•运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布•连续型随机变量的概率分布•分布函数•数学期望•变异数第七章假设检验第一节二项分布二项分布的数学形式•二项分布的讨论第二节统计检验的基本步骤建立假设•求抽样分布•选择显著性水平和否定域•计算检验统计量•判定第三节正态分布正态分布的数学形式•标准正态分布•正态曲线下的面积•二项分布的正态近似法第四节中心极限定理抽样分布•中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验•学生t分布(小样本总体均值的检验)•关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式•超几何分布的数学期望与方差•关于超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质•关于泊松分布的近似第三节卡方分布( 分布)卡方分布的数学形式•卡方分布的性质•样本方差的抽样分布第四节F分布F分布数学形式•F分布的性质•关于F分布的近似第九章参数估计第一节点估计无偏性•一致性•有效性第二节区间估计精确性和可靠性•抽样平均误差与概率度•区间估计的步骤第三节其他类型的置信区间未知,小样本总体均值的区间估计•总体成数的估计•总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差•分层抽样的抽样误差•整群抽样的抽样误差•等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素•确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验•大样本成数差检验第二节两总体小样本假设检验小样本均值差检验•小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验•一实验组与一控制组的假设检验•对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计•σ12和σ22未知,对均值差的区间估计•大样本成数区间估计•配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”•符号检验与二项检验•简便检验•“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验•配对符号秩检验的步骤•符号秩检验的效力第三节秩和检验独立样本的秩和检验•秩和•秩和检验的具体步骤•U检验第四节游程检验独立样本的游程检验•游程•游程检验的具体步骤•差符号游程检验第五节累计频数检验独立样本的累计频数检验•累计频数检验的步骤•没有预测方向和已经预测方向•经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向•因果关系第二节定类变量的相关分析列联表•削减误差比例•系数•系数第三节定序变量的相关分析同序对、异序对、同分对•Gamma系数•肯德尔等级相关系数•萨默斯(d系数)•斯皮尔曼等级相关系数•肯德尔和谐系数第四节定距变量的相关分析相关表和相关图•积差系数的导出和计算•积差系数的性质第五节回归分析线性回归•积差系数的PRE性质•相关指数R第六节曲线相关与回归第十三章检验与方差分析第一节拟合优度检验问题的导出•拟合优度检验(比率拟合检验) •正态拟合检验第二节无关联性检验独立性、理论频数及自由度•关于频数比较和连续性修正•列联表的卡方分解•关系强度的量度第三节方差分析总变差及其分解•关于自由度•关于检验统计量Fo的计算•相关比率•关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验•积差系数的检验•回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类•动态比较指标•动态平均指标第二节时间数列的趋势分析随手绘法•移动平均法•半数平均法•最小平方法第三节指数分析法动态指数及其分类•质量指标综合指数•数量指标综合指数•用与个体指数的联系来求综合指数•其他权数形式的质量和数量综合指数•指数体系和因素分析•静态指数第一章导论统计是关于数字和数据合成的学问。
(完整word版)卢淑华 《社会统计学》讲义
![(完整word版)卢淑华 《社会统计学》讲义](https://img.taocdn.com/s3/m/047d34afd15abe23492f4d70.png)
社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学(卢淑华)PPT培训课件
![社会统计学(卢淑华)PPT培训课件](https://img.taocdn.com/s3/m/c8e73033a8956bec0975e395.png)
例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x
x nx
n
xa
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
三、二项分布的数学期望
E
n
x
P
n
x
x
x
Cp q x
n
nx
n
p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
3、二点分布----一次贝努里试验的概率分布; 二项分布----n次贝努里试验的概率分布;
4、二点分布是二项分布的特殊情况
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质 1)P(=0)>0 P(=1) >0 2)P(=0)+ P(=1)=q+p=1 3)二点分布的期望与方差
如:同一地点的交通事故。
例
某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
社会统计学习题 卢淑华
![社会统计学习题 卢淑华](https://img.taocdn.com/s3/m/3bbe7a48c5da50e2534d7f3b.png)
1、P58习题十五人数户数0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。
(3)试求四分互差和标准差。
婚龄人数1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 13、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)年龄人数21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89(1)试作频率统计表、直方图和折线图(2)试求四分互差。
4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少?6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少?8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少?9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少?12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率?13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。
社会统计学6
![社会统计学6](https://img.taocdn.com/s3/m/f028a5c8f111f18582d05a94.png)
• 上例中,由于每个样本均是大样本,样本均值的方差仅为2,这 说明大样本对总体的代表性要优于小样本。样本方差的均值为34, 较总体方差为36这一数值存在2个单位的差距,这正好是样本均值 的方差,这2个单位的差距是由抽样误差导致的。
• 总之,大样本下的均值的方差要小于小样本很多,反映出任意抽 到一个有代表性样本的可能性提高,样本的代表性在增强。
的分布样本估计量是样本的一个函数,在统计学中称作统计量, 因此抽样分布也是指统计量的分布。当我们要对某一总体的参数 进行估计时,就要研究来自该总体的所有可能的样本统计量的分 布,比如样本均值的分布、样本比例的分布,从而概括有关统计 量抽样分布的一般规律。因而抽样分布也是随机变量函数分布。
• 我们希望利用样本,特别是通过作为样本函数的样本统计量来了 解总体,对总体进行推断,这些样本统计量包括前文提到的样本 均值、样本中位数、样本标准差以及样本相关系数等组成的函数。 这些样本统计量对于不同的样本会计算出不同的值,也就是说, 具有相同样本量的样本统计量作为随机样本的函数也是随机的, 也有自己的分布,这些分布就成为抽样分布。
• (3)计算所有样本均值的均值,为80。
• (4)计算每一个样本的方差 (组内方差),共有16个方差。
• (5)计算所有样本均值的方差 (均值的抽样方差),为0.5。
• (6)计算所有样本方差的均值,为35.5。
• (7)样本方差的均值与样本均值的方差合计为36,等于总体方差。
• 不难发现,经过分层抽样计算的均值分布更加集中,全部样本的 均值为80,其中最小值为79,最高值为81,样本均值的方差仅为 0.5,即随机抽到某个样本均对总体具有很好的代表性。(见表6.5、 表6.6和图6.4)。在样本量一定的情形下,分层抽样较不分层抽样 抽到的样本更加能够反映总体的特征,样本方差的均值为35.5,更 接近总体方差36这一取值。较小样本和未分层的大样本来说,它 的抽样误差更小,也更加近似于所有可能样本方差的均值。
社会统计学课后题答案(卢淑华)
![社会统计学课后题答案(卢淑华)](https://img.taocdn.com/s3/m/a7164133cdbff121dd36a32d7375a417866fc199.png)
《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、)(28.516200182525400)(5252004025504000元元=´++==´-+=M M d )(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==´-+==´-+=Q Q Q Q Q )(66.225509245092410050924001001005260032760000)(2222元====-=-=åås s N N b n b n i i i i i i 四、(1)极差R=1529-65=1464R=1529-65=1464(百元)(百元)(2)将数据从小到大排序:)将数据从小到大排序:65 92 106 118 122 135 148 174 185 65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===´-+==´-+==+´==+=Q Q (3))(92.42164.178017101026742495204)(222百元==-=-=ååNNx x i i s五、五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、六、633.010*******)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=´===´=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P x(2) 10口井皆不产油的概率为:02825.07.03.0)0(1010===C P x(3)该公司赢利的机会为:85069.07.03.07.03.01)2(911101010=--=³C C P x八、八、1465.071828.28!24)2(4442=´====--e x P l 九、九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==££=--e ex P x P x P l 十、十、。
社会调查教程第6章
![社会调查教程第6章](https://img.taocdn.com/s3/m/ed0a2c6d5901020206409c1d.png)
一、搜集文献的基本要求
1. 有用性 2. 可信性 3. 代表性 4. 全面性 5. 多样性 6. 连续性 7. 时效性
二、查找文献的具体方法
四种方法: 1.检索工具查找法
• 手工检索法 • 机读检索法 2.参考文献查找法 3.循环查找法 4.专家咨询法
三、获取文献的主要途径
• 纸质文献 • 索取、交换、购买、拍照、录制、借阅、复 制等
四、文献调查法的应用
1. 纵贯分析或历史研究 常用于理论研究和社会变迁研究,尤其适于 做长时段的研究。
2.探索性研究
五、对文献调查法的评价
(一)优点 1.可以超越时间、空间的限制 2.不与调查对象直接接触,不介入调查对象的任 何活动,不会引起调查对象的任何反应。 3.方便、自由、安全 4.省时、省钱,效率高
一、文献的概念、种类和发展趋势
• 发展趋势 • 数量急剧增加 • 种类日益繁多 • 质量良莠不齐
二、文献调查法的概念和特点
• 概念
• 采用科学方法搜集文献资料、摘取有用 信息、进行整理分 析的调查方法。
• 特点 • 历史性 • 间接性 • 非介入性和无反应性
三、文献调查的步骤
1. 确定方向 2. 文献收集 3. 文献整理 4. 文献解读 5. 文献分析
• 网络文献 • 先通过浏览和搜索网站检索,然后将有用文 献复制或下载,保存到相应文档里
四、搜集文献应注意的问题
1. 确定搜集文献的重点 2. 明确搜集文献的范围 3. 注意搜集文献的质量 4. 整理搜集文献的目录
第三节 信息的摘取
第四节 内容分析法
一用
五、对文献调查法的评价
(一)缺点 1.获得的主要是书面信息,不是活生生的现实, 缺乏具体性和生动性 2.客观性和真实性往往难以保证 3.经常会发生文献资料难寻觅、有效文献难找齐 的缺憾。
社会统计学第六章
![社会统计学第六章](https://img.taocdn.com/s3/m/5adaa21d763231126edb112c.png)
n
ˆ 为总体成数p的点估计值 • 其中,P p(1 p) • 1-α为置信度。 p ˆ n ˆ • 当p未知情况下,可用 ˆ 代替:p≈ P P
ˆ Z P
ˆ , P Z 2 P ˆ ˆ 2 p
• 例:某厂对一批产品的质量进行抽样检验,采用重复抽样抽取 样品200只,样本优质率为85%,试计算当把握程度为95%时优 质品率的区间范围。 • 解:由题意可知: ˆ 1 p ˆ 0.15 ˆ 0.85;q • n=200, p • 1-α=0.95,α=0.05,Zα/2=Z0.025=1.96
• 即μ的的置信度为95%的置信区间为(497.26,508.58)。 • 从上例可以看出:当置信度1-α较大时,置信区间也较大; 当置信度1-α较小时,置信区间也较小。
• (二) 2为未知 • 公式:
• 例:有一大批糖果,现从中随机抽取16袋,称得重量(克) 如下: • 506 508 499 502 504 510 497 512 • 514 505 493 496 506 502 509 496 • 设袋装糖果的重量服从正态分布,试求总体均值μ的置信 度为0.95的置信区间。 • 解:α=0.05,k=n-1=15 • 查t(n-1)分布表可知:t0.025(15)=2.1315, • 计算得 x 503.75, s 6.2022 • 得μ的置信度为95%的置信区间
[503.75 6.2022 2.1315 ]即(500.4, 507.1 ) 16 就是说估计袋装糖果重 量的均值在 500.4克与507.1克之间, 这个估计值的可信度为 95%。
• 二、总体频率π的区间估计 • 设π为总体频率,P为样本频率,n为样本容量。 • 总体频率的置信区间为:
社会统计学课后题答案(卢淑华)
![社会统计学课后题答案(卢淑华)](https://img.taocdn.com/s3/m/1011923476a20029bc642d73.png)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
社会统计学(卢淑华版)ppt课件
![社会统计学(卢淑华版)ppt课件](https://img.taocdn.com/s3/m/42c64b67f111f18583d05aca.png)
的约
④剩余平方和RSS的自由度
剩余平方和BSS是围绕着各格AiBj的均值计算的,所以 剩余平方和BSS的自由度为abr-ab
28
⑤交互作用IA×B的自由度 自由度之间存在与平方和之间同样的关系式:
abr-1
a-1
b-1
?
abr-ab
交互作用IA×B的自由度=(abr-1)-(a-1)-(b-1)-(abr-ab)=(a-1)(b-1)
显著影响 • 注意:拒绝原假设,只表明至少有两个总体的均值
不相等,并不意味着所有的均值都不相等 • 2、构造检验的统计量 • ⑴水平的均值
8
第二节:单因素方差分析/一元方差分析 • 假定从第i个总体中抽取一个容量为ni的简单随机样本,第i
个总体的样本均值为该样本的全部观察值总和除以观察值 的个数。计算公式:
20
⑧计算均方 ⑵构造检验统计量
其中a-1是自由度 其中a-1是自由度 其中(a-1)、(b-1) 是自由度
21
⑷确定临界 值,并与检 验统计量进 行比较,得 出结论:
用Excel进行方差分析 (Excel分析步骤)
第1步:选择“数据 ”下拉菜单 第2步:选择【数据分析】选项 第3步:在分析工具中选择【单因素方差分析】 ,
离差平方和,反映全部观察值的离散状况,其计 算公式为:
⑷计算组间平方和BSS
组间平方和是各组平均值 与总平均值 的离差平方和, 反映各总体的样本均值之间的差异程度,计算公式为:
10
第二节:单因素方差分析/一元方差分析
• ⑸计算组内平方和RSS • 组内平方和是每个水平或组的各样本数据与其组
平均值的离差平方和,该平方和反映的是随机误 差的大小,计算公式为:
社会统计学
![社会统计学](https://img.taocdn.com/s3/m/c3f938719b6648d7c1c7463b.png)
社会统计学社会统计学 (1)1.基本概念 (16)统计学 (16)一门系统收集、整理、计算、分析和解释数据并从中得出结论的科学,通常被看成应用数学的一个分支 (16)分类 (16)描述统计 (16)概念 (16)用图表、表格和概括性的数字对数据进行描述 (16)内容 (16)搜集数据 (16)整理数据 (16)展示数据 (16)描述性分析 (16)目的 (16)描述数据基本特征 (16)找出数据的基本规律 (16)推断统计 (16)根据样本信息,对总体进行估计、假设检验、预测等推断 (16)内容 (16)参数估计 (17)假设检验 (17)目的 (17)对总体特征做出推断 (17)数理统计(关于统计的数理理论) (17)从量的方面分析事物之间的相互联系和相互作用,试图通过对事物量的规定性的分析来把握事物质的规定性,使人们从数据中(尤其是大量数据中)提取有意义的信息。
(17)社会统计学 (17)概念 (17)是一门系统地收集、整理、计算、分析和解释有关社会现象的数据资料的科学,旨在岁社会现象内部的各种联系和关系进行定量分析和统计处理。
统计分析针对的是变量。
(17)2.随机现象与基础概率 (17)随机现象及其特征 (17)随机现象 (17)具有统计规律的现象 (17)特征 (17)双重性 (17)偶然性 (17)在一次试验或观察中事件出现的可能具有偶然性;可能会出现 (18)统计规律性 (18)在相同条件下,进行大量重复试验或观察时,随机事件出现可能的大小是稳定的(概率论研究的内容) (18)偶然性和规律性关系 (18)单独的现象具有偶然性,但对于大量的现象,具有规律性。
(18)偶然事件(随机事件)的概率就是随机事件隐蔽着的规律。
(18)随机现象是概率论的研究对象,概率论是统计推论的理论(数学)基础,概率是统计推论的依据。
统计推论的所有数学表都是以概率为基础的。
(18)共同点 (18)在一定条件下事物出现只具有可能性不具备必然性,大量存在于自然经济社会领域内 (18)分类 (18)确定现象 (18)在一定的条件(S)下某种结果必然会发生的现象,此时现象的可能结果只有一个,并且事先就能够确定 (18)非确定现象 (18)指在某种条件实现后,某种结果可能发生也可能不发生的现象.也就是说,此时存在多种可能性,但究竟发生哪种结果事先却不能肯定 (19)概率 (19)定义 (19)随机事件:对随机现象进行的观察或试验称为随机试验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为
Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)
置信区间与置信度的关系:
在样本容量一定的情况下,置信区间和置信度是相互制约
的。置信度愈大,则相应的置信区间也愈宽。
用样本成数:p
1n
x n i 1 i
m n
n
xi
m
表示在样本n次观测中,A类共出
i 1
现m次。
例: 5位被调查者的月收入: A 500 B 510 C 490 D 520 E 480 求总体均值、方差的点估计值
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n
样本方差
S 2 的方差
信度为0.95时的 的双侧置信区间。
2、 2 为未知时
当总体满足正态分布,但 2未知的情况
下,以下统计量满足自由度k=n-1的t分布。
t x
sn
t n 1
的双侧置信区间有:p t t 2 1
代入:
P x t 2
s
x t 2
s 1
n
n
接上例
如果 2 未知,x 800 s 10 0.05
一、例
二、样本均值的分布
1、总体分布为正态分布 N , 2 ,且方差已知,样本均值自
然服从正态分布。
x
2、总体为正态分布 N ,2 ,但方差为未知,统计量 s n
已不再服从正态分布,而是服从自由度k=n-1的t分布。
3、任意总体,大样本情况,根据中心极限定理,在大样本
情况下,x 的分布接近于正态分布。
:D2 S
4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
时,Qˆ n 按概率收敛于总体参数Q,即对于任何正 数 ,有:
lim P ˆ Q Q
1
n
则称 Qˆ n 是Q的一致估计值。
第四节 抽样分布
n
(二)大样本总体成数p的区间估计 区间估计公式:
z z p p
2
p p p 2
p 1
p
总体成数p的点估计值
p
p1 p
n
当p未知情况下,用 p 代替 p p
z 为正态分布双侧区间的分位点 2
三、大样本二总体均值差的区间估计
1、样本均值差为:x1 x2 1 2
s 2
n
1
2
2
1
x1 2
接上例:
抽样10户,收入状况如下: 790 800 810 820 780 760 840 800 750 850
求 的2 置信区间。( 0.05 )
第六节 大样本区间估计
一、大样本总体均值 的区间估计
z
p x
2
z s
n x 2
s 1 n
为总体标准差,当 为未知情况下,可
1、总体:研究的全体 2、样本与简单随机样本:
从总体中按一定方式抽出的一部分叫样本。要求 抽样的数据不但是随机变量而且相互独立,遵从 同一分布,那么,这种样本就叫简单随机样本。
▲简单随机样本有3种情况
3、统计量:根据样本数据计算的统计指标称统计 量。
1n n i 1
2)样本方差 S 2 1
n
xi x 2
二、正态总体均值的区间估计
1、2 为已知
以下统计量满足正态分布
x Z n
对于 的双侧置信区间有
P Z 2 Z Z 2 1
z z 即: P x x 1
2n
2 n
N 0,1
练习
例:某地月收入状况服从正态分布,根据 64人的抽样,其平均收入为800元,求置
用样本标准差代替总体标准差。
n为样本容量 n 50
z2 为正态分布双侧区间的分位点。
二、总体成数(二项总体参数)的估计
(一)总体成数P的点估计
如果在样本容量为n的简单随机抽样中,对 于所要研究的A共出现m次,则样本成数 Pˆ
pˆ m 为总体中A成数P的点估计值。
n
E pˆ
Dp pˆpq
第六章 参数估计
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
结论:在社会现象的研究中,只要n足够大,x 的分布将确
定它为一个近似的正态分布。
2
一般情况下 S2 分布很复杂,它的精确分布 不一定能求出来。要知道它的大致形状, 可通过计算机模拟的方法,从总体中随机 抽取相当数目的样本,并作出样本方差的 频率直方图。
第五节 正态总体的区间估计
一、置信度、置信区间
作为总体均值差 1 2 的点估计值。
2、区间估计:
z z x x x x x x x x p
1 2 1 2 1 2 1 2 1 2 1
2
2
2
2
x x n n 1 2
1 2
1
2
s 2 1
2 1
s 2 2 2 2
z z 区间:
x x x x x x x x 1 2
1 2 1 , 2
1 2
2
2
z 为正态分布双侧区间的分位点 2
四、大样本二总体成数差的区间估计
1、样本成数差
p1
p
为总体成数差
2
p1 p2 的
点估计值。
2、区间估计
z p p z pp1
p2
2
p 1
p2
1
2 p1 p2 2
1
p
2p
1
抽样人数为20,求置信区间。
三、正态总体方差的区间估计
对于正态总体 N , 2 ,以下统计量满足自
由度k=n-1的 x2 分布: n21S 2 x2 n 1
对于给定置信度 1 ,双侧区间2 x 的临界
值应满足: 2
2 2
x x x p
1 2
2
1
整理: n 12s
x p 2
2
n 1 i 1
3)样本成数 ˆP m点估计公式
1、总体均值的点估计值
用样本均值:x 1 n xi n i 1
2、总体方差的点估计值
用样本方差:2
1 n
n
xi
1 i 1
x
2
用标准差: S S 2 作为σ 的点估计值
3、总体成数的点估计值
p p p p
p1 p2
11
1
21
2
p p
n1
n2
1 1
p2 p 2
z 为正态分布双侧区间的分位点 2