社会统计学复习整理

合集下载

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

cf↑表示低于某个等级的频数有多少cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

社会统计学重点

社会统计学重点

2.社会调查资料的特点:随机性和统计规律性。

3.怎样选用统计分析方法:1.全面调查和非全面调查。

2.单变量和多变量。

3.变量层次.4.分布概念:指一个概念或变量,它的各个情况出现的次数或频次,又称频次分布。

表现形式:数对的集合.5.变量取值的要求—⑴变量取值必须完备;⑵变量取值必须互斥。

6.统计表:是用表格形式来标识前面所说变量的分布。

它不需要文字叙述,就能反应出资料的特性以及资料之间的关系,在编印,传递方面有很大优点,比统计表更精确,但不及统计图直观。

7.统计表必须具备的内容:1.表号。

2.表头。

3.标识行。

4.主体行。

5.表尾。

8.根据变量的层次,可以选择以下不同的统计图形:定类变量:圆瓣图、条形图。

定序变量:条形图。

定距变量:直方图、折线图。

9.圆瓣图:是将资料展示在一个圆的平面上,通常用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。

10.条形图:是用长条的高度来表示资料类别的次数或百分数。

定类:离散。

定序:离散或紧挨着的。

11.直方图:直方图从图形来看,也是紧挨着的长条形所组成,它与条形图不同,宽度有意义,一般来说,直方图是以长条的面积来表示频次或相对频次,而条形的长度。

即纵轴高度表示是频次密度或相对频次密度。

频次密度=频次/组距。

12.折线图:如果用直线连接直方图中条形顶端的中点,就是折线图。

折线图可使资料的频次分布趋势更一目了然。

13.累计图和累计表:表示的是大于某个变量值的频次是多少或小于某个变量值的频次是多少。

14.众值:就是用具有频数最多的变量值来表示变量的集中值。

15.中位值:是数据序列之中央位置之变量值。

未分组:N为奇数时:中位值等于n+1/2. N 为偶数时:中位值等于中间两变量和/2. 根据频次分布求中位值:中位值等于频次的和+1/2.中位值等于求出所对应值所在的区域。

分组:1.计算出累计频次,得到累计百分比。

2.确定最高频次所在组。

社会统计学重点知识梳理

社会统计学重点知识梳理

《社会统计学》重点知识梳理第一章绪论[教学目的]:本章是对社会统计学这门课程对概要性介绍。

通过本章对学习,首先使学生熟悉到学习这门课程对重要意义和作用,激发其学习对踊跃性和主动性。

其次使学生对该课程有一个大体对了解,并掌握其中的一些基础性的知识,为后面对学习打下基础。

[教学重点]:变量及变量层次[教学难点]:统计和统计学对含义[教学方法和手段]:讲授法[学时分配]:4学时[教学内容]:统计和统计学的含义,统计学的产生和发展,变量及变量层次第一节统计和统计学的含义一统计的含义统计作为一种社会实践活动已有悠长的历史。

在外语中,统计一词与国家一词来自同一词源。

因此,可以说,自从有了国家就有了统计实践活动。

最初,统计只是为统治者管理国家对需要而搜集资料,弄清国家对人力、物力、财力,作为国家管理的依据。

(如早在古代奴隶制的国家,由于赋税、徭役、征兵对需要,就开始了人口、土地等的记录和简单的统计工作。

今天,统计一词已被人们赋予多种含义,在不同场合,其可以具有不同含义。

一般来说,统计一词包括以下三种含义:一指统计工作,即调查研究,包括资料的收集、整理和分析;二指统计资料,包括统计数据和分析报告;三指统计学这门学科,研究如何搜集、整理和分析数据资料。

其中,前两种含义统计工作和统计资料指的是统计的实践活动,统计学则指理论研究。

二统计学的含义一、概念统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对客观事物的科学认识。

统计数据的收集是取得统计数据的过程,它是进行统计分析对基础。

离开了统计数据,统计方法就失去了用武之地。

如何取得所需的统计数据是统计学研究的内容之一。

统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。

数据整理是介于数据收集与数据分析之间的一个必要环节。

统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律对过程。

自考 社会工作00278社会统计学 复习资料

自考 社会工作00278社会统计学 复习资料

00278社会统计学复习资料狭义的社会统计学的四环结构:社会统计、经济统计、科技统计和环境统计。

狭义的社会统计学的三环结构是指社会统计、经济统计和科技统计。

犯罪统计学属于社会秩序与公共安全统计领域的学科劳动力统计的主要更新的是非正规就业;社会时间构成统计领域的主要更新是时间利用调查。

社会生活统计的主要更新体现在贫困统计。

人口流量在时间和空间两个角度来看分别属于时期指标、状态转移;人口存量在时间和空间两个角度来看分别属于时点指标、当前状态年平均人口=[(年初人口)/2+第一季度末人口+第二季度末人口+第三季度末人口+(年末人口)/2]/4复合家庭的形式、直系家庭的形式;家庭划分的标准一夫一妻制家庭属于按家庭传袭规则来划分聘用新劳动力属于劳动力机械增减;劳动力生老病死属于劳动力自然增减极大值与极小值的比率分析是相对差异分析法;绝对差额分析法是指极大值与极小值的差额分析变量分为连续变量与离散变量。

众数、中位数和平均数恩格尔系数、基尼系数:每千人口医疗卫生机构数医疗社会保险统计指标、公安机关统计指标、检察院统计指标、衡量工作与生活平衡指标(如雇员工时过长比例)、联合国经社理事会社会指标体系衡量消除贫困的指标、衡量健康状况指标、社会发展水平指标(如人口总负担系数属于逆指标)弹性就业是不限时间、不限收入、不限场所的灵活多样的就业形式新生儿死亡率计算中的新生儿是指某地区一年内出生未满28天失业社会保险基金属于社会失业保险统计指标各级法院数、法院工作人员数、审判人员数属于法院统计指标根据贫困的程度,贫困可以分为绝对贫困和相对贫困新生儿死亡率属于衡量医疗卫生保健程度的指标因自然规律获某些不确定因素使劳动力总量发生增减变化的是自然增减学生巩固率是某一学年内自始至终读完一个学年的学生数与学年初开始时在校学生数的比率社会统计学新领域诞生的主要标志是非市场服务统计时间的划分:个人生活必须时间、自由支配时间等、家务劳动时间等。

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次 二判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

cf↑表示低于某个等级的频数有多少cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

一、定类变量1.众值(Mode)Mo:用具有频数最多的变量的取值来表示变量的集中值。

社会统计学复习题

社会统计学复习题

社会统计学复习题一、名词解释1、社会统计学2、中位数3、众数4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。

5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。

7、消减误差比例:变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。

将削减误差比例记为PRE 。

8、因果关系:变量之间的关系满足三个条件,才能断定是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

10、散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。

11、同序对:在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。

12、异序对:在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。

13、大数定理:当我们的观察次数n 趋向无限时,随机事件可能转换为不可能事件或必然事件。

即,在大量观察的前提下,观察结果具有稳定性。

二、选择题6.下面能进行除法运算的测量尺度是()A 定比尺度B 定类尺度C 定距尺度D 定序尺度7.教育程度是()的测量。

A 定比尺度B 定类尺度C 定距尺度D 定序尺度8.智商是()的测量。

社会统计学复习全资料

社会统计学复习全资料
4. 定距变项
⑴简单线性回归
; ;
⑵协方差:
⑶积距相关系数: [-1,1]
5. 定类变项与定距变项
⑴相关比率( 平方系数,适用于不对称关系):
; [0,1]
四、参数估计
1. 点估计
⑴样本均值:
⑵样本方差:
⑶样本成数:
2. 区间估计
⑴正态分布总体的区间估计
①总体方差( )已知:
②总体方差( )未知:
⑵大样本区间估计( )
4.虚无假设与研究假设
虚无假设 又称原假设、零假设。是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。研究假设 又称备择假设,是研究者所需证实的假设。否定 后可以认为 是对的。
5.甲种误差与乙种误差
甲种误差又称第一类错误,是指 为真,但小概率事件发生了,拒绝了 ,即把真的当成假的,它是在拒绝原假设时出现的错误。犯甲种误差的概率是显著性水平 。乙种误差即纳伪的错误,又称第二类错误,是指 为假,但小概率事件没有发生,接受即把假的当成真的,它是在接受原假设时出现的错误。犯乙种误差的概率为 , 的值随着真值 与原假设中 的偏离程度而变化, 越小, 的数值就越大。 大 就小, 小 就大。
2.点估计与区间估计
点估计指根据样本资料以一个最适当的样本统计值来代表总体的参数值,简单明确,但不能说明估计结果的抽样误差和把握程度;区间估计指以两个数值之间的间距来估计参数值。点估计是区间估计的基础。
3.置信度和置信度水平
置信度又称置信概率或置信系数,表示用置信区间估计的可靠性,即置信区间包含参数 的概率。置信度水平表示用置信区间估计不可靠的概率。置信度与置信度水平之和为1。
3. 定距层次
⑴间距:上、下限之差。

社会统计学知识点总结

社会统计学知识点总结

第一章数据与统计学数据分析所使用的方法大体上可分为描述统计和推论统计(推断统计),描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

推断统计主要研究如何根据样本信息来推断总体的特征,内容包括参数估计和假设检验两大类。

变量:是描述观察对象某种特征的概念,其特点是从一次观察到下一次观察可能会出现不同的结果(具有一个以上取值的概念)1、下列哪一个选项不是变量?( )A. 民族B. 智商C. 衣服的尺寸D. 女性答案:C2、下列变量属于数值型变量的是( )A. 工资收入B. 产品等级C. 学生对考试改革的态度D. 企业的类型答案:A解析:3、社会统计学的数据分析方法主要包括统计描述和( )A. 统计描述B. 统计推导C. 统计推论D. 统计分析答案:C4、能计算均值和标准差的必须是哪种变量( )A. 自变量B. 因变量C. 数值型变量D. 字符串型变量答案:C5、在SPSS中最多可以设置几个独立的缺失值?( )A. 3B. 4C. 5D. 8答案:A6、描述统计可以最恰当地表述为( )A.数据作概括性的表达B.对总体所作的结论C.测量操作的应用D.原始数据到标准分的转变答案:A解析:描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

第二章数据的描述性分析:图表展示1、欲以图形显示两变量X和Y的关系,最好创建( )。

A. 直方图B. 圆形图C. 柱形图D. 散点图答案:D第三章数据的描述性分析:概括性度量1、下列统计指标中,对极端值的变化最不敏感的是( )。

A. 众值B. 中位值C. 四分位差D. 均值答案:A2、经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( )A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据答案:B解析:根据标准得分可以判断一组数据中是否存在离群点。

社会统计学 复习资料

社会统计学 复习资料

社会统计学第一章导论一.社会统计学的产生与发展1.国势学派:(又称记录学派或历史学派)对国家显著事迹的记录和比较。

“有名无实”代表人物:阿享瓦尔(1719—1772)“统计学之父”、康令(1606—1681)2.政治算术学派:对国家事项首创数字对比、分析。

“有实无名”代表人物:威廉 配第(1623—1687)“政治经济学之父”、格朗特(1620—1674)3.数理统计学派:将法国古典概率论引入统计学,用纯数学的方法对社会现象进行研究。

代表人物:凯特勒(1796—1874)“现代统计学之父”4.社会统计学派:研究社会现象代表人物:克尼斯(1821—1898)、梅尔(1841—1925)、恩格尔(1821—1896)二.社会统计学的对象和特点社会统计学:用于统计的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种方法与技术。

研究对象概括而言是指社会现象的数量方面。

社会统计学特点:就研究对象而言,社会统计学主要是从研究和反映一定经济基础之上的上层建筑方面去认识社会;就研究内容而言,社会统计需要对人们的态度、观念、行为进行度量,测量这些社会现象目前还没有一个精确而统一的尺度,只能以近似估算或词语表达等方式来代替;就调查方法而言,社会统计中,由于其研究对象所具有的特征,抽样调查更为常用。

三.社会统计学的方法1.大量观察法:就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。

2.大数定理:是随机现象出现的基本规律,一般意义为:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。

3.综合指标法4.统计推断法四.社会统计学的几个基本概念1.总体与单位总体:作为统计研究对象的,由许多具有共性的单位构成的整体。

单位:构成整体的每一个个体。

2.标志与变量,标志:总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志。

社会统计学重难点汇总

社会统计学重难点汇总

社会统计学重难点汇总
(这个很重要,希望大家能熟练掌握,不会的可以以邮件的形式发给我,我会及时解答)
1.统计分析大致分为哪两类?具体有哪些内容?
2.什么是参数?什么是统计量?二者的区别和联系是什么?
3.变量的测量等级(或尺度)有哪些?各自的特点是什么?请举例说明。

4.对单变量应该从哪些方面进行描述?
5.适合定类变量描述的图形有哪些?
6.适合对分许变量描述的图形有哪些?
7.适合对定距变量进行描述的变量有哪些?
8.描述变量集中趋势的统计量有哪些?怎么计算?
9.描述变量离散程度的统计量有哪些?怎么计算?
10.正偏和负偏的分布特点
11.总体分布、样本分布和抽样分布
12.标准误和标准差的区别
13.正态分布的特征
14.T分布、F分布、卡方分布
15.变量的标准化处理
16.中心极限定理
17.什么是参数估计?点估计和区间估计的区别是什么?
18.点估计的评价标准
19.置信区间的基本构成
20.对置信区间如何解释
21.假设检验的基本步骤
22.假设检验中的第一类错误和第二类错误
23.假设检验
(1)一个总体的检验:单总体均值的检验(总体方差已知)、单总体均值的检验(总体方差未知)、单总体比例的检验
(2)两个总体的检验
两个独立总体均值的比较检验(总体方差未知,但两个总体方差相等)13年考的计算题,很重要
两个独立总体均值的比较检验(总体方差已知)。

社会统计学复习重点

社会统计学复习重点

社会统计学第一章社会统计学的研究范围内容社会统计学是研究如何描述和分析社会生活与社会发展状况数量方面的科学。

从社会统计的学科性质可以看出,社会统计学学科体系具有以下主要特征:1,研究客体的独立性。

2,研究方法的特有性。

3,内容结构的系统性与层次性。

4,与专业统计的相互渗透性。

5,学科体系的发展性。

社会统计指标的种类分为;主观指标与客观指标,定类指标,定序指标,定距指标与定比指标。

问题:为什么要开展主观指标的搜集工作呢?1,主观指标调查是社会主义生产目的的要求。

2,补充客观指标的不足。

在实际运用时,应注意以下几点:1,对于同一现象,可以用不同类型的指标反映。

2,在采用指标体系法对统计客体进行统计描述时,应尽量采用同一层次统计指标,当较低层次的统计指标引人指标体系时,就会降低其测量层次。

3,对于定序指标或定类指标不能不加分析地直接将其转化成高层次统计指标。

第二章人口总量统计人口总量既可以从存量角度理解,也可以从流量角度理解,也可以从平均量的角度理解。

人口存量与人口流量的一般定义:人口存量指一定时点上具有某种特征(或处于某种状态)的人口总体。

人口结构又称人口构成,人口结构统计在于通过相应的计算方法揭示了人口结构的内在联系及其与社会经济因素的相互关系。

根据人口结构的性质大致可分为三大类,人口的自然结构,人口的地域结构和人口的社会结构。

人口年龄金子塔的横轴表示人口数或者人口构成,其中左侧表示男性人口,右侧表示女性人口,纵轴表示年龄。

研究人口再生产过程时应该注意的几点:1,不仅要注意人口群体数量的再生产,也要注意人口群体质量的再生产。

2,由于人口再生产有很强的惯性作用,所以在限制人口政策时要有长远观点。

3,应该注意人口群体的年龄结构。

反应人口增长率的指标有两个,一是人口增长率,一是人口自然增长率。

人口增长率是指人口增量与平均人口之比,反映一定时期内总人口的增长程度。

人口增长率和人口自然增长率之差为迁移增长率。

社会统计学期末复习题与答案整理

社会统计学期末复习题与答案整理

社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。

此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。

这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。

这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。

此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。

社会统计学复习大纲

社会统计学复习大纲

社会统计学一、名词解释1,人口数:所谓人口数,是指一定时间、空间范围内的有生命的个人的总和。

这个人口数亦称为总人口数。

2,国内迁移:国内迁移是指人口从本国某一地区向另一地区移动,这一地区的迁出构成另一地区的迁入,迁入和迁出两者对应发生。

3,统计规律性:所谓统计规律性,是指在一定条件下,就其个别一次的结果来说都具有偶然性,但大量重复的试验或观察,则其结果无不呈现一定的规律性,这种规律性,称作统计规律性。

4,随机现象:事前不可预言的现象,即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定。

(在一定的条件下,例如某一天,事物的出现只具有可能性而不具有必然性的现象,所谓可能又不必然,则意味着在一定的条件下事物的出现不止一种,因此,对其中任一种结果的出现,都只能对事物的事先了解程度。

说具有一定的可能性、偶然性,也称随即性,而这种非确定性的存在,并不取决于)5,随机事件:随机现象的结果以及这些结果的集合就称作随机事件,或简称事件,是并非一定会发生而只是可能发生也可能不会发生的非确定性事件。

6,假设检验:对总体ξ的分布律或分布参数作某种假设,根据抽取的样本观测值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这一统计推断过程就是所谓的假设检验。

7,回置抽样:所谓回置抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。

使用回置抽样法,先后两次抽取是彼此独立的。

因为每一次抽取后抽取到的单位都得返还,总体保持不变,前一次的结果不可能影响到后一次。

8,非概率抽样:又称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法.(它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体.虽然根据样本调查的结果也可在一定程度上说明总体的性质,特征,但不能从数量上推断总体.非概率抽样)主要有典型调查,偶遇抽样,主观抽样,定额抽样, y9,置信区间: P200置信区间,也就是对于一个参数的估计值,一个参数的区间估计。

社会统计学-社会统计学知识点(仅供参考)

社会统计学-社会统计学知识点(仅供参考)

第7章住户活动统计
第一节住户活动及其统计内容
1、住户的概念
2、住户活动统计应该包括的内容
3、住户的分类
第二节居民收入统计
1、居民收入、居民消费、居民投资、居民财产的含义
2、居民总收入和居民可支配收入的概念
3、工资性收入、经营性收入、财产性收入、转移性收入
4、居民收入需要明确的两点
5、住户收入总量统计:
1)住户总收入:城镇住户总收入、农村住户总收入
2)住户可支配收入:城镇住户可支配收入、农村住户纯收入(可支配收入)、农村住户现金收入
6、居民收入水平及其变动统计:
1)总体人均收入
2)户人均收入
3)实际收入
7、居民收入结构统计:
第三节居民消费统计
1、居民消费含义
2、居民消费统计需注意的六点
3、居民消费总量及其水平统计:
1)住户主要消费品消费量和人均消费量:居民人均消费品消费量;户人均消费品消费量
2)居民消费支出总额与人均消费支出:人均年消费支出;户人均年消费支出4、居民消费倾向与消费结构统计:
1)居民消费倾向统计:居民平均消费倾向;居民边际消费倾向
2)居民消费结构统计:消费内容结构;消费方式结构;消费目的结构
5、恩格尔系数及其应用:恩格尔定律;恩格尔系数定义及计算公式
第四节居民收入、消费分布差异的统计与分析。

社会统计学期末复习题整理

社会统计学期末复习题整理

社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。

此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。

这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。

这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。

此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。

社会统计应用备考

社会统计应用备考

第一部分考题类型一、不定项选择(2′×10=20′)既有单选,也有多选。

主要考一些小的知识点。

例如:下列那些可能是概率:A、0B、0.001C、0.6188D、1.732答案:ABC二、填空题(1′×20=20′)主要考一些概念和名词解释。

例如:社会统计的两大方法是和。

答案:叙述统计法推论统计法三、计算题(15′×3=45′)主要考三个知识点:1、双均值或双百分率检定2、参数估计3、集中量数和离散量数四、制表(15′×1=15′)制一个条件次数表第二部分复习重点1、社会学目的:正确地理解和准确地预测社会现象的变化,从而改进人类的社会生活。

2、所谓社会学研究,就是运用科学的方法来搜集和分析社会社会事实,以理解社会现象之间的关系。

3、社会学研究除了叙述社会现象间的关系以外,也要力求解释相关的原因,同时要注意到社会现象间的关系在不同情况下的变化。

4、科学研究,就是运用客观的、逻辑的和系统的方法来搜集事实和分析事实。

5、社会学研究历程大致分为三个阶段:(1)筹划、(2)执行、(3)总结。

6、在规划一项研究时,大致分为五个步骤:选定研究题目、初步探索、成立假设、理论解释与澄清概念、研究策略。

7、假设就是假定某一现象的变化与另一现象的变化具有某种关系。

8、研究策略:(1)研究设计、(2)测量变项、(3)测量层次、(4)界定母体和决定抽样步骤、(5)统计分析。

9、实验法分组方法:一是随机法、二是配对法。

10、社会调查法,是在研究过程中不改变社会研究现状,只求就地取材,然后以统计方法推算变项与变项间的关系。

11、社会统计可以分为两大方法:叙述统计法和推论统计法。

12、社会调查可以分为两大种类:叙述性调查和统计性调查。

13、进行社会调查时,可作全体调查,也可作抽样调查。

14、社会调查按调查时间又可分为:横剖调查纵贯观调查。

其中,纵贯调查又分为两类:趋势研究和同组研究。

15、合并指标方法:类型法、指数构成法和尺度法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

一、定类变量1.众值(Mode)Mo:用具有频数最多的变量的取值来表示变量的集中值。

2.众值的特征:(1):众值理论上可以用于定类、定序和定距三个层次的变量来描述集中趋势,但是由于众指不精确,一般只用于定类层次的变量。

(2):众值最好找,是最容易求出的值,但它精确度也是最差的。

二、定序变量1.中位值(Md)。

2.分组数据求中位值公式:Md=L+(n/2- cf↑/n)(U-L)L:中位值的真实下界值U:中位值的真实上界值n:中位值组的频数cf↑:低于中位值所在组的累加(向上)频次N:调查总数Md位值:N/2二、定距变量1.均值(Mean):将变量的各个数值相加起来,除以总个数,求取一个平均值的数值,一般用¯x来表示。

2.均值的特征:仅适合定距层次的变量●它最灵敏,预测的精确度最高●对资料所提供的信息运用得最充分3.均值的求法(一)原始数据求均值:X=∑X1/N(X表示变量x的均值;∑X1表示变量观察值的总和。

)(二)根据频次分布求均值:¯x=(¯x表示变量X的均值;表示变量的每一个取值和该变量频数相乘的和;表示把变量的每个取值下的频次都加起来,即调查总数N)(三) 分组数据求均值:¯x=(n1表示每组次数,b表示每组的组中值,表示个案数目)第四节离散趋势测量法●离散趋势测量法:是求出一个值来表示个案与个案之间的差异情况。

●离散趋势或离散特征可以告诉我们估计值误差的大小。

一、定类变量(异众比率V)V就是非众值的次数与全部个案数目的比率。

V=(N-全部个案数目;/___ V值越小,众值代表性越好。

二、定序变量1.极差(R)—观察的最大值与最小值之差。

2.四分互差:将数值排序,分为四个等分,第一个四分位置的值与第三个四分位置的值的差异。

四分位差Q=Q75-Q25(一)未分组数据:2 2 3 4 6 9 10 10 11 13 15Md的位置=N+1/2=11+1/2=6Q25的位置=N+1/4=11+1/4=3(第三位数)Q75的位置=(N+1)=(11+1)=9(第九位数)所以,四分位差Q= Q75-Q25=11-3=8(二)分组数据1.中位值公式=Md=L+(-cf↑)/n(U-L)2.Q25=L+(-cf↑)/n(U-L)L:四分之一位值组的真实下界值U:四分之一位值组的真实上界值n:四分之一位值组的频数cf↑:低于四分之一位值组的向上累加频次N:调查总数Q25位置=N/4;3.Q75=L+(- cf↑)/n(U-L)L:四分之三位值组的真实下界值U:四分之三位值组的真实上界值n:四分之三位值组的频数cf↑:低于四分之三位值组的向上累加频次N:调查总数Q75位置=3N/4;三、定距变量(一)标准差σ与方差σ²σ=(δ即对均值的偏差平方均值的平方根)σ²=(二)根据未分组的频次分布求方差σ=N-调查总数;Xi-表示变量的每个取值;ni-表示每个取值的频次(三)分组数据求方差——用组中值代替bi代替xi代入公式中σ=第三章概率一、概率1.不可能事件的概率:P(O)=02.必然事件的概率:P(S)=13.随机事件的概率:0≦P(E)≦1二、两个重要概念1.普查:对统计总体的全部单位进行调查以搜集资料统计资料的工作。

2.抽查:按照某种方法以总体中抽取一部分样本进行调查,以搜集统计资料的工作。

三、频率分布于概率分布的关系1.频率分布是实验值,是可以变化的,称之为统计分布或经验分布。

2.概率分布是理论值,是唯一的,称之为理论分布。

3.当观测次数很大时,随机变量取值的频率接近于其概率,这时随机变量的统计分布与理论分布将大致相符。

四、总体均值和方差1.总体均值(E):随机变量各取值分别乘取值的概率的总和。

E(ξ)=µ=∑PiXi2.总体方差(D):就是随机变量偏离总体均值的程度。

D=S²=E(X²)-[E(x)]²3.总体均值和样本均值的区别:●总体均值是对研究对象进行普查后得出的均值。

●样本均值是对从总体中抽取的样本数据计算出来的均值。

4.总体方差与样本方差的区别:●总体方差是对研究对象进行普查后,利用数据算出来的方差。

●样本方差是根据从总体中抽取出的样本的调查总数据,计算出来的方差。

5.总体均值方差和样本均值方差表示法1.总体均值E=µ,总体方差D=σ²,总体标准差=σ2.样本均值=¯x,样本方差=s²,样本标准差=S6.结论1.通过普查,可以得出概率、总体均值E(µ)、总体方差D(σ²),这些值我们称为参数值。

2.通过抽查,可以得出频率、样本均值¯x、样本方差s²,这些值我们称为统计值。

3.当样本为大样本(N≧30),频率≈概率、样本均值≈总体均值、样本方差≈总体方差。

4.当样本数无穷接近总体数的时候,频率=概率、样本均值=总体均值、样本方差=总体方差。

5.统计学的任务就是如何利用统计值来推论参数值(统计推论),实现我们的研究目的。

第四章常见统计分布第一节二点分布一、二点分布(0-1分布):就是变量的取值只有两类的分布。

如:性别。

二、二分变量的分布律:随机变量如果满足二点分布,则其概率分布为——P(ξ=0)=q;P(ξ=1)=P;P+q=1第二节二项分布一、二项分布:在相同条件下进行n次独立试验,每次试验只有两种可能的结果,事件A出现的概率P(A)=P,事件A不出现的概率P(A)=1-p=q.第三节正态分布一、什么是正态分布?中心极限定理:对于任何变量,不管其原有分布如何,如果把它们n个加在一起,当n大于一定数之后(n>30),那么其和的分布必然接近正态分布。

二、正态分布密度曲线的特点1.一个高峰2.一个对称轴——X=µ3.一个渐近线——X轴4.正态分布曲线是单峰值对称的,因此这种分布的变量,其众值、中位值和均值是重叠的。

5.正态分布下的面积为1.三、正态曲线的参数意义1.正态分布的两个参数是µ(总体均值)和σ(总体方差)。

2.两个参数对曲线形状的影响:(1)φ(X)在x=μ处达到峰值,以直线x=μ为对称轴。

在σ一定的情况下,若μ增大,图形右移;若μ减小,则左移,但形状不变。

(2)当μ值一定时,值越小,则对应的图形越尖越瘦。

第四节标准正态分布标准正态分布:标准正态分布就是通过公式把一般正态分布转化而来,这样把不同的正态分布都统一为(0,1)的正态分布,然后再通过查表求出两点之间的概率。

公式:Ζ=1.标准正态分布的μ=0,σ=1,其图形以Ζ=0为对称轴。

2.标准正态分布记作X~N(0,1),一般正态分布记作X~N(μ~σ²)3.标准正态分布的图形唯一的,其值可以通过查表(附表4)求得。

(只有标准正态分布才能查表,如果是一般正态分布则先用公式转化为标准正态分布)4.正态分布N(μ~σ²)和标准正态分布N(0,1)面积之间的对应关系:当X=μ+σ时,Ζ==1当X=μ-σ时,Ζ==-1第五节常用统计分布一、X²分布(卡方分布)设变量ξ1、ξ2,、、、、、、ξk相互独立,且都服从N(0,1),则X²=(ξ1)²+(ξ2)²+…+(ξk)²称为自由度为K的X²分布。

记作:ξ~X²(k)二、t分布设随机变量ξ和η独立,且ξ~N(0,1),η~X²(k),则随机变量t (t=)服从自由度为k的t分布,记作t~t(k)。

三、F分布设随机变量ξ和η独立,且ξ~X²(k1)η~X²(k2),则随机变量F (F=) 服从自由度(k1,k2)的分布记作F~F(k1,k2)。

第五章参数估计一、关于抽样的一些概念1.总体:构成总体的所有元素的集合,元素则是构成总体的最基本的单位。

2.样本:从总体中按一定方式抽取出来的一部分元素的集合。

3.抽样:从总体中,按一定的方式选择或抽取样本的过程。

4.抽样单位:一次直接抽样所使用的基本单位。

二、统计推论1.统计推论:根据局部资料(样本资料)对总体进行推断的过程。

2.样本资料的特点:(1)样本资料来源于总体,因此局部资料的特性在某种程度上能反映总体的特征。

(2)由于抽样的随机性,则抽样的结果有可能不等于总体的结果。

(3)当样本达到一定规模的时候(大样本),呈现规律性。

3.统计值:从样本中计算出来的数值。

4.参数值:总体的数值。

5.统计推论的容分为两个部分:(1)通过样本的统计值对总体的未知参数进行估计,称为参数估计。

(2)通过样本对总体的某种假设进行检验,称为假设检验。

三、抽样分布1.样本均值 的分布:我们按照简单随机抽样的方法,从总体中抽取样本,因为每一个个体被抽中的机会具有随机性,所以每一次抽出的样本其均值都不同,那么在同一个总体中,抽取n 次就有n 个样本均值( ),而样本均值 的分布就是这n n x xx ,,,21 x x个样本均值的分布。

相关文档
最新文档