社会统计学 复习资料

合集下载

社会统计学重点

社会统计学重点

2.社会调查资料的特点:随机性和统计规律性。

3.怎样选用统计分析方法:1.全面调查和非全面调查。

2.单变量和多变量。

3.变量层次.4.分布概念:指一个概念或变量,它的各个情况出现的次数或频次,又称频次分布。

表现形式:数对的集合.5.变量取值的要求—⑴变量取值必须完备;⑵变量取值必须互斥。

6.统计表:是用表格形式来标识前面所说变量的分布。

它不需要文字叙述,就能反应出资料的特性以及资料之间的关系,在编印,传递方面有很大优点,比统计表更精确,但不及统计图直观。

7.统计表必须具备的内容:1.表号。

2.表头。

3.标识行。

4.主体行。

5.表尾。

8.根据变量的层次,可以选择以下不同的统计图形:定类变量:圆瓣图、条形图。

定序变量:条形图。

定距变量:直方图、折线图。

9.圆瓣图:是将资料展示在一个圆的平面上,通常用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。

10.条形图:是用长条的高度来表示资料类别的次数或百分数。

定类:离散。

定序:离散或紧挨着的。

11.直方图:直方图从图形来看,也是紧挨着的长条形所组成,它与条形图不同,宽度有意义,一般来说,直方图是以长条的面积来表示频次或相对频次,而条形的长度。

即纵轴高度表示是频次密度或相对频次密度。

频次密度=频次/组距。

12.折线图:如果用直线连接直方图中条形顶端的中点,就是折线图。

折线图可使资料的频次分布趋势更一目了然。

13.累计图和累计表:表示的是大于某个变量值的频次是多少或小于某个变量值的频次是多少。

14.众值:就是用具有频数最多的变量值来表示变量的集中值。

15.中位值:是数据序列之中央位置之变量值。

未分组:N为奇数时:中位值等于n+1/2. N 为偶数时:中位值等于中间两变量和/2. 根据频次分布求中位值:中位值等于频次的和+1/2.中位值等于求出所对应值所在的区域。

分组:1.计算出累计频次,得到累计百分比。

2.确定最高频次所在组。

社会统计学重点

社会统计学重点

社会统计学
第一章
1.什么是统计学?P1 S1
2.什么是社会统计学?P1 S1
3.有哪些学派,代表人物及其特点分别是什么?P1 S2
4.描述统计P2 S7
5.推断统计P2 S7
6.总体和个体★P2 S9
7.标志和变量★P3 S11
8.指标(概念、分类,和标志的区别及联系)P3--P7 S12
第二章
1.统计调查的组织形式(普查、重点调查、典型调查、抽样调查、随机抽样与非随机抽样)
2.概念的操作化(定类、定序、定距、定比)P11 S22
3.统计误差(登记误差、代表性误差、抽样误差)P12 S22
第三章
1.什么是统计分组?P19 S26
2.统计分组的原则P19 S26
3.统计表的格式和种类P20 S28
4.单项数列和组距数列的适用条件P21 S32
5.统计图:曲线图分类P23 S42
6.洛伦兹曲线与基尼系数P24 S44
第四章
1.算数平均数、众数、中位数的区别P25—P29 S46—S61
2.计算
第五章
1.标准差系数的适用条件S72
2.计算
第六章
1.什么是相关关系?
2.什么是函数关系?
3.相关关系的种类
4.什么是列联表?P33
5.计算(同序对、异序对等)
第十二章
1.定距变量相关种类
2.皮尔逊相关系数的取值
第十四章
1.环比发展速度、定基发展速度的关系
2.时间数列的构成、分类、编制原则。

自考 社会工作00278社会统计学 复习资料

自考 社会工作00278社会统计学 复习资料

00278社会统计学复习资料狭义的社会统计学的四环结构:社会统计、经济统计、科技统计和环境统计。

狭义的社会统计学的三环结构是指社会统计、经济统计和科技统计。

犯罪统计学属于社会秩序与公共安全统计领域的学科劳动力统计的主要更新的是非正规就业;社会时间构成统计领域的主要更新是时间利用调查。

社会生活统计的主要更新体现在贫困统计。

人口流量在时间和空间两个角度来看分别属于时期指标、状态转移;人口存量在时间和空间两个角度来看分别属于时点指标、当前状态年平均人口=[(年初人口)/2+第一季度末人口+第二季度末人口+第三季度末人口+(年末人口)/2]/4复合家庭的形式、直系家庭的形式;家庭划分的标准一夫一妻制家庭属于按家庭传袭规则来划分聘用新劳动力属于劳动力机械增减;劳动力生老病死属于劳动力自然增减极大值与极小值的比率分析是相对差异分析法;绝对差额分析法是指极大值与极小值的差额分析变量分为连续变量与离散变量。

众数、中位数和平均数恩格尔系数、基尼系数:每千人口医疗卫生机构数医疗社会保险统计指标、公安机关统计指标、检察院统计指标、衡量工作与生活平衡指标(如雇员工时过长比例)、联合国经社理事会社会指标体系衡量消除贫困的指标、衡量健康状况指标、社会发展水平指标(如人口总负担系数属于逆指标)弹性就业是不限时间、不限收入、不限场所的灵活多样的就业形式新生儿死亡率计算中的新生儿是指某地区一年内出生未满28天失业社会保险基金属于社会失业保险统计指标各级法院数、法院工作人员数、审判人员数属于法院统计指标根据贫困的程度,贫困可以分为绝对贫困和相对贫困新生儿死亡率属于衡量医疗卫生保健程度的指标因自然规律获某些不确定因素使劳动力总量发生增减变化的是自然增减学生巩固率是某一学年内自始至终读完一个学年的学生数与学年初开始时在校学生数的比率社会统计学新领域诞生的主要标志是非市场服务统计时间的划分:个人生活必须时间、自由支配时间等、家务劳动时间等。

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

社会统计学期末复习题

社会统计学期末复习题

社会统计学期末复习题
以下是一些社会统计学的期末复习题:
1. 解释什么是样本和总体。

2. 什么是频率分布?如何绘制频率分布表和频率分布图?
3. 解释中心趋势的测量,包括均值、中位数和众数。

4. 什么是离散度?如何测量离散度?给出常用的离散度测量方法。

5. 解释正态分布,并说明其特征和重要性。

6. 什么是假设检验?描述假设检验的基本步骤。

7. 什么是相关分析?解释相关系数和它们的意义。

8. 什么是线性回归分析?如何确定最佳拟合直线?
9. 什么是抽样和抽样误差?列举几种常见的抽样方法。

10. 解释因果关系和相关关系之间的区别。

1
这些问题涵盖了社会统计学的主要概念和方法,希望对你的复习有所帮助。

如果有任何其他问题,请随时提问。

2。

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比拟大小,不能这个变量只能是定类变量。

3.最后如果这个变量能够比拟大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。

三、变量层次的比拟定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次〔或频率〕分布的一种工具。

2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明〔频次、频率〕(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数〔cf↑〕和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组适宜,分为等距分组和非等距分组。

(2)组限:包括上限〔up〕和下限〔low〕(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

(完整word版)社会统计学简答题与计算题复习资料

(完整word版)社会统计学简答题与计算题复习资料

社会统计学复习材料简答题1、统计数据的质量要求:1、精度:最低的抽样误差或随机误差;2、准确性:最小的非抽样误差或偏差;3、关联性:满足用户决策、管理和研究的需要;4、及时性:在最短的时间里取得并公布数据;5、一致性:保持时间序列的可比性;6、最低成本:以最经济的方式取得数据。

2、抽样误差及其影响因素:1、由于抽样的随机性所带来的误差;2、所有样本可能的结果与总体真值之间的平均性差异;3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。

3、判断计量优劣的评判标准:用样本的估计量直接作为总体参数的估计值,无偏性:估计量抽样分布的数学期望等于被估计的总体参数;有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。

4、假设检验的一般步骤:(1)陈述原假设和备择假设;(2)从所研究的总体中抽出一个随机样本;(3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域;(5)将统计量的值与临界值进行比较,作出决策;(6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。

5、假设检验中的两类错误及其之间的关系错误:1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a,即显著性水平;2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b。

a和b的关系就像翘翘板,a小b就大,a大b就小。

因此,在样本容量n固定情况下,不能同时减少两类错误!一般采用增加样本容量的办法来解决。

关系:当显著性水平a减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是接受域增大了,因此纳伪的概率b要增大。

反之亦然(P235)。

也就是说如果要减小b,就增大显著性水平a。

6、置信区间与置信度的关系表达式:称作置信区间。

称作置信度,可信度,或置信水平。

社会统计学重点归纳

社会统计学重点归纳

社会统计学重点归纳社会统计学是研究社会现象和社会问题的一门学科,它运用数理统计的方法对社会现象进行分析和解释。

社会统计学的核心任务是通过收集、整理和分析社会数据,揭示社会现象背后的规律和趋势,为社会科学研究提供数据支持。

首先,社会统计学的基本概念和原理是我们了解的重点。

社会统计学的基本概念包括总体、抽样、变量、频数等。

总体是研究对象的全体,抽样是从总体中选取样本来代表总体,变量是研究对象的属性或特征,频数是某一变量取值的次数。

社会统计学的基本原理包括随机抽样、抽样误差、样本容量等。

了解这些基本概念和原理是进行社会统计学研究的基础。

其次,社会统计学的数据收集方法和数据分析技术是我们需要掌握的重点。

社会统计学的数据收集方法包括问卷调查、访谈调查、观察方法等。

问卷调查是通过编制问卷,向研究对象发放并收集回答的数据;访谈调查是通过面对面或电话等方式与研究对象进行交流,收集数据;观察方法是通过观察社会现象或行为,获取数据。

社会统计学的数据分析技术包括描述统计和推论统计。

描述统计是对数据进行整理、概括和展示,包括频数分布、频率分布、中心趋势和离散程度等指标;推论统计是根据样本数据推断总体特征,包括抽样分布、参数估计和假设检验等方法。

再次,社会统计学的应用范围和意义是我们需要关注的重点。

社会统计学在社会科学研究中起着重要的作用。

它可以帮助我们了解社会现象的分布和变化趋势,揭示社会问题的成因和解决方案。

社会统计学在人口学、经济学、社会学、心理学等学科中都有广泛的应用。

例如,人口统计学可以对人口的数量、结构、分布等进行研究,为制定人口政策和规划提供依据;经济统计学可以对经济发展的各个方面进行研究,为制定经济政策和决策提供支持;社会学统计学可以对社会问题和社会现象进行研究,为社会管理和社会改革提供指导。

最后,社会统计学的发展趋势和挑战是我们需要关注的重点。

随着社会的发展和变化,社会统计学也在不断发展和进步。

社会统计学的发展趋势包括数据科学的兴起、大数据的应用、人工智能的发展等。

社会统计学复习整理

社会统计学复习整理

社会统计学复习整理一、变量的测量层次 二判断变量层次的技巧1.首先所有的变量都是定类变量。

2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。

3.最后如果这个定距变量,如果没有意义就只能是定序变量。

三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。

2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。

(2)累加频率:把各级的百分率逐渐相加。

也分为向下累加百分率和向下累加百分率。

2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。

3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。

cf↑表示低于某个等级的频数有多少cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。

2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。

(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。

(6)组中值:真实上限与真实下限的平均值。

第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。

2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。

一、定类变量1.众值(Mode)Mo:用具有频数最多的变量的取值来表示变量的集中值。

社会统计学复习资料

社会统计学复习资料

微体谬误:分析单位指的是研究对象的个体,也就是研究所观察的单位,它可以是个人、群体、组织或者社会事件。

在研究中,针对不同分析单位的结论,不可以在不同分析单位的研究对象间推论,否则就会产生两种谬误:区群谬误(ecological fallacy)和微体谬误(atomistic fallacy)。

前者是指以群体或其他整体为分析单位的研究结论推广到个体单位时犯的错误;后者是指以个体为分析单位的研究结论推广到较大分析单位时犯的错误。

描述计统:是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。

描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

推论统计:是统计学乃至于心理统计学中较为年轻的一部分内容。

它以统计结果为依据,来证明或推翻某个命题。

具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。

怎么样设计抽样?方案一:一、调查设计和初步计划在这一阶段,我们必须确定研究的目的和如何在时间和资源有限的前提下达成这一目的。

1、确定研究的目的1)检验某一假设?2)检验一系列相关假设组成的因果模型?例如,a.具有传统价值观的人使用安非他命的可能性较小;b.有吸毒朋友的人更有可能使用安非他命;c.具有传统价值观的人有吸毒朋友的可能性较小。

3)估计具有某种信仰或具有某种特定行为的人的比例?例如,总体中花在专业学习上的时间每周为40个小时的人的比例是多少?4)是为了研究某些特定的问题或人口中某一群体的态度或行为随时间的变化而变化的情况,还是为了解我们是否能找到一些干预手段来纠正人们的某些行为?在上述各种不同的调查目的中,有许多是典型地需要对成年人口总体的常规调查研究,而有些则可能与一般人口的调查研究无关,只是与某些特定的子群体有关。

例如,大学教员对加入工会组织持什么态度?外来移民工花费在看病上的钱占其收入的比例是多少?我们的研究目的也可能与个人完全不相干,但却与组织、群体、企业或政府机构有关。

社会统计学知识(2020.05.29)

社会统计学知识(2020.05.29)

社会统计学知识1.定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其他特征时,这种变量称为定类变量。

P72.定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间的大小、程度等序次差异时,这种变量称为定序变量。

P83.定距变量:当变量值不仅可以将个体区分为不同类别并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这种变量称为定距变量。

P84.定比变量:当变量除了具有定类、定序、定距这三种变量的全部特征外,还可以计算两个变量之间的比值时,这样的变量称为定比变量。

P95.离散变量:如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。

6.连续变量:如果一个变量的变量值是连续不断的,即可以取无限多个数值,这种变量称为连续变量。

P107.自变量:把能引起其他变量变化的变量,称为自变量。

P108.因变量:把由其他变量的变化而导致自身发生变化的变量称为因变量。

P109.总体:是指构成它的所有个体的集合,P1110.个体:是指构成总体的最基本单位。

P1111.样本:是指从总体中按照一定方法抽取的一部分个体的集合。

P1112.抽样单位:是指一次直接的抽样所使用的基本单位。

P1113.抽样框:是指一次直接抽样时样本中所有抽样单位的名单。

P1114.普查:是指对总体中所有的个体进行的一次全面调查。

P1215.抽样调查:是指从总体中按照一定方法抽取的一部分个体组成一个样本进行调查的方式,再根据调查结果推断总体特征。

16.归纳法:是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;17.演绎法:是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。

18.组距:各组上限值与下限值的差。

P4519.频数:就是某个类别或某个小组中的数据个数,也叫次数。

P4920.频率:就是一个样本中某一类别或某一小组中数据个数占总数据个数的比重。

社会统计学知识点总结

社会统计学知识点总结

第一章数据与统计学数据分析所使用的方法大体上可分为描述统计和推论统计(推断统计),描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

推断统计主要研究如何根据样本信息来推断总体的特征,内容包括参数估计和假设检验两大类。

变量:是描述观察对象某种特征的概念,其特点是从一次观察到下一次观察可能会出现不同的结果(具有一个以上取值的概念)1、下列哪一个选项不是变量?( )A. 民族B. 智商C. 衣服的尺寸D. 女性答案:C2、下列变量属于数值型变量的是( )A. 工资收入B. 产品等级C. 学生对考试改革的态度D. 企业的类型答案:A解析:3、社会统计学的数据分析方法主要包括统计描述和( )A. 统计描述B. 统计推导C. 统计推论D. 统计分析答案:C4、能计算均值和标准差的必须是哪种变量( )A. 自变量B. 因变量C. 数值型变量D. 字符串型变量答案:C5、在SPSS中最多可以设置几个独立的缺失值?( )A. 3B. 4C. 5D. 8答案:A6、描述统计可以最恰当地表述为( )A.数据作概括性的表达B.对总体所作的结论C.测量操作的应用D.原始数据到标准分的转变答案:A解析:描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

第二章数据的描述性分析:图表展示1、欲以图形显示两变量X和Y的关系,最好创建( )。

A. 直方图B. 圆形图C. 柱形图D. 散点图答案:D第三章数据的描述性分析:概括性度量1、下列统计指标中,对极端值的变化最不敏感的是( )。

A. 众值B. 中位值C. 四分位差D. 均值答案:A2、经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( )A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据答案:B解析:根据标准得分可以判断一组数据中是否存在离群点。

社会统计学复习重点

社会统计学复习重点

社会统计学第一章社会统计学的研究范围内容社会统计学是研究如何描述和分析社会生活与社会发展状况数量方面的科学。

从社会统计的学科性质可以看出,社会统计学学科体系具有以下主要特征:1,研究客体的独立性。

2,研究方法的特有性。

3,内容结构的系统性与层次性。

4,与专业统计的相互渗透性。

5,学科体系的发展性。

社会统计指标的种类分为;主观指标与客观指标,定类指标,定序指标,定距指标与定比指标。

问题:为什么要开展主观指标的搜集工作呢?1,主观指标调查是社会主义生产目的的要求。

2,补充客观指标的不足。

在实际运用时,应注意以下几点:1,对于同一现象,可以用不同类型的指标反映。

2,在采用指标体系法对统计客体进行统计描述时,应尽量采用同一层次统计指标,当较低层次的统计指标引人指标体系时,就会降低其测量层次。

3,对于定序指标或定类指标不能不加分析地直接将其转化成高层次统计指标。

第二章人口总量统计人口总量既可以从存量角度理解,也可以从流量角度理解,也可以从平均量的角度理解。

人口存量与人口流量的一般定义:人口存量指一定时点上具有某种特征(或处于某种状态)的人口总体。

人口结构又称人口构成,人口结构统计在于通过相应的计算方法揭示了人口结构的内在联系及其与社会经济因素的相互关系。

根据人口结构的性质大致可分为三大类,人口的自然结构,人口的地域结构和人口的社会结构。

人口年龄金子塔的横轴表示人口数或者人口构成,其中左侧表示男性人口,右侧表示女性人口,纵轴表示年龄。

研究人口再生产过程时应该注意的几点:1,不仅要注意人口群体数量的再生产,也要注意人口群体质量的再生产。

2,由于人口再生产有很强的惯性作用,所以在限制人口政策时要有长远观点。

3,应该注意人口群体的年龄结构。

反应人口增长率的指标有两个,一是人口增长率,一是人口自然增长率。

人口增长率是指人口增量与平均人口之比,反映一定时期内总人口的增长程度。

人口增长率和人口自然增长率之差为迁移增长率。

社会统计学-社会统计学知识点(仅供参考)

社会统计学-社会统计学知识点(仅供参考)

第7章住户活动统计
第一节住户活动及其统计内容
1、住户的概念
2、住户活动统计应该包括的内容
3、住户的分类
第二节居民收入统计
1、居民收入、居民消费、居民投资、居民财产的含义
2、居民总收入和居民可支配收入的概念
3、工资性收入、经营性收入、财产性收入、转移性收入
4、居民收入需要明确的两点
5、住户收入总量统计:
1)住户总收入:城镇住户总收入、农村住户总收入
2)住户可支配收入:城镇住户可支配收入、农村住户纯收入(可支配收入)、农村住户现金收入
6、居民收入水平及其变动统计:
1)总体人均收入
2)户人均收入
3)实际收入
7、居民收入结构统计:
第三节居民消费统计
1、居民消费含义
2、居民消费统计需注意的六点
3、居民消费总量及其水平统计:
1)住户主要消费品消费量和人均消费量:居民人均消费品消费量;户人均消费品消费量
2)居民消费支出总额与人均消费支出:人均年消费支出;户人均年消费支出4、居民消费倾向与消费结构统计:
1)居民消费倾向统计:居民平均消费倾向;居民边际消费倾向
2)居民消费结构统计:消费内容结构;消费方式结构;消费目的结构
5、恩格尔系数及其应用:恩格尔定律;恩格尔系数定义及计算公式
第四节居民收入、消费分布差异的统计与分析。

社会统计学复习资料

社会统计学复习资料

《社会统计学》复习资料一、概念辨析(3×8') 1.参数估计与假设检验参数估计是通过样本对总体的未知参数进行估计,假设检验指通过样本对总体的某种假设进行检验。

参数估计是先看样本的情况,再看总体的情况。

假设检验是先假设总体的情况,再以一个随机样本的统计值来检验这个假设是否正确。

换言之,要先构思总体情况,才进行抽样和分析样本的资料。

2.点估计与区间估计点估计指根据样本资料以一个最适当的样本统计值来代表总体的参数值,简单明确,但不能说明估计结果的抽样误差和把握程度;区间估计指以两个数值之间的间距来估计参数值。

点估计是区间估计的基础。

3.置信度和置信度水平置信度又称置信概率或置信系数,表示用置信区间估计的可靠性,即置信区间包含参数Q 的概率。

置信度水平表示用置信区间估计不可靠的概率。

置信度与置信度水平之和为1。

4.虚无假设与研究假设虚无假设0H 又称原假设、零假设。

是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。

研究假设1H 又称备择假设,是研究者所需证实的假设。

否定0H 后可以认为1H 是对的。

5.甲种误差与乙种误差甲种误差又称第一类错误,是指0H 为真,但小概率事件发生了,拒绝了0H ,即把真的当成假的,它是在拒绝原假设时出现的错误。

犯甲种误差的概率是显著性水平α。

乙种误差即纳伪的错误,又称第二类错误,是指0H 为假,但小概率事件没有发生,接受即把假的当成真的,它是在接受原假设时出现的错误。

犯乙种误差的概率为β,β的值随着真值μ与原假设中0μ的偏离程度而变化,0μμμ-=∆越小,β的数值就越大。

α大β就小,α小β就大。

6.独立样本和配对样本独立样本指从二个总体中,分别独立地各抽取一个随机样本进行比较和研究。

配对样本指它只有一个样本,但样本中每个个体要先后观测两次,这样所有个体先观测的值看作是来自第一个总体的样本值,所有个体后观测的值,看作是来自另一个个体的样本值,以此来比较两总体之间的不同。

社会统计学复习大纲 .doc

社会统计学复习大纲 .doc

社会统计学复习大纲
一、量度层次
1、定类尺度
2、定序测度
3、定距测度
4、定比测度
二、单变量描述性统计学
1、基本技术
2、集中趋势测量法
3、离散趋势测量法
4、正态分布
三、简化两个变项的分布
1、统计相关的性质
2、交互分类与百分表
3、简化相关与消减误差
四、关测量法与测量层次
1、两个定类变项相关测量
2、两个定序变量相关测量
3、两个定距变量的分析
4、定类变项与定距变项
五、抽样与统计推论
1、抽样调查简介
2、抽样分布
3、二项抽样分布
六、参数估计
1、参数的点值估计
2、正态总体的区间估计
3、大样本区间估计
4、必要抽样数目的确定
七、假设检验的基本概念
1、统计假设
2、两类误差和假设检验的步骤
八、单总体假设检验
1、大样本假设检验
2、小样本假设检验
九、二总体假设检验
1、大样本二总体假设检验
2、小样本二总体假设检验
3、配对样本的比较
十、假设的检定:两个变项的相关
1、两个定类变项
2、两个定序变量
3、两个定距变量
4、定类与定距变量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、参数:是一个变量。

我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。

如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。

?2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。

?3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。

通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。

备择假设有三种形式,以H0为=Z0为例,当H0被否定,可能被采用的H1为>Z0,?<Z0或≠Z04、非参数检验:也称自由检定法,指对分布类型已知总体进行参数检验之外,所有检验方法的总称,这类方法的使用不需要对总体分布作任何事先的假定,例如:正态分布等,同时从检验内容来说,也不是检验总体分布的某些参数,例如均值等,而是检验总体某些有关的性质。

5、非参数检验与参数检验的区别?①非参数检验的限制比参数检验少,无需任何假定,无需限制变量类型,且计算量小,简单易行?②但非参数检验与参数检验相比,效率较差,不精确,检验相同的问题,需要比参数检验更大的样本量?③非参数检验显着,参数检验不一定显着,但参数检验显着,非参数检验必定显着?6、选择相关系数的标准1看两个变量的变量层次2看两个变量是否对称?7、假设检验与区间估计的逻辑有哪些不同不同?①假设检验从总体到样本,即事先对总体参数值或分布形式作出某种假设,然后利用样本来判断这个原假设是否成立?②区间估计从样本到总体,即根据样本计算出一个范围来对未知参数进行估计?相同:区间估计与假设检验的统计处理时相通的,实际上假设检验的接受域也正是区间估计的置信区间?8、相关关系的特点:①现象之间确实存在着数量上的依存关系。

就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。

?②现象间的数量依存关系值是不确定的。

就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。

?9、相关系数:指线性相关系数,对两个变量之间线性相关程度的度量。

相关程度有强弱之分,一般是在-1到1之间,相关系数越趋于0,关系越弱,相关系数与趋于绝对值1时,关系越强。

10、参数估计:即根据抽样结果合理地、科学地猜测总体参数的具体值或其范围。

参数估计包括参数的点估计和区间估计两种11、统计值:关于调查样本中某一变量的综合描述,是样本特征值,如样本均值,成数及方差12、置信水平:指总体位置参数落在置信区间内的概率。

用(1- )表示,常用的置信水平有:99%,95%,90%?13、变量分为哪几个层次?定类变量与定序变量之间的相关系数是什么??变量分为四个层次,即定类变量、定序变量、定距变量和定比变量。

相关系数是eat2? 14、我们通常根据哪些原则确定原假设与备择假设??原假设是关于总体间参数值相等或总体分布符合某种分布的假设,是待否定的假定,与之相对立,备择假设是指总体间参数值不相等或总体分布不符合某种分布的假设,是待选择的假设? 原则二:原假设往往是研究者不愿接受而期待拒绝的假设,备择假设往往是研究者希望证实并且期待接受的假设,研究中的假设一般是备择假设,通常先设立备择假设,再对立的设定原假设? 原则三:如果研究的目的只在于分析事物间是否有差异,不强调哪个比哪个好,这种情况下的假设比较容易,可以根据原则去理解和假设,这时进行的是双侧检验的情形,原假设设定为H0:U=U0等,备择假设随即设定为其对立面? 原则四:如果研究的目的在于分析事物哪个比哪个好,这时可以根据原则二去理解和假设如题目中问“是否更长,大……”,即进行右侧检验,原假设设定为:H0:U≦U0等,反之,则进行左侧检验,原假设为H0:U≧U0等。

15、何为列联表?制作列联表的原则有哪些??1)列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。

?2)制作原则:第一行是自变量的取值,第二行是因变量的取值16、接受域:接受H0的区间,抽样所获数据计算的统计量值小于临界值,则接受H0。

17、临界值:把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率即为显着水平α,φ(Zα)=1-α,Zα称作临界值。

(详见教材p232)18、推断统计:主要用于抽样调查,以抽样调查获得的信息材料通过推断统计进行简化处理,以便从样本的统计值推断总体的参数值。

19、抽样分布:指统计量的分布。

抽样分布是在同一总体反复不断抽取不同样本时,各个样本可能出现的样本统计值的分布情况20、假设检验中选择统计量的一般原则是什么??假设检验是通过样本计算某个统计量进行的,选择统计量的一般原则首先是确定是大样本还是小样本,然后根据总体方差是一直还是未知选择统计量21、试比较相关系数与回归系数的关系相关系数r表示的是两变量之间的疏密程度,回归系数b是回归直线的斜率,说明回归直线的陡度。

相关关系r表现了真实数据与回归直线靠拢的程度22、总体均值检验时,哪些情况下可以使用Z检验答:总体均值检验使用Z检验时的假定条件如下:1连个样本都是独立的随机样本?2两个总体都服从正态分布?3如总体不服从正态分布,可以用正态分布来近似23、小概率原则:它是假设检验的基本思想,包括两个部分,一是指概率很小的随机事件在一次观察中不可能出现;二是如果小概率事件在一次观察中出现了,那么假设就是错误的。

(小概率原理:在日常生活中,人们习惯于把概率很小的事件,当做在一次观察中不可能出现的事件。

)?24、散点图:散点图是相关关系的图形表示,数据点在直角坐系平面上的分布图。

散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的回归方程对数据点进行拟合。

25、回归方程:是研究自变量x不同取值时,因变量y平均值的变化。

当因变量y的平均值与自变量x呈线性规律时,称做线性回归方程。

26、拒绝域:是在显着性水平 下,小概率事件发生后,拒绝原假设H0的区间。

27、简述点估计与区间估计的含义。

他们之间的区别与联系有哪些?1)点估计:指用样本计算出来的一个数来估计未知参数,由于它只是一个点值所以称为参数的点估计。

?2)区间估计:是通过样本计算出一个范围来对位置参数进行估计?3)区别?4)联系28、简述置信度和置信区间的含义,并说明他们之间的关系是什么?1)含义:用Q(X1,X2,X3…..Xn)作为未知参数Q的估计值,那么包含未知参数估计值的区间就为置信区间;用置信度1-?来测量置信区间估计的可靠性?2)关系:在样本容量一定的情况下,置信区间和置信度是相互制约的,置信度越大,即估计的可靠性愈大,则相应的置信区间也愈宽,估计的愈不精确,例如,某班的考试成绩,如果估计区间为0-100分,显然这样的估计永远可靠,因为任何考试的结果,平均成绩都不会超出估计的范围?总之,置信度与置信区间的关系表达式:相互制约,置信度越大,置信区间越宽。

29、中心极限定理对社会调查的意义有哪些?中心极限定理在社会调查中有着重要的意义。

因为在抽样调查中被研究对象的总体分布往往是未知的。

在这种情况下,中心极限定理告诉我们,只要样本容量足够大,样本均值的分布都是已知的,且都接近正态分布。

这样就给未知分布总体的研究奠定了理论基础,对社会调查有着很实用的理论意义。

30、PRE:指消减误差比例,就是表示用一个现象来解释另一个现象时,能够减除百分之几的错误。

在测量变量的相关程度时,假定现象x与现象y有关,用x去测量y的误差的相对差值与不知y与x有关时预测y的全部误差之比:即PRE=(E1-E2)/E131、独立样本:从两个总体中分别独立的随机抽取一个样本进行比较研究32、相关样本:又称配对样本。

它只有一个样本,但样本中每个个体要先后测量两次,这样所有个体先观测的值看做是来自第一个总体的样本值,所有个体先后观测的值看作是来自另一个总体的样本值,以此来比较研究连个总体之间的不同。

33、非对称关系:数学中,若?R为集合A到B上的关系,对集合中任意元素a与b(a∈A,b ∈B),下述语句保持有效,则A到B上的二元关系R是非对称的:若?aRb,且bRa?,那么,a?=?b?。

其数学表述为:任取a∈A,b∈B,?aRb且bRa→a=b。

34、为什么要进行假设检验,简述假设检验的步骤。

1)原因:1社会现象具有随机性或非确定性,同时也有规律性2一切具有随机性质的社会现象进行局部推论总体时难免有误会3当总体很大时,一般都采用抽样调查来检验命题假设4假设检验实际上就是人们来意常识性地进行盘顿和决策的小概率原理?2)步骤:①根据实际问题作出假设,假设包括原假设H0和备择假设H1两部分,原假设必须写出,备择假设在双边检验的情况下可不写②根据样本确定合适的检验统计量③根据问题的需要给出显着性水平的大小④搜集数据,计算检验统计量的值⑤作出统计决策,若样本统计量的值落入拒绝域,则拒绝H0接受备择假设H1,否则接受H035、假设检验会犯哪两类错误,犯第一类错误的概率是什么。

(1)弃真错误:原假设为真时拒绝原假设,在统计中称第一类错误,犯第一类错误的大小就是显着性水平?(2)纳伪错误:接受了未知的不真实状态,把假当成了真,它是在接受原假设时出现的错误,称作第二类错误,犯第二类错误的概率用?表示36、假设检验和区间估计逻辑有何不同。

相关文档
最新文档