社会统计学期末章节复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章统计学在社会研究中的应用
(一)社会学研究的过程
提出问题:首先明确要做什么?进行研究的目的?
形成假设:假设是对两个变量之间关系的陈述,是一种尝试性的回答;
收集数据:确定收集的变量、方法和总量等等;
分析数据:对原始数据进行审核、整理、归类、统计和分析;
检验假设:支持或不支持该假设。
(二)变量类型
定类变量、定序变量、定距变量、定比变量
离散变量、连续变量
因变量、自变量
(三)抽样方式
普查、抽样调查、非概率抽样、概率抽样
总体、样本、抽样框、抽样单位
简单随机抽样、整群抽样、分层抽样、系统抽样、定额配比抽样
判断抽样、偶遇抽样、滚雪球抽样、定额抽样
(四)归纳法与演绎法
归纳法是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;
演绎法则与归纳法正好相反,是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。
考试题型分析
1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为(D)
A.简单随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
备注:此题考察的概率抽样的具体方法,其中四个选项都作为重点的方法的理解和运用,重点是整群抽样和分层抽样,区分好两种即整群和分层抽样的具体含义和做法,具体知识点参照教材P13
2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是(A)
A.332.1万户家庭
B.3000户家庭
C.332.1户家庭的年均收入
D.3000户家庭的年均收入
备注:此类题型出现概率较高,主要考察学生对样本和总体的区别,区分两个概念是关键,具体内容参照教材P11
3.简答题:判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)考研辅导班参加者的姓名(定性变量)
(2)家庭月消费(定量变量连续变量)
(3)温度(定量变量连续变量)
(4)上个月外出吃饭的次数(定量变量离散变量)
(5)产品等级(定性变量)
备注:考察具体的变量的各种分类,主要是按照测量水平分类和离散连续变量,具体参照教材P7-P10
第三章数据的组织与展示
(一)组距分组
将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。
频数、频率、百分比、比率;
条形图、饼图、环形图、直方图、折线图、线图
考试题型分析
1.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(C)
A.5小时
B.6小时
C.5.5小时
D.6.5小时
备注:此题考查的内容是分组数据的组中值问题,尤其是针对没有上限值和没有下限值的组的组中值,具体计算参照P44
2.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形(A)
A.环形图
B.饼图
C.直方图
D.条形图
备注:此题考查的是统计图的运用,尤其是作为集中代表性的统计图,要严格区分每种统计图使用的范围和数据类型,具体内容参照P58-P64
3.简答题:简述直方图与条形图相同点与区别
(1)条形图适用于所有类型数据,而直方图只适用于数值型数据;
(2)条形图中条形的宽度是固定的,是用条形的长度(或高度)表示各类别频数的多少;而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义;
(3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩形通常是紧密排列的。
备注:此题考查的是统计图的运用,尤其是作为集中代表性的统计图,要严格区分每种统计图使用的范围和数据类型,具体内容参照P58-P64
第四章中心趋势测量
(一)中心趋势
反映一组数据中各个数值向中心值集中的程度,是指一组数据向某一中心值靠拢的趋势。
众数、中位数、均值(分组数据与未分组数据)
计算与比较
对称分布:Mo=Me= X
左偏态分布:X 右偏态分布:Mo 变差来源SS df MS F Sig. 组间1602708.6 B D F 0.000 组内40158.08 C E —— 总计 A 11 ——— 考试题型分析 1.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是(D) A.86 B.77 C.90 D.88 备注:此题考察内容为中位数的计算,中位数计算要先排序后找中位数,尤其是要注意偶数序列的中位数,是处于中间位置的两个数的和平均作为中位数,具体参照教材P74 2.对于左偏分布,平均数、中位数和众数之间的关系是(C ) A.平均数>中位数>众数 B.中位数>平均数>众数 C.众数>中位数>平均数 D.众数>平均数>中位数 备注:考察集中趋势测量指标间的关系,要注意左偏态和右偏态的区别,极大值和极小值都会影响到平均数,具体参照教材P82 3.计算题 (1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。计算题 企业 编号销售额 企业编 号 销售额 企业 编号 销售额 企业 编号 销售额 1152 11105 21103 31136 2105 12123 22103 32146 3117 13116 23137 33127 497 14115 24138 34135