社会统计学第一章(李沛良)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LOGO
社会研究的统计应用
一、课程要求 1、考核形式:平时表现30%;期中测试30%; 期末测试40%。 2、平时表现要求:不缺勤,上课积极回答问 题,勤于提问 二、联系方式 1、email: 2、电话:
学习统计学的一些建议
不要缺课。由于课程内容是前后呼应的,缺课非 常不利于后续内容的学习。 重在理解,要求识记而非背诵 勤于预习和复习,注意将知识整合。 多做练习,通过练习加深对统计方法的理解。 通过实际操作熟悉相应的统计软件。 多用统计学思维方法联想社会经济热点事件。
为什么要学习社会统计学?
1、有多少中学生是因为身体距离过近而最终恋爱 的呢?是不是有其它的因素的影响呢?哪些因素更 加显著呢? 2、中国留学生造假的情况是怎样的呢?是不是只 有中国的才造假呢?造假者申请成功的几率是多少 呢?哪些学生更容易造假呢?
学习社会统计学,目的是期望通过这一科学 的方法来分析社会事实,从而理解社会现象 之间的关系。
为什么要成立假设呢?
成立假设以后的各项研究步骤,就是为求知道假 设是对还是错
科学的研究是要求事前想清楚,即先成立假设, 然后力求推翻这个假设;或者是证明假设“可能 ”是正确的 当前的社会科学研究,为力求符合科学的要求, 大部分是争取先成立假设,然后收集资料来进行 验证,并进行重复测验
举例
1、对乡镇地区的高中教育水平影响因素研究? 影响因素:师资专业水平、学生入学成绩、父母教育水平 2、新生代农民工精神健康的影响因素研究? 影响因素:? 问题:如何设计研究假设呢?
理论解释与澄清概念
无论是推翻还是接受研究假设(A无论是否影响B),需 要给出合理的解释。
对研究中所涉及的核心概念要详细解释清楚
你相信这样的一些统计结论吗?
吸烟对健康是有害的,吸香烟的男性减少寿命2250天 不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天 身体超重30%会使寿命减少1300天 每天摄取500毫升维生素C,生命可延长6年 身材高的父亲,其子女的身高也较高 二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明 ,依此类推 学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱 乐磁带或其他曲目做得更好 上课坐在前面的学生平均考试分数比坐在后面的学生高 漂亮的女性有损男性的智力。男性在看到漂亮女性时智力会下降,这 就是为什么大学里的女孩子比男孩子学习好的原因
常用社会研究统计数据来源:
中央研究院调查研究专题中心 http://www.sinica.edu.tw/as/survey/ 香港科技大学调查研究中心 http://www.ust.hk/~websosc/survey/indexc.html 上海社会科学院调查研究中心 http://www.sass.org.cn/sdy/zxjj.jsp 中国青年报社会调查研究中心 http://www.qtick.com/cooperator/zqb/index.html 北京大学社会调查研究中心 http://www.pku.edu.cn/academic/pucssr/index.htm 中国社会调查所 http://www.chinasurvey.com.cn/ 中国问卷调查网(北京神鹰邦特社会调查事务所办) http://www.cctvj.com/
变量(variable)和标志
标志 说明总体单位属性或者数量特征的名称在统计上称为 标志,如学生总体的,姓名、籍贯、年龄、文化程度、 民族等; 标志的分类 数量标志:凡是能够用数量的多少来表示的标志,如 年龄,身高,体重等; 品质标志:只能够用文字表述的标志,如性别、喜好 等;
初步探索 收集有关的文献 咨询专家 观察个案
成立假设 假设:是指根据以往的研究结果和研究者对研究 内容的初步探索之后,假定现象与现象之间的关 系。 具体而言:假设是假定某一现象的变化(A变量) 与另一种现象的变化(B变量)具有某种关系。 假设的方式:函数式和差异式
函数式: 如果A愈高,则B也愈高;或者如果A愈低,则B愈低 差异式: A不同则B不同 (当变量不存在高低的性质时适用)
推断统计 (inferential statistics)
1.研究如何利用样本数 据来推断总体特征的统 计学分支 2.内容 参数估计 假设检验 3.目的 对总体特征作出推 断
总体
Baidu Nhomakorabea
样 本
推断统计的主要任务:用统计量估计参数
总体 样本
参数(parameter):描 述总体数量特征的概念 常用希腊字母。例如总 体均值用 表示;总体 方差用 2 表示等。
统计量(statistic):描 述样本数量特征的概念, 常用英文字母表示,如样 本均值用 x 表示,样本 方差用 s 2表示等。
描述统计与推断统计的关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
反映客观 现象的数 据
样本数据
描述统计 (统计数据的搜集、整 理、显示和分析等)
推断统计 (利用样本信息和概率 论对总体的数量特征进 行估计和检验等)
描述统计(descriptive statistics)
1. 用表格、图形和数字来概 括、显示数据特征的统计方 法。 2.内容 搜集数据 整理数据 展示数据 描述性分析 3. 目的 描述数据特征 找出数据的基本规律
¥
50
25 0
Q1 Q2 Q3 Q4
x = 30 s2 = 105
如:《新生代农民工精神健康及其影响因素》一文
复习题 《劳工宿舍:企业社会责任还是经济理性》 社会责任假设:企业类型(跨国、本土)、工资收入、员 工福利
控制(经济理性)假设:企业加班时间、企业工资类型( 底薪制、整合工资)
研究策略
如何证明假设呢? 1、研究设计 社会研究的四种方法? 社会调查法(问卷)、实验法、实地研究(访谈、观察) 、文献法(统计资料分析、二次分析)——《社会调查方 法》课程内容,请同学自行复习。 2、测量变量 (1)社会统计几个核心概念
概念、变量、指标和指标体系
概念(concepts): 对现象的抽象,是一类事物的属性在人们主观上的反映。
物质财富 生活用品 家具 椅子
高
大
含糊
低
小
明确
抽象层次
涵盖面
特征
变量(variable) 具有一个以上取值的概念,或者说,就是包含一 个以上范畴的概念;而那些只有一个固定不变的 值的概念,则叫做常量 变量的性质:构成变量的各个值必须具备穷尽性 和互斥性 指标(indicator) 表示一个概念或者变量含义的一组可观察到的事 物,称做这一概念或变量的一组指标 概念是抽象的,而指标是具体的;概念是主观印 象,而指标是客观存在的事物;概念只能想象, 指标是可以观察和辨认的。
社会统计学:
运用统计的一般原理,对社会各种静态结构与动态 趋势进行定量描述或者推断的一种专门方法与技术。
(1)主要是侧重于对社会问题、社会人态度、观念、行为等 的度量,如:中央研究院调查中心所做的台湾青少年成长历程 研究、宗教对台湾老人健康的影响、高职学生的职业价值观念 等。 (2)主要采用抽样调查,全面调查等用的较少; (3)主要是采用假设检验的方法完成由样本到总体的认识;
总体、样本、单位
总体(population) 所研究的全部个体 ( 数据 ) 的集合,由许多具有共性 的单位构成的整体,其中的每一个元素称为个体 , 也成为单位或者总体单位。 特点:大量性、同质性、变异性 样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量 从总体抽选出样本的过程叫做抽样
LOGO
第一章 科学方法与社会研究历程
为什么要学习社会统计学?
社会科学的目的是什么?
举例:2011年8月29日网易教育新闻:
为防早恋,中学规定男女间距大于60厘米 中国学生造假成风 谎言叩开美国大学?
现象之间的关系图: 1、中学生恋爱——身体距离 2、中国留学生——造假
目的之一:正确地理解社会现象的变化 目的之二:准确地预测社会现象的变化,从 而改进人类的社会生活。
复合指标构成的几种方法: 类型法:将各指标交互分类。 如:变量——代际职业地位流动,如何构造其指标呢? 指数法:各种比率,如:生育率、失业率等。 尺度法:根据各指标之间的关系来计算总值,使得研究对 象高低有序,如:总和尺度法。 总和尺度法:将各个分指标加总起来。 例子:精神健康、抗逆力……
按照变异情况,分为可变标志和不变标志 可变的品质标志成为变项; 可变的数量标志称为变量; 变量的具体表现称为变量值,关于某一数量标志的一 系列数值,在统计上又称为数据 重点区分:变量、变量值、数据。 按照卫生部的统计,中国卫生总费用 2010年为 19600 亿元, 2005 年卫生总费用仅为 8000 多亿元。过去 5年 间年均增长 13.6% ,远远超过 GDP 的增长速度。简单 计算,分担给每个人的卫生费用是 1500多元,同期中 国农村居民人均纯收入5919元。
参数和统计量
参数(parameter) 来描述总体特征的概括性数字度量,是研究者想要 了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体 比例()等 总体参数通常用希腊字母表示 统计量(statistic) 用来描述样本特征的概括性数字度量,它是根据样 本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x)、样本标准差(s)、 样本比例(p)等 样本统计量通常用小写英文字母来表示
描述统计的例子
例 1 : 2005 年我国出生人口性别比(男:女)已 经升高到 119.92 ,与正常值 106 相比有严重的 偏离。 例2:中国经济增长的起伏
20
GDP增长率
15 10 5 0
1978
1981
1984
1987
1990
年份
1993
1996
1999
2002
推断统计的例子
例1: 2003年人口变动抽样调查以全国为总体 ,在全国抽取了990个县(市、区)、3734个乡( 镇、街道)、6544个调查小区的126万人。根据 调查结果推算,2003年末全国总人口为 129227万人,出生人口为1599万人,死亡人 口为825万人,净增人口为774万人。 例2:一家大公司的会计部门会从所有的发票 中选择一部分来检查公司所有发票的准确性。
为什么要学习社会统计学? 对“裸婚”的态度调查:
中国青年报社会调查中心通过民意中国网和搜狐新闻中心, 对3214人进行的在线调查显示: 47.5%的人表示能接受自己或家人“裸婚”; 23.3%的人则表示不能接受; 其他29.2%的人表示不好说; 怎样才算“裸婚”?调查中,受访者给出的排序依次是: 没房(89.5%),没车(78.4%),没钻戒(67.1%),不办婚礼 (60.1%),不度蜜月(52.2%)等。 哪些是幸福婚姻必须的要素?调查显示,87.9%的人首选 “信任”,其次是“爱情”(78.1%),排在第三位的是 “孩子”(40.5%)。接下来还有房子(36.7%)、车子(11.5%) 等物质因素。
参考书目:
教材:李沛良著:《社会研究的统计应用》,中国社会科
学文献出版社2002年。
主要参考书:
卢淑华编著:《社会统计学》,北京大学出版社1995年版。 郭志刚主编:《社会统计分析方法—SPSS软件应用》,中国 人民大学出版社1999年 薛薇,SPSS统计分析方法及应用,中国人民大学出版社2008 年
总体数据
总体内在的 数量规律性
LOGO
社会科学研究的阶段与步骤
一、社会科学研究的三个阶段
筹划
执行
总结
(一)筹划阶段
选定研究 题目
研究策略
理论解释与 澄清概念
初步探索
成立假设
选定研究题目 研究题目的现实背景和理论背景 研究题目的重要性 例如:农村留守老人需要满足的家庭支持研究 青少年问题 隔代抚养问题 儿童教育问题
社会研究的统计应用
一、课程要求 1、考核形式:平时表现30%;期中测试30%; 期末测试40%。 2、平时表现要求:不缺勤,上课积极回答问 题,勤于提问 二、联系方式 1、email: 2、电话:
学习统计学的一些建议
不要缺课。由于课程内容是前后呼应的,缺课非 常不利于后续内容的学习。 重在理解,要求识记而非背诵 勤于预习和复习,注意将知识整合。 多做练习,通过练习加深对统计方法的理解。 通过实际操作熟悉相应的统计软件。 多用统计学思维方法联想社会经济热点事件。
为什么要学习社会统计学?
1、有多少中学生是因为身体距离过近而最终恋爱 的呢?是不是有其它的因素的影响呢?哪些因素更 加显著呢? 2、中国留学生造假的情况是怎样的呢?是不是只 有中国的才造假呢?造假者申请成功的几率是多少 呢?哪些学生更容易造假呢?
学习社会统计学,目的是期望通过这一科学 的方法来分析社会事实,从而理解社会现象 之间的关系。
为什么要成立假设呢?
成立假设以后的各项研究步骤,就是为求知道假 设是对还是错
科学的研究是要求事前想清楚,即先成立假设, 然后力求推翻这个假设;或者是证明假设“可能 ”是正确的 当前的社会科学研究,为力求符合科学的要求, 大部分是争取先成立假设,然后收集资料来进行 验证,并进行重复测验
举例
1、对乡镇地区的高中教育水平影响因素研究? 影响因素:师资专业水平、学生入学成绩、父母教育水平 2、新生代农民工精神健康的影响因素研究? 影响因素:? 问题:如何设计研究假设呢?
理论解释与澄清概念
无论是推翻还是接受研究假设(A无论是否影响B),需 要给出合理的解释。
对研究中所涉及的核心概念要详细解释清楚
你相信这样的一些统计结论吗?
吸烟对健康是有害的,吸香烟的男性减少寿命2250天 不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天 身体超重30%会使寿命减少1300天 每天摄取500毫升维生素C,生命可延长6年 身材高的父亲,其子女的身高也较高 二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明 ,依此类推 学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱 乐磁带或其他曲目做得更好 上课坐在前面的学生平均考试分数比坐在后面的学生高 漂亮的女性有损男性的智力。男性在看到漂亮女性时智力会下降,这 就是为什么大学里的女孩子比男孩子学习好的原因
常用社会研究统计数据来源:
中央研究院调查研究专题中心 http://www.sinica.edu.tw/as/survey/ 香港科技大学调查研究中心 http://www.ust.hk/~websosc/survey/indexc.html 上海社会科学院调查研究中心 http://www.sass.org.cn/sdy/zxjj.jsp 中国青年报社会调查研究中心 http://www.qtick.com/cooperator/zqb/index.html 北京大学社会调查研究中心 http://www.pku.edu.cn/academic/pucssr/index.htm 中国社会调查所 http://www.chinasurvey.com.cn/ 中国问卷调查网(北京神鹰邦特社会调查事务所办) http://www.cctvj.com/
变量(variable)和标志
标志 说明总体单位属性或者数量特征的名称在统计上称为 标志,如学生总体的,姓名、籍贯、年龄、文化程度、 民族等; 标志的分类 数量标志:凡是能够用数量的多少来表示的标志,如 年龄,身高,体重等; 品质标志:只能够用文字表述的标志,如性别、喜好 等;
初步探索 收集有关的文献 咨询专家 观察个案
成立假设 假设:是指根据以往的研究结果和研究者对研究 内容的初步探索之后,假定现象与现象之间的关 系。 具体而言:假设是假定某一现象的变化(A变量) 与另一种现象的变化(B变量)具有某种关系。 假设的方式:函数式和差异式
函数式: 如果A愈高,则B也愈高;或者如果A愈低,则B愈低 差异式: A不同则B不同 (当变量不存在高低的性质时适用)
推断统计 (inferential statistics)
1.研究如何利用样本数 据来推断总体特征的统 计学分支 2.内容 参数估计 假设检验 3.目的 对总体特征作出推 断
总体
Baidu Nhomakorabea
样 本
推断统计的主要任务:用统计量估计参数
总体 样本
参数(parameter):描 述总体数量特征的概念 常用希腊字母。例如总 体均值用 表示;总体 方差用 2 表示等。
统计量(statistic):描 述样本数量特征的概念, 常用英文字母表示,如样 本均值用 x 表示,样本 方差用 s 2表示等。
描述统计与推断统计的关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
反映客观 现象的数 据
样本数据
描述统计 (统计数据的搜集、整 理、显示和分析等)
推断统计 (利用样本信息和概率 论对总体的数量特征进 行估计和检验等)
描述统计(descriptive statistics)
1. 用表格、图形和数字来概 括、显示数据特征的统计方 法。 2.内容 搜集数据 整理数据 展示数据 描述性分析 3. 目的 描述数据特征 找出数据的基本规律
¥
50
25 0
Q1 Q2 Q3 Q4
x = 30 s2 = 105
如:《新生代农民工精神健康及其影响因素》一文
复习题 《劳工宿舍:企业社会责任还是经济理性》 社会责任假设:企业类型(跨国、本土)、工资收入、员 工福利
控制(经济理性)假设:企业加班时间、企业工资类型( 底薪制、整合工资)
研究策略
如何证明假设呢? 1、研究设计 社会研究的四种方法? 社会调查法(问卷)、实验法、实地研究(访谈、观察) 、文献法(统计资料分析、二次分析)——《社会调查方 法》课程内容,请同学自行复习。 2、测量变量 (1)社会统计几个核心概念
概念、变量、指标和指标体系
概念(concepts): 对现象的抽象,是一类事物的属性在人们主观上的反映。
物质财富 生活用品 家具 椅子
高
大
含糊
低
小
明确
抽象层次
涵盖面
特征
变量(variable) 具有一个以上取值的概念,或者说,就是包含一 个以上范畴的概念;而那些只有一个固定不变的 值的概念,则叫做常量 变量的性质:构成变量的各个值必须具备穷尽性 和互斥性 指标(indicator) 表示一个概念或者变量含义的一组可观察到的事 物,称做这一概念或变量的一组指标 概念是抽象的,而指标是具体的;概念是主观印 象,而指标是客观存在的事物;概念只能想象, 指标是可以观察和辨认的。
社会统计学:
运用统计的一般原理,对社会各种静态结构与动态 趋势进行定量描述或者推断的一种专门方法与技术。
(1)主要是侧重于对社会问题、社会人态度、观念、行为等 的度量,如:中央研究院调查中心所做的台湾青少年成长历程 研究、宗教对台湾老人健康的影响、高职学生的职业价值观念 等。 (2)主要采用抽样调查,全面调查等用的较少; (3)主要是采用假设检验的方法完成由样本到总体的认识;
总体、样本、单位
总体(population) 所研究的全部个体 ( 数据 ) 的集合,由许多具有共性 的单位构成的整体,其中的每一个元素称为个体 , 也成为单位或者总体单位。 特点:大量性、同质性、变异性 样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量 从总体抽选出样本的过程叫做抽样
LOGO
第一章 科学方法与社会研究历程
为什么要学习社会统计学?
社会科学的目的是什么?
举例:2011年8月29日网易教育新闻:
为防早恋,中学规定男女间距大于60厘米 中国学生造假成风 谎言叩开美国大学?
现象之间的关系图: 1、中学生恋爱——身体距离 2、中国留学生——造假
目的之一:正确地理解社会现象的变化 目的之二:准确地预测社会现象的变化,从 而改进人类的社会生活。
复合指标构成的几种方法: 类型法:将各指标交互分类。 如:变量——代际职业地位流动,如何构造其指标呢? 指数法:各种比率,如:生育率、失业率等。 尺度法:根据各指标之间的关系来计算总值,使得研究对 象高低有序,如:总和尺度法。 总和尺度法:将各个分指标加总起来。 例子:精神健康、抗逆力……
按照变异情况,分为可变标志和不变标志 可变的品质标志成为变项; 可变的数量标志称为变量; 变量的具体表现称为变量值,关于某一数量标志的一 系列数值,在统计上又称为数据 重点区分:变量、变量值、数据。 按照卫生部的统计,中国卫生总费用 2010年为 19600 亿元, 2005 年卫生总费用仅为 8000 多亿元。过去 5年 间年均增长 13.6% ,远远超过 GDP 的增长速度。简单 计算,分担给每个人的卫生费用是 1500多元,同期中 国农村居民人均纯收入5919元。
参数和统计量
参数(parameter) 来描述总体特征的概括性数字度量,是研究者想要 了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体 比例()等 总体参数通常用希腊字母表示 统计量(statistic) 用来描述样本特征的概括性数字度量,它是根据样 本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x)、样本标准差(s)、 样本比例(p)等 样本统计量通常用小写英文字母来表示
描述统计的例子
例 1 : 2005 年我国出生人口性别比(男:女)已 经升高到 119.92 ,与正常值 106 相比有严重的 偏离。 例2:中国经济增长的起伏
20
GDP增长率
15 10 5 0
1978
1981
1984
1987
1990
年份
1993
1996
1999
2002
推断统计的例子
例1: 2003年人口变动抽样调查以全国为总体 ,在全国抽取了990个县(市、区)、3734个乡( 镇、街道)、6544个调查小区的126万人。根据 调查结果推算,2003年末全国总人口为 129227万人,出生人口为1599万人,死亡人 口为825万人,净增人口为774万人。 例2:一家大公司的会计部门会从所有的发票 中选择一部分来检查公司所有发票的准确性。
为什么要学习社会统计学? 对“裸婚”的态度调查:
中国青年报社会调查中心通过民意中国网和搜狐新闻中心, 对3214人进行的在线调查显示: 47.5%的人表示能接受自己或家人“裸婚”; 23.3%的人则表示不能接受; 其他29.2%的人表示不好说; 怎样才算“裸婚”?调查中,受访者给出的排序依次是: 没房(89.5%),没车(78.4%),没钻戒(67.1%),不办婚礼 (60.1%),不度蜜月(52.2%)等。 哪些是幸福婚姻必须的要素?调查显示,87.9%的人首选 “信任”,其次是“爱情”(78.1%),排在第三位的是 “孩子”(40.5%)。接下来还有房子(36.7%)、车子(11.5%) 等物质因素。
参考书目:
教材:李沛良著:《社会研究的统计应用》,中国社会科
学文献出版社2002年。
主要参考书:
卢淑华编著:《社会统计学》,北京大学出版社1995年版。 郭志刚主编:《社会统计分析方法—SPSS软件应用》,中国 人民大学出版社1999年 薛薇,SPSS统计分析方法及应用,中国人民大学出版社2008 年
总体数据
总体内在的 数量规律性
LOGO
社会科学研究的阶段与步骤
一、社会科学研究的三个阶段
筹划
执行
总结
(一)筹划阶段
选定研究 题目
研究策略
理论解释与 澄清概念
初步探索
成立假设
选定研究题目 研究题目的现实背景和理论背景 研究题目的重要性 例如:农村留守老人需要满足的家庭支持研究 青少年问题 隔代抚养问题 儿童教育问题