社会统计学卢淑华版xPPT课件
卢淑华《社会统计学》讲义
![卢淑华《社会统计学》讲义](https://img.taocdn.com/s3/m/c44a041c02d8ce2f0066f5335a8102d276a261b0.png)
卢淑华《社会统计学》讲义社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学(卢淑华)_第六章
![社会统计学(卢淑华)_第六章](https://img.taocdn.com/s3/m/3d5f000c2e3f5727a5e962ac.png)
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q 2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n
样本方差
S 2 的方差
:D2 S
4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
第五节 正态总体的区间估计
一、置信度、置信区间
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为
Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)
置信区间与置信度的关系:
社会统计学(卢淑华)-第三章
![社会统计学(卢淑华)-第三章](https://img.taocdn.com/s3/m/495a85482f3f5727a5e9856a561252d380eb2020.png)
接上例。某天,随机抽出一份表格,发现有错 误,办公室主管想知道由第一、第二、第三个 工作人员所造成的概率是多少?
第二节 概率分布、均值不方差
一、概率分布:
随机现象一共有多少种结果,以及每种结果伴随的概率。
1、离散型随机变量及其概率分布——分布列
概率分布:P X i Pi
例1:10人中,女性3人,抽3人,女性人数的概率分布。
③ 求[ E()]2P·( =xi)
④ 2=
5、方差的性质
① 常数的方差为0
② D(+C)= D()
③ D(C·)=DC2 ·()
④ 两个独立变量
D(+ )= D()+D( )
推广n个
例题
12名学生,3女,9男。任抽一人,如为女 生,则不放回,再抽一人,直到抽到男生 为止,求,抽到男生以前已抽出的女生人 数的数学期望与方差。
PAB PA P B A 或 PAB PB P A B
推论: PA1 A2 An PA1 AP1 A2PAn A1 A2 An
例题1
某城市中,有60%的家庭订阅日报,有80% 的家庭有电视机,假定这两个事件是独立 的,随机抽出一个家庭,发现既订日报又 有电视机的概率?
答案
PAi
B
PAi
• PB PB
Ai
其中
n
PB
i 1
PAi • PB Ai
全概例:
有三个工作人员被指定复制某种表格。某一人 复制了这种表格的40%,第二人复制了35%, 第三人复制了23%,第一人的错误率为0.04, 第二人的错误率为0.06,第三人的错误率为 0.03。随机抽一份表格,这份表格有错误的概 率为多少?
集
社会统计学(卢淑华),第十章
![社会统计学(卢淑华),第十章](https://img.taocdn.com/s3/m/36394b89d4bbfd0a79563c1ec5da50e2534dd11b.png)
调查过程不应给被调查者带来身体或心理 上的伤害,避免涉及敏感或隐私问题。
数据处理与分析中的伦理问题
数据真实性
在处理和分析数据时,应确保数 据的真实性和完整性,避免篡改
、伪造或选择性使用数据。
数据安全性
采取必要的技术和管理措施, 确保数据的安全存储和传输, 防止数据泄露、损坏或丢失。
数据分析的客观性
报告统计结果时,应提供足够的信息 和数据支持结论,避免选择性报告或 隐瞒不利结果。
避免过度解读
在解释统计结果时,应避免过度解读 或夸大其意义,以免误导读者或产生 不必要的恐慌。
尊重被调查者的权益
在报告统计结果时,应注意保护被调 查者的隐私和权益,避免泄露个人信 息或造成不必要的伤害。
THANK YOU
社会问题调查
通过问卷调查、访谈、观察等方 法收集数据,了解社会问题的现
状、原因和影响。
社会问题分析
运用统计分析方法对调查数据进 行处理和分析,揭示社会问题的
本质和规律。
社会问题解决方案
基于分析结果,提出针对性的解 决方案和建议,为政府和社会各
界提供参考。
社会政策的制定与评估
社会政策制定
01
运用统计数据和分析结果,为政府制定社会政策提供科学依据
04
因子分析
一种通过降维技术,将多个相关变量简化为少数几个 综合变量的统计分析方法。
05
聚类分析
一种根据样本或变量之间的相似性或距离,将其分为 不同类别的统计分析方法。
02
描述性统计方法
频数分布与图形表示
频数分布表
将数据进行分类,并统计各类别出现的次数,形成 频数分布表,以直观展示数据的分布情况。
SAS是一款高级统计分析软件 ,具有强大的数据处理、分析 和可视化功能,适用于大规模 数据处理和复杂统计分析。
社会统计学(卢淑华)PPT培训课件
![社会统计学(卢淑华)PPT培训课件](https://img.taocdn.com/s3/m/c8e73033a8956bec0975e395.png)
例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x
x nx
n
xa
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
三、二项分布的数学期望
E
n
x
P
n
x
x
x
Cp q x
n
nx
n
p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
3、二点分布----一次贝努里试验的概率分布; 二项分布----n次贝努里试验的概率分布;
4、二点分布是二项分布的特殊情况
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质 1)P(=0)>0 P(=1) >0 2)P(=0)+ P(=1)=q+p=1 3)二点分布的期望与方差
如:同一地点的交通事故。
例
某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
《社会统计学》人大版ppt课件
![《社会统计学》人大版ppt课件](https://img.taocdn.com/s3/m/3314b67fb0717fd5370cdccc.png)
最新版整理ppt
9
第一章 绪论 第四节 变量的层次及统计分析方法的选择
• (三)不同层次变量的功能及转换
由于对某一事物进行测量时可以使用不同层次的测量工具, 因此对同一事物进行测量可能出现多种测量结果。
设计问卷时,要尽可能多地设计测量层次高的变量。
最新版整理ppt
10
第一章 绪论 第四节 变量的层次及统计分析方法的选择
3
第一章 绪论
1 社会学研究的过程及统计学的应用
2 统计分析方法在社会学研究中的作用 3 抽样方法与统计分析方法的选择 4 变量的层次及统计分析方法的选择 Exe 本章习题
最新版整理ppt
4
第一章 绪论 第一节 社会学研究的过程及统计学的应用
审核、录入 与录入误差
的消除
统计分析 与理论假设的
检验
(二)样本(Sample)
是从总体中抽出的用于实施调查研究的对象集合。
二、抽样方法与统计分析方法的选择
•应用随机原则获得的样本称为随机样本,否则是非随机样本。
•社会统计学的内容可分为两大部分:描述统计与推论统计。
•全面调查,只使用描述统计即可。
•应用推论统计的必要前提是样本必须是随机样本。
最新版整理ppt
邮电出版社,2006年4月。
2. 卢淑华,《社会统计学》(第三版),北京大学出版社,2005年5月。
3. 戴维.K.希尔德布兰德、加德曼.R.爱沃森、约翰.H.奥尔德里奇等著,
《社会统计方法与技术》,社会科学文献出版社,2005年6月。
4. 浙江大学数学系高等数学教研组编,《概率论与数理统计》,人民教
2、有序类别变量( Ordinal Variable )
也称为定序变量或序列变量。如职称、职务级别、学生的年级 等等。如用1、2、3、4、5、6、7分别表示文盲、小学、初中 、高中、大专、大学、研究生。
《社会统计学》PPT课件(110页)
![《社会统计学》PPT课件(110页)](https://img.taocdn.com/s3/m/1ebfbbbd7e192279168884868762caaedc33ba58.png)
《社会统计学》PPT课件(110页)一、引言社会统计学是研究社会现象数量特征及其规律的学科,是社会学的重要组成部分。
本课件将带领大家深入了解社会统计学的定义、研究方法、数据来源以及在社会各个领域的应用。
二、社会统计学的定义社会统计学是一门应用统计学原理和方法,对社会现象进行数量分析和描述的学科。
它通过收集、整理、分析和解释社会数据,揭示社会现象的数量特征、变化规律和相互关系,为社会决策提供科学依据。
三、社会统计学的研究方法1. 调查研究法:通过问卷调查、访谈等方式,收集社会数据,了解社会现象的实际情况。
2. 实验研究法:在控制条件下,对研究对象进行实验,观察和记录实验结果,分析社会现象的因果关系。
3. 文献研究法:通过查阅相关文献,了解社会现象的历史、现状和发展趋势。
4. 案例研究法:选取具有代表性的社会现象,进行深入分析,揭示其内在规律。
5. 统计模型法:运用统计模型,对社会现象进行定量分析,预测社会现象的未来发展趋势。
四、社会统计学数据来源1. 政府统计部门:提供国家、地区和行业的社会经济数据。
2. 学术研究机构:发布学术研究报告,提供社会现象的定量分析结果。
3. 社会调查机构:开展社会调查,收集社会数据,为政府、企业和社会组织提供决策依据。
4. 新闻媒体:报道社会现象,提供社会数据的实时更新。
5. 公共图书馆和档案馆:保存历史文献,为研究社会现象提供数据支持。
五、社会统计学在社会领域的应用1. 社会经济领域:分析经济增长、就业、收入分配等社会经济现象,为国家制定经济发展政策提供依据。
3. 社会问题领域:分析社会问题,如贫困、犯罪、环境污染等,为解决社会问题提供科学依据。
4. 社会发展领域:研究社会发展规律,为推动社会进步提供理论支持。
5. 社会管理领域:分析社会管理现状,为提高社会管理水平提供数据支持。
社会统计学作为一门研究社会现象数量特征及其规律的学科,具有广泛的应用价值。
通过掌握社会统计学的定义、研究方法、数据来源及其在社会领域的应用,我们可以更好地了解社会现象,为政府、企业和社会组织提供决策依据,推动社会进步。
社会统计学(卢淑华),第一章资料
![社会统计学(卢淑华),第一章资料](https://img.taocdn.com/s3/m/f97987b3551810a6f52486d4.png)
一、社会统计学的发展
统计学的两大流派:数理统计学派和社 会统计学派
数理统计学派的原创始人是比利时的A ·凯特靳, 其最大的贡献就是将法国的古典概率引入统计 学,用纯数学的方法对社会现象进行研究; 社会统计学派的首倡者是德国的K·克尼斯,他 认为统计研究的对象是社会现象,研究方法为 大量观察法。
例:中学升学率调查
课题确定:升学率差异较大;学生择校
初探:收集文献,前人研究;咨询相关人员; 典型个案观察(好坏各2-3所中学)
假设:构思影响因素:1、师资专业水平,2、 学生入学水平,3、父母教育水平;
师资水平高
升学率高
入学成绩好
升学率高
父母教育水平高
升学率高
续例
操作化定义:如,师资:学历、职称、 获奖等;学生水平:考分、地域、性别 等;父母水平:学历、职业、教育子女的 时间等(注意:每一个定义就是一个变量, 要注意变量的各种可能取值)
1、混淆统计联系与因果关系 根据观测数据得到的统计联系(如相关 关系)只是因果关系存在的必要条件, 而不是充分条件。
2、事后解释错误 将探测性研究或描述性研究得到的理论 假设反过来作为假设检验来看待。
统计分析中常见的错误
3、生态学错误 混淆宏观模式与微观模式。 如:教育、经济水平越高的地区生育水平 越低,不能引申为个人教育水平与生育 水平的关系。 4、还原论错误 根据较低层次研究单位的分析结果推断较 高层次单位的运行规律。
联合国有关组织规定: 若低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.6以上表示收入差距悬殊。
二、社会学不社会统计学
1、社会学研究的重要环节 ▲课题---了解课题---假设---术语---问卷---调查---校核---统计
社会统计学导论 ppt课件
![社会统计学导论 ppt课件](https://img.taocdn.com/s3/m/d584dd9790c69ec3d5bb75ce.png)
定序测量(ordinal measurement)
一个变量如果能够依照操作定义界定的明确特征或属 性而排列等级高低、先后的次序,就适用于定序层次 的测量。
例:经济地位、文化程度、满意度和态度等。
使用的数字只显示等级顺序,除此之外,别无他意。 即:不显示属性的真正数量值,并且等级之间的间隔 也不一定相等。
定距测量(interval measurement)
不仅能将事物区别为不同的类别和等级,而且能确定 等级之间的间隔距离和数量差别。
每一等级之间的间距是相等的,可以用来相加或相减。 比如气温、IQ值。
定距测量上,没有绝对的零点,所以定距层次的数字 只能加减,相乘或相除都没有任何意义。
定比测量(ratio measurement)
“如果两性具有同样的价值观,则他们就可能结为伴 侣。”
若A,则可能有B,也可能有C,D……
表现为一种散点图。
案例:班级总体平均成绩和抽查的平均成绩。
(2) 统计规律性
不确定性只是随机现象的一个方面,另一方面则是它 潜在的统计规律性。
例如:婴儿性别比;离婚率等。
恩格斯:在表面上是偶然性在起作用的地方,这种偶 然性始终是受内部的隐蔽着的规律支配的,而问题只 是在于发现这些规律。
是测量中的最高层次,具有低层次测量的所有特征, 同时还有一个绝对零点。因而数字可以加减乘除,运 算结果都有实际意义。
例:年龄、身高、体重、收入等。
一个变量能否进行定比层次的测量,关键在于零点是 否是绝对的。检验办法是:零是否可被认为是“一无 所有”。
选择测量层次时,应当注意:
(1)社会现象大多只能以定类或定序尺度测量,有 时也可以将某些现象近似地视为定距或定比变量。
会想出办法 。(例如:电视节目中的调查)
社会统计学-导论精选.ppt
![社会统计学-导论精选.ppt](https://img.taocdn.com/s3/m/9652865a0242a8956aece426.png)
运算来处理,反过来则可以。 (4)一个变量采用何种层次测量,取决于研究所要
求的精确性。
精选
23
资料收集方法
问卷法 访问法 观察法 量表与测验 实验法 文献法
精选
24
精选
25
资料收集 方法
自填式问 卷法
个别发送法 集中填答法 邮寄填答法 网络调查法
“如果两性具有同样的价值观,则他们就可能结为伴 侣。”
若A,则可能有B,也可能有C,D…… 表现为一种散点图。
案例:班级总体平均成绩和抽查的平均成绩。
精选
28
(2) 统计规律性
不确定性只是随机现象的一个方面,另一方面则是它 潜在的统计规律性。
例如:婴儿性别比;离婚率等。
恩格斯:在表面上是偶然性在起作用的地方,这种偶 然性始终是受内部的隐蔽着的规律支配的,而问题只 是在于发现这些规律。
结构式访 问法
当面访问法 电话访问法
精选
26
社会调查资料的特点(P7)
(1)随机性
客观现象可以分为确定性现象和非确定性现象。
“重力作用下的物体降落。” “水在常压下,加热到100℃必然沸腾。” A和B之间,存在确定的函数关系,即B=f(A)。
精选
27
非确定性现象是指在某种条件下可能发生也可能不发 生的现象。
精选
32
3 几个基本概念
概念与变量 概念(concept) 变量(variable):概念的一种类型。分为连续变量、离
散变量;解释变量(自变量 )、被解释变量(因变量 ),中介变量。
精选
33
元素:搜集信息的基本单位,即分析单位。既可以是 人,也可是家庭、组织、社区等。
社会统计学(卢淑华),第十章ppt课件
![社会统计学(卢淑华),第十章ppt课件](https://img.taocdn.com/s3/m/092558c1af45b307e9719728.png)
第十讲 列联表
第一节 概念 1、研究内容 1)研究两定类变量的关系 2)为研究y的分类是否与x之分类有关,将
可编辑课件
30
E1即为猜错人数之和。 推广:
E1 n*1 (1 n*1 ) n*2 (1 n*2 ) n*r (
n
n
n 1
n
r
2
n j1 * j
可编辑课件
31
知道x与y有关后:用y的条件分布来猜y值 当x=男生时 随机10人,猜对聊天的人数:10×10/50 猜错的人数:10-10×10/50 随机40人,猜对游戏的人数:40×40/50 猜错的人数:40-40×40/50 猜错二者相加:=(10-10×10/50)+(40-40×40/50)
在1,1之间。
可编辑课件
20
1、 系数
ad bc
a bc d a cb d
0 ——当两变量相互独立
1 —— b、c为零, 值最大1
a、d为零, 值最小-1
1 ——一般情况
前例中计算
可编辑课件
21
2、Q系数
Q ad - bc ad bc
当a、b、c、d中有一个是零时,则 Q 1
x2 i 1
ni Ei2 Ei
~
2
r 1
3、
4、比较
可编辑课件
16
例:以下是老、中、青三代对某影片的抽 样,能否认为三代人对该影片评价有显 著差异
老
中
青
很高
社会统计学(卢淑华版)ppt课件
![社会统计学(卢淑华版)ppt课件](https://img.taocdn.com/s3/m/42c64b67f111f18583d05aca.png)
⑴自变量A的检验 检验统计量:
根据给定的显著性水平α,查出临界值 。如果
,
则不拒绝原假设。否则,拒绝原假设。
⑵自变量B的检验
检验统计量:
根据给定的显著性水平α,查出临界值 。如果
,
则不拒绝原假设。否则,拒绝原假设。 31
5、交互作用显著情况下,自变量A、B显著性的检验 交互作用显著情况下,自变量A、B的检验方法要根据变 量A和B的性质来确定。如果某变量的取值是固定的,则 该变量属于固定变量。如果变量所涉及的测试个体是随 机选择的,则该变量属于随机变量。根据A、B性质的不 同,可以分为三种模型: ⑴固定模型:A、B都是固定变量 对于固定模型,F检验分母项就用剩余误差项(RSS)的均方
• 若原假设(自变量对因变量没有影响)成立,组 间均方与组内均方的数值就应该很接近,它们的 比值就会接近1;若原假设不成立,组间均方会大 于组内均方,它们之间的比值就会大于1。当这个
比值大到某种程度时,就可以说不同水平之间存 在着显著差异,即自变量对因变量有影响。
• 三、方差分析的基本假定
• 1、每个总体都应服从正态分布
然后选择【确定】
第4步:当对话框出现时
在【输入区域 】方框内键入数据单元格区域
在【】方框内键入0.05(可根据需要确定) 在【输出选项 】中选择输出区域
22
• 例 三个地区家庭人口数的抽样调查如下表所示, 试问这三地区的平均家庭人口有没有显著差异?
家庭人口数
甲地
2 6 4 13 5 8 4 6
地区
5
第一节 方差分析的原理
• 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本。
• 2、各个总体的方差必须相同 • 各组观察数据是从具有相同方差的总体中抽取的。 • 3、观察值是独立的 • 四、问题的一般提法
社会统计学 卢淑华
![社会统计学 卢淑华](https://img.taocdn.com/s3/m/8feb5a9ea48da0116c175f0e7cd184254a351b58.png)
社会统计学社会统计学是一门研究社会现象和问题的统计学科。
它通过收集、整理和分析大量社会数据,提供了对社会行为、社会关系和社会结构的科学视角。
社会统计学可以帮助我们理解社会的变迁和发展趋势,为社会科学研究和决策提供数据支持。
一、社会统计学的定义和作用社会统计学是统计学的一个重要分支,它关注社会领域的统计数据和现象。
社会统计学包括以下几个方面的研究内容:1.社会人口统计学:研究人口的数量、分布、结构和变动趋势等问题,包括人口普查、人口调查和人口统计分析等方法。
2.社会经济统计学:研究社会经济活动的数量、结构和变动趋势等问题,包括就业率、收入分配、消费水平等指标的统计分析。
3.社会调查统计学:研究社会问题和社会行为的数据收集和分析方法,包括问卷调查、面访调查和实地观察等技术手段。
4.社会健康统计学:研究社会健康问题的统计数据和分析方法,包括疾病发生率、医疗资源分布和保健水平等指标的统计分析。
5.社会环境统计学:研究社会环境问题的统计数据和分析方法,包括自然资源利用、环境污染和生态平衡等指标的统计分析。
社会统计学的作用主要体现在以下几个方面:1.揭示社会现象的特征:社会统计学通过大量统计数据的分析,能够揭示社会现象的数量、分布和变动趋势等特征,帮助我们更好地理解社会。
2.分析社会问题的原因:社会统计学可以对社会问题进行定量分析,帮助我们找到问题的原因和影响因素,为制定解决方案提供依据。
3.评估社会政策效果:社会统计学可以用于对社会政策的实施效果进行评估,了解政策对社会的影响程度和效果,为政策调整和优化提供参考。
4.提供决策支持:社会统计学可以为政府、企业和组织等提供科学的决策支持,帮助他们做出准确的决策,提高工作效率和决策的科学性。
二、社会统计学的方法和技术社会统计学主要依靠大量数据的收集、整理和分析来揭示社会现象和问题。
以下是一些常用的社会统计学方法和技术:1.问卷调查:通过编制调查问卷,对一定群体进行调查,收集社会数据和意见信息。
社会统计学-卢淑华(第4版)-第2章.xPPT课件
![社会统计学-卢淑华(第4版)-第2章.xPPT课件](https://img.taocdn.com/s3/m/89e0ae6465ce050877321369.png)
-
12
关于统计分组的个人认识
原则:统计分组没有对错,只有好坏。
开口组实际中应用更广。
极端值,extreme 判断va依lue据:发生概率非常小,后果很严重
911事 2004印度洋海啸 件
飞机失事、英法核潜艇相撞、美、俄卫星相撞
,股灾,亚洲金融危机-
13
饼图(Pie) 250, 12%
110, 5%
-
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
17
父亲身高(800名)
-
18
母亲身高(800名)
-
19
1.245-1.275;1.275-1.305,……
-
10
(三) 定距变量
身高
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
原则:以5或10的倍数作为组距。本例选择:0.03
第三:确定组限。
要求:第一组下限要小于所有数据的最小值,最后一组上限要 大于所有数据的最大值
原则:以5或10的倍数作为组限。
-
9
(三) 定距变量
统计分组的步骤(等距、重合、组距式分组)
第四:计数。 以0.03作为组距的分组情况。 1.265-1.295;1.295-1.325,…… 1.255-1.285;1.285-1.315,……
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
0岁 1-4岁 5-9岁 10-14岁 15-19岁 20-24岁 25-29岁 30-34岁 35-39岁 40-44岁 45-49岁 50-54岁 55-59岁 60-64岁 65-69岁 70-74岁 75-79岁 80-84岁 85-89岁 90及以上
22
60.0 50.0 40.0 30.0 20.0 10.0
17
父亲身高(800名)
2019-09-23
统计学
18
母亲身高(800名)
2019-09-23
统计学
19
父亲体重(800名)
2019-09-23
统计学
20
母亲体重(800名)
2019-09-23
统计学
21
350
300
250
200
150
100
50
0
2019-09-23
1992年
2008年
分年龄别的死亡率
80000
按年龄和分人口数 (2012年,0.83%人口抽样调查)
2019-09-23
统计学
100000
120000
15
120 80 40 0
2019-09-23
100名儿童身高向上累计直方图
统计学
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
第2章 单变量描述统计分析
第1节 统计分组
按品质标志分组
统计分组
按数量标志分组
单项式分组 组距式分组
2019-09-23
统计学
等距、不等距
重合、不重合
1
一、分布(distribution)
• 变量各种可能取值及其出现的次数或频 次,又称频次分布。
频数、频次、次数(frequency)
2019-09-23
13
饼图(Pie) 250, 12%
110, 5%
720, 34%
1050, 49%
核心家庭 直系家庭 联合家庭 其他
图2.1 家庭结构分布图
2019-09-23
统计学
14
条形图 bar
90-94 75-79 60-64 45-49 30-34 15-19
0-4 0
20000
40000
60000
2019-09-23
统计学
12
关于统计分组的个人认识
原则:统计分组没有对错,只有好坏。
开口组实际中应用更广。 极端值,extreme value 判断依据:发生概率非常小,后果很严重
911事件 2004印度洋海啸
飞机失事、英法核潜艇相撞、美、俄卫星相撞
,股灾,亚洲金融危机 2019-09-23
统计学
统计学
2
二、统计表
家庭结构 核心家庭 直系家庭 联合家庭
其他 总数
表2.5 家庭结构的频次分布
频次
百分比(%)
1050
49.30
720
33.80
110
5.16
250
11.74
2130
100.00
2019-09-23
统计学
3
多选项二分法
a
b
c
d
e
样本1
√
√
√
×
√
样本2
×
×
√
√
√
样本3
√
×
×
√
√
样本4
2019-09-23
统计学
10
(三) 定距变量
身高
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565 合计 2019-09-23
Hale Waihona Puke 表2.11 100名儿童身高统计分组表
向上累计 组中值 人数 频率
人数 频率
1.28 1
1
1
1
1.31 4
4
5
5
1.34 7
7
12 12
1.37 22 22 34 34
1.40 24 24 58 58
1.43 24 24 82 82
1.46 10 10 92 92
1.49 6
6
98 98
1.52 1
第一:确定组数。经验公式 k=1+lgn/lg2 k =1+lg100/lg2=7.64
第二:确定组距。 组距 =(最大值-最小值)/组数 =(1.56-1.27)/10=0.029
原则:以5或10的倍数作为组距。本例选择:0.03
第三:确定组限。
要求:第一组下限要小于所有数据的最小值,最后一组上限要 大于所有数据的最大值
1
99 99
1.55 1
1 100 100
— 100 1统0计0 学 —
—
向下累计
人数 频率
100 100
99
99
95
95
88
88
66
66
42
42
18
18
8
8
2
2
1
1
—
— 11
向上累计:由低到高,上限以下 向下累计:由高到低,下限以上
思考:360体 您本次开机共用时1分10秒,击败了全国12%
的电脑……
16
120 80 40 0
2019-09-23
100名儿童身高向下累计直方图
统计学
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
√
√
×
×
√
样本5
√
√
×
×
√
2019-09-23
统计学
4
多选项二分法
a
b
c
d
e
样本1
1
1
1
0
1
样本2
0
0
1
1
1
样本3
1
0
0
1
1
样本4
1
1
0
0
1
样本5
1
1
0
0
1
合计
4
3
2
2
5
2019-09-23
统计学
5
多选项分类法
• P26 例2 • P27 例3
2019-09-23
统计学
6
3、加权平均法
P28 例4
原则:以5或10的倍数作为组限。
2019-09-23
统计学
9
(三) 定距变量
统计分组的步骤(等距、重合、组距式分组)
第四:计数。 以0.03作为组距的分组情况。 1.265-1.295;1.295-1.325,…… 1.255-1.285;1.285-1.315,……
1.245-1.275;1.275-1.305,……
0.0 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012
2019-09-23
统计学
7
(二)定序变量
喜爱程度 很反感 不爱看 一般 爱看 非常爱看 总数
表2-7 单位对武打片的反映统计 频次 3 10 10 9 7 39
百分比(%) 7.69 25.64 25.64 23.08 17.95
100.00
2019-09-23
统计学
8
(三) 定距变量
统计分组的步骤(等距、重合、组距式分组)