实用社会统计分析技术及SPSS和STATA统计软件操作说明(第一讲) 李春玲PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
职业 工人 干部 学生 工人 工人 教师 农民 工人 工人 工人
什么是推论统计 (Inferential Statistics
• 推论统计就是从一个较小的群体中了解 的信息并得出相关结论,推广到更大的 一个群体。我们把较小的这个群体,也 就是我们收集了数据的群体称之为样本 (sample),把更大的那个群体,也就 是我们所感兴趣的、要研究的对象群体 称之为总体(population)。
• 有三个离散程度的量度指标:全距(range)、 标准差(standard deviation)、方差 (variance)。 其中,最常用的是标准差。
标准差
• 标准差反映的是每一个个案的分值与平 均的分值之间的差距,简单来说,就是 平均差异有多大。
• 标准差越大表示差异越大。
X X 2
s n 1
26.3
60.1
41-50 1158 18.7
18.7
78.8
51-60 773 12.5
12.5
91.3
61-70 540
8.7
8.7
100.0
Total 6194 100.0
什么是统计学
• 统计学就是描述、组织和解释数据或信 息的一套工具和技术。它帮助我们理解 周围的世界。
统计分析中的 两个最基础的概念
• 描述性统计(Descriptive Statistics)
• 推论统计(Inferential Statistics )
什么是描述性统计 (Descriptive Statistics)
集中趋势的量度
• 集中趋势(平均数值)是对整个群体的数 值的最好的代表。
• 有三种形式的平均数值:平均值 (mean)、中位数(median)、众数 (mode)。 其中,最常用的是平均值。
X X N
离散程度
• 离散程度 (异质性 )反映的是数值之间是如 何的不同。
• 同样均值不同差异程度 。如: 7,6,3,3,1 3,4,4,5,4 4,4,4,4,4
模型。
用图形显示数据
• 为什么要用图形显示数据? • 柱状图 • 多边图 • 线性图
年龄组
Cumulat ive
Frequency Percent Valid Percent Percent
Valid 16-20 693 11.2
11.2
11.2
21-30 1403 22.7
22.7
33.8
31-40 1628 26.3
方差
• 量度离散程度的第三个指标是方差 (variance)。
• 方差就是标准差的平方。
2 XX s2
n1
单变量描述性统计
• 均值 • 标准差
单变量描述统计的目的
• 检查数据 • 对此变量的分布特征做初步判断; • 依据此数据推论总体是否合适,要如果
做调整; • 依据此变量分布特征,选择合适的统计
偏误估计(biased estimation)与 无偏估计(unbiased estimation)
• 很多因素导致了偏误估计——过高估计或过低估 计。样本的代表性、数据收集过程中的误差、计 算中的差错,尤其是干扰因素的作用,等等,都 有可能导致偏误估计。
• 要达到无偏估计需要一系列的技术手段,应用统 计技术的研究者就是采用这些技术手段,以样本 去推测总体,以达到无偏估计。
21.21 455.68
N 样本 数
41 70 64 200 358 643 615 715 2523 297 5526
Std. Dev iation 标准 差 636.978 1601.001 5860.855 863.124 609.443 1202.417 557.462 532.824 178.298 93.208 997.006
不同样本量的标准差的偏误估计与无偏估计之差比较
样本数
标准差公 式中分子
的值
10 500 100 500 1000 500
总体标准 差的偏误 估计(除
以n)
7.07
2.24
0.7071
总体标准 差的无偏 估计(除 以n-1)
7.45
2.25
0.7075
偏误估计 与无偏估 计之差
0.38 0.01 0.0004
• 统计分析技术:6)量表和指标建构、7)列联表分析 技术、8)简单线性回归、9)多元回归、10)非线性 转换、11)对数线性模型、12)logistic回归、13)多 元logistic回归、14)等级logistic回归、15)Probit模型、 16)tobit 模型、17)poisson 回归、18)因子分析、19) 路径分析、20)结构方程、21)事件史分析
• 在社会科学研究中,人为地制造(模拟)试验环 境,控制各种干扰因素,以达到(自然)科学的 求证方法。这就是社会统计学的一种思维方式。
描述性统计
• 集中趋势的量度(measures of central tendency) :共性
• 离散程度 的量度(measures of variability): 异质性
实用社会统计分析技术
及SPSS和STATA统计软件操作说明 第一讲
课程主要内容:
• 本课程教授的内容是专门针对抽样调查 数据资料的统计分析技术,而不适用于 试验性调查资料和观察性调查资料的分 析。
课程安排:
• 统计学基础知识:1)描述性统计、2)概率论和3)推 论统计。(三讲)。
• 数据处理技术:4)数据录入、整理、校验和加权、5) 数据加工、重组和再生变量。(两讲)。
十个 阶层 的平 均个 人月 收入
个人 月总收 入(排除 在校生 )
十大 阶层 国家 与社会 管理者 经理 人员 私营 企业主 专业 技术人 员 办事 人员 个体 工商户 商业 服务业 员工 产业 工人 农业 劳动者 城乡 无业失 业半失 业者 T ot al
M ea n 均值
944.17 1436.28 4175.56 782.73 664.86 925.42 570.13 540.06 150.14
• 描述性统计就是组织、描述和总结所收 集到的一组数据的特征。
• 需要注意的是,它所描述的是这组数据 本身的分布特征。
编号
1 2 3 4 5 6 7 8 9 10
姓名
王X X 李X X 张X X 李X X 李X X 刘X X 陈X X 王X X 陈X X 吴X X
Βιβλιοθήκη Baidu
年龄
30 42 18 26 22 29 19 22 25 23