初级社会统计学第二讲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(6)曲线:组距越小,线条就越平滑;如果能 把组距变得无限小,曲线就会很平滑,定距 资料是连续的,原则上可以使组距无限小, 因此可以用平滑曲线显示次数分布。
9
a) J形曲线:下降先急后缓,上升先缓后急。
b) U形曲线:先降后升或先升后降。 c) 峰状曲线:单峰,双峰和多峰。 d) 对称曲线:从中央分隔,两边对称。
3
(3)比率:把计算比例是所用的基数变大,使 之更容易理解,社会学最常用的是百分率。 f × 100 ( 1000,10000 ) F 精确程度越高或样本越大,保留小数越多。 四舍五入原则:前单五入
(4)对比值
4
(5)图示法 长条法:以长方形长度表示次数或百分率。 饼 图:把一圆形平面按数值比例分割。
7
(4)直方图:以一个矩形的面积(长*宽)表示 数值之次数或百分率的多少。由于数值有连 续性,各个矩形都要相连排列。以一个坐标 的横轴的宽度表示组距,以纵轴的长度表示 次数或百分率,二者的乘积就是该组数值的 次数或百分率。
8
(5)折线图:把各个矩形顶端的中点用直线连 接起来,使得各组的次数或百分率的分布情 况显而易见。
简化一个变量的分布
——基wk.baidu.com技术
简化资料标准:依据变量的测量层次。 适用于较低测量层次的统计法,也可以适用 于较高的层次。
2
一.定类层次
(1)频数分布:一个概念或者变量,它的各个 情况出现的次数或频次。可以把原始资料作 初步简化,但是不能用来比较不同的样本。
(2)比例:每类的次数(f)除以总数(N), 可以比较不同的样本资料中的同一类别信息。
12
5
二.定序层次
(1)累加次数(cf):把次数逐级相加起来,向 上累加和向下累加。让我们容易知道某个值 以下或以上的次数总和。 (2)累加百分率(c%):将各级百分率数值逐 级相加。也可计算累加比例,累加千分率。
6
三.定距层次
(1)先将值分成若干组,然后计算每组次数。
(2)组限:每组值的范围,包括上限和下限。 真实上限:标示上限+0.5 真实下限:标示下限 -0.5 (3)组距:每个组的宽度,是真实上限与真实 下限之差。
10
e) 非对称曲线:数值是偏态(skewed)分布 正向偏态 负向偏态
11
小结
有了分布,可以看出统计的频次大概集中在 变量值的哪一部分以及频次随变量变化的趋 势。同时,通过分布还可以对不同总体的统 计进行比较。
统计图和统计表都是为了表达变量的分布。 分布是绘制统计图和统计表的基础,没有分 布也就无法绘制相应的图和表。
9
a) J形曲线:下降先急后缓,上升先缓后急。
b) U形曲线:先降后升或先升后降。 c) 峰状曲线:单峰,双峰和多峰。 d) 对称曲线:从中央分隔,两边对称。
3
(3)比率:把计算比例是所用的基数变大,使 之更容易理解,社会学最常用的是百分率。 f × 100 ( 1000,10000 ) F 精确程度越高或样本越大,保留小数越多。 四舍五入原则:前单五入
(4)对比值
4
(5)图示法 长条法:以长方形长度表示次数或百分率。 饼 图:把一圆形平面按数值比例分割。
7
(4)直方图:以一个矩形的面积(长*宽)表示 数值之次数或百分率的多少。由于数值有连 续性,各个矩形都要相连排列。以一个坐标 的横轴的宽度表示组距,以纵轴的长度表示 次数或百分率,二者的乘积就是该组数值的 次数或百分率。
8
(5)折线图:把各个矩形顶端的中点用直线连 接起来,使得各组的次数或百分率的分布情 况显而易见。
简化一个变量的分布
——基wk.baidu.com技术
简化资料标准:依据变量的测量层次。 适用于较低测量层次的统计法,也可以适用 于较高的层次。
2
一.定类层次
(1)频数分布:一个概念或者变量,它的各个 情况出现的次数或频次。可以把原始资料作 初步简化,但是不能用来比较不同的样本。
(2)比例:每类的次数(f)除以总数(N), 可以比较不同的样本资料中的同一类别信息。
12
5
二.定序层次
(1)累加次数(cf):把次数逐级相加起来,向 上累加和向下累加。让我们容易知道某个值 以下或以上的次数总和。 (2)累加百分率(c%):将各级百分率数值逐 级相加。也可计算累加比例,累加千分率。
6
三.定距层次
(1)先将值分成若干组,然后计算每组次数。
(2)组限:每组值的范围,包括上限和下限。 真实上限:标示上限+0.5 真实下限:标示下限 -0.5 (3)组距:每个组的宽度,是真实上限与真实 下限之差。
10
e) 非对称曲线:数值是偏态(skewed)分布 正向偏态 负向偏态
11
小结
有了分布,可以看出统计的频次大概集中在 变量值的哪一部分以及频次随变量变化的趋 势。同时,通过分布还可以对不同总体的统 计进行比较。
统计图和统计表都是为了表达变量的分布。 分布是绘制统计图和统计表的基础,没有分 布也就无法绘制相应的图和表。