社会调查方法:统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)当资料是定序,定类测量或者是有开口组的定 居测量时,中位数能够拟补不足.
众数
众数:一组数据中出现次数最多的那个数据,叫 做这组数据的众数(mode)。符号为(Mo).
众数着眼于对各数据出现的次数的考察, 是一组数 据中的原数据,其大小只与这组数据中的部分数 据有关,当一组数据中有不少数据多次重复出现时, 其众数往往是我们关心的一种统计量; 一组数据中的众数有时不只一个,如数据2、3、1、2、l、3中,2和3都出现了2次,它们都是这组 数据的众数
算术平均数的计算方法
1、用原始数据计算平均数 。当一组数据个数不 多时,可直接用原始数据来计算。
如某实验小组10人的实验成绩为11,13,15,16, 16,16,17,18,18,20。其平均数为:
2、用频数分布表求平均数 。如果样本的数据很多, 达到数十个或数百个,则需编制频数分布表,用频 数分布表求平均数。
例1:某校三个系各选5名同学,参加智力竞赛,他们的 成绩分别如下:
中文系:78 79 80 81 82
数学系:65 72
英语系:35 78 平均成绩 =80
80 88 95
89 98 100
求三系学生代表成绩的标准差???
S(中文系)=1.414(分) S(数学系)=10.8(分) S(英语系)=23.8(分)
离散量数分析
离散(中)量数分析 指的是用一个特别的数值 来反映一组数据相互之间的离散(中)程度.即各 组数据相对于平均数的差异程度(离中程度)。 差异程度小,平均数的代表性高;差异程度大, 代表性低。 常见的离散量数统计量有全距,标准差,异众比率, 和四分位差
1.全距(R)
示例:
某三个班各选5名同学参加测试.他们的成绩分别如 下 中文系:78, 79, 80, 81. 82 数学系:65, 72, 80, 88, 95 外语系:35, 78, 89, 98, 100 X = 80 X = 80 X = 80
Xc 为各组的组中值,f 为各组的频数,N 为总次数(
)
某中学初三甲班60人英语期中考试成绩 平均数、标准差计算表
中位数与平均数的比较
1)平均数要求计算所有的数值,而中位数只用到数 值的相对位置,一般说来平均数利用了更多的信息, 更全面和准确.
(2)平均数容易受到极端值的影响,中位数则不会 受到这种影响. 教材P359
数据预处理:缺损値处理、加权处理、变量重 新编码、创造新变量。 数据统计分析:单变量、双变量、多变量统计 分析、统计图、统计表
第一节、单变量描述统计
由一种变量的全部分数或观察值组成的一组或一 批数据称为一个分布。单变量数据的描述统计就 是对其分布情况进行说明。
单变量描述统计包括集中量数分析、离散量数分 析。
中位数(Md)
中位数(Md),又称中数,是频数分布上50%处的 数值。
将一组数据依大小顺序排列后,若数据的个数为 奇数个,就以位于最中间的那个数据作为中位数; 若数据的个数为偶数个,就以最中间的两个数据 的算术平均数作为中位数。
中位数的计算方法
例如,有一组数据依从小到大排列如下:62、65、 66、68、69、71、72。因为数据个数为奇数个, 所以排在最中间的数值68就是中位数,即Md=68。
又如,有一组数据依从大到小排列如下:98、95、 92、88、79、77、71、66。因为数据个数为偶 数个,所以排在最中间的两个数据88与79的算术 平均数就是中位数,即Md=(88+79)÷2=83.5。
算术平均数
通常称平均数,又称均数或均值。英文为Mean,故 以M表示。如果是由变量X计算得来的就记为 (读X 杠),现在一般都 以表示样本的平均数,以U 表示总体的平均数。 算术平均数就是各个变量值相加求和再除以变量的 总次数。
一.频数分布与频率分布
频数分布(Frequency Distribution),就是指一组 数据中取不同值的个案的次数分布情况,它一般 以频数分布表的形式表达。
频率分布(percentages distribution),是一组 数据中不同取值的频数相对于总数的比率分布情 况.常以百分比的形式来表达.
3.异从比率 是指非众数的次数与总体内全部总体单位的比率。异众 比率越小,众数的代表性越大。 4.四分位差 把一组数据按大小排列成序列,然后分成四个数据数目相 等的段落,各段落分界点上的数,叫四分位数。(即每组 占25%) 舍去资料中数值最高的 25 %和最低的 25 %,仅就中间 50 %数据求其量数作为离中量数,就是四分位差。 四分位差之间的间距越小,中位数的代表性越大。 (1)对定序类资料计算四分位差。 Q=Q3-Q1 (2)对定距类资料计算四分位差。
统计分析
统计分析方法是一种定量分析。它是进行科学预测 的重要方法。
统计分析的特点: (1)统计分析要以定性分析为基础; (2)统计分析源自文库法必须和其他分析结合运用; 统计分析有一套专门的方法和技术。
统计分析的过程:
数据录入: SPSS,Excel,Foxbase, SAS
数据清理:检查消除错误数据、补充漏录数据
问:以上三组数据分布有什么特点吗?
全距也叫极差,它是一组数据中,最大值与最小值之
差.
R=Xmax-Xmin
2.标准差
标准差:一组数据对其平均数的偏差平方的算术平均 数的平方根。一般以S表示
式中S(样本统计值)为标准差,X为各学生的成绩分 数, 为学生成绩的平均数,x为各学生成绩分数的离 差,n为学生(数据)数。
案例:编制频数分布表、频数分布图
某中学初三甲班60人期中英语考试分数
某中学初三甲班60人英语期中考试成绩 累积频数(频率)分布表
某中学初三甲班60人英语期中考试成绩 累积频数(频率)分布图
二、集中量数分析
集中量数就是代表数据分布集中趋势的量数。
集中量数分析指的是用一个典型值或代表值来反 映一组数据的一般水平,或者说反映这组数据向 这个典型值集中的情况。 最常见的集中量数有算术平均数(简称平均数,也 称为均值)、众数和中位数三种。