第六章 研究数据的收集与分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图6-11 某公司1981-1983三年的销售额
江西师范大学
(五)作图注意事项 1.作图优秀的标准:在最短的时间内用最少的笔墨在 最小的空间里给观众最多的思考。 2.根据所依据的任务绘制统计图: 1)用来比较统计指标时:直线图 条形图 带形图 2)表示总体结构:条形图 圆饼图 3)表现现象的发展过程:线形图 4)表示现象间的依存关系:折线图 5)总体各单位的分配:次数分布图
图6-7 甲乙两市人均医疗费变化图
江西师范大学
(2)盒形图 (图6-8)
图6-8 两地区高三男生身高数据图
江西师范大学
(3)直方图 (图6-9)
图6-9 某学校男生身高分布图
江西师范大学
(4)多边形图(折线图)(图6-10)
图6-10 某工厂某产品月生产量图
江西师范大学
(5)时间序列图(图6-11)
单位:万人
年 份
图6—2 某市2003年各类中等学校在校学生数圆饼图
江西师范大学
(2)条形图 1)柱形图(图6-3)
图6-3 初一某学生的各科成绩
江西师范大学
2)带形图(图6-4)
图6-4 我国2001-2004年废水排放量统计
江西师范大学
3)复合条形图(图6-5)
图6-5 四个班级学生操行评定结果比较图
江西师范大学
2)中位数 中位数是一组按大小顺序排列的数据中位置居中的数值, 简称中数。中位数是居中间位置的数,代表一组数据的平 均水平,所以它是集中量数的一种。 对于未经整理的原始数据,首先将其依大小顺序排列,然 后,观察数据总个数:如果数据的个数为奇数时,就取位 于中央的数据作为中位数;如果数据的个数为偶数时,则 取位于最中间的两个数据的算术平均数为中位数。例如, 下面7个数据2,4,6,7,9,10,12的中位数是7;而下 面的8个数据3,4,6,8,9,11,13,14的中位数则为 (8+9)/2=8.5。中位数的人工计算可参考表6-6中的公 式6-4和公式6-5。
0
1 1 1
52
54 54 52
合计
24
27
52
59
24
18
5
3
212
江西师范大学
3.统计图 分类变量(定性变量)和度量变量(定量变量)作图 。 分类变量常用的图形: (1)圆饼图
表6—4 某市2003年各类中等学校在校学生数
其 中 中等学校 中等专业学校 2003年 112.49 14.12 普通 学校 79.9 4 职业 学校 11.3 4 技 工 学 校 7.0 9
不及 格 3 2
合计 54 54
江西师范大学
(3)复合表 (表ห้องสมุดไป่ตู้-3)
表6—3 某校6年级学生操行评定结果统计表
优秀 男 女 良好 男 女 合格 男 女 须努力 男 女 合计
一班
二班 三班 四班
7
6 6 5
6
8 7 6
13
12 14 13
15
14 15 15
6
7 5 6
4
5 5 4
1
1 1 2
江西师范大学
3)标准分 为了把不同测验或不同学科的成绩进行相对比较, 常采用标准分数量表。 标准分数也称Z分数,通常用符号Z来表示。标准 分数是某一原始分数与平均数之差除以标准差所得 之商。计算方法见表6-6中的公式6-13。
江西师范大学
(3)相关系数 所谓相关,指变量之间的相互关系。在统计学中,一般将 描述和分析两个或两个以上变量之间相关的性质及其相关 程度的过程,称之为相关分析。 作为样本相关系数,常用字母r表示;作为总体相关系数, 常用字母ρ表示。 相关系数的数值范围是介于–1与+1之间(即–1≤r≤1), 常用小数形式表示,一般要取小数点后两位数字来表示, 以便比较精确地描述其相关程度。 两个变量之间的相关程度用相关系数r的绝对值表示,其绝 对值越接近1,表明两个变量的相关程度越高;其绝对值 越接近于0,表明两个变量相关程度越低。如果其绝对值 等于1,则表示两个变量完全直线相关。如果其绝对值为 零,则表示两个变量完全不相关(不是直线相关)。 变量相关的方向通过相关系数r所具有的符号来表示,“+” 号表示正相关,即0≤r≤1。“﹣”表示负相关,即0≥r≥﹣ 1。
江西师范大学
第一节 研究数据的分类与整理 一、研究数据的类型 1.根据数据质量的好坏分为好数据和坏数据。 2.根据统计数据得到的途径(含状态)分为观 测数据和实验数据。 3.按照数据的性质分为定性数据和定量数据。 4.根据统计数据获得来源不同,分为原始数据 和二手数据。 5.根据数据的分布情况可分为连续型数据和离 散型数据。
江西师范大学
(1)集中变量(集中量数) 在将数据资料进行初步整理所编制的次数分布表或 图上,我们可以看出各组数据分布的次数虽然各有 不同,但大部分数据都趋向于某点,这种向某点集 中的现象,称为集中趋势。而代表数据的集中趋势 的统计量被称为集中量数,也叫集中变量。集中变 量是用来反映一系列数据整体平均水平的数值。 常用的集中量数有算术平均数、中数、众数、几何 平均数等。
3.研究指标 定类指标、定序指标、定距指标和定比指标。 4.参数和统计量 5.次数(常用符号f代表) 6.误差 (1)系统误差 (2)随机误差 (3)抽样误差
江西师范大学
(二)统计分析的分类 统计分析主要包括描述统计、推断统计和实验设计辅助统计。 1.描述统计 描述统计是指用数学方法来整理和概括,用以反映现象分布特 征的一种统计分析方法,是一系列数字数据的统计方法。包括 数据的初步整理、数据集中趋势和离散均势的度量以及相关关 系的度量等几个方面。 例如,计算集中量数指标(算术平均数、中位数、众数等)来 反映数据分布的集中趋势;计算差异量数指标(如标准差、百 分位距)来反映数据分布的离散程度;计算相关量数指标(如 相关系数)来反映数据之间的相关程度。一般情况下,集中量 数、差异量数、相关量数均可借助计算机等辅助工具进行运算 。如遇特殊情况,可参照表6-6相关公式进行人工计算。(见 WORD文档附件)
江西师范大学
1)方差和标准差 方差和标准差是测度数据变异程度的最重要、最常 用的指标。方差是各个数据与其算术平均数的离差 平方的平均数,通常总体方差以σ2表示,样本方 差以S2表示。标准差又称均方差,是方差的平方 根,总体标准差用σ表示,样本标准差用S表示。 标准差是最常用的差异量数。 由于方差、标准差的计算较为复杂,可用袖珍电子 计算器,这样计算就比较方便。其人工计算方法可 参考表6-6中的公式6-8、6-9、6-10、6-11。
江西师范大学
(四)绘制统计图表
1.统计表 统计表的结构(见WORD文档附件表6-1)
江西师范大学
2.统计表的种类 (1)简单表 (2)分组表 (如表6-2)
表6—2 某校7年级3班54名学生的数学和英语成绩统计表
优秀 数学 英语 6 5
良好 9 10
中 29 28
及格 7 9
江西师范大学
第二节 定性分析 一、定性分析的特征 (一)定性分析是对自然情境下的现象的研究 (二)定性分析以描述性资料为主 (三)定性分析既关注结果,更关注过程 (四)定性分析具有归纳的取向 (五)定性分析具有整体的观点
江西师范大学
二、常用的定性分析方法 (一)因果分析法 (二)比较分析法 1.纵向比较和横向比较 2. 定性比较与定量比较 3. 单项比较和综合比较 (三)归纳和演绎法 (四)分析和综合法 (五)扎根理论
江西师范大学
二、研究数据收集方法(图6-1)
图6-1
江西师范大学
三、研究数据的整理 (一)数据检查 (二)数据分类 (三)编制次数分布表 1.求全距(用字母R表示) 2.定组数
江西师范大学
3.求组距(用字母i表示) 组距i=(全距+1)/组数 4.定组限 一般多用以下两种表示: 1)60—70,70—80,80—90 2)60—69,70—79,80 —89 5.求组中值 组中值=精确下限+组距/2 如以“10”为组距,则“80—90”一组的组中值为:组中值=7 9.5+10/2=84.5 6.归类划记
一、统计分析 (一)统计分析的基本概念 1.总体、个体、样本、抽样 2.变量 变量的基本类型: (1)相关变量与因果变量 (2)主体变量与客体变量 (3)直接测量变量和间接测量变量 (4)操作规程性变量与非操作性变量 (5)研究变量和非研究变量 (6)随机变量 江西师范大学 (7)分类变量和度量变量(定性变量和定量变量)
江西师范大学
三、定性分析基本过程 (一)资料的审核与评价 1.对资料源进行复查 2.对经过初步整理的资料进行印证 3.对资料获得的方法再审查 4.对文字资料说明的事实进行理性分析 5.评价资料有效性 (二)资料整理 (三)资料分析,探索规律 四、定性分析的局限性
江西师范大学
2)变异系数 变异系数又称标准差系数,它是一组数据的标准差 与其相应的均值之比,是测度数据离散程度的相对 指标,它不具有实际测量单位。常用符号CV表示 。计算方法见表6-6中的公式6-12。 从公式可看出,差异系数的大小与平均数的大小成 反比关系。标准差系数主要用于对不同组别数据的 平均数代表性的比较。标准差系数大的说明该组数 据平均指标代表性就小,说明数据分布的离散程度 大,即越偏离平均位置;标准差系数小的说明该组 数据平均指标代表性就大,说明数据分布的离散程 度小。
第六章
研究数据的收集与分析
江西师范大学
学习指南 本章主要介绍研究数据的分类与整理方法,在此基 础上介绍定性分析的特征、常用方法、分析的基本 过程、定性分析的局限性。统计分析时描述统计及 推论统计的科学运用,以及社会网络分析的方法及 适用条件。计算机在统计分析中的作用、基本步骤 及常用的SPSS统计分析软件使用介绍。
江西师范大学
3)众数 众数也称范数或密集数,它通常是指在一组数据中 出现次数最多的那个数值。在一组数据中,如果某 个数据是众数,那就意味着这个数值至少应当出现 两次。如果同时出现两个数值都具有最高的并且相 同的次数,那么,这组数据就有两个众数;如果三 个或更多的数据具有相同的最高次数,那么就是有 多个众数;如果全部数据出现的次数都不超过1次 ,则可说这组数据没有众数或众数不存在,但不能 说众数是0。众数的人工计算公式见表6-6中的公 式6-6和6-7。
江西师范大学
4)单式条形图 (图6-6)
表6—5 某中学毕业生实验能力问卷调查结果的次数分布表 实验能力 很 强(A) 较 强(B) 次数 10 29
一 般(C)
较 差(D) 很 差(E) 总和
85
46 2 172
图6—6 某中学毕业生实验能力次数分布图
江西师范大学
度量变量常用的图形: (1)点线图 (图6-7)
江西师范大学
上述三种集中量数在表示一组观测数据的集中趋势 时各有其优点与不足。详见表6-7。
表6-7 众数、中位数、平均数特征比较
江西师范大学
(2)差异量数 (差异变量) 差异量数是代表一组数据相对于平均值或其他集中 量变异程度或离散程度的量数。它反映了数据分布 的离中趋势,即分化的程度。一般来讲,数据分布 越分散,差异量数愈大,则集中量数的代表性愈小 ;数据分布越集中,差异量数愈小,则集中量数的 代表性愈大。 在此仅介绍统计分析中最常用的方差、标准差和变 异系数、标准分。
江西师范大学
1)算术平均数 算术平均数通常称为平均数、均值或均数,是统计 学中最常用的一种集中量数。其最大优点就是稳定 性好。它是各变量值的总和除以变量总次数所得之 商。根据不同情况可分别采取简单算术平均数、频 数算术平均数、加权算术平均数的计算方法。人工 计算可见表6-6中公式6-1、6-2、6-3。
江西师范大学
第三节 定量分析 定量分析就是应用数理统计的一般原理和方法,对 研究过程中所搜集来的数据资料进行整理、分析, 并以此为依据,进行科学推断,从而揭示蕴含于其 中的客观规律的一种研究方法。 在各种定量分析方法中,统计分析和社会网络分析 应用最广泛。
江西师范大学