研究数据的收集与分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

❖ 描述统计是指用数学方法来整理和概括,用以反映现象分布特 征的一种统计分析方法,是一系列数字数据的统计方法。包括 数据的初步整理、数据集中趋势和离散均势的度量以及相关关 系的度量等几个方面。
❖ 例如,计算集中量数指标(算术平均数、中位数、众数等)来
反映数据分布的集中趋势;计算差异量数指标(如标准差、百
江西师范大学
❖ 1)方差和标准差 ❖ 方差和标准差是测度数据变异程度的最重要、最常
用的指标。方差是各个数据与其算术平均数的离差 平方的平均数,通常总体方差以σ2表示,样本方
差以S2表示。标准差又称均方差,是方差的平方 根,总体标准差用σ表示,样本标准差用S表示。
标准差是最常用的差异量数。 ❖ 由于方差、标准差的计算较为复杂,可用袖珍电子
表6—2 某校7年级3班54名学生的数学和英语成绩统计表
优 秀 良 好 中 及 格 不及 合 计 格
数学 6
9
29
7
3
54
英语 5
10 28
9
2
54
江西师范大学
❖ (3)复合表 (表6-3)
表6—3 某校6年级学生操行评定结果统计表
一班 二班 三班 四班 合计
优秀 男女
7
6
6
8
6
7
5
6
24 27
良好 男女
江西师范大学
❖ 上述三种集中量数在表示一组观测数据的集中趋势 时各有其优点与不足。详见表6-7。
表6-7 众数、中位数、平均数特征比较
江西师范大学
❖ (2)差异量数 (差异变量) ❖ 差异量数是代表一组数据相对于平均值或其他集中
量变异程度或离散程度的量数。它反映了数据分布 的离中趋势,即分化的程度。一般来讲,数据分布 越分散,差异量数愈大,则集中量数的代表性愈小 ;数据分布越集中,差异量数愈小,则集中量数的 代表性愈大。 ❖ 在此仅介绍统计分析中最常用的方差、标准差和变 异系数、标准分。
❖ 从公式可看出,差异系数的大小与平均数的大小成 反比关系。标准差系数主要用于对不同组别数据的 平均数代表性的比较。标准差系数大的说明该组数 据平均指标代表性就小,说明数据分布的离散程度 大,即越偏离平均位置;标准差系数小的说明该组 数据平均指标代表性就大,说明数据分布的离散程 度小。
江西师范大学
❖ 3)标准分 ❖ 为了把不同测验或不同学科的成绩进行相对比较,
常采用标准分数量表。 ❖ 标准分数也称Z分数,通常用符号Z来表示。标准
分数是某一原始分数与平均数之差除以标准差所得 之商。计算方法见表6-6中的公式6-13。
江西师范大学
❖ (3)相关系数
❖ 所谓相关,指变量之间的相互关系。在统计学中,一般将 描述和分析两个或两个以上变量之间相关的性质及其相关 程度的过程,称之为相关分析。
❖ 作为样本相关系数,常用字母r表示;作为总体相关系数, 常用字母ρ表示。
❖ 相关系数的数值范围是介于–1与+1之间(即–1≤r≤1), 常用小数形式表示,一般要取小数点后两位数字来表示, 以便比较精确地描述其相关程度。
❖ 两个变量之间的相关程度用相关系数r的绝对值表示,其绝 对值越接近1,表明两个变量的相关程度越高;其绝对值 越接近于0,表明两个变量相关程度越低。如果其绝对值 等于1,则表示两个变量完全直线相关。如果其绝对值为 零,则表示两个变量完全不相关(不是直线相关)。
江西师范大学

第一节 研究数据的分类与整理
❖ 一、研究数据的类型
❖ 1.根据数据质量的好坏分为好数据和坏数据。
❖ 2.根据统计数据得到的途径(含状态)分为观 测数据和实验数据。
❖ 3.按照数据的性质分为定性数据和定量数据。
❖ 4.根据统计数据获得来源不同,分为原始数据 和二手数据。
❖ 5.根据数据的分布情况可分为连续型数据和离 散型数据。
图上,我们可以看出各组数据分布的次数虽然各有 不同,但大部分数据都趋向于某点,这种向某点集 中的现象,称为集中趋势。而代表数据的集中趋势 的统计量被称为集中量数,也叫集中变量。集中变 量是用来反映一系列数据整体平均水平的数值。 ❖ 常用的集中量数有算术平均数、中数、众数、几何 平均数等。
江西师范大学
13 15 12 14 14 15 13 15 52 59
合格 男女
6
4
7
5
5
5
6
4
24 18
须努力 男女
合计
1
0 52
1
1 54
1
1 54
2
1 52
5
3 212
江西师范大学
❖ 3.统计图
❖ 分类变量(定性变量)和度量变量(定量变量)作图 。
❖ 分类变量常用的图形:
❖ (1)圆饼图
表6—4 某市2003年各类中等学校在校学生数 单位:万人
江西师范大学
❖ 三、定性分析基本过程 ❖ (一)资料的审核与评价 ❖ 1.对资料源进行复查 ❖ 2.对经过初步整理的资料进行印证 ❖ 3.对资料获得的方法再审查 ❖ 4.对文字资料说明的事实进行理性分析 ❖ 5.评价资料有效性 ❖ (二)资料整理 ❖ (三)资料分析,探索规律 ❖ 四、定性分析的局限性
江西师范大学
❖ 2)中位数
❖ 中位数是一组按大小顺序排列的数据中位置居中的数值, 简称中数。中位数是居中间位置的数,代表一组数据的平 均水平,所以它是集中量数的一种。
❖ 对于未经整理的原始数据,首先将其依大小顺序排列,然 后,观察数据总个数:如果数据的个数为奇数时,就取位 于中央的数据作为中位数;如果数据的个数为偶数时,则 取位于最中间的两个数据的算术平均数为中位数。例如, 下面7个数据2,4,6,7,9,10,12的中位数是7;而下 面的8个数据3,4,6,8,9,11,13,14的中位数则为 (8+9)/2=8.5。中位数的人工计算可参考表6-6中的公 式6-4和公式6-5。
❖ 3.研究指标 ❖ 定类指标、定序指标、定距指标和定比指标。 ❖ 4.参数和统计量 ❖ 5.次数(常用符号f代表) ❖ 6.误差 ❖ (1)系统误差 ❖ (2)随机误差 ❖ (3)抽样误差
江西师范大学
❖ (二)统计分析的分类
❖ 统计分析主要包括描述统计、推断统计和实验设计辅助统计。
❖ 1.描述统计
分位距)来反映数据分布的离散程度;计算相关量数指标(如
相关系数)来反映数据之间的相关程度。一般情况下,集中量
数、差异量数、相关量数均可借助计算机等辅助工具进行运算
。如遇特殊情况,可参照表6-6相关公式进行人工计算。(见
WORD文档附件)
江西师范大学
❖ (1)集中变量(集中量数) ❖ 在将数据资料进行初步整理所编制的次数分布表或
图6-9 某学校男生身高分布图
江西师范大学
❖ (4)多边形图(折线图)(图6-10)
图6-10 某工厂某产品月生产量图
江西师范大学
❖ (5)时间序列图(图6-11)
图6-11 某公司1981-1983三年的销售额
江西师范大学
❖ (五)作图注意事项 ❖ 1.作图优秀的标准:在最短的时间内用最少的笔墨在
江西师范大学
❖ 3)众数
❖ 众数也称范数或密集数,它通常是指在一组数据中 出现次数最多的那个数值。在一组数据中,如果某 个数据是众数,那就意味着这个数值至少应当出现 两次。如果同时出现两个数值都具有最高的并且相 同的次数,那么,这组数据就有两个众数;如果三 个或更多的数据具有相同的最高次数,那么就是有 多个众数;如果全部数据出现的次数都不超过1次 ,则可说这组数据没有众数或众数不存在,但不能 说众数是0。众数的人工计算公式见表6-6中的公 式6-6和6-7。
❖ 一、定性分析的特征
❖ (一)定性分析是对自然情境下的现象的研究
❖ (二)定性分析以描述性资料为主
Baidu Nhomakorabea
❖ (三)定性分析既关注结果,更关注过程
❖ (四)定性分析具有归纳的取向
❖ (五)定性分析具有整体的观点
江西师范大学
❖ 二、常用的定性分析方法 ❖ (一)因果分析法 ❖ (二)比较分析法 ❖ 1.纵向比较和横向比较 ❖ 2. 定性比较与定量比较 ❖ 3. 单项比较和综合比较 ❖ (三)归纳和演绎法 ❖ (四)分析和综合法 ❖ (五)扎根理论
❖ 1)算术平均数 ❖ 算术平均数通常称为平均数、均值或均数,是统计
学中最常用的一种集中量数。其最大优点就是稳定 性好。它是各变量值的总和除以变量总次数所得之 商。根据不同情况可分别采取简单算术平均数、频 数算术平均数、加权算术平均数的计算方法。人工 计算可见表6-6中公式6-1、6-2、6-3。
年份
中等学校
其中
中等专业学校
普通 职业 技 学校 学校 工
学 校
2003年
112.49
14.12
79.9 11.3 7.0
4
4
9
图6—2 某市2003年各类中等学校在校学生数圆饼图
江西师范大学
❖ (2)条形图 ❖ 1)柱形图(图6-3)
图6-3 初一某学生的各科成绩
江西师范大学
❖ 2)带形图(图6-4)
—89 ❖ 5.求组中值 ❖ 组中值=精确下限+组距/2 ❖ 如以“10”为组距,则“80—90”一组的组中值为:组中值=7
9.5+10/2=84.5 ❖ 6.归类划记
江西师范大学
❖ (四)绘制统计图表 ❖ 1.统计表 ❖ 统计表的结构(见WORD文档附件表6-1)
江西师范大学
❖ 2.统计表的种类 ❖ (1)简单表 ❖ (2)分组表 (如表6-2)
最小的空间里给观众最多的思考。 ❖ 2.根据所依据的任务绘制统计图: ❖ 1)用来比较统计指标时:直线图 条形图 带形图 ❖ 2)表示总体结构:条形图 圆饼图 ❖ 3)表现现象的发展过程:线形图 ❖ 4)表示现象间的依存关系:折线图 ❖ 5)总体各单位的分配:次数分布图
江西师范大学

第二节 定性分析
❖ 变量相关的方向通过相关系数r所具有的符号来表示,“+” 号表示正相关,即0≤r≤1。“﹣”表示负相关,即0≥r≥﹣ 1。
❖ 第六章 研究数据的收集与分析
江西师范大学
❖ 学习指南 ❖ 本章主要介绍研究数据的分类与整理方法,在此基
础上介绍定性分析的特征、常用方法、分析的基本 过程、定性分析的局限性。统计分析时描述统计及 推论统计的科学运用,以及社会网络分析的方法及 适用条件。计算机在统计分析中的作用、基本步骤 及常用的SPSS统计分析软件使用介绍。
江西师范大学
❖ 二、研究数据收集方法(图6-1)
图6-1
江西师范大学
❖ 三、研究数据的整理 ❖ (一)数据检查 ❖ (二)数据分类 ❖ (三)编制次数分布表 ❖ 1.求全距(用字母R表示) ❖ 2.定组数
江西师范大学
❖ 3.求组距(用字母i表示) ❖ 组距i=(全距+1)/组数 ❖ 4.定组限 ❖ 一般多用以下两种表示: ❖ 1)60—70,70—80,80—90 2)60—69,70—79,80
图6-4 我国2001-2004年废水排放量统计
江西师范大学
❖ 3)复合条形图(图6-5)
图6-5 四个班级学生操行评定结果比较图
江西师范大学
❖ 4)单式条形图 (图6-6)
表6—5 某中学毕业生实验能力问卷调查结果的次数分布表
实验能力 很 强(A) 较 强(B) 一 般(C) 较 差(D) 很 差(E) 总和
计算器,这样计算就比较方便。其人工计算方法可 参考表6-6中的公式6-8、6-9、6-10、6-11。
江西师范大学
❖ 2)变异系数
❖ 变异系数又称标准差系数,它是一组数据的标准差 与其相应的均值之比,是测度数据离散程度的相对
指标,它不具有实际测量单位。常用符号CV表示
。计算方法见表6-6中的公式6-12。
江西师范大学

第三节 定量分析
❖ 定量分析就是应用数理统计的一般原理和方法,对 研究过程中所搜集来的数据资料进行整理、分析, 并以此为依据,进行科学推断,从而揭示蕴含于其 中的客观规律的一种研究方法。
❖ 在各种定量分析方法中,统计分析和社会网络分析
应用最广泛。
江西师范大学
❖ 一、统计分析 ❖ (一)统计分析的基本概念 ❖ 1.总体、个体、样本、抽样 ❖ 2.变量 ❖ 变量的基本类型: ❖ (1)相关变量与因果变量 ❖ (2)主体变量与客体变量 ❖ (3)直接测量变量和间接测量变量 ❖ (4)操作规程性变量与非操作性变量 ❖ (5)研究变量和非研究变量 ❖ (6)随机变量 ❖ (7)分类变量和度量变量(定性变量和定量变量)江西师范大学
次数 10 29 85 46 2 172
图6—6 某中学毕业生实验能力次数分布图
江西师范大学
❖ 度量变量常用的图形: ❖ (1)点线图 (图6-7)
图6-7 甲乙两市人均医疗费变化图
江西师范大学
❖ (2)盒形图 (图6-8)
图6-8 两地区高三男生身高数据图
江西师范大学
❖ (3)直方图 (图6-9)
相关文档
最新文档