第六章_调查资料的统计分析
第六章市场调查资料的整理与分析
第二节 市场调查资料的整理
❖ 一、整理的意义和原则 ❖ 资料整理是指根据研究目的和要求,运用列表
、作图等方法,对调查资料进行科学的加工、 归纳和简缩,使之系统化、条理化,成为反映 总体特征的综合资料的工作过程。
整理资料要遵循以下原则
整理资料 的原则
条理化
系统化
pany Logo
二、分类或分组
❖ 〔一〕分类或分组的涵义 ❖ 调查资料的分类,就是按照品质标志把调查得到的资料
❖ 1.实验的各种环境条件是否具有一般的典型代 表性。
❖ 2.测定某一因素对实验对象的影响作用时,其 他因素是否得以控制。
❖ 3.实验组的选定及其所参照的控制组确实定是 否具有科学性。
❖ 4.实验进行的次数或者选定的样本是否足以说 明问题,实验数据是否正确无误。
〔三〕对询问调查法所得资料的审核
❖ 1.询问的问题是否符合调查目的,是否恰当。 ❖ 2.被调查者的意见是否受了某些人的影响而未
❖ 5.结论和建议
❖ 结论和建议是撰写综合的分析报告的主要目的 。这局部包括对引言和正文局部所提出的主要 内容的总结,提出如何利用已证明和正文局部 所提出的主要内容的总结,提出如何利用已证 明为有效的措施和解决某一具体问题可供选择 的方案与建议。结论和建议与正文局部的论述 要紧密对应,不可以提出无论据的结论,也不 要没有结论性意见的论证。
档案管理教案 第六章 档案登记和统计
第六章档案登记和统计
案例:
××服装公司的档案室保存有公司的文书档案、设计档案、经营档案、设备档案、音像档案等。由于该档案室忽视了档案日常管理过程的监控,一些管理环节没有进行必要的登记和记录,导致存在下列问题:
一、档案收进、入库、销毁等变化情况心中无数。一次,总经理检查档案室工作,询问到相关情况时,档案室主任拿不出确切的数字汇报,而只能凭借记忆和经验说出大概的情况。总经理对此很不满意,并指示档案室改进工作,加强日常管理和监督。
二、档案借阅、利用等情况不明。一次,公司营销部主任向档案室调阅关于前两年销售工作的文件,在案卷目录上查到了相关文件的条目,但是在库房中却找不到案卷。后几经查找,才发现有关的案卷已被设计部的××设计师借阅。
三、档案管理业务状况无从查考。例如:档案室对库房中档案的保存位置进行调整、对损坏的档案进行修复、对库房设备进行维护等,这些活动档案室都没有做相关记录,造成事后出现问题时无法查考核实工作质量及追究责任。
总经理对档案室的这种情况提出了批评,并指示他们完善各个环节的登记制度,印制登记表格等文件,加强过程的监控。
简析:
档案工作的进展和质量一方面是通过制度和标准来检验;另一方面就是依靠登记和统计的手段进行记录与反馈。
这个案例告诉我们:档案登记和统计工作贯穿于档案管理活动的各个环节,可以直接准确地反映问题、责任人员等各方面情况。做好它,可以对管理质量进行全程监控。
第一节档案登记和统计概述
一、档案登记和统计的一般概念:
(一)档案登记:
档案登记,是对档案管理活动中所有重要的事实、行为和数据进行随时记录的工作。登记有两种类型:一种是带有司法行为性质的认证性登记,如婚姻登记,商标、专利、工商营业执照的注册登记等等;一种是在各项日常管理活动中对各种事实、行为的工作记录性登记,如会客登记、出入库登记等。本章所讲的档案登记是属于第二种类型的工作记录性登记,这种登记的目的与作用在于对管理活动中发生的种种较为重要的事实、行为、现象、数字等进行随时记录,以把握整个管理工作的进程与状态。
第六章 咨询调查
第六章咨询调查
一、调查资料
管理咨询时,应明确所要调查的资料类型,以及如收集这些资料。
1. 项目的性质决定所需收集的数据类型。数据往往包括外部数据和内部数据。收集数据的目的是收集一定量的客观事实。
2. 数据收集类型的抉择不仅会受到客户组织明显商业考虑的影响,而且还会受到组织内部其他文化和政治因素的影响。
(一)内部数据(试分析咨询师收集内部业务数椐的来源途径)
对于内部资料的来源,咨询师应该求助于:
1. 销售业绩
(1)公司账目和报告;
(2)业务计划和预算;
(3)技术记录和销售记录;
(4)个人纪录;
(5)有关关键供应商和顾客的记录。
2. 财务健康性
组织的财务健康性可通过各种财务比率来判断。如权益比例、长期负债比例、库存销售比例、资本回报率、权益回报率、回款利润率以及营业利润等。
3. IT信息
如:IT的目标是什么,用户对系统的认识如何等。
4. 人力资源
在职员工数量、职务、人员流动率、报酬、雇员态度、公司文化等。
(二)外部数据(简述咨询调查的外部数据主要包括哪些内容?)
1. 股东数据;
2. 供应商数据;
3. 顾客数据;
4. 市场数据;
5. 竞争力数据;
6. 竞争对手。
(三)注意事项
收集数据时,要注意:
1. 历史数据;
2. 收集清单;
4. 资料保密。
二、调查方法
收集数据资料是管理咨询工作最费神、费力的工作,但它又是管理咨询最重要的的基础工作。可以说,一切咨询成败与否的关键在于对事实的深入调查。
(一)方法归类(拉大网法和定点撒网法)
收集资料的途径:拉大网法和定点撒网法。
1. 拉大网法:是指不管重点或非重点。将来访者的过去、现在、自身、环境等所有资料都一股脑地收集起来。
社会调查研究方法——统计分析
具体步骤: “分析”——“降维”——“因子分析”
(1)将问卷的主观题部分全部 选择为“变量”。点击“描述”, 设置如下:
社会调查研究方法——统计分析
汇报人:殷文文 日期:2016.12.23
一、统计分析概述
1、定义 统计分析就是运用统计学方法对调查得到的数据资 料进行定量分析,以揭示事物内在的数量关系、规律和 发展趋势的一种资料分析方法。
2、统计分析的作用
(1)统计分析的方法提供一种清晰精确的形式化语言, 对资料进行简化和描述
集中趋势的描述指标 (a)算术平均值 (b)几何平均值 (c)众数 (d)中位数
描述性统计分析
(2)离中趋势分析
数据的离散程度是数据分布的另一个重要特征,是指各变量值远离中心值 的程度,因此也叫离中趋势。
离中趋势的描述指标 (a)极差:也称全距,是一组数据的最大值和最小值的差。 (b)四分位数:处在数据一半位置的观测值被称为中位数,则处在数据的 25%和75%位置的观测值分别叫做下十分位数(Q1)和上四分位数(Q3), 四分位差即为(Q3-Q1)。 (c)方差与标准差:方差是各变量值与其均值的平均离散程度,标准差为 方差的平方根。(标准差越大,表示分布越分散;而标准差越小,表示分布越集 中。 )
第六章 调查法
(2)空缺率太高,问卷漏答项在三项及其以上者;
(3)问卷答案呈现规律性作答的问卷;
(4)答案雷同的问卷;
(5)卷面存在前后矛盾现象,不符合逻辑和常识性的答卷;
(6)反向记分题目与原题目得分差异在3 分以上的问卷。
此外,也可以借助统计学的极端值和因子分析来剔除无效问卷。
3.通俗性原则
即表述问题的语言要通俗,不要给调查对象陌生难以理解的语言。
4.准确性原则
即表述问题的语言要准确,不要使用模棱两可、含混不清或容易产生歧义的语言或概念。
5.客观性原则
即表述问题的态度要客观,不要带有诱导性或倾向性言辞。
6.非否定性原则
即要避免使用否定句形式来表述问题。
7.可接受原则
即必领考虑调查对象是否自愿、真实地回答问题。凡调查对象不可能自愿、真实回答的问题,都不应该正面提出。
3.取得权威机枃的支持
进行邮寄问卷调查时,如果能够与某些权威机构(如政府主管部门、行业协会)合作,得到权威机构的支持和协助,则对于提高受访者参与调查的积极性有很大帮助。
4.采用合适的问卷调查方式
调查方式对问卷的回收率也有重大影响。根据一般经验,报刊问卷的回收率一般为 10%~20%,邮政问卷的回收率一般为 40%~70%,送发问卷的回收率一般为 80%~90%,访问问卷的回收率最高。因此,在条件许可的情况下,应尽可能采用回收率高的问卷调查方式。
统计学第六章 抽样调查
第三节
抽样平均误差
抽样误差的概念和理解 抽样误差: 抽样误差:来源于登记性误差和代表性误差 登记性误差 调查误差或工作误差,指在调查,编辑,编码, 调查误差或工作误差,指在调查,编辑,编码,汇 总过程中由于观察,测量,登记, 总过程中由于观察,测量,登记,计算上的差错或被调 查者提供虚假资料而引起的误差. 查者提供虚假资料而引起的误差. 这种误差的直接表现就是没有真实客观地搜集或记录 被调查单位的标志值或标志特征, 被调查单位的标志值或标志特征,从而使所计算的统计量 偏离其真实值. 偏离其真实值. 登记性误差存在于所有的统计调查中, 登记性误差存在于所有的统计调查中,而且调查的范 围越大,调查单位越多,产生误差的可能性越大. 围越大,调查单位越多,产生误差的可能性越大. 登记性误差与测量工具的精度,测量技术, 登记性误差与测量工具的精度,测量技术,调查人员 的责任心,被调查者的合作态度等密切相关. 的责任心,被调查者的合作态度等密切相关.
n N
▼抽样总体(样本)特征的描述 抽样总体(样本) 抽样总体(样本)特征也是通过均值和标准差来描述的. 抽样总体(样本)特征也是通过均值和标准差来描述的. 不是确定的,唯一的,因此抽样指标也不是确定的, 不是确定的,唯一的,因此抽样指标也不是确定的,唯 一的,是样本变量的函数,是随机变量. 一的,是样本变量的函数,是随机变量. 变量总体: 变量总体:
数据统计分析的方法
数据统计分析的方法
数据统计分析是指利用统计学和数学方法对收集到的数据进行处理、分析和解释的过程。数据统计分析的方法包括:
1. 描述统计分析:描述统计分析是对数据进行整理、总结和描述的过程。常用的方法包括计数、求和、平均数、中位数、众数、标准差、方差、分位数等。
2. 探索性数据分析(EDA):探索性数据分析是通过可视化和统计方法来发现数据集中的模式、关联和异常。常用的方法包括绘制直方图、散点图、箱线图、相关系数分析等。
3. 假设检验:假设检验是利用统计学方法来判断一个观察结果是否与某个假设一致的过程。常用的方法包括t检验、方差分析、卡方检验、置信区间估计等。
4. 回归分析:回归分析用于确定自变量和因变量之间的关系。常用的方法包括线性回归、多元回归、逻辑回归等。
5. 时间序列分析:时间序列分析用于对一系列按时间顺序排列的数据进行建模和分析。常用的方法包括趋势分析、周期性分析、季节性分析、移动平均等。
6. 非参数统计方法:非参数统计方法不依赖于数据分布的假设,适用于对分布未知或不符合正态分布的数据进行分析。常用的方法包括Wilcoxon符号秩检验、
Mann-Whitney U检验、Kruskal-Wallis H检验等。
7. 多元统计分析:多元统计分析是指同时考虑多个自变量对因变量的影响以及自变量之间的相互作用的分析方法。常用的方法包括主成分分析、因子分析、判别分析等。
根据研究目的和数据特点,可以选择合适的分析方法进行数据统计分析。
调查资料的整理与分析
情境一 调查资料的整理
• (3) 划 记 法 。 划 记 法 , 事 先 设 计 好 空 白 的 分 组 统 计 表 , 然后对所有问卷中的相同问项的不同答案一份一份地 进行查看,并用划记法划记 (常用 “正‘),全部问卷查看 与划记完毕,即可统计出相同问项下的不同答案的次数, 最后录入正式的分组统计表上。
上一页 下一页 返回
情境一 调查资料的整理
• (11) 帕累托图。 帕累托图, 主要用来描述财富分配、 库存物资、 客户分布、 产品销售等分布不均匀的现象。一般是将所研究的现象 分为A、B、C三类,A类的单位数占10%~20%,而指标值占 70%~80%;B类的单位数占20%~25%,而指标值占15%~20%; C 类的单位数占60%~65%,而指标值占5%~10%,然后依据累计频率 制图。图3-12所示为某厂产品销售客户A、B、C分类。
• (4) 卡片法。 卡片法, 利用摘录卡作为记录工具, 对开放式问题的回答 或深层访谈的 回答进行过录或记录, 然后依据这些卡片进行 “ 意见 归纳处理’ 。
上一页 下一页 返回
情境一 调查资料的整理
• 五、 市场调查资料的陈示
• ( 一) 统计表 • 1. 统计表的含义 • 统计表, 是以纵横交叉的线条所绘制的表格来陈示数据的一种形式。 • 2. 统计表的构成 • 统计表从形式上看, 是由总标题、 横行标题、 纵栏标题、 指标数
统计学第六章抽样调查
❖ 区间估计
点估计
❖ 从总体中抽取一个样本,根据该样本的 统计量对总体的未知参数作出一个数值 点的估计
▪ 例如: 用样本均值作为总体未知均值的估计 值就是一个点估计
❖ 点估计没有给出估计值接近总体未知参数 程度的信息
点估计
❖ 常用的点估计量有:
❖
落在总体均值某一区间内的样本
x = Zx
x_
有偏样本方差和标准差是总体方差和标准差的一致、 有效估计量,但不是无偏估计量
无偏样本方差和标准差是总体方差和标准差的一致、 有效、无偏估计量
评价估计量的三个评价标准
❖ 无偏性 ❖ 有效性 ❖ 一致性
估计量的优良性准则——无偏性
❖ 无偏性:估计量的数学期望等于被估计的总 体参数
P( X )
无偏
有偏
A
C
X
估计量的优良性准则——有效性
有效性:一个方差较小的无偏估计量称为一个更
有效的估计量。如,与其他估计量相比,样本均值 是一个更有效的估计量
P(X )
均值的抽样分布
B
中位数的抽样分布
A
X
估计量的优良性准则——一致性
❖ 一致性:随着样本容量的增大,估计量越来越接
近被估计的总体参数
P(X )
较大的样本容量
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
统计学第六章课后题及答案解析
第六章
一、单项选择题
1.下面的函数关系是( )
A现代化水平与劳动生产率 B圆周的长度决定于它的半径
C家庭的收入和消费的关系 D亩产量与施肥量
2.相关系数r的取值范围( )
A -∞< r <+∞
B -1≤r≤+1
C -1< r < +1
D 0≤r≤+1
3.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )
A增加70元 B减少70元 C增加80元 D减少80元
4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( )
A +1
B -1
C 0.5
D 1
5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )
A线性相关还是非线性相关 B正相关还是负相关
C完全相关还是不完全相关 D单相关还是复相关
6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程ŷ=a+bx。经计算,方程为ŷ=200—0.8x,该方程参数的计算( )
A a值是明显不对的
B b值是明显不对的
C a值和b值都是不对的
D a值和b值都是正确的
7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )
A 8
B 0.32
C 2
D 12.5
8.进行相关分析,要求相关的两个变量( )
A都是随机的 B都不是随机的
C一个是随机的,一个不是随机的 D随机或不随机都可以
9.下列关系中,属于正相关关系的有( )
A合理限度内,施肥量和平均单产量之间的关系
B产品产量与单位产品成本之间的关系
统计分析方法
第一章 统计分析概论
• 概要
统计透过现象的数量表现来认识事物的本质和发展变 化的规律性,是一种高级的理性思维活动。因此,统 计分析是统计专业学生需要掌握的基本技能之一。
• 目标要求
1.掌握分析的含义及特点; 2.掌握分析的程序、要领和技巧; 3.增强统计分析的实际能力。
7
统计分析的含义和任务 统计分析的一般问题 统计分析的程序
13
第二节 统计分析的一般问题
统计分析的理论基础 统计分析的内容和方法 统计分析的种类 统计分析的条件 统计分析应注意的问题
14
一、统计分析的理论基础
• 以辩证唯物主义所阐明的对立统一规律、 量变质变规律及认识论的诸多原理作为 方法论基础。 • 以政治经济学所阐明的经济发展规律和 基本原理作为理论基础。
4
第五章 统计分析报告
第一节 第二节 第三节 第四节 统计分析报告写作的特点 统计分析报告的基本结构 分析报告写作的原则、程序与技巧 统计分析报告的评价
第六章
第一节 第二节 第三节
统计分析报告范例
进度统计分析报告 专题统计分析报告 统计调查分析报告
5
第六章 调查报告案例
【案例一】某公司商品出口总值构成及变动分析 【案例二】当代大学生思想状况变化的分析 【案例三】分析煤耗季节变动,掌握原煤供需规 【案例四】分析轧钢设备利用状况,挖掘设备利用潜力 【案例五】国有工业企业改制费用情况分析 【案例六】我国主要奶制品产量构成及变动分析
现场调查资料的分析方法
现场调查资料的分析方法
经过现场资料收集、整理阶段后,即进入现场调查资料的分析阶段。现场调查资料的分析方法在设计阶段就应该有一个全面的分析计划,本章将围绕不同的资料类型,详细阐述现场调查资料的分析方法。
第一节现场调查资料的分析计划和步骤
一、分析方法的选择原则
进行现场调查资料的分析时,选择恰当的现场调查资料分析方法非常重要。如果分析方法选择不当,将会得到错误的结果。选择现场调查资料的分析方法应当遵循以下原则:
1、明确现场调查的类型
不同的现场调查类型,如横断面调查研究、生态学调查研究、病例对照调查研究、队列调查研究、现场流行病学试验等,其分析方法均不相同。因此,在进行现场调查资料的分析时,应明确现场调查的类型。
2、2、分析研究资料是否存在混杂偏倚
混杂偏倚往往会对结果产生不良的影响,如果资料存在混杂偏倚,则应进行分层分析。
3、3、分析方法由浅入深
对现场调查资料的分析,应首先选择简单的统计分析方法。如先进行描述性统计,然后选择恰当的显著性检验方法。先进行单因素分析,然后进行多因素分析等。
二、分析的计划和步骤
现场调查前必须有一个周密的调查计划,即使是爆发性调查,也不能盲目入手,因为只有在合理的调查设计下,才能得到可靠的现场数据,进行相关的分析。本章因只涉及现场调查资料的分析方法,故此仅论述现场调查资料的分析步骤。
(一)资料的整理
原始数据往往是不能直接进行分析的,根据现场调查的设计类型和目的,将资料整理成所需要的形式。整理过程包
括:
1、原始调查表格的整理、核对重新找到调查对象核实漏填、误填项目,删除缺项太多的调查表格。调查表格的设计、调查员的培训非常重要。
昆虫调查和统计59张
• 害虫调查,一般是通过样本调查来估计某害虫总体 在田间的发生期、发生量或危害程度等的。
第六章 农业昆虫的调查与资料分析
第一节 农业昆虫的调查 (三)取样方法 三.抽样调查
• 样本=估计总体,我们希望样本愈能近似代表总
体就愈好。 • 但样本不应是随意选择的,而是随机从总体中抽 样得来的。 • 在调查时,对总体或样本性状,通常用平均数、 标准差、变异系数等来表示。
第六章 农业昆虫的调查与资料分析
第一节 农业昆虫的调查
一.调查的目的意义 ★实地调查,获取昆虫的群落结构、分布、发生时 期、发生数量与生态因素的关系、寄主受害程度及 防治效果等数据,为明确防治对象、测报防治适期、 确定防治指标与方法,为搞好综合防治提供科学的 理论依据。
★因此,田间调查是掌握昆虫种群动态规律、进行 预测预报、害虫防治与益虫利用等植保工作的技术 手段。
第一节 农业昆虫的调查
三.抽样调查
(一)昆虫田间分布型
图1-3 昆虫田间分布型
1.随机分布型 2.核心分布型 3.嵌纹分布型
第六章 农业昆虫的调查与资料分析
三.抽样调查 第一节 农业昆虫的调查
(一)昆虫田间分布型
1.随机(二项)分布型 在田间呈稀疏的、个体间 距离不等的、比较均匀的分布状态。 由于调查取样时各个在样点内出现的机率相同, 取样时样点数可少些,样点可适当大些。 一般采用对角式或棋盘式抽样调查。如玉米螟卵 块、菜粉蝶卵、水稻秧田中的三化螟成虫及卵、棉 田中的盲蝽象的分布。 (另:泊松-其个体都是独立的,个体间无相互作用,个体
市场调查资料的整理和分析
数据处理阶段的质量控制
01
数据清洗和整理
对采集到的数据进行清洗和整理,去 除无效、缺失或异常数据,确保数据 的完整性和准确性。
02
选择合适的数据分析 方法
根据调查目的和需求,选择合适的数 据分析方法,如描述性统计、因素分 析、回归分析等,以揭示数据背后的 规律和趋势。
03
检测和分析误差
在数据处理阶段,应检测和分析误差 的来源,如测量误差、抽样误差等, 以评估调查结果的可信度和准确性。
针对具体案例进行深入剖析和研 究,以揭示市场现象的背景、过 程和结果。
综合分析方法
1 2 3
混合分析法
结合定量和定性两种方法,将数据转化为文字 描述,再结合实际情况进行综合分析。
实证研究法
通过实地调查、实验等方法收集数据,并运用 科学方法进行分析和检验,以揭示市场现象的 本质和规律。
决策分析法
根据市场调查资料和数据分析结果,制定相应 的市场策略和决策方案,以提高企业的竞争力 和盈利能力。
关注客户的需求和期望,致力于提供满足客 户需求的产品或服务。
03
01
3. 持续改进
不断寻求改进的机会,持续优化产品或服务 的质量。
05
02
原则
质量控制应遵循以下原则
04
2. 全面质量管理
将质量控制理念贯穿于产品或服务的整个生 命周期,从设计、研发到生产、销售和服务 。
第6章 2 普查和抽样调查
总体、个体、样本、样本容量. 【例 2】某地区有 8 所高中和 22 所初中,要了解该地区中学生的视力情况, 下列抽样方式获得的数据最能反映该地区中学生视力情况的是( ) A.从该地区随机选取一所中学里的学生 B.从该地区 30 所中学里随机选取 800 名学生 C.从该地区一所高中和一所初中各选取一个年级的学生 D.从该地区的 22 所初中里随机选取 400 名学生 【思路分析】在选取样本时,应注意抽取的个体是随机抽取的,不能集中 到某一区域或时间内,总之抽取的样本应具有代表性和广泛性. 【规范解答】B
A.总体是 360
B.样本容量是 60
C.样本是 60 名学生
D.个体是每个学生
8.为了调查了解某县初一男生的身高,有关部门准备对 200 名初一男生的 身高做调查,以下调查方案中最合理的是( D ) A.查阅外地 200 名初一男生的身高统计资料 B.测量该县县城一所中学 200 名初一男生的身高 C.测量该县两所农村中学各 100 名初一男生的身高 D.在该县县城和农村各任选两所中学,在这四所中学中,用抽签的方法分 别选择 50 名初一男生,然后测量他们的身高 9.为了调查某批汽车的安全性能,从中随机抽取 5 辆车做碰撞试验,则此 调查方式是 抽样调查 .
C.100
D.抽取的 100 台电视机的寿命
5.下列调查中,你认为采用什么调查方式较合适? (1)要了解一批元宵的口味; (2)要了解某班级中男女人数情况; (3)要了解中国 2016 年人均消费情况; (4)上海世博会的受欢迎程度. 解:(1)抽样调查 (2)普查 (3)抽样调查 (4)抽样调查
社会调查方法8项目八 调查资料统计与分析
• 举例二:指出表8-5中的中位数
• 表8-5所给出的是组距分组资料。 • 在组距分组资料中,首先需要计算出全部数据的
中间位置,并找到中间位置所对应的数据组,然 后可以根据下限公式求中位数。
• L下为中位数所在组的下限值,fm为中位数所在组的频数,i 为中位数所在组的组距,f为各组频数,cf小为比中位数所 在组的数值小的所有组的累计频数。
• 常用的离散趋势统计量有异众比率、四分 位差、全距、标准差、离散系数等。
异众比率
• 异众比率是指非众数次数与总体全部次数之 比。
• 异众比率适用于定类测量,用于补充说明众 数的代表性。
• 异众比率越小,说明众数的代表性越好;异 众比率越大,说明众数的代表性越差。
四分位差
• 四分位差Q是指舍去一组数据中最大和最小的1/4, 只计算中央1/2的资料中的最大值与最小值之差。
任务一 单变量描述统计
【相关知识】 单变量描述统计分析的目的在于用
比较简洁的数据反映大量数据资料中所 包含的基本信息。其基本方法包括变量 的频次分布与频率分布、集中趋势与离 散趋势分析等。
一、频次分布与频率分布
• 频次分布反映的是变量每个取值出现的次数。频率分 布反映的是变量每个取值的次数在全部个案数中所占 的比例,也称相对频次分布,一般用百分比分布来表 示。
统计量”对话框,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.2 描述性统计分析
描述性统计分析( Descriptive Analysis ) 指对被调查总体所有单位的有关数据进行整 理和计算综合指标等的加工处理,是用来描 述总体特征的统计分析方法。 市场调查分析中最常用的描述性统计分析, 主要包括对调查数据的分组分析、集中趋势 分析、离散程度分析和相对程度分析、指数 分析。
总数 杭州百货大楼 银泰百货 不知道/未回答
Байду номын сангаас
300 144 146 10
6.2.2 绘图
统计绘图的种类:线图、条形图或称柱状 图、圆饼图、曲线图、直方图。 统计图的作用:
形象地表明事物总体结构。 表明统计指标不同条件下的对比关系。 反映事物发展变化的过程和趋势。 说明总体单位按某一标志的分布情况。 显示现象之间的相互依存关系。
2. 事后编码
对于开放式问题而言,只能在资料收集好之后, 再根据受访者的回答内容来决定不同答案的指定 编码。
编码的依据不应只是文字,更重要的是文字所反 映出来的被调查者的潜在意识。
所以对开放式问题的编码有一整套科学的方法与 操作程序。
事后编码程序
列出答案。将所有被访者提供的答案一一列出
次数分布
是将总体中的所有单位按某个数量标志分组后, 所形成的总体单位数在组之间的分布。分布在各 的总体单位数叫次数或频数。各组次数与总次数 之比叫做比重、比率或频率。
次数分布实质,是反映统计总体中所有单位在各 组的分布状态和分布特征的一个数列,也可以称 做次数分配数列,简称分布数列。
案例
问题:“您为什么选择海尔空调?” 列出所有答案:
1.节能环保 2.外形美观 3.价格公道 4.噪音低 5.空调效果好 6.性价比高 7.高科技 8.体积小 9.大品牌 10.邻居都用这个牌子 11.经常在广告中见到 12.没想过 13.不知道 14.没什么特别原因
根据回答分类来编码
1、质量、科技 1,4,5,7 3、价格实惠 3,6 5、不清楚 12,13,14 2、外形 4、大名牌 2,8 9,10,11
6.1.2 编码
编码是指对一个问题的不同回答进行分组和确定 数字代码的过程。
1.事先编码
大多数的问卷中大部分问题都是封闭式的,即已 经预先编码。这意味着对调查中一组问题的不同 数字编码已被确定,所有封闭式问题都是事先编 码的。
事先编码案例
1. 您每月生活费的主要来源是_____? A. 父母 B. 家教、兼职 C. 奖学金/助学金 D.其它 2. 您父母平均一个月给您的生活费是______? A. 500元以下 B. 500-800元 C. 800-1000元 D. 1000-1500元 E. 1500以上 3. 您每月实际消费是_____? A. 500元以下 B. 500-800元 C. 800-1000元 D. 1000-1500元 E. 1500以上 4. 你的消费习惯可以描述为_______? A. 事先做好消费计划再花钱 B. 以勤俭为本 C. 想花就花 D. 其它 (请注明)
15.3
46
5.6
多因素列表(交叉列表)案例
消费者购物地点选择简单交叉分析表
总数 人数 频数 100% 48.0% 48.7% 3.3 % 18~34岁 65 21 43 1 100 % 32.3 % 66.3 % 1.5 % 年龄 35~54岁 83 40 40 3 100 % 48.2 % 48.2 % 3.6 % 55以上 151 57 40 3
周工资额(元)
84 85 87 91 94 95 96 97 99 101 103 105 106 107 109 110 111 118 119 121 128 合计
人数(次数)
1 1 1 2 1 1 1 1 1 2 1 3 4 2 1 1 2 1 1 1 1 30
案例(变量次数分配的编制)
案例(变量次数分配的编制)
第一步:按从小到大的顺序排列数据 84、85、87、91、91、94、95、96、97、 99、101、101、103、105、105、105、106、 106、106、106、107、107、109、110、 111、111、118、119、121、128 第二步:将相同的数据归入同一组,并汇 总各组数值的个数
案例(不等距分组的变量次数分配编制)
某地区人口年龄分配情况
按年龄分组 1岁以下 1~7岁 7~18岁 18~25岁 25~55岁 55岁以上 合计 人口数(万人) 2 12.2 24.0 14.8 34.2 16.3 103.5
某地区个人年收入额分配
按年收入额 各组所占百分比 分组(元) (% ) 0~5,000 23.9 5,000~10,000 34.8 10,000~15,000 20.1 15,000~45,000 17.28 45,000~75,000 1.74 75,000~105,000 0.88 105,000~135,000 0.81 135,000以上 0.48 合 计 100.00
变量次数分配的编制 按数量标志编制次数分配,所形成的结 果称为变量次数分配。变量次数分配的编 制程序如下:
将原始资料顺序排列 将各个数据按其数值大小归入相应的组内 确定组数和组距(组中最大值与最小值差额) 确定组限(组的两个端点)
案例(变量次数分配的编制)
假设某企业30个非熟练工人的周工资额 (元)如下: 106、99、85、121、84、94、106、105、 110、119、101、95、91、87、105、106、 109、118、96、128、91、97、105、111、 111、107、103、101、107、106
被调查者
答案
人数(人)
总数 杭州百货大楼 银泰百货 300 265 240
频数(%)
100 88.3 80.0
数量(个)
818 265 240
频次(%)
100 32.4 29.3
杭州大厦
解百 元华购物中心
112
92 63
37.3
30.7 21.0
112
92 63
13.7
11.2 7.7
西湖时代广场
46
调查资料整理的基本步骤
设计和编制资料整理方案。这是保证统计资料的 整理有计划、有组织地进行的重要一步。资料的 整理往往不是整理一个或两个指标,而是整理多 个有联系的指标所组成的指标体系。
对原始资料进行审核。资料的审核是第一步,为 了保证质量必须进行严格的审核。
综合汇总调查项目,对原始资料进行分组、编码、 汇总和计算是关键。 对整理好的资料再进行一次审核,然后编制成一 个统计表,以表示社会经济现象在数量上的联系。
第三步:确定组数和 组距 第四步:确定组限
周工资 人数 额(元) (个)
80~90 90~100 100~110 110~120 120~130 合计
3 7 13 5 2 30
各组人 数占总 人数百 分比% 10 23 43 17 7 100
分组方法的选择 选择等距分组还是不等距分组,主要根 据研究的目的和观察值的特点决定。 如果研究目的是要从数量上区分不同性质 的类别,就必须根据被研究现象各类别在 数量上的特点确定各组组距, 如果所收集的原始数据中有极端值存在, 为避免组数太多,分布特征无法详实的情 况,也可能采用不等距分组,在数据分布 密集的地方用较短组距,在数据分布疏散 的地方采用较长组距。
单项变量分布数列
按日产量分组 (件) 25 26 27 28 29 30 合计 工人人数 (人) 10 20 30 50 40 30 180 比重 (%) 6 10 17 28 22 17 100
案例
组距变量数列
企业数 6 16 6 28 比重(%) 21.3 57.4 21.3 100.00
按计划完成程度分组 100以下 100—110 110以上 合计
6.1.1 调查资料的审核
审核的主要内容
资料的真实性。调查资料来源的客观性问题,来 源必须是客观的。调查资料本身的真实性问题, 要辨别出资料的真伪,把那些违背常理的、前后 矛盾的资料舍去。 资料的准确性。准确的审核要着重检查那些含糊 不清的、笼笼统统的以及互相矛盾的资料。 资料的完整性。第一,调查资料总体的完整性。 第二,每份调查资料的完整性。
案例
统计分组可以显示社会现象之间的依存关系
某地区粮食单位面积产量和施肥量的关系
每公顷化肥施用量 (千克) 116.25 133.50 145.50 153.75 163.50 粮食单位面积产量 (千克/公顷) 2827.5 3124.5 3396.0 3608.3 3484.0
统计分组标志的选择 标志指反映事物属性或特征的名称。 根据分组标志的不同性质,分组有不同的类型: 根据分组标志的数量的不同,可分为简单分组和 复合分组两类。
6.1.3 调查资料的统计分类、分组
统计分类、分组,是指根据社会调查的目 的和要求,按照一定标志,将所研究的事 物或现象区分为不同的类型或组的一种整 理资料的方法。 分类、分组的作用: 可以找出总体内部各个部分之间的差异 可以深入了解现象总体的内部结构 可以显示社会现象之间的依存关系
案例
统计分组可以深入了解现象总体的内部结构:
根据所使用分组标志的性质不同,可分为品质标 志分组(比如按性别、职业等分组)和数量标志 分组(比如按年龄、收入、人口、产量等分组)。
案例
我国各级各类型图书馆普遍使用的分类方法就是《中国图 书馆图书分类法》,简称“中图法”。《中图法》是我国 于1975年正式出版编制的一部大型综合性的图书分类法。 它采用五分法的分类体系,把图书资料所包括的知识内容 划分为"马克思主义 列宁主义 毛泽东思想"、"哲学"、" 社会科学"、"自然科学"和"综合性图书"五大基本部类。 社会科学 A 马列主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
信度与效度
信度是指对同一事物进行重复测量时,所得到的 结果的一致性程度,一致性程度越高则信度越高。 效度则是指一项测量能正确测出它所要测量的事 物的程度。 一份问卷如果无信度则一定无效度,有效度则一 定有信度;然而有信度不能保证有效度。
因此,在设计调查方案时要努力确保调查中的每 一个问题就是调查者想要的变量,而且这种变量 保持一定的一致性。
6.2 描述性统计分析
6.2.1 列表 列表,即把调查资料按照一定的目的,用 表格形式展现出来 表的结构:标题、横标目、纵标目、数字。 表的种类:简单分组表(单因素列表)、 复合分组表(交叉列表)。 制作方法:制作应遵循科学、实用、简练、 美观原则。
简单列表(单因素列表)案例
消费者购物地点选择调查表
我国三次产业分类的从业人员构成情况 单位(%) 产业\年份 1993 1994 1995 1996 1997 第一 56.4 51.3 52.2 50.0 49.9 第二 22.4 22.7 23.0 23.5 23.7 第三 21.2 23.0 24.8 26.0 26.4 合计 100.0 100.0 100.0 100.0 100.0
6.2.3描述性统计分析的内容
1、数据的集中趋势分析。对调查数据公布的数量规律性 中集中特征进行分析,是对被调查总体的特征进行准确描 述的重要前提。数据集中趋势分析的对象,包括数据的均 值(各类平均数)、中位数和众数。 均值是数据偶然性和随机性的一个特征值,反映了一些数 据必然性的特点。 中位数(Me)的确定可以以未分组资料为基础,也可由分 组资料得到。它同样不受到资料中少数极端值大小的影响。 在某些情况下,用中位数反映现象的一般水平比算术平均 数更具有代表性,尤其对于两极分化严重的数据,更是如 此。 众数(Mo)是总体中出现次数最多单位的标志值,也是测 定数据集中趋势的一种方法,克服了平均数指标会受数据 中极端值影响的缺陷。
将有意义的答案列成频数分布表,并确定可以接受 的分组数
对答案挑选归并。在符合调研目的的前提下,保留 频数多的答案,把频数少的答案尽可能归并成含义 相近的几个组,有时对那些含义相去甚远,频数又 很低的,可以一并用“其它”来概括。 对所确定的分组选择正式的描述 制定编码规则
事后编码案例
第六章 调查资料的统计分析
调查资料整理的基本知识 调查资料整理的基本方法 调查资料初步统计分析的方法 参考书目:马庆国,《管理统计》,北京,科学
出版社,2002年第一版。
6.1 调查资料的整理
所谓资料整理,是指运用科学的方法,将 调查所得的原始资料按调查目的进行审核、 汇总与初步加工,使之系统化和条理化, 并以集中、简明的方式反映调查对象总体 情况的过程。