第一章统计案例分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面访调查:即调查者直接走访被调查者,当面听取被调查者的意见。 邮寄调查:将事先设计好的调查表(亦称问卷,questionnaire)投寄
给调查对象,要求填好后寄回。
(一)调查方法的确定
由于本案例面向对象是大量同学,所以焦点小组访谈法、头脑 风暴、德尔菲法都不合适,接下来对面访调查和邮寄调查的优劣作 出比较。
1、6名运动员射击成绩分布的比较
6名运动员中,射击平均水平最好 的(中位数最高的)是德国选手 克里斯蒂安·赖茨,而最差的是基 思·桑德森。从离散状况看,离散 程度最小的是亚历山大·彼得里夫 利,表明该运动员发挥比较稳定, 而最大的是罗曼·邦达鲁克,表明 该运动员发挥的最不稳定的。
从分布的形状来看,亚历山大·彼得里夫利、克里斯蒂 安·赖茨、罗曼·邦达鲁克,射击成绩比较对称,而其他 选手的分布存在一定的偏斜。
案例分析
射击运动员的比赛成绩除受自身射击水平影响外,其发 挥的稳定性是至关重要的,其稳定性可以用各次射击环数的 差异以及比赛射击成绩的分布来反映,要综合评价一名运动 员射击水平的好坏可以从以下几个方面入手:
1、6名运动员射击成绩分布的比较 2、6名运动员射击成绩的分析和比较 3、6名运动员射击成绩的离群点分析
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
4、三个国家奖牌总数的构成及其比较
要反映每一个国家获得的奖牌的构成情况,可选择饼图。要 比较三个国家获得的奖牌构成,可以绘制环形图。
5、三个国家奖牌总数的相似性比较
一、案例分析
(一)调查方法的确定 (二)样本量的确定 (三)抽样方法的确定 (四)问卷设计
(一)调查方法的确定
抽样方法主要有:焦点小组访谈法、头脑风暴法、德尔菲法、面访 调查、邮寄调查等。
焦点小组访谈法:采用小型座谈会的形式,由一个经过训练的主持人 以一种无结构、自然的形式与一个小组的具有代表性的消费者或 客户交谈。从而获得对有关问题的深入了解。
(二)样本量的确定
样本量的大小取决于总体元素的多少,同时也与估计所要求的 精度以及调查所需的人力、物力和财力有关。
本案例抽样总体为2525名应届本科毕业生,根据人力、物力、 财力认为样本为总体的10%-15%比较合适,最终确定为14%。约为 350人,考虑其他原因可能是无效样本,确定为370。
(三)抽样方法的确定
全部列出,要设置“其他”选项)
案例1.2 北京奥运会奖牌的分布及构成分析
2008年北京奥运会,中国体育代表团取得了金牌第一,奖牌总数 100枚的历史最好成绩,本届奥运会共设奖牌958枚,其中金牌302枚, 银牌303枚,铜牌353枚,下表给出了金牌总数前三名国家所获得的奖 牌分布情况。
需要分析的问题是: 1.选择适当的统计量对上述数据进行描述和分析 2.选择适当的图形对上述数据进行展示和分析
头脑风暴法:集中有关专家召开专题会议,主持者以明确的方式向所 有参与者阐明问题,说明会议的规则,尽力创造在融洽轻松的会 议气氛下,由专家们“自由”提出尽可能多的方案。
德尔菲法:是依据系统的程序,采用匿名发表意见的方式,即团队成 员之间不得互相讨论,不发生横向联系,只能与调查人员发生关 系,以反复的填写问卷,以集结问卷填写人的共识及搜集各方意 见,可用来构造团队沟通流程,应对复杂任务难题的管理技。
案例分析
选择何种统计量和图形描述一组数据,取决于分析的目的和所掌握的 数据的特点,该组数据涉及到分类变量及分类数据,因此可以从以下几 个方面进行分析:
1、奖牌构成分析 2、三个国家奖牌总数的分布及其分析 3、每个国家男女奖牌数的分布及其比较 4、三个国家奖牌总数的构成及其比较 5、三个国家奖牌总数的相似性比较
银牌 10 23.81 11 19.3
铜牌 8 19.05 19 33.33
合计 42
100
57 100
0
51 51.00
0
21 21.00
1
28 28.00
1
100 100
在男子获得的42枚奖牌中,金牌占57.14%,银牌占23.81%,铜牌占19.05%。在女 子获得的57枚奖牌中,金牌占47.37%,银牌占19.3%,铜牌占33.33%。 在中国队获得的100枚奖牌中,金牌占51.00%,银牌占21.00%,铜牌占28.00%。
Fra Baidu bibliotek 2、6名运动员射击成绩的分析和比较
从各运动员发挥的水平来看,平均成绩最高的是拉尔夫·许曼,为10.025,最低的为基 思·桑德森仅为9.68,而中位数最高的为克里斯蒂安·赖茨10.2,最低的是基思·桑德森9.8环。 从发挥稳定性来看,发挥最稳定的是亚历山大·彼得里夫利,标准差为0.531,离散系数为 0.053;列昂尼德·叶基莫夫,标准差为0.053环,离散离线为0.054。而发挥最不稳定的是 罗曼·邦达鲁克,标准差为0.0862环,离散系数为0.089,而极差高达3.7环。从最后的决赛 总成绩看,最好的是拉尔夫·许曼,为200.5环,而最差的是基思·桑德森,仅为193.6环。 从各选手射击成绩的分布来看,偏态系数最小的是列昂尼德·叶基莫夫,为-0.453,为轻 微左偏,而其他5名选手的偏态系数均小于-1,有较严重的左偏,这说明运动员在最初的 几枪中,成绩普遍较低,说明运动员最初射击时有一定的紧张情绪,而后面的射击成绩 较好,说明运动员的紧张情绪已经消除逐步进入状态。
案例1.4 三个产业生产总值的描述性分析
地区生产总值反映了一个地区的经济发展水平,而生产总值中各 产业的构成则反映了一个地区经济发展的格局。
需要分析的问题是: 分析三个产业生产总值之间的关系以及三个产业生产总值分布的特征。
从以下两个方面进行案例分析: 1、三个产业生产总值的相关性分析 2、三个产业生产总值分布特征的分析
同理可以对美国及俄罗斯进行相同的分析
1、奖牌构成分析
奖牌 金 银 铜 合计
中国、美国和俄罗斯的奖牌数及其构成
中国 构成% 美国 构成% 俄罗斯
51 51.00 36 32.73 23
21 21.00 38 34.55 21
28 28.00 36 32.73 28
100 100 110 100
72
构成% 31.94 29.17 38.89 100
1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图 矩阵。
从重叠散点图可以看出,第二产业与第一产业和第三产业的生产总值 之间都有较强的线性关系。这说明第二产业的发展对第一产业和第三产业 的发展有较强的拉动关系,其中第二产业对第三产业的拉动尤为突出。
1、三个产业生产总值的相关性分析
为进一步分析三个产业之间的关系强度,需要计算相关系数。
三个产业之间均存在显著的线性相关关系。
2、三个产业生产总值分布特征的分析
首先,绘制有关图形来观察三个产业生产总值分布的特征和形状。
为比较三个产业生产总值的分布状况,可以绘制箱线图。
要比较三个国家所获得的金牌、银牌、和铜牌数的分布情况 是否相似,可绘制雷达图。
案例1.3 分析运动员发挥的稳定性
需要分析的问题是: 1.选择适当的图形比较各运动员射击成绩的分布的特 征,并分析各运动员的决赛成绩是否存在离群点。 2.计算相关的描述统计量,并进行分析。 3.利用相关的统计量判断各运动员的决赛成绩是否存在 离群点。
确定抽样方法主要考虑两个因素:样本的有效性和抽样的可操作性。
根据本次调查对象的特点,本案例最终采用两阶段抽样: 第一阶段为分层抽样,以寝室为抽样单位,按专业和性别分层, 按照 比例抽出各层应该抽取的寝室,得到一系列的群体; 第二阶段为随机抽样,在第一阶段抽到的寝室内随机抽取学生作 为调查对象。
(三)抽样方法的确定
留置问卷调查:邮寄调查的一种,这种方法实际上介于邮寄调查和 面访调查之间,指调查员按照面访的方式找到被调查者,说明调查 目的和填写要求之后,将问卷留在被调查者手中,由被调查者自主 完成,之后由调查员取回填好的问卷。
采用理由:综合邮寄调查保密性强的优点,同时结合了面访调查回 收率高的优势,同时可以避免由于调查员自身素质的原因带来的偏 差。
1、奖牌构成分析
对分类数据的描述适用的统计量主要是频数、比例、比率等,根据分析的 目的可以对每个国家的男子、女子、公开组/混合组分别计算百分比和比例 等。同时可以对三个国家的金银牌的频数、比例进行分析。
中国队各组别的奖牌数及其构成
奖牌 男子 构成% 女子 构成% 公开/混合组 总计 构成%
金牌 24 57.14 27 47.37
3、6名运动员射击成绩的离群点分析
如果将平均数加减三倍的标准差之外的数据定为离群点,6名运动员的射击 成绩中,只有亚历山大·彼得里夫利的-3.032属于离群点,考虑到射击成绩的特 点,可以将平均数加减2倍的标准差之外的数据定为离群点。从各运动员的标 准分数来看,超过2的有:亚历山大·彼得里夫利的-3.032,罗曼·邦达鲁克的2.942,克里斯蒂安·赖茨的-2.932,基思·桑德森的-2,818,拉尔夫·许曼的2.80482,列昂尼德·叶基莫夫的-2.00171,均属于离群点,这表明,各运动员都 有发挥失常的情况,这也体系了射击运动的特点。
第三,第一阶段抽的寝室后,每个寝室有6名学生,总人数不多,而且 不存在较大的差异性,所以第二阶段采取简单随机抽样。
(四)问卷设计
问卷设计过程中主要考虑两个问题:问卷的内容和问卷的格式。 问卷的内容 1.大学生毕业去向及就业难易度的调查 2.毕业生就业取向的调查 3.毕业生就业去向的调查 4.影响大学生就业的因素调查 5.大学生对国家就业政策的认知状况调查
2、三个国家奖牌总数的分布及其分布
要描述每个国家得到奖牌数分布,可选择条形图。要比较三个国家 获得的金牌、银牌和铜牌的分布情况,可以绘制复式条形图。三个国 家奖牌总数的复式条形图。
3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
3、每个国家男女奖牌数的分布及其比较
理由:
第一,大学生的就业状况会受到专业、性别等因素的影响,即总体中 的个体之间存在显著性差异,所以第一阶段采取分层抽样的方法。
第二,目的是抽取毕业生,但是考虑到抽样的可实施性,如果直接对 毕业生进行分层抽样就会存在对毕业生和在校本科生的鉴别问题, 所以将调查地点定在毕业生的寝室,以寝室为抽样单位采取分层抽 样得到相应的群体。
第一章
数据收集和描述
案例1.1
金融危机形势下大学生 就业状况调查方案设计
一、学习目标
1、了解数据收集的主要过程 2、了解抽样方法的确定思路 3、了解问卷设计的过程及注意的主要问题 4、通过本案例的学习,熟悉数据收集的整体过程,了解
数据收集过程中要考虑的主要问题,重点体会抽样方法 的确定和问卷设计的方法,达到能自主思考、自主设计 调查方案、自主收集数据的目的。
1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图矩 阵。
从散点图矩阵可以看出,三个产业的生产总值之间都存在某种程度 的线性关系。其中第二产业和第三产业,第二产业与第一产业之间存在 较强的线性关系,为考察第二产业与第一产业和第三产业之间的关系, 可以绘制重叠散点图。
1、6名运动员射击成绩分布的比较
选择何种图形描述该组数据,取决于分析的目的和所掌握的数据的特 点,这里涉及的数值型数据,如果要反映每名运动员射击成绩的分布, 可考虑使用茎叶图,如果要比较6名运动员射击成绩的分布,则应考虑 使用箱线图。(SPSS做的)
图中用·标出的点是每名运动员射 击成绩超过其四分位1.5倍的点, 被视为离群点,而用*表示的点 表示其成绩超过其四分位差3倍的 点,被视为极值。如亚历山大·彼 得里夫利,在第19枪射出的9.1环 属于离群点,而第2枪射出的8.4环 属于极值。
(四)问卷设计
问卷的格式
1.要有卷头语和卷尾语。 2.关于背景信息的调查(一般放在问卷的最后,本案例的背景部分比
较简单且不敏感,所以放在开头)。 3.问卷答题说明(要用统一字体,采用非问卷主体使用的字体)。 4.主观题放在问卷的最后。 5.问卷题目主干用词要准确,避免歧义。(选项设置需周全,若不能
给调查对象,要求填好后寄回。
(一)调查方法的确定
由于本案例面向对象是大量同学,所以焦点小组访谈法、头脑 风暴、德尔菲法都不合适,接下来对面访调查和邮寄调查的优劣作 出比较。
1、6名运动员射击成绩分布的比较
6名运动员中,射击平均水平最好 的(中位数最高的)是德国选手 克里斯蒂安·赖茨,而最差的是基 思·桑德森。从离散状况看,离散 程度最小的是亚历山大·彼得里夫 利,表明该运动员发挥比较稳定, 而最大的是罗曼·邦达鲁克,表明 该运动员发挥的最不稳定的。
从分布的形状来看,亚历山大·彼得里夫利、克里斯蒂 安·赖茨、罗曼·邦达鲁克,射击成绩比较对称,而其他 选手的分布存在一定的偏斜。
案例分析
射击运动员的比赛成绩除受自身射击水平影响外,其发 挥的稳定性是至关重要的,其稳定性可以用各次射击环数的 差异以及比赛射击成绩的分布来反映,要综合评价一名运动 员射击水平的好坏可以从以下几个方面入手:
1、6名运动员射击成绩分布的比较 2、6名运动员射击成绩的分析和比较 3、6名运动员射击成绩的离群点分析
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
4、三个国家奖牌总数的构成及其比较
要反映每一个国家获得的奖牌的构成情况,可选择饼图。要 比较三个国家获得的奖牌构成,可以绘制环形图。
5、三个国家奖牌总数的相似性比较
一、案例分析
(一)调查方法的确定 (二)样本量的确定 (三)抽样方法的确定 (四)问卷设计
(一)调查方法的确定
抽样方法主要有:焦点小组访谈法、头脑风暴法、德尔菲法、面访 调查、邮寄调查等。
焦点小组访谈法:采用小型座谈会的形式,由一个经过训练的主持人 以一种无结构、自然的形式与一个小组的具有代表性的消费者或 客户交谈。从而获得对有关问题的深入了解。
(二)样本量的确定
样本量的大小取决于总体元素的多少,同时也与估计所要求的 精度以及调查所需的人力、物力和财力有关。
本案例抽样总体为2525名应届本科毕业生,根据人力、物力、 财力认为样本为总体的10%-15%比较合适,最终确定为14%。约为 350人,考虑其他原因可能是无效样本,确定为370。
(三)抽样方法的确定
全部列出,要设置“其他”选项)
案例1.2 北京奥运会奖牌的分布及构成分析
2008年北京奥运会,中国体育代表团取得了金牌第一,奖牌总数 100枚的历史最好成绩,本届奥运会共设奖牌958枚,其中金牌302枚, 银牌303枚,铜牌353枚,下表给出了金牌总数前三名国家所获得的奖 牌分布情况。
需要分析的问题是: 1.选择适当的统计量对上述数据进行描述和分析 2.选择适当的图形对上述数据进行展示和分析
头脑风暴法:集中有关专家召开专题会议,主持者以明确的方式向所 有参与者阐明问题,说明会议的规则,尽力创造在融洽轻松的会 议气氛下,由专家们“自由”提出尽可能多的方案。
德尔菲法:是依据系统的程序,采用匿名发表意见的方式,即团队成 员之间不得互相讨论,不发生横向联系,只能与调查人员发生关 系,以反复的填写问卷,以集结问卷填写人的共识及搜集各方意 见,可用来构造团队沟通流程,应对复杂任务难题的管理技。
案例分析
选择何种统计量和图形描述一组数据,取决于分析的目的和所掌握的 数据的特点,该组数据涉及到分类变量及分类数据,因此可以从以下几 个方面进行分析:
1、奖牌构成分析 2、三个国家奖牌总数的分布及其分析 3、每个国家男女奖牌数的分布及其比较 4、三个国家奖牌总数的构成及其比较 5、三个国家奖牌总数的相似性比较
银牌 10 23.81 11 19.3
铜牌 8 19.05 19 33.33
合计 42
100
57 100
0
51 51.00
0
21 21.00
1
28 28.00
1
100 100
在男子获得的42枚奖牌中,金牌占57.14%,银牌占23.81%,铜牌占19.05%。在女 子获得的57枚奖牌中,金牌占47.37%,银牌占19.3%,铜牌占33.33%。 在中国队获得的100枚奖牌中,金牌占51.00%,银牌占21.00%,铜牌占28.00%。
Fra Baidu bibliotek 2、6名运动员射击成绩的分析和比较
从各运动员发挥的水平来看,平均成绩最高的是拉尔夫·许曼,为10.025,最低的为基 思·桑德森仅为9.68,而中位数最高的为克里斯蒂安·赖茨10.2,最低的是基思·桑德森9.8环。 从发挥稳定性来看,发挥最稳定的是亚历山大·彼得里夫利,标准差为0.531,离散系数为 0.053;列昂尼德·叶基莫夫,标准差为0.053环,离散离线为0.054。而发挥最不稳定的是 罗曼·邦达鲁克,标准差为0.0862环,离散系数为0.089,而极差高达3.7环。从最后的决赛 总成绩看,最好的是拉尔夫·许曼,为200.5环,而最差的是基思·桑德森,仅为193.6环。 从各选手射击成绩的分布来看,偏态系数最小的是列昂尼德·叶基莫夫,为-0.453,为轻 微左偏,而其他5名选手的偏态系数均小于-1,有较严重的左偏,这说明运动员在最初的 几枪中,成绩普遍较低,说明运动员最初射击时有一定的紧张情绪,而后面的射击成绩 较好,说明运动员的紧张情绪已经消除逐步进入状态。
案例1.4 三个产业生产总值的描述性分析
地区生产总值反映了一个地区的经济发展水平,而生产总值中各 产业的构成则反映了一个地区经济发展的格局。
需要分析的问题是: 分析三个产业生产总值之间的关系以及三个产业生产总值分布的特征。
从以下两个方面进行案例分析: 1、三个产业生产总值的相关性分析 2、三个产业生产总值分布特征的分析
同理可以对美国及俄罗斯进行相同的分析
1、奖牌构成分析
奖牌 金 银 铜 合计
中国、美国和俄罗斯的奖牌数及其构成
中国 构成% 美国 构成% 俄罗斯
51 51.00 36 32.73 23
21 21.00 38 34.55 21
28 28.00 36 32.73 28
100 100 110 100
72
构成% 31.94 29.17 38.89 100
1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图 矩阵。
从重叠散点图可以看出,第二产业与第一产业和第三产业的生产总值 之间都有较强的线性关系。这说明第二产业的发展对第一产业和第三产业 的发展有较强的拉动关系,其中第二产业对第三产业的拉动尤为突出。
1、三个产业生产总值的相关性分析
为进一步分析三个产业之间的关系强度,需要计算相关系数。
三个产业之间均存在显著的线性相关关系。
2、三个产业生产总值分布特征的分析
首先,绘制有关图形来观察三个产业生产总值分布的特征和形状。
为比较三个产业生产总值的分布状况,可以绘制箱线图。
要比较三个国家所获得的金牌、银牌、和铜牌数的分布情况 是否相似,可绘制雷达图。
案例1.3 分析运动员发挥的稳定性
需要分析的问题是: 1.选择适当的图形比较各运动员射击成绩的分布的特 征,并分析各运动员的决赛成绩是否存在离群点。 2.计算相关的描述统计量,并进行分析。 3.利用相关的统计量判断各运动员的决赛成绩是否存在 离群点。
确定抽样方法主要考虑两个因素:样本的有效性和抽样的可操作性。
根据本次调查对象的特点,本案例最终采用两阶段抽样: 第一阶段为分层抽样,以寝室为抽样单位,按专业和性别分层, 按照 比例抽出各层应该抽取的寝室,得到一系列的群体; 第二阶段为随机抽样,在第一阶段抽到的寝室内随机抽取学生作 为调查对象。
(三)抽样方法的确定
留置问卷调查:邮寄调查的一种,这种方法实际上介于邮寄调查和 面访调查之间,指调查员按照面访的方式找到被调查者,说明调查 目的和填写要求之后,将问卷留在被调查者手中,由被调查者自主 完成,之后由调查员取回填好的问卷。
采用理由:综合邮寄调查保密性强的优点,同时结合了面访调查回 收率高的优势,同时可以避免由于调查员自身素质的原因带来的偏 差。
1、奖牌构成分析
对分类数据的描述适用的统计量主要是频数、比例、比率等,根据分析的 目的可以对每个国家的男子、女子、公开组/混合组分别计算百分比和比例 等。同时可以对三个国家的金银牌的频数、比例进行分析。
中国队各组别的奖牌数及其构成
奖牌 男子 构成% 女子 构成% 公开/混合组 总计 构成%
金牌 24 57.14 27 47.37
3、6名运动员射击成绩的离群点分析
如果将平均数加减三倍的标准差之外的数据定为离群点,6名运动员的射击 成绩中,只有亚历山大·彼得里夫利的-3.032属于离群点,考虑到射击成绩的特 点,可以将平均数加减2倍的标准差之外的数据定为离群点。从各运动员的标 准分数来看,超过2的有:亚历山大·彼得里夫利的-3.032,罗曼·邦达鲁克的2.942,克里斯蒂安·赖茨的-2.932,基思·桑德森的-2,818,拉尔夫·许曼的2.80482,列昂尼德·叶基莫夫的-2.00171,均属于离群点,这表明,各运动员都 有发挥失常的情况,这也体系了射击运动的特点。
第三,第一阶段抽的寝室后,每个寝室有6名学生,总人数不多,而且 不存在较大的差异性,所以第二阶段采取简单随机抽样。
(四)问卷设计
问卷设计过程中主要考虑两个问题:问卷的内容和问卷的格式。 问卷的内容 1.大学生毕业去向及就业难易度的调查 2.毕业生就业取向的调查 3.毕业生就业去向的调查 4.影响大学生就业的因素调查 5.大学生对国家就业政策的认知状况调查
2、三个国家奖牌总数的分布及其分布
要描述每个国家得到奖牌数分布,可选择条形图。要比较三个国家 获得的金牌、银牌和铜牌的分布情况,可以绘制复式条形图。三个国 家奖牌总数的复式条形图。
3、每个国家男女奖牌数的分布及其比较
要描述各代表对男女获得的奖牌数的分布,可使用复式条形图。
3、每个国家男女奖牌数的分布及其比较
理由:
第一,大学生的就业状况会受到专业、性别等因素的影响,即总体中 的个体之间存在显著性差异,所以第一阶段采取分层抽样的方法。
第二,目的是抽取毕业生,但是考虑到抽样的可实施性,如果直接对 毕业生进行分层抽样就会存在对毕业生和在校本科生的鉴别问题, 所以将调查地点定在毕业生的寝室,以寝室为抽样单位采取分层抽 样得到相应的群体。
第一章
数据收集和描述
案例1.1
金融危机形势下大学生 就业状况调查方案设计
一、学习目标
1、了解数据收集的主要过程 2、了解抽样方法的确定思路 3、了解问卷设计的过程及注意的主要问题 4、通过本案例的学习,熟悉数据收集的整体过程,了解
数据收集过程中要考虑的主要问题,重点体会抽样方法 的确定和问卷设计的方法,达到能自主思考、自主设计 调查方案、自主收集数据的目的。
1、三个产业生产总值的相关性分析
为比较三个产业两两之间的关系,可绘制三个产业生产总值之间的散点图矩 阵。
从散点图矩阵可以看出,三个产业的生产总值之间都存在某种程度 的线性关系。其中第二产业和第三产业,第二产业与第一产业之间存在 较强的线性关系,为考察第二产业与第一产业和第三产业之间的关系, 可以绘制重叠散点图。
1、6名运动员射击成绩分布的比较
选择何种图形描述该组数据,取决于分析的目的和所掌握的数据的特 点,这里涉及的数值型数据,如果要反映每名运动员射击成绩的分布, 可考虑使用茎叶图,如果要比较6名运动员射击成绩的分布,则应考虑 使用箱线图。(SPSS做的)
图中用·标出的点是每名运动员射 击成绩超过其四分位1.5倍的点, 被视为离群点,而用*表示的点 表示其成绩超过其四分位差3倍的 点,被视为极值。如亚历山大·彼 得里夫利,在第19枪射出的9.1环 属于离群点,而第2枪射出的8.4环 属于极值。
(四)问卷设计
问卷的格式
1.要有卷头语和卷尾语。 2.关于背景信息的调查(一般放在问卷的最后,本案例的背景部分比
较简单且不敏感,所以放在开头)。 3.问卷答题说明(要用统一字体,采用非问卷主体使用的字体)。 4.主观题放在问卷的最后。 5.问卷题目主干用词要准确,避免歧义。(选项设置需周全,若不能