市场调查 数据分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分为:招贴、报刊杂志、广播、电视、互联网等; 居民按文化程度标志分组,可划分为:大学、大学以
上、高中、初中、小学、文盲和半文盲等。 人口按照性别标志分为男、女两组; 企业按照组织形式标志分为个人业主企业、合伙制企业、
股份制企业、合资企业等均属此类。
3
数量标志分组是指按事物数量方面的差异来分组。 如消费者按人口、年龄、人均收入分组、企业规模 按营业额分组等。
居民的生活水平分组,按照居民家庭的恩格尔系数 标志分为:
在60%以上居民家庭归为贫困家庭; 在50%-60%的家庭归为温饱家庭; 在40%-50%的家庭归为小康家庭; 在40%以下的家庭归为富裕家庭。
4
资料分组的原则和作用
分组的原则:同质性、差异性、概括性。 同质性:各组内的资料必须具有相同的性质。 差异性:级别之间的资料存在质和量的差别。 概括性:分组后所有单位都有归属的类或组,无一遗漏。
1%
0.50%
-1% 蔓登琳 圣麦乐 光明 和路雪 雀巢 伊利 雪克 八喜 冷狗 -1.00%
-3%
22
调研结果的表述
80%
78%
70%
60%
50%
40%
30%
20%
10%
0% 财经新闻
65% 股票投资
最多
其次
再次
总和
32%
30%
26%
投资学园
市场经营
宏观焦点
23
调研结果的表述
表11-4 2002年6月与2005年6月两次调查网民上网主要目的的比较
电视新闻报道 活动广告
报刊介绍文章 让利、抽奖等促销活动
路牌广告
20%
40%
60%
已购者 欲购者
80%
100%
26
调研结果的表述
35% 30% 25% 20% 15% 10%
5% 0%
0 -5%
0.02
0.04
0.06
0.08
0.1
0.12
27
数据的集中量数分析与离中量数分析
一、数据的集中量数分析 1.集中量数的意义 集中量数也称集中趋势,也就是人们通常说的“平均值”。 平均指标反映了总体分布的集中趋势,它是总体分布的重
80-89 1
4.2%
第五,确定组限与组中值。每组的起点数为下限, 终点数为上限。
对连续变量分组时,相邻组的组限必须重合。按 习惯规定,各组内不包括上限数值,即“上组限 不在内”原则。如:营业额(万元)5-10 、1015、15-20、20-25、25-30(连续组距分组)
对离散变量分组时。如:年龄 20岁以下、21-30、 31-40、41-50、51岁以上(间断组距分组)
系列1
20
调研结果的表述
60% 50% 40% 30% 20% 10% 0%
超市
购买场所VS性别
男
女
街头小店 活动冷饮车 批发店 餐馆、专卖店 大卖场 21
调研结果的表述
9% 7% 6.50%
AEI-末夏 AEI-初夏
AEI-盛夏 5%
3.40%
3%
2.30%
1.40% 1.20%
-0.10% -0.10%
一般文员/业务 人员 14%
企业管理人员 19%
技术人员 16%
社会科学专业人 员 2%
工厂/商店职员 19% 个体户 5%
待业 2%
退休人员
其他
3%
9%
家庭主妇
2%
学生 2%
机关团体干部
教育工作者
6%
10%
25
调研结果的表述
0%
电视广告 同事、亲戚或朋友
商店宣传资料 报刊广告
促销人员介绍 自己使用同品牌产品的经验
百分比(%) 11.1 18.9 33.7 18.3 18.0 100.0
14
统计表的典型形式
婚姻、性别与时装购买选择分布表
时装购买选择 小计 高档时装 171
中档时装 219
低档时装 130 被调查者人数 520
男性 已婚 125
164
101 390
未婚 46
55
29 130
小计 169
203
108 480
网图
民
上
网
目
的 的
年
构月
成与
比
较
年
月 两 次 调 查
其他 学术研究
获取信息
50 47.6 4037.8 30
休闲娱乐 37.9
20 3.7 210
18.9
1.4 0.80
2 1.2 4.4 1.3
6.6 10.3
5.9 14.9
学习
对外通信
免费资源
交友
10th200206 16th200506
24
调研结果的表述
要特征。当我们度量现象的集中趋势,即研究现象的一般 水平时,显然不能用其中一个个别的观察值来表示,而只 能用一个有代表性的量把现象的一般水平表现出来,这个 量就是平均数。 在度量集中趋势的各种平均数中,最常用的有众数、中位 数、算术平均数三种。
28
2.集中量数的两个显著特点
一是抽象性。用一个数值来代表一组数据,对原始数据来 说是一种简化的过程。
1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 2800-3000 3000以上
4
50
8
100
5
45
10
90
13
44
26
88
25
37
50
74
36
25
72
50
44
14
88
28
47
6
94
12
50
3
100
6
13
调查资料的描述
一、调查结果的表格化
女性 已婚
75
135
90 300
未婚 94
68
18 180
15
统计表的结构
从形式上看: 统计表 总 标 题 写在表的上端中部
横行标题 写在表的左方 纵栏标题 写在表的上方 指标数值 写在交叉对应处 从内容上看: 统计表 主词 列在横行标题的位置 宾词 列在纵栏标题的位置
16
统计表的设计
必须遵循科学、实用、简练、美观的原则。 统计表形式的设计 应设计成由纵横交叉组成的长方形表格,长宽
如日本一专家根据对作出杰出贡献的许多科学家的调查, 得出脑力劳动者的最佳智力年龄区是45岁左右。也许没 有一位科学家刚好在45岁作出最大的科研成果,但这一 数值却是全体成员年龄的集中表现。
4
8
1
2
8
16
12
24
11
22
8
16
3
6
3
6
合计
50
100
Me
2200
25 13 200 12
2400(元)
Me
2200 2513 200 2400(元)
12
12
某市50户居民消费品支出情况分布 表2
累计频数(户)
累计频率(%)
按户消费支出分组(元) 以下累计 以上累计 以下累计 以上累计
数值型数据可以是离散数据,或者是连续数据。 离散型数据的频数分布是将每一个变量值作为一组,
统计每组变量值出现的频数,列出频数分布表。如: 对城市家庭按照儿童数量分组,可分成0、1、2、3等 组。 连续型变量数据的频数分布要求首先对变量值进行分 组,然后统计出变量每一组值出现的次数或频度。例 如,家庭按人均居住面积分组分为:4平方米以下、 4-14平方米、14平方米以上。 频率分布分析:它指出每个问题中各备选答案被选择的 数量。
分组的基本作用 (1)划分市场现象的类型。 (2)表明市场现象的内部结构。 (3)反映现象间的依存关系。
5
某种产品在某市场上的总供给量
分类
市场总供给量
合计
100%
国有制企业 “三资”企业
民营企业 其他类型企业
28.63% 17.45% 42.12% 11.80%
6
数值型数据分组与频数分布
之间应保持适当的比例。 表上、下两端的端线应以粗线或双线绘制,其
他线条应以细线绘制,左右两端均不划线。 横行合计应列在最后一行,纵栏合计应列在最
前一栏。
17
统计表制表技术要求
文字工整、字迹清晰、数字对齐。 统计数字部分不应留有空白。 对需要特殊说明的统计指标和数据,应
在表下加注说明。
18
对以上调查资料采用等距分8组,组距200元,编 制组距数列、频数、频率、以上累计和以下累计如 下表1:
11
某市50户居民消费品支出情况分布 表1
按户消费支出分组(元)
频数(户) 频率(%)
1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 2800-3000 3000以上
1660 1760 2460 2200 2360 3160 2420 2920 2340 2160 2100 2200 2140 2740 2400 3260 2500 2720 2540 2840 2360 2060 2740 2300 2820 2340 2460 2530 2760 3020 2020 1720 1620 2260 2280 2380 2520 2700 1860 2840 2160 2020 2100 2500 2320 2640 2760 2620 2540 2500
统计图可采用手工制作,也可以采用电脑作为辅助工具 进行制作。
19
(一)统计图的要素 完整的统计图包括六个要素:即图号、图名、图目、图尺、 图形和图注。
百分比
图11-1 某大学学生半年上网购物次数的调查统 计图
60%
50%
40%
30%
20%
10%
0% 1-2 次
3-5次
6-10次 10次以上
购买次数
组数K≈6,
组距≈8(调整为10)。
借助EXCEL软件列出该地区网民每月实际上网费用的频 数分布如表11-3所示。
表11-3 某地区网民每月实际上网费用的频数分布
按费用分组
30-39
40-49
50-59
60-69
70-79
用户数(频数)
1
4
9
5
4
用户比例(%)
4.2%
16.7%
37.5%
20.8%
16.7%
7
连续型变量数据的等距分组的步骤
第一,选择恰当的分组标志; 第二,确定分组界限; 第三,确定分组形式;变量值可以采用等距分组或
不等距分组。 第四,确定组距和组数。 可以按 斯特杰斯(Sturges)提出的经验公式来确定
组距:
d R 1 3.3lg N
组距=(最大变量值-最小变量值)/组数
8
[例11.1] 从某地区抽取24名互联网用户,得知其月均上网费用 (单位:元)如下:34,47,55,42,71,68,46,83,51,53, 59,60,63,65,74,57,57,54,67,55,73,49,54,77。
试对上述数据分组并列出频数分布表。
按照连续型数据的分组步骤完成组数、组距的计算:
频数 55 68 108 73 61
累加频数 55 123 231 304 365
单位:箱
频 率(%) 15.1 18.6 29.6 20.0 16.7
累加频率(%) 15.1 33.7 63.3 83.3 100.0
10
市场调查数据资料分组举例
对某市50户居民抽样调查得到的消费品支出资料如 下:(单位元)
统计表是数据资料表现的一种重要方式,它能够简明 地描述资料的特性以及不同资料之间的关系,便于进 行比较分析。在封闭式问卷中,每个调查问项都是分 组的标准,问项下的备选答案都是分组后的组别或类 别。
购买意愿 绝对会买 很可能会买 不知道 很可能不买 绝对不买 合计
资料表格化形式 数值(频率)
124 211 376 204 200 1115
第11章 数据分析
1
数据分类/分组与频数分布
一、调查资料的分组
审核后的数据资料只有进行分组和汇总,才能 为市场分析提供系统化和条理化的综合指标数 据。
分组是根据调查任务的要求和事物本身的特点, 按照一定的标准或标志将所调查的数据资料分 为若干组成部分或类别的一种统计方法。
2
调查资料的分组
分组标志分为品质标志和数量标志。 品质标志是指按事物属性方面的差别分组。 例如,按照企业进行产品宣传的媒体类别标志分组,可划
上网 主要目的
获取 信息
休闲 娱乐
学习
交友
免费 资源
对外 通信
学术 研究
其他
2002年6月第10次调查 47.6% 18.9% 6.6% 14.9% 1.2% 4.4% 0.8% 3.7%
2005年6月第16次调查 37.8% 37.9% 10.3% 5.9% 1.3% 2% 1.4% 2%
11-6 2002 6 2005 6
二、统计图
统计图以圆点多少、直线长短、曲线起伏、条形长短、 柱状高低、圆饼面积、体积大小、实物形象大小或多少、 地图分布等图形来陈示调查数据。
用统计图陈示调查数据具有“一图抵千字”的表达效果, 因为图形能给人以深刻而明确的印象,能揭示现象发展 变化的结构、趋势、相互关系和变化规律,便于表达、 宣传、讲演、广告和辅助统计分析。但统计图能包含的 统计项目较少,且只能显示出调查数据的概数,故统计 图常配合统计表、市场调查报告使用。图示的主要种类 有条形图、圆形图、曲线图和统计地图。
组中值是代表各组变量值平均水平的数值。往往 用组中值作为各组变量值的代表值。
组中值=(上限值+下限值)/2
9
请思考:某超市一年的日销量最大为892箱,最小为 403箱,如何分组?
分析:一般可在400~899的范围内分为5组,于是有 以下结果:
销售量频数、频率统计表
日销售量 400~499 500~599 600~699 700~799 800~899
上、高中、初中、小学、文盲和半文盲等。 人口按照性别标志分为男、女两组; 企业按照组织形式标志分为个人业主企业、合伙制企业、
股份制企业、合资企业等均属此类。
3
数量标志分组是指按事物数量方面的差异来分组。 如消费者按人口、年龄、人均收入分组、企业规模 按营业额分组等。
居民的生活水平分组,按照居民家庭的恩格尔系数 标志分为:
在60%以上居民家庭归为贫困家庭; 在50%-60%的家庭归为温饱家庭; 在40%-50%的家庭归为小康家庭; 在40%以下的家庭归为富裕家庭。
4
资料分组的原则和作用
分组的原则:同质性、差异性、概括性。 同质性:各组内的资料必须具有相同的性质。 差异性:级别之间的资料存在质和量的差别。 概括性:分组后所有单位都有归属的类或组,无一遗漏。
1%
0.50%
-1% 蔓登琳 圣麦乐 光明 和路雪 雀巢 伊利 雪克 八喜 冷狗 -1.00%
-3%
22
调研结果的表述
80%
78%
70%
60%
50%
40%
30%
20%
10%
0% 财经新闻
65% 股票投资
最多
其次
再次
总和
32%
30%
26%
投资学园
市场经营
宏观焦点
23
调研结果的表述
表11-4 2002年6月与2005年6月两次调查网民上网主要目的的比较
电视新闻报道 活动广告
报刊介绍文章 让利、抽奖等促销活动
路牌广告
20%
40%
60%
已购者 欲购者
80%
100%
26
调研结果的表述
35% 30% 25% 20% 15% 10%
5% 0%
0 -5%
0.02
0.04
0.06
0.08
0.1
0.12
27
数据的集中量数分析与离中量数分析
一、数据的集中量数分析 1.集中量数的意义 集中量数也称集中趋势,也就是人们通常说的“平均值”。 平均指标反映了总体分布的集中趋势,它是总体分布的重
80-89 1
4.2%
第五,确定组限与组中值。每组的起点数为下限, 终点数为上限。
对连续变量分组时,相邻组的组限必须重合。按 习惯规定,各组内不包括上限数值,即“上组限 不在内”原则。如:营业额(万元)5-10 、1015、15-20、20-25、25-30(连续组距分组)
对离散变量分组时。如:年龄 20岁以下、21-30、 31-40、41-50、51岁以上(间断组距分组)
系列1
20
调研结果的表述
60% 50% 40% 30% 20% 10% 0%
超市
购买场所VS性别
男
女
街头小店 活动冷饮车 批发店 餐馆、专卖店 大卖场 21
调研结果的表述
9% 7% 6.50%
AEI-末夏 AEI-初夏
AEI-盛夏 5%
3.40%
3%
2.30%
1.40% 1.20%
-0.10% -0.10%
一般文员/业务 人员 14%
企业管理人员 19%
技术人员 16%
社会科学专业人 员 2%
工厂/商店职员 19% 个体户 5%
待业 2%
退休人员
其他
3%
9%
家庭主妇
2%
学生 2%
机关团体干部
教育工作者
6%
10%
25
调研结果的表述
0%
电视广告 同事、亲戚或朋友
商店宣传资料 报刊广告
促销人员介绍 自己使用同品牌产品的经验
百分比(%) 11.1 18.9 33.7 18.3 18.0 100.0
14
统计表的典型形式
婚姻、性别与时装购买选择分布表
时装购买选择 小计 高档时装 171
中档时装 219
低档时装 130 被调查者人数 520
男性 已婚 125
164
101 390
未婚 46
55
29 130
小计 169
203
108 480
网图
民
上
网
目
的 的
年
构月
成与
比
较
年
月 两 次 调 查
其他 学术研究
获取信息
50 47.6 4037.8 30
休闲娱乐 37.9
20 3.7 210
18.9
1.4 0.80
2 1.2 4.4 1.3
6.6 10.3
5.9 14.9
学习
对外通信
免费资源
交友
10th200206 16th200506
24
调研结果的表述
要特征。当我们度量现象的集中趋势,即研究现象的一般 水平时,显然不能用其中一个个别的观察值来表示,而只 能用一个有代表性的量把现象的一般水平表现出来,这个 量就是平均数。 在度量集中趋势的各种平均数中,最常用的有众数、中位 数、算术平均数三种。
28
2.集中量数的两个显著特点
一是抽象性。用一个数值来代表一组数据,对原始数据来 说是一种简化的过程。
1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 2800-3000 3000以上
4
50
8
100
5
45
10
90
13
44
26
88
25
37
50
74
36
25
72
50
44
14
88
28
47
6
94
12
50
3
100
6
13
调查资料的描述
一、调查结果的表格化
女性 已婚
75
135
90 300
未婚 94
68
18 180
15
统计表的结构
从形式上看: 统计表 总 标 题 写在表的上端中部
横行标题 写在表的左方 纵栏标题 写在表的上方 指标数值 写在交叉对应处 从内容上看: 统计表 主词 列在横行标题的位置 宾词 列在纵栏标题的位置
16
统计表的设计
必须遵循科学、实用、简练、美观的原则。 统计表形式的设计 应设计成由纵横交叉组成的长方形表格,长宽
如日本一专家根据对作出杰出贡献的许多科学家的调查, 得出脑力劳动者的最佳智力年龄区是45岁左右。也许没 有一位科学家刚好在45岁作出最大的科研成果,但这一 数值却是全体成员年龄的集中表现。
4
8
1
2
8
16
12
24
11
22
8
16
3
6
3
6
合计
50
100
Me
2200
25 13 200 12
2400(元)
Me
2200 2513 200 2400(元)
12
12
某市50户居民消费品支出情况分布 表2
累计频数(户)
累计频率(%)
按户消费支出分组(元) 以下累计 以上累计 以下累计 以上累计
数值型数据可以是离散数据,或者是连续数据。 离散型数据的频数分布是将每一个变量值作为一组,
统计每组变量值出现的频数,列出频数分布表。如: 对城市家庭按照儿童数量分组,可分成0、1、2、3等 组。 连续型变量数据的频数分布要求首先对变量值进行分 组,然后统计出变量每一组值出现的次数或频度。例 如,家庭按人均居住面积分组分为:4平方米以下、 4-14平方米、14平方米以上。 频率分布分析:它指出每个问题中各备选答案被选择的 数量。
分组的基本作用 (1)划分市场现象的类型。 (2)表明市场现象的内部结构。 (3)反映现象间的依存关系。
5
某种产品在某市场上的总供给量
分类
市场总供给量
合计
100%
国有制企业 “三资”企业
民营企业 其他类型企业
28.63% 17.45% 42.12% 11.80%
6
数值型数据分组与频数分布
之间应保持适当的比例。 表上、下两端的端线应以粗线或双线绘制,其
他线条应以细线绘制,左右两端均不划线。 横行合计应列在最后一行,纵栏合计应列在最
前一栏。
17
统计表制表技术要求
文字工整、字迹清晰、数字对齐。 统计数字部分不应留有空白。 对需要特殊说明的统计指标和数据,应
在表下加注说明。
18
对以上调查资料采用等距分8组,组距200元,编 制组距数列、频数、频率、以上累计和以下累计如 下表1:
11
某市50户居民消费品支出情况分布 表1
按户消费支出分组(元)
频数(户) 频率(%)
1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 2800-3000 3000以上
1660 1760 2460 2200 2360 3160 2420 2920 2340 2160 2100 2200 2140 2740 2400 3260 2500 2720 2540 2840 2360 2060 2740 2300 2820 2340 2460 2530 2760 3020 2020 1720 1620 2260 2280 2380 2520 2700 1860 2840 2160 2020 2100 2500 2320 2640 2760 2620 2540 2500
统计图可采用手工制作,也可以采用电脑作为辅助工具 进行制作。
19
(一)统计图的要素 完整的统计图包括六个要素:即图号、图名、图目、图尺、 图形和图注。
百分比
图11-1 某大学学生半年上网购物次数的调查统 计图
60%
50%
40%
30%
20%
10%
0% 1-2 次
3-5次
6-10次 10次以上
购买次数
组数K≈6,
组距≈8(调整为10)。
借助EXCEL软件列出该地区网民每月实际上网费用的频 数分布如表11-3所示。
表11-3 某地区网民每月实际上网费用的频数分布
按费用分组
30-39
40-49
50-59
60-69
70-79
用户数(频数)
1
4
9
5
4
用户比例(%)
4.2%
16.7%
37.5%
20.8%
16.7%
7
连续型变量数据的等距分组的步骤
第一,选择恰当的分组标志; 第二,确定分组界限; 第三,确定分组形式;变量值可以采用等距分组或
不等距分组。 第四,确定组距和组数。 可以按 斯特杰斯(Sturges)提出的经验公式来确定
组距:
d R 1 3.3lg N
组距=(最大变量值-最小变量值)/组数
8
[例11.1] 从某地区抽取24名互联网用户,得知其月均上网费用 (单位:元)如下:34,47,55,42,71,68,46,83,51,53, 59,60,63,65,74,57,57,54,67,55,73,49,54,77。
试对上述数据分组并列出频数分布表。
按照连续型数据的分组步骤完成组数、组距的计算:
频数 55 68 108 73 61
累加频数 55 123 231 304 365
单位:箱
频 率(%) 15.1 18.6 29.6 20.0 16.7
累加频率(%) 15.1 33.7 63.3 83.3 100.0
10
市场调查数据资料分组举例
对某市50户居民抽样调查得到的消费品支出资料如 下:(单位元)
统计表是数据资料表现的一种重要方式,它能够简明 地描述资料的特性以及不同资料之间的关系,便于进 行比较分析。在封闭式问卷中,每个调查问项都是分 组的标准,问项下的备选答案都是分组后的组别或类 别。
购买意愿 绝对会买 很可能会买 不知道 很可能不买 绝对不买 合计
资料表格化形式 数值(频率)
124 211 376 204 200 1115
第11章 数据分析
1
数据分类/分组与频数分布
一、调查资料的分组
审核后的数据资料只有进行分组和汇总,才能 为市场分析提供系统化和条理化的综合指标数 据。
分组是根据调查任务的要求和事物本身的特点, 按照一定的标准或标志将所调查的数据资料分 为若干组成部分或类别的一种统计方法。
2
调查资料的分组
分组标志分为品质标志和数量标志。 品质标志是指按事物属性方面的差别分组。 例如,按照企业进行产品宣传的媒体类别标志分组,可划
上网 主要目的
获取 信息
休闲 娱乐
学习
交友
免费 资源
对外 通信
学术 研究
其他
2002年6月第10次调查 47.6% 18.9% 6.6% 14.9% 1.2% 4.4% 0.8% 3.7%
2005年6月第16次调查 37.8% 37.9% 10.3% 5.9% 1.3% 2% 1.4% 2%
11-6 2002 6 2005 6
二、统计图
统计图以圆点多少、直线长短、曲线起伏、条形长短、 柱状高低、圆饼面积、体积大小、实物形象大小或多少、 地图分布等图形来陈示调查数据。
用统计图陈示调查数据具有“一图抵千字”的表达效果, 因为图形能给人以深刻而明确的印象,能揭示现象发展 变化的结构、趋势、相互关系和变化规律,便于表达、 宣传、讲演、广告和辅助统计分析。但统计图能包含的 统计项目较少,且只能显示出调查数据的概数,故统计 图常配合统计表、市场调查报告使用。图示的主要种类 有条形图、圆形图、曲线图和统计地图。
组中值是代表各组变量值平均水平的数值。往往 用组中值作为各组变量值的代表值。
组中值=(上限值+下限值)/2
9
请思考:某超市一年的日销量最大为892箱,最小为 403箱,如何分组?
分析:一般可在400~899的范围内分为5组,于是有 以下结果:
销售量频数、频率统计表
日销售量 400~499 500~599 600~699 700~799 800~899