数据分析期末试题及答案
电子商务数据分析期末试题(一)含答案

电子商务数据分析期末试题(一)含答案电子商务数据分析期末试题(一)含答案一、填空题 (共 10 题,每题 1 分。
)1.输入公式的方法与输入文字型数据类似,不同的是它必须以__________作为开头,然后才是公式的表达式。
2. Excel 中__________是计算和存储数据的文件,它由__________构成。
3 .在设置单元格区域时,两单元格之间用冒号(:)表示______________________________;单元格之间用单引号(’ )表示____________________。
4. ________________能直接反映消费者流量,帮助企业调整销售方向,影响企业的经济效益。
5.选择要输入身份证号码的单元格,在输入身份证号码的数字前先输入一______________________________,然后再输入身份证号码即可。
6. __________是指一定时期内,每一位消费者购买商品的平均金额,也就是平均交易金额。
7.生意参谋中的“__________”功能版块可以纵览店铺的各项交易数据,能够清楚显示店铺的运营情况和出现的问题。
8. __________是指消费者直接通过关键词搜索等途径进入店铺中的流量。
9. __________是百度指数的默认显示模块,可以反映搜索指数和咨询指数的趋势情况。
10. Excel 中的求和函数是__________。
二、单项选择题 (共 10 题,每题 1 分。
)1.()是转化漏斗模型的最后一个环节,它能够准确反映出店铺的整个成交转化情况。
A.有效入店率B.咨询转化率C.订单支付率D.成交转化率2.函数 AVERAGE(A1:B5)相当于()。
A.求(A1: B5) 区域的最小值B.求(A1: B5) 区域的平均值C.求(A1: B5) 区域的最大值D.求(A1: B5) 区域的总和3.工作表被保护后,该工作表中的单元格的内容、格式()。
第六章数据分析期末复习专练答案解析

数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。
电子商务数据分析 期末考卷(三)含答案

电子商务数据分析期末考卷(三)含答案1.电商运营核心指标中,用于判断营销效果的指标是哪个?标准答案:B正确答案:B2.下面关于RFM分析法中第一个指标R的说法正确的是什么?标准答案:B正确答案:B3.对某款冲锋衣及其竞品从防水、防风、透气、保暖、耐磨5个维度进行比较,选用哪种图表比较合适?标准答案:C正确答案:C4.在图表中分别展示A店铺与B店铺2014-2019年成交金额的变化趋势,适合选用哪种图表?标准答案:A正确答案:A5.在电子商务运营过程中,当浏览量数据出现异常,持续下跌,可能导致异常的原因是什么?标准答案:B正确答案:B6.下列行为不符合数据分析人员职业道德的是什么?标准答案:C正确答案:C7.VLOOKUP函数是Excel中的哪种函数,与LOOKUP函数和HLOOKUP函数属于一类函数?标准答案:A正确答案:A8.当一个企业购入原材料,使用移动平均法对发出成本进行计算,如果原有材料单价为2元,数量为200件,一次购入原材料实际单价为3元,数量为100件,那么发出成本的单价是多少元?标准答案:D正确答案:D9.对比分析的方法中,环比分析法是对同类指标本期与上期数据进行比较,常用于企业数据分析来比较同一年不同时间段的情况。
10.绘制漏斗图时,占位数据的计算公式为(最初环节数据-正在进行环节数据)÷2.11.借助时间序列进行对比分析是进行不同时期对比的方法。
12.在进行对比分析时,要选择具有可比性的多个指标进行比较,不具有可比性的指标包括客单价与订单响应时长。
13.LEFT函数的语法为:=LEFT(text,[num_chars]),其中text指的是需要提取字符的字符串。
14.常用的数据分类与处理方法包括数据清洗、数据计算、数据排序,但不包括分层统计。
15.店铺成交客户平均购买次数的最小值为1.16.发出成本的单价为:(2*200+3*100)/(200+100)。
1.下列不属于市场指标的是什么?A。
《电商数据分析》期末复习题

《电商数据分析》期末复习题您的姓名: [填空题] *_________________________________1、下列数据指标中不属于供应链指标的是()。
[单选题] *A、订单满足率B、商品访客数(正确答案)C、库存周转率D、平均配送成本2、下列不属于指数工具的是()。
[单选题] *A、百度指数B、百度统计(正确答案)C、搜狗指数D、360趋势3、以下第三方工具中可查看竞争对手店铺销售数据、引流途径、广告投放、活动推广等数据信息的是()。
[单选题] *A、店侦探(正确答案)B、京东商智C、火车采集器D、百度指数4、()是产品在平台交易热度的体现,是衡量店铺、产品受欢迎程度的一个重要指标,它越高该产品越受消费者欢迎。
[单选题] *A、产品交易指数(正确答案)B、产品搜索指数C、产品购买指数D、产品收藏指数5、下列采集行为属于违法行为的是()。
[单选题] *A、使用生意参谋工具导出自己店铺运营数据B、使用百度指数工具获取关键词搜索指数及用户画像数据C、通过技术手段进入竞争对手网站数据库获取网站流量及销售数据(正确答案)D、使用数据采集工具采集其他网站公开数据信息用于数据分析6、以下不属于客户行为数据的是()。
[单选题] *A、购买时间B、客户地域(正确答案)C、支付金额D、评价7、产品获客能力是对产品为店铺或平台获取新客户的能力的衡量,主要指标不包括()。
[单选题] *A、客户关注量B、收藏量C、重复购买率D、店铺销售额(正确答案)8、在Excel中COUNT函数的功能是()。
[单选题] *A、求和B、计数(正确答案)C、算平均值D、条件求和9、某网店是一家经营化妆品的网店,近期,该网店的客户总数为200人,其中30人重复购买,这30人中有18人重复购买1次(即:购买2次),有12人重复购买2次(即:购买3次),那么交易次数计算,近期该网店的复购率是()。
[单选题] *A、21%(正确答案)B、18%C、15%D、30%10、某企业店铺单日成交了4个客户的订单,订单金额分别是:4620元、5670元、3850元、6660元,其客单价为()。
Excel商务数据分析与应用-期末试卷(含答案)

10._________用高亮颜色展示用户的访问偏好,对用户的体验数据进行可视化展示。
二、单项选择题 (共10题,每题1
1.下列不属于流量数据的是()。
A.人均费用
B.浏览量
C.访客数
D.在线时长
2.下列恒道
D.谷歌分析
3.下列属于数据收集内部渠道的是()。
①客户调查②专家与客户访谈③专业调研机构④内部数据库
A.①、②、④
B.①、③、④
C.①、②、③
D.全部
4.下列不属于数据分析工具的是()
A.SPSS
B.R
C.PowerPoint
5.绩效考核一般以()为单位。
A.天
B.周
C.月
D.年
6.一般情况下可以将用户的维度归纳为四类,下列属于用户维度的有()。
A.爱好
B.屏幕大小
C.广告来源
D.用户活跃度
7.线下供货商主要有()。
A.商品批发市场
B.实体店
C.生产厂家
D.商家网站
8.下列属于前端行为数据的有()。
A.访问量
B.浏览量
C.站内搜索
C.跳失率
D.转化率
9.下列不属于营运指标的是()。
A.成交指标
B.订单指标
C.会员指标
D.采购指标
10.在用户分群的基础上,一般抽取()个用户来进行细查即可覆盖分群用户大部分的行为规律。
A.1~2
B.2~3
C.3~5
D.5~10
三、多项选择题 (共10题,每题2
1.下列属于后端商业数据的是()。
python数据分析期末考试题及答案

python数据分析期末考试题及答案一、单项选择题(每题2分,共20分)1. 在Python中,用于数据科学计算的库是:A. NumPyB. MatplotlibC. PandasD. SciPy答案:A2. 下列哪个函数用于计算数组的均值?A. mean()B. median()C. sum()D. count()答案:A3. Pandas中,哪个函数用于读取CSV文件?A. read_csv()B. read_excel()C. read_sql()D. read_html()答案:A4. 在Pandas中,DataFrame的列可以被重新命名,使用的方法是什么?A. rename()B. rename_axis()C. set_axis()D. set_index()答案:A5. 如果要将一个Pandas DataFrame的列转换为行,应该使用哪个方法?A. transpose()B. pivot()C. melt()D. reshape()答案:A二、多项选择题(每题3分,共15分)1. 下列哪些函数可以用来创建NumPy数组?A. array()B. zeros()C. ones()D. linspace()答案:ABCD2. Pandas中,哪些方法可以用来删除DataFrame中的行?A. drop()B. remove()C. delete()D. pop()答案:AD3. 在Python数据分析中,哪些库常用于数据可视化?A. MatplotlibB. SeabornC. PlotlyD. Bokeh答案:ABCD三、简答题(每题5分,共30分)1. 请解释Python中列表推导式的作用。
答案:列表推导式是一种简洁的构建列表的方法,它允许开发者通过一个表达式来创建列表,这个表达式可以包含条件语句和循环语句。
2. 描述Pandas中DataFrame和Series的主要区别。
答案:DataFrame是一个二维标签化数据结构,可以看作是由多个Series组成的,每个Series可以看作是DataFrame的一列。
数据分析与可视化技术期末考试试卷及答案

数据分析与可视化技术期末考试试卷及答案一、单项选择题(以下各题只有一项为正确答案,每小题2分,共40分)(1)使用python3命令在当前路径创建虚环境“prjVenv”,正确的命令是()。
A.python3 prjVenvB.python3 -m theVenvC.python3 -m venvprjVenvD.python3 -m venv@prjVenv(2)以下哪一项不是现代主流的云服务计算模型。
()A.基础设施即服务(IaaS,Infrastructure as a Service)B. 硬件即服务(HaaS,Hardware as a Service)C.平台即服务(PaaS,Platform as a Service)D.软件即服务(SaaS,Software as a Service)(3)运行如下flask代码后,使用浏览器访问“localhost:5000/index”页面输出结果是()。
from flask import Flaskapp = Flask(__name__)@app.route('/index')def index():return 'Hello World!'A.app.routeC.Hello World!D.'Hello World!'(4)需要在代码中引入pyecharts包的options成员,应该使用()命令实现。
A.import pyecharts and optionsB.frompyechartsimport optionsC.import pyecharts’ optionsD.import options from pyecharts(5)开发人员可以远程访问运行在aws平台linux2虚机上的jupyter-notebook服务。
访问jupyter-notebook服务默认的网络端口是()。
python数据分析期末考试题及答案

python数据分析期末考试题及答案一、选择题(每题2分,共10分)1. 在Python中,用于数据分析最常用的库是哪一个?A. NumPyB. MatplotlibC. PandasD. TensorFlow答案:C2. DataFrame对象是Pandas库中的哪种数据结构?A. 数组B. 字典C. 列表D. 表格答案:D3. 下列哪个函数可以用来计算DataFrame中数值列的平均值?A. sum()B. mean()C. max()D. median()答案:B4. 如何将字符串类型的日期转换为Python的datetime对象?A. strptime()B. strftime()C. datetime()D. parse()答案:A5. 在Pandas中,如何对DataFrame进行分组操作?A. group()B. groupby()C. aggregate()D. combine()答案:B二、填空题(每题3分,共15分)1. 使用Pandas进行数据分析时,____函数可以用来读取CSV文件。
答案:read_csv2. 如果要将DataFrame的列名重命名为新的名称,可以使用____方法。
答案:rename3. 在Pandas中,____函数可以用于计算两个日期之间的时间差。
答案:pd.to_timedelta4. 当需要对DataFrame的列进行排序时,可以使用____方法。
答案:sort_values5. 为了在Pandas中筛选出满足特定条件的行,可以使用____方法。
答案:query三、简答题(每题10分,共20分)1. 描述如何使用Pandas库对DataFrame进行数据清洗,包括处理缺失值和异常值。
答案:在Pandas中,可以使用dropna()方法删除含有缺失值的行或列,使用fillna()方法填充缺失值。
对于异常值,可以使用describe()方法查看数据的统计摘要,然后根据业务逻辑和统计分析确定异常值,并使用loc或mask等方法进行替换或删除。
《 数据分析 》课程期末考试试题A卷

命题方式:单独命题佛山科学技术学院2008—2009学年第一学期《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:共3 页第 2 页共 3 页第3 页一(1)SAS界面包括输出框,日志框,编辑器(2)在非数值变量后面家上”$”符号.(3) 自由格式输入数据应加上”@@”标记.(4) 三均值的计算公式^M=1/4Q1+1/2M+1/4Q3二程序:data t1;input x@@;cards;100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal;run;proc capability graphics normal;histogram x/normal;qqplot x/normal(….);run;(1)由上图可知道均值:109.510556 方差:40.5703938变异系数:5.81632451 峰度:0.05978054偏度:-0.3324812(2)中位数:上四分位数:下四分位数:四分位极差:(3)做出直方图、QQ图、茎叶图、箱线图直方图:QQ图茎叶图:箱线图:(4)进行正态性W 检验(取05.0=α).由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。
三data t2; input x1-x4; cards ;16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8proc corr cov pearson ; run ;(1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:Pearson 相关矩阵:(2)分析各指标间的相关性(取10.0=α)由Pearson 相关矩阵的上三角矩阵看出r13,r14都大于10.0=α 故这些向量的相关性不是很强。
数据分析期末考试试卷(附带答案)

数据分析期末考试试卷(附带答案)请注意以下说明:- 本试卷共分为两部分:选择题和解答题。
- 所有答案均应在答题纸上写出,并标明题号。
- 每道选择题只有一个正确答案,请选出最恰当的答案。
- 解答题应尽量简洁明了,如有计算过程,请写清楚。
- 考试时间为120分钟,试卷满分为100分。
- 祝你好运!选择题1. 数据分析的目的是:A. 收集数据B. 组织数据C. 提取信息D. 分享结果2. 下面哪个不是数据分析常用的可视化工具:A. 折线图B. 饼图C. 柱状图D. 线性回归模型3. 数据清洗是指:A. 删除不需要的数据B. 处理数据中的缺失值和异常值C. 将数据转换为可视化形式D. 对数据进行统计分析4. 数据挖掘是从大量的数据中发现:A. 数据的类型B. 数据的来源C. 数据的模式和关联性D. 数据的质量5. 在回归分析中,用于预测的变量称为:A. 因变量B. 自变量C. 联合变量D. 相关变量解答题1. 简述数据分析的步骤。
2. 举例说明数据清洗的过程。
3. 什么是数据可视化?简要介绍一种常用的数据可视化工具。
4. 解释线性回归模型的概念和作用。
5. 什么是关联分析?举例说明如何进行关联分析。
答案选择题:1. C2. D3. B4. C5. B解答题:1. 数据分析的步骤包括:收集数据、清洗数据、探索数据、分析数据、可视化数据和得出结论。
2. 数据清洗的过程可以举例为以下步骤:- 删除含有缺失值的观测数据- 填充缺失值- 删除异常值- 校验数据是否符合预设规则3. 数据可视化是通过图表、图形等方式将数据转化为可视形式以便更好地理解和分析数据的过程。
一种常用的数据可视化工具是柱状图,它可以直观地展示不同类别或变量之间的比较情况。
4. 线性回归模型是一种用于建立因变量与一个或多个自变量之间关系的统计模型。
它的作用是通过对自变量与因变量的关系进行建模和分析,来预测因变量的数值。
5. 关联分析是对数据集中项之间的关联性进行探索和分析的过程。
《数据分析与SPSS软件应用》期末试卷及答案2套

《数据分析与SPSS软件应用》试卷A一、填空题(每空2分,共20分)1. 统计分析所使用的数据按照其测量精度,可以分为四种类型,分别是定性数据、定序数据、和。
2. SPSS中可以进行变量转换的命令有。
3. 多选项二分法是将设置为一个SPSS变量,而多选项分类法是将设置为SPSS变量。
4. 进行两独立样本群均值比较前,首先要验证的是。
5. 协方差分析中,对协变量的要求是数值型,多个协变量间互相独立和。
6. 多配对样本的柯克兰Q检验适用的数据类型为。
7. 衡量定距变量间的线性关系常用相关系数。
8.常用来刻画回归直线对数据拟合程度的检验统计量指标为。
二、选择题(每小题2分,共20分)1. 在SPSS中,以下哪种不属于SPSS的基本运行方式?()A 完全窗口菜单方式B 批处理命令方式C 程序运行方式D 混合运行方式2. 设置变量属性时,不属于SPSS提供的变量类型的是()A 数值型B 科学计数型C 分数型D 字符型3. 数据的描述统计分析结果显示偏度值为-1.3,则下列对数据分布状态说法正确的是()A 左偏B 正偏C 与正态分布一致D 可能存在极大值4. 若原假设与备择假设为:H0:μ1=μ2 H1:μ1≤μ2,则:()A 应使用右侧单尾检验B 应使用左侧单尾检验C 应使用双尾检验D 无法检验5. 下列哪个不是单因素方差分析的基本假定?()A 各总体的均值相等B 各总体相互独立C 样本来自于正态总体D 各总体的方差相等6. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是?()A 两个独立总体均值差的检验B 两个配对总体均值差的检验C 一个总体均值的检验D 单因素方差分析7. 皮尔逊简单相关系数为1,说明()A 两变量之间不存在线性相关关系B 两变量之间是负相关关系C 两变量之间存在完全的线性相关关系D 两变量之间具有高度相关性8.下列说法正确的是()A回归分析是以变量之间存在函数关系为前提的B回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法C 回归分析中自变量个数只能为一个D 回归分析是反应确定性问题的统计分析方法9.以下关于聚类分析的叙述中错误的是()A 聚类分析的目的在于将事物按其特性分成几个聚类,使同一类内的事物具有高度相似性B 不同聚类的事物则具有高度的异质性C 对于衡量相似性,只能使用距离的工具D 建立聚类的方法,有层次聚类法和快速聚类法10. 关于因子分析,错误的说法是()A 适用于多变量、大样本B 原变量间不必要存在高度的相关性C定类和定序变量不适合做因子分析D 因子得分可以作为新变量存储在数据表格中三、判断题(每小题2分,共20分)1. SPSS中可将”.”用于变量命名,且”.”可以位于变量名末尾。
大数据期末考试试题及答案

大数据期末考试试题及答案一、选择题(每题2分,共20分)1. 大数据的4V特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visibility(可见性)答案:D2. 在大数据环境下,以下哪个不是Hadoop生态系统中的组件?A. HBaseB. HiveC. SparkD. MongoDB答案:D3. 以下哪个不是大数据存储技术?A. NoSQLB. Hadoop Distributed File System (HDFS)C. Relational Database Management System (RDBMS)D. Distributed Cache答案:C4. 大数据中的数据挖掘过程不包括以下哪一步?A. 数据预处理C. 数据可视化D. 数据收集答案:C5. 以下哪个算法不是用于机器学习的?A. K-meansB. Decision TreesC. PageRankD. QuickSort答案:D6. 在大数据中,以下哪个不是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 增加数据量D. 标准化数据格式答案:C7. 以下哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 小型零售答案:D8. 以下哪个是大数据分析的挑战?B. 数据质量高C. 数据类型单一D. 数据处理速度慢答案:D9. 以下哪个是大数据可视化工具?A. ExcelB. TableauC. PhotoshopD. Word答案:B10. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 个人笔记答案:D二、简答题(每题10分,共30分)1. 请简述大数据的4V特征。
答案:大数据的4V特征包括Volume(体量),即数据量巨大;Velocity(速度),即数据生成和处理的速度非常快;Variety(多样性),即数据类型多样,包括结构化、半结构化和非结构化数据;Veracity(真实性),即数据的准确性和可靠性。
新媒体数据分析考试试卷答案

《新媒体数据分析》期末考试试卷答案注意事项:1.本试卷为闭卷考试。
2.应根据授课内容展开描述,有独到见解可加分。
3.请在两小时时间以内完成。
一、单选题(每小题2分,共20分)1.(B)是指将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除,最后整理成为可以进一步加工、使用的数据。
A.交叉分析法B.数据清洗C.用户分群D.漏斗分析法2.( D)是指用户对内容的点赞、留言等互动的情况,是衡量用户黏性的重要数据。
A.新增用户数据B.活跃用户数据C. 留存用户数据 D. 用户互动数据3.( B)指的是用户在一次登录、退出行为之间,用于阅读内容的时间总和,它是评估内容质量的一个数据指标。
A. 内容分享率B. 在线时长C. 完成阅读率D.内容分享人数4.(A )是指公众号运营人员设置好一定关键词规则后,用户在公众号消息页面发送该关键词,公众号会自动回复设置好的内容,回复内容的形式包括图文消息、纯文字、图片等。
A.消息关键词B.消息分析C.跳转链接D.收取消息5.在(C )模块,可以看到近 7 天、近 30 天、近 90 天或者近一年任意时段的粉丝增长情况。
A.取关粉丝B.活跃粉丝C.粉丝趋势分析D.今日可投粉丝6.(D)是反映文章是否能吸引用户读完的指标。
A.平均阅读量B.平均阅读进度C.收藏量D.读完量7.(A)是公众号用户在各地区的分布情况,可以具体到某个省内某个地级市的用户占比A. 地域归属数据B.实时竞价C.软广D.关键词标签技术8.(A)模块统计的是账号发布的头条文章的情况,包括文章发布数、文章阅读数和文章转评赞数。
A. 文章B.视频C.博文D.粉丝变化9.“文章内容被推荐到用户信息流的次数”指的是( C )A.读完量B.平均阅读速度C.推荐量D.收藏量10. “所有读者中,文章阅读进度不足 20%的读者占比”指的是单篇图文数据中的哪个指标?( A )A.跳出率B.用户黏性C.转化率D.以上都是二、多选题(每小题3分,共30分)1.在微博“数据概览”处可以看到昨日关键指标,包括(ABCDEFGH )A净增粉丝数、B阅读数、C转评赞数、D发博数、E文章发布数、F文章阅读数、G视频发布数、 H视频播放量,2.用户分享的动力来源分别是( BC )A.公众号消息阅读次数B.对内容质量的认可C.用户能表达自己的观点D.分享次数3.公众号图文阅读量的来源主要有两大渠道(C )和(D)。
《数据分析》期末复习题

《数据分析》期末复习题1. 在电子商务领域,商务数据可以分为两大类:_______和_____。
[填空题] *空1答案:前端行为数据空2答案:后端商业数据2. 场景营销是基于___、_____、_____等三大场景之一的一种新营销理念。
[填空题] *空1答案:输入场景空2答案:搜索场景空3答案:浏览场景3. 电商的基础数据主要有_____、____、会员数据、___和_____。
[填空题] *空1答案:营销数据空2答案:流量数据空3答案:交易及服务数据空4答案:行业数据4. 一般平台商都不支持____个月以上的交易数据下载。
[填空题] *_________________________________(答案:3)5. ____是电商运营的核心指标。
[填空题] *_________________________________(答案:转化率)6. 通常我们提到的转化率是____。
[填空题] *_________________________________(答案:成交转化率)7. ____是指为了达到某个目标进行多个方案并行测试,每个方案仅有一个变量不同,最后以某种规则选择最优的方案。
[填空题] *_________________________________(答案:A/B测试)8. ____用高亮颜色展示用户的访问偏好,对用户的体验数据进行可视化展示。
[填空题] *_________________________________(答案:热图|热力图)9. 下列不属于流量数据的是()。
[单选题] *A.人均费用(正确答案)B.浏览量C.访客数D.在线时长10. 下列属于第三方数据网站的是()。
[单选题] *A.百度统计B.数据魔方C.量子恒道(正确答案)D.谷歌分析11. 下列属于数据收集内部渠道的是()。
①客户调查②专家与客户访谈③专业调研机构④内部数据库 [单选题] *A.①、②、④(正确答案)B.①、③、④C.①、②、③D.全部12. 下列不属于数据分析工具的是() [单选题] *A.SPSSB.RC.PowerPoint(正确答案)D.Python13. ()是电商运营中采购与销售的中转站。
电子商务数据分析 期末试题(一)含答案

电子商务数据分析期末试题(一)含答案1.数据分析是数据分析报告写作的前提和基础。
2.订单满足率的计算公式为(单位时间内已完成订单数量/单位时间内已经接收的订单总数量)*100%。
3.点击率的计算公式为点击量/展现量×100%。
4.图表在数据分析报告中的目的是通过直观的表现形式,更有利于人们对数据的洞察。
5.数据分析报告常见的标题不包括排比型标题。
6.根据统计数据,11月份该女装网店的复购率为0.2.7.下单转化率是指确认订单客户数/该商品的总访问数×100%。
8.产品交易指数是产品在平台交易热度的体现,是衡量店铺、产品受欢迎程度的一个重要指标,它越高该产品越受消费者欢迎。
9.删除明显有问题的段落。
17.关于数据清洗,正确的说法是去重、补漏、纠错。
18.函数COUNTIF(range,criteria)的功能是计算某个区域中满足给定条件的单元格个数。
19.漏斗图分析数据分析方法适合分析业务周期长、流程规范且环节多的指标,比如网站转化率、销售转化率等。
20.这组价格中的众数和中位数分别是70、70元。
21.EXCEL描述统计结果中不包括加权算术平均数指标。
22.线性趋势线适用于增长或降低的速度比较平稳、关系稳定的数据集合。
23.2020年的预测销售量为57万件。
24.不考虑数据和时间之间的关系不属于时间序列预测法基本特点。
A、可以发现潜在的商机和市场需求B、可以优化产品和服务的设计和推广C、可以提高客户满意度和忠诚度D、可以帮助企业降低风险和避免经营错误25.在用来衡量离散程度的指标中,正确的说法是方差是标准差的平方。
26.图表的数据墨水比并不需要严格的搭配比例,只是一个观念,要求我们尽可能将墨水用在数据元素上,而不是非数据元素上。
因此选项C是错误的。
27.对于某销售水果的网店计划对其店中5个品种的橙子从甜度、个头、色泽、气味这4个维度进行综合分析,选用雷达图较为合适。
28.在电商企业日常运营报表中,无需体现行业发展数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析期末试题及答案一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命及人均GDP、成人识字率、一岁儿童疫苗接种率的关系。
(25分)解:1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。
尝试多种模型后采用曲线估计,得出表示地区平均寿命(y)及人均GDP(x1)的对数有线性关系上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。
上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。
上图是以疫苗接种率(x3)的三次方(33x)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间呈正线性关系所以可以采用如下的线性回归方法分析。
2.线性回归先用强行进入的方式建立如下线性方程设Y=β0+β1*(Xi1)+β2*Xi2+β3*3iX+εi i=1.2 (24)其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差模型汇总b模型R R 方调整 R方标准估计的误差1.952a.907.891 3.332a. 预测变量: (常量), x3, x1, x2。
b. 因变量: y上表是线性回归模型下的拟合优度结果,由上表知,R值为0.952,大于0.8,表示两变量间有较强的线性关系。
且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。
建立总体性的假设检验提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零得如下方差分析表上表是方差分析SAS输出结果。
由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)及人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。
做独立性的假设检验得出参数估计表上表是有关参数估计的信息,同样是上面的检验假设,H0:β1=β2=β3=0: H1:β1、β2、β3不全为零由表知,β1=33.014,β1=0.072,β2=0.169,β3=0.178,以β1=0.072为例,表示当成人识字率(x2),一岁儿童疫苗接种率(x3)不变时,,人均GDP(x1)每增加一个单位,平均寿命(y)就增加0.072个单位。
基于以上结果得出年平均寿命(y)及人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有显著性的线性关系有回归方程Y=33.014+0.072*X1+ 0.169*X2+ 0.178*X3β1、β2、β3对应得p值分别为0.000,0.000,0.002,对应的概率p值都小于0.05,表示它们的单独性的假设检验没通过,即该模型是最优的,所以不用采用逐步回归的方式分析。
对原始数据进行残差分析未标准化的残差RES_1-7.53964-3.57019-3.42221-2.89835-2.30455-2.17263-2.05862-1.37142-1.17048-.43890-.17260-.03190.946551.428961.612521.615902.101393.018563.025713.498084.607375.29645以X1为横轴,RES_1为纵轴画出如下散点图由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。
同理可以得出RES_1及X2、X3的散点图,由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。
由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。
误差项的正态性检验数据(RES_1)标准化残差ZRES_1由图可以看出,散点图近似的在一条直线附近,则可以认为数据来自正太分布总体二、诊断发现运营不良的金融企业是审计核查的一项重要功能,审计核查的分类失败会导致灾难性的后果。
下表列出了66家公司的部分运营财务比率,其中33家在2年后破产Y=0,另外33家在同期保持偿付能力(Y=1)。
请用变量X1(未分配利润/总资产),X2(税前利润/总资产)和X3(销售额/总资产)拟合一个Logistic 回归模型,并根据模型给出实际意义的分析,数据见财务比率.sav(25分)。
解:整体性的假设检验 提出假设性检验H0:回归系数i β=0(i=1,2,3),H1:不都为0 建立logistic 模型: =3213210X X X ββββ+++上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵,其中33家在2年后破产(y=0),但模型均预测为错误,正确率为0%,另外33家在同期保持偿付能力(Y=1),正确率为100%,所以模型总的预测正确率为50%。
由上表得知,如果变量X1(未分配利润/总资产),X2(税前利润/总资产)进入方程,概率p值都为0.000,小于显著性水平0.05,本应该是拒绝原假设,X1,X2是可以进入方程的。
而X3(销售额/总资产)进入方程,概率p值为0.094,大于显著性水平0.05,本应该是接受原假设,X3(销售额/总资产)是不能进入方程的,但这里的解释变量的筛选策略为enter,是强行进入方程的。
用强行全部进入-2倍的对数似然函数值越小表示模型的拟合优度越高,这里的值是5.791,比较小,表示模型的拟合优度还可以,而且Nagelkerke R 方为0.969,及0相比还是比较大的,所以拟合度比较高上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵,其中33家在2年后破产(y=0),但模型预测出了32家,正确率为97%,另外33家在同期保持偿付能力(Y=1),模型预测出了32家,正确率为97%,所以模型总的预测正确率为97%,较之前的有很大的提高。
上表给出了方程中变量的系数。
由表得出160.5,180.0,336.0,334.10,3210===-=ββββ以1β为例,表示控制变量X2(税前利润/总资产)和X3(销售额/总资产)不变,X1(未分配利润/总资产)每增加一个单位,增加0.336分单位 模型方程:= 4.160X3X2180.00.336X1-10.334-++ Logistic 回归方程:P{Y=0}=)4.160X3X2180.00.336X1--10.334ex p(1)4.160X3X2180.00.336X1--10.334ex p(+++++由表得知,X1到X3对应的概率p 值都大于0.05,接受原假设,表示X1到X3对Y 都没有显著性影响。
所以用下述方法改进。
用向前步进(wald )-2倍的对数似然函数值越小表示模型的拟合优度越高,这里的值是9.472,比之前的5.791要大,表示拟合优度降低,表示用向前的方法并没有比进入的方法好而且从上表知道总的预测百分比为97%,没有变化,所以这一步较之前的强行进入的方法没什么优化,也就是没什么必要用向前的方法做。
所以有最优的一个Logistic 回归模型为 模型方程:= 4.160X3X2180.00.336X1-10.334-++ Logistic 回归方程: P{Y=0}=)4.160X3X2180.00.336X1--10.334ex p(1)4.160X3X2180.00.336X1--10.334ex p(+++++三、为了研究几个省市的科技创新力问题,现在取了2005年8个省得15个科技指标数据,试用因子分析方法来分析一个省得科技创新能力主要受到哪些潜在因素的影响。
数据见8个省市的科技指标数据.sav,其中各个指标的解释如下:(25分) X1:每百万人科技活动人员数(人/万人)X2:从事科技活动人员中科学技术、工程师所占比重(%)X3 :R&D人员占科技胡哦哦的呢人员的比重(%)X4:大专以上学历人口数占总人口数的比例(%)X5 :地方财政科技拨款占地方财政支出的比重(%)X6:R&D经费占GDP比重(%)X7:R&D经费中挤出研究所占比例(%)X8:人均GDP(元/人)X9:高科技产品出口额占商品出口额的比重(%)X10:规模以上产业增加值中高技术产业份额(%)X11 :万名科技人员被国际三大检索工具收录的论文数(篇/百万人)X12 :每百万人口发明专利的授权量(件/百万人)X13:发明专利申请授权量占专利申请授权量的比重(%)X14 :万人技术市场成交合同金额(万元/万人)X15 :财政性教育经费支出占GDP比重(%)解:上表是用协方差矩阵分析法分析出的总方差的结果,由上表知道,初始特征值间所占的比例相差很大,取值范围差异大,所以不大适合做协方差的矩阵分析。
所以应该采用相关矩阵的方法分析如下:上表是15个变量间的相关系数矩阵,可以看出相关系数都比较高,比如X1(每百万人科技活动人员数(人/万人))和X2(从事科技活动人员中科学技术、工程师所占比重(%))的相关系数0.859,接近1,呈较强的的线性相关性,所以能够从中提取公因子,适合做因子分析由表可知,前两个因子的特征根值很高,累积方差贡献率为分别为85.608(>=80%即可),对解释原有变量的贡献很大,第3个以后的因子特征根值都很小,对解释原有变量的贡献很校,可以忽略,因此提取第一和第二个因子比较合适,基本能表达所有信息。
有特征值1λ=11.136 2λ=1.706上表是因子载荷矩阵A以X1,X5,X10为例,有因子分析模型1X =0.9731F -0.1582F +1 ;X=0.4821F+0.4972F+2ε;5X=0.6111F+0.6372F+3ε;10因为X,和10X,变量在1F,2F上都有较大的相差不大的载荷,5几乎都受它们的共同影响,因子间的差异性没有表示出来,不方便进行因子命名,所以要进行正交旋转(拉大因子间的差异性)对A做方差最大的正交旋转,得到正交旋转矩阵上表为旋转后的因子载荷矩阵 以X1,X5,X10为例,有因子分析模型1X =0.9601F -0.2232F +1 ;X=0.2581F+0.6422F+2ε;5X=0.3251F+0.8212F+3ε;10在第一公因子1F对应的列中,正载荷主要是X1,X2,X3,X4,X6,X7,X11,X12,X13,X14,X15,其载荷分别是0.960……,所以1F可视为高科技因子;在第二公共因子2F对应的列中,正载荷主要是,X5,X10其载荷是0.642,0.821,所以2F可视为非该科技因子;有公共因子1F,2F的得分矩阵如下:F1的得分:-0.90012-0.79770-0.47026-0.45750-0.003730.128880.255142.24528得分越高表示科技越高F2的得分-1.31413-1.28805-0.53602-0.026410.332790.397341.000451.43403得分越低表示分高科技成分越高四、湖南省某白酒厂开发了一种新的白酒,想在本省上市,考虑到公司的现状:生产能力小,营销实力不强,在全省范围内没有系统的营销网络。