数据分析专项训练及答案
数据分析答案完整版(整理)
x n n x j ( x j x) n 1 n 1 n 1
n2
x j x( j ) x j
服 从 正 态 分 布 。 故 有 E xi x E i
1 n j 0 , n j 1
1 n 1 n n 1 2 D xi x D i j E i j ,故 xi x 服从分 n n n j 1 j 1
N (0, 2 I n ) , (1 , 2 ,
, n ) ,则
,1 .
N (0, 2 ( I n H n )) 。其中:
1
1 1 n 1 , H n n 1, n 1 1
n n 1
n 1 n 2 n n 1 2
——证毕—— 3.条件同第 2 题,证明: (1) x N 0, n
2
(2) N 1 S 2 / 2 x2 n 1 , (4 ) t n
x t n 1
由与此变换为正交变换知, yi 2 xi 2 ,同时 x1 , x2 , , xn 为相互独
i 1 i 1
n
n
立的正态分布。
密度函数 f x1 , x2 ,
xi 1 2 2 i 1 由于正交的雅可比行列 , xn e 2 n
2
1 , n 1 , 1 ,由正交性有 n 1
2 , 3n,
a
第六章数据分析期末复习专练答案解析
数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。
数据分析试题及答案
数据分析试题及答案题目一:某电商平台收集了一年内用户的购物数据,数据包括用户ID、购买金额、购买时间等。
请你根据下面的数据,回答以下问题:(数据表格)用户ID 购买金额(元)购买时间001 100 2020-01-02002 200 2020-01-03003 300 2020-01-03004 150 2020-01-04005 250 2020-01-051. 请计算2020年1月份的总销售额和平均销售额。
2. 请统计2020年1月份每天的订单量。
3. 请找出购买金额最高的用户ID及其购买金额。
4. 请找出购买时间距离2020年1月2日最近的用户ID及其购买时间。
答案:1. 总销售额计算:2020年1月份的总销售额 = 100 + 200 + 300 + 150 + 250 = 1000元平均销售额计算:2020年1月份的平均销售额 = 1000 / 5 = 200元2. 每天的订单量统计:2020年1月2日订单量:12020年1月3日订单量:22020年1月4日订单量:12020年1月5日订单量:13. 购买金额最高的用户ID及其购买金额:购买金额最高的用户ID:003购买金额:300元4. 购买时间距离2020年1月2日最近的用户ID及其购买时间:购买时间距离2020年1月2日最近的用户ID:001购买时间:2020-01-02题目二:某汽车公司的销售数据如下所示,请根据下面的数据,回答以下问题:(数据表格)销售日期销售数量(辆)销售额(万元)2020-01-01 10 1002020-01-02 15 1502020-01-03 20 2002020-01-04 25 2502020-01-05 30 3001. 请计算2020年1月份的总销售数量和总销售额。
2. 请计算2020年1月份的平均销售数量和平均销售额。
3. 请找出销售数量最高和最低的日期。
4. 请计算销售数量和销售额之间的相关系数。
数据分析及应用试题库及答案
数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。
A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。
A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。
初中数据分析试题及答案
初中数据分析试题及答案一、单项选择题(每题2分,共20分)1. 下列哪个选项是描述数据集中趋势的统计量?A. 极差B. 中位数C. 众数D. 方差答案:B2. 一组数据的平均数是50,中位数是45,众数是40,这组数据可能呈现什么分布?A. 正偏态分布B. 负偏态分布C. 对称分布D. 不能确定答案:A3. 在统计学中,用于衡量数据离散程度的指标是?A. 平均数B. 中位数C. 众数D. 标准差答案:D4. 以下哪个不是数据分析中常用的图表类型?A. 条形图B. 折线图C. 饼图D. 树状图答案:D5. 如果一组数据的方差为0,这意味着什么?A. 数据中存在异常值B. 数据完全一致C. 数据没有变化D. 数据分布不均匀答案:B6. 相关系数的取值范围是?A. -1到1B. 0到1C. 1到100D. 任意实数答案:A7. 以下哪个统计图可以直观地表示出数据随时间的变化趋势?A. 散点图B. 条形图C. 折线图D. 饼图答案:C8. 在一组数据中,如果众数是唯一的,那么这组数据的众数是?A. 最大值B. 最小值C. 出现次数最多的值D. 平均值答案:C9. 一组数据的标准差越大,说明这组数据的?A. 集中程度越高B. 离散程度越高C. 变化越小D. 变化越大答案:B10. 以下哪个统计量可以用来衡量一组数据的离散程度?A. 平均数B. 中位数C. 众数D. 极差答案:D二、多项选择题(每题3分,共15分)1. 数据分析中,哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些图表可以用来展示分类数据?A. 条形图B. 折线图C. 饼图D. 散点图答案:AC3. 在数据分析中,哪些因素可能会影响数据的离散程度?A. 数据的分布B. 数据的量级C. 数据的异常值D. 数据的集中趋势答案:ABC4. 以下哪些统计量可以用来衡量数据的相关性?A. 相关系数B. 标准差C. 回归分析D. 方差答案:AC5. 以下哪些因素可能会影响数据的分布形状?A. 数据的量级B. 数据的异常值C. 数据的集中趋势D. 数据的离散程度答案:ABD三、简答题(每题5分,共10分)1. 请简述中位数和众数在数据分析中的作用。
六年级数学数据分析专项练习题及答案
六年级数学数据分析专项练习题及答案一、选择题1. 下列哪个不是连续统计资料A. 今天上午10点钟每10分钟的体温B. 近一周每天的降水量C. 放在实验室里的草虫的重量D. 不同年级学生的体重2. 下列资料中哪个是离散统计资料A. 月份和季节的关系B. 过去一周每天的最高气温C. 一年级学生的身高D. 一天中不同时间段的读书时间3. 小明一周的学习时间如下:4, 5, 6, 7, 4, 5, 8(单位:小时)。
平均学习时间是多少?A. 5小时B. 6小时C. 7小时D. 8小时4. 某班学生参加了一次考试,得到的分数如下:85, 90, 92, 88, 83, 86, 95。
以下哪个图形可以正确表示这些分数?A. 折线图B. 饼图C. 柱状图D. 散点图5. 某班学生的年龄分布如下:10, 11, 11, 10, 12, 10, 11, 10, 12, 13。
以下哪个图形可以正确表示这些数据?A. 折线图B. 饼图C. 柱状图D. 散点图二、填空题1. 下列是连续数据的是________ (体温, 体重, 学生姓名)2. 某班同学的身高如下 (120cm, 130cm, 125cm, 135cm),其中众数为________3. 折线图适合表示________的变化4. 某地区一周的降水量如下 (10mm, 5mm, 15mm, 20mm, 8mm),其中极差为________三、解答题1. 小明的家人去年9月份的电费如下:120元、130元、110元、140元、130元。
求这些电费的平均值和中位数。
解析:平均值 = (120 + 130 + 110 + 140 + 130) / 5 = 130元中位数 = 130元2. 某小组同学去年参加了一次数学竞赛,得到的分数如下:80分、90分、85分、95分、88分。
请画出这些分数的柱状图,并标明横轴和纵轴的单位。
解析:横轴:分数纵轴:人数|100 ||90 || x80 | x x x|_____________80 85 90 953. 某年级的同学身高如下:120cm、125cm、115cm、130cm、135cm。
[必刷题]2024七年级数学下册数据分析专项专题训练(含答案)
[必刷题]2024七年级数学下册数据分析专项专题训练(含答案)试题部分一、选择题:1. 下列数据中,众数是8的是()A. 2, 3, 5, 7, 8, 8, 9B. 1, 2, 3, 4, 5, 6, 7C. 6, 7, 8, 9, 10, 11, 12D. 4, 5, 6, 7, 8, 9, 102. 以下哪个统计量能够反映一组数据的波动大小?()A. 平均数B. 中位数C. 众数D. 方差3. 在一组数据中,若中位数是50,那么这组数据中至少有()个数据不小于50。
A. 1B. 2C. 50D. 无法确定4. 下列关于平均数、中位数和众数的关系,错误的是()A. 平均数、中位数和众数可以相等B. 平均数受极端值影响较大C. 中位数不受极端值影响D. 众数只能有一个5. 有一组数据:3, 5, 7, 9, 11, 13, x,若这组数据的平均数为8,那么x的值为()A. 7B. 9C. 11D. 136. 下列关于方差的说法,正确的是()A. 方差越大,数据分布越集中B. 方差越小,数据分布越分散C. 方差等于各数据与平均数的差的平方和的平均数D. 方差可以为负数7. 下列数据中,哪一个不是有效数据?()A. 2.5B. 0C. 3D. 无8. 下列关于频数分布表的说法,错误的是()A. 频数分布表可以直观地展示数据的分布情况B. 频数是指某个数据出现的次数C. 频率是指某个数据出现的次数与总次数的比值D. 频率之和必须等于19. 在一组数据中,若众数是50,那么这组数据中至少有()个数据等于50。
A. 1B. 2C. 50D. 无法确定10. 下列关于极差的说法,正确的是()A. 极差越大,数据分布越集中B. 极差越小,数据分布越分散C. 极差等于最大值与最小值的差D. 极差可以为负数二、判断题:1. 平均数、中位数和众数都是描述数据集中趋势的统计量。
()2. 在一组数据中,平均数一定大于等于中位数。
数据分析及应用模拟题含答案
数据分析及应用模拟题含答案一、单选题(共30题,每题1分,共30分)1、下列函数中,用于沿着轴方向堆叠Pandas对象的是A、A 五分之一B、B 六分之一C、C 七分之一D、D 七分之五正确答案:D2、Numpy.random模块中用于对一个序列进行随机排序的函数是()。
A、A uniformB、B shuffleC、C permutationD、D normal正确答案:B3、将一个从大到小的数组,用以下排序方法排序成从小到大的,()最快。
A、A 插入排序B、B 冒泡排序C、C 快速排序D、D 堆排序正确答案:D4、代码if ‘p’ in ‘pip python’: print(‘pip python’.replace(‘p’, ‘P’))的执行结果是()A、A PiP pythonB、B pip PythonC、C PiP PythonD、D Pip Python正确答案:C5、以下程序的不可能输出结果是:from random import * print(round(random(),2))A、A 0.47B、B 0.54C、C 0.27D、D 1.87正确答案:D6、人患癌症的概率为1/1000.假设有一台癌症诊断仪S1,通过对它以往的诊断记录的分析,如果患者确实患有癌症它的确诊率为90%,如果患者没有癌症,被诊断成癌症的概率是10%。
某人在被诊断为癌症后,他真正患癌症的概率为()A、A 9/1000B、B 1/1000C、C 1/112D、D 9/10正确答案:C7、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C8、matpltlib中绘制图形,可以通过传递参数设置当前绘图区的标题及位置。
若标题是s,以下设置绘图区标题写法对的是:()A、A plt.text(x,y, s")"B、B plt.title(x,y, s")"C、C plt.text(s",loc= center )"D、D plt.title(s",loc= center )"正确答案:D9、import pandas as pd df=pd.DataFrame({ a :list(""opq""),b :[3,2,1]},index=[ e , f , g ]) 以下说法错误的是: ()A、A df[0:1]返回第0行的数据B、B df[0:1]返回第0列的数据C、C df[0]会报错D、D df[ e ]会报错正确答案:B10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、python语言中""A、A 按位取反B、B 按位异或C、C 按位与D、D 左移一位正确答案:D12、在软件开发中,下面任务不属于设计阶段的是______。
数据分析及应用模拟练习题含答案
数据分析及应用模拟练习题含答案一、单选题(共30题,每题1分,共30分)1、蒙特卡罗算法是()的一种A、A 分支界限法B、B 概率算法C、C 贪心算法D、D 回溯算法正确答案:B2、下面属于良好程序设计风格的是______。
A、A 源程序文档化B、B 程序效率第一C、C 随意使用无条件转移语句D、D 程序输入输出的随意性正确答案:A3、假设有命令(P)import numpy as np bArray = np.array([[1,2,3],[4,5,6]])则,bArray.ndim的结果是A、A 逻辑覆盖法B、B 等价类划分C、C 边界值分析D、D 功能图法正确答案:A4、若实体A和B是一对多的联系,实体B和C是一对一的联系,则实体A和C的联系是______。
A、A 一对一B、B 一对多C、C 多对一D、D 多对多正确答案:B5、DataFrame对象df返回第一行以及返回最后一行的代码是:()A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A6、np.arange(1,10,1).reshape([3,3])[1:,2:]=(?)。
A、A [8 9]B、B [6 9]C、C [[6][9]]D、D 抛异常正确答案:C7、某二叉树共有150个结点,其中有50个度为1的结点,则______。
A、A 不存在这样的二叉树B、B 该二叉树有49个叶子结点C、C 该二叉树有50个叶子结点D、D 该二叉树有51个叶子结点正确答案:A8、x=np.arange(1,10,1).reshape([3,3]) y=np.arange(10,19,1).reshape(3,3) np.r_[x,y].shape==()A、A (6,3)B、B (3,6)C、C (3,3)D、D (6,6)正确答案:A9、在进行算术运算时,如果希望一次性输出多个统计指标可以使用()方法A、A statistics()B、B describe()C、C all()D、D results()正确答案:B10、关于哑变量的说法中,下列选项描述错误的是A、A 哑变量是人为虚设的变量B、B 哑变量在转换成指标矩阵后,其值通常为0或1C、C Pnadas中get_dummies()函数可以对类别进行哑变量处理D、D 哑变量的使用没有实际意义正确答案:D11、请找出数列11,18,38,83…的下一项()A、A 146B、B 168C、C 171D、D 203正确答案:C12、用import matplotlib.pyplot as pt引入pyplot模块后,下面可以对执行的代码是()A、A plt.plot([1,2,3])B、B pt.plot([1,2,3])C、C plt.plot[1,2,3]D、D pt.plot[1,2,3]正确答案:B13、pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A、A CSV文件B、B 文本文件C、C 工作簿文件D、D EXE文件正确答案:D14、在下述论述中,正确的是()。
数据分析专项训练解析含答案
x
变,则 等于( )
y
A. 3a 4b
【答案】D 【解析】
B. 4a 3b
C. 3b 4a
D. 4b 3a
【分析】 根据已知条件表示出价格变化前后两种糖果的平均价格,进而得出等式求出即可.
【详解】 解:∵甲、乙两种糖果,原价分别为每千克 a 元和 b 元, 两种糖果按甲种糖果 x 千克与乙种糖果 y 千克的比例混合,
解:原来数据的平均数= a 2 4 2a 6 8 3a 9 25 5 ,
5
5
原来数据的方差= S 2 (a 2 5)2 (4 5)2 (2a 6 5)2 (8 3a 5)2 (9 5)2 , 5
增加数据 5 后的平均数= a 2 4 2a 6 8 3a 9 5 30 5 (平均数没变化),
A.85,90
B.85,87.5
C.90,85
【答案】B
【解析】
试题解析:85 分的有 8 人,人数最多,故众数为 85 分;
D.95,90
处于中间位置的数为第 10、11 两个数, 为 85 分,90 分,中位数为 87.5 分. 故选 B. 考点:1.众数;2.中位数
7.有甲、乙两种糖果,原价分别为每千克 a 元和 b 元.根据调查,将两种糖果按甲种糖 果 x 千克与乙种糖果 y 千克的比例混合,取得了较好的销售效果.现在糖果价格有了调 整:甲种糖果单价下降 15%,乙种糖果单价上涨 20%,但按原比例混合的糖果单价恰好不
【详解】
在这一组数据中 20 出现了 3 次,次数最多,故众数是 20; 把数据按从小到大的顺序排列:19,20,20,20,22,22,23,24, 处于这组数据中间位置的数 20 和 22,那么由中位数的定义可知,这组数据的中位数是 21. 故选 C. 【点睛】
数据分析真题汇编附答案解析
数据分析真题汇编附答案解析一、选择题1.回忆位中数和众数的概念;2.在只有15人参加的演讲比赛中,参赛选手的成绩各不相同,若选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的( )A.平均数B.中位数C.众数D.以上都不对【答案】B【解析】【分析】此题是中位数在生活中的运用,知道自己的成绩以及全部成绩的中位数就可知道自己是否进入前8名.【详解】15名参赛选手的成绩各不相同,第8名的成绩就是这组数据的中位数,所以选手知道自己的成绩和中位数就可知道自己是否进入前8名.故选B.【点睛】理解平均数,中位数,众数的意义.3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是()A.平均数是6B.中位数是6.5C.众数是7D.平均每周锻炼超过6小时的人数占该班人数的一半【答案】A【解析】【分析】根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否.【详解】A、平均数为150×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意;B、∵一共有50个数据,∴按从小到大排列,第25,26个数据的平均值是中位数,∴中位数是6.5,故此选项正确,不合题意;C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意;D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意;故选A.【点睛】此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.4.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:决赛成绩/分95908580人数4682那么20名学生决赛成绩的众数和中位数分别是( )A.85,90 B.85,87.5 C.90,85 D.95,90【答案】B【解析】试题解析:85分的有8人,人数最多,故众数为85分;处于中间位置的数为第10、11两个数,为85分,90分,中位数为87.5分.故选B.考点:1.众数;2.中位数5.小明参加射击比赛,10次射击的成绩如表:若小明再射击2次,分别命中7环、9环,与前10次相比,小明12次射击的成绩()A.平均数变大,方差不变B.平均数不变,方差不变C.平均数不变,方差变大D.平均数不变,方差变小【答案】D【解析】【分析】首先利用计算出前10次射击的平均数,再计算出方差,然后计算出再射击2次后的平均数和方差,进而可得答案.【详解】前10次平均数:(6×3+7×1+8×2+9×1+10×3)÷10=8,方差:S2=110[(6﹣8)2×3+(7﹣8)2+(8﹣8)2×2+(9﹣8)2+3×(10﹣8)2]=2.6,再射击2次后的平均数::(6×3+7×1+8×2+9×1+10×3+7+9)÷12=8,方差:S2=112[(6﹣8)2×3+(7﹣8)2×2+(8﹣8)2×2+(9﹣8)2×2+3×(10﹣8)2]=73,平均数不变,方差变小,故选:D.【点睛】此题主要考查了方差和平均数,关键是掌握方差计算公式:S2=1n[(x1﹣x)2+(x2﹣x)2+…+(x n﹣x)2].6.甲、乙两名同学分别进行6次射击训练,训练成绩(单位:环)如下表对他们的训练成绩作如下分析,其中说法正确的是()A.他们训练成绩的平均数相同B.他们训练成绩的中位数不同C.他们训练成绩的众数不同D.他们训练成绩的方差不同【答案】D【解析】【分析】利用方差的定义、以及众数和中位数的定义分别计算即可得出答案.【详解】∵甲6次射击的成绩从小到大排列为6、7、8、8、9、10,∴甲成绩的平均数为67889106+++++=8,中位数为882+=8、众数为8,方差为16×[(6﹣8)2+(7﹣8)2+2×(8﹣8)2+(9﹣8)2+(10﹣8)2]=53,∵乙6次射击的成绩从小到大排列为:7、7、8、8、8、9,∴乙成绩的平均数为7788896+++++=476,中位数为882+=8、众数为8,方差为16×[2×(7﹣476)2+3×(8﹣476)2+(9﹣476)2]=1736,则甲、乙两人的平均成绩不相同、中位数和众数均相同,而方差不相同,故选D.【点睛】本题考查了中位数、方差以及众数的定义等知识,熟练掌握相关定义以及求解方法是解题的关键.7.下列说法:①一组对边平行,另一组对边相等的四边形是平行四边形;②经过有交通信号灯的路口,遇到红灯是必然事件;③若甲组数据的方差是0.3,乙组数据的方差是0.1,则甲数据比乙组数据稳定;④圆内接正六边形的边长等于这个圆的半径,其中正确说法的个数是()A.1个B.2个C.3个D.4个【答案】A【解析】【分析】根据平行四边形的判定去判断①;根据必然事件的定义去判断②;根据方差的意义去判断③;根据圆内接正多边形的相关角度去计算④.【详解】一组对边平行,另一组对边相等的四边形也有可能是等腰梯形,①错误;必然事件是一定会发生的事件,遇到红灯是随机事件,②错误;方差越大越不稳定,越小越稳定,乙比甲更稳定,③错误;正六边形的边所对的圆心角是60︒,所以构成等边三角形,④结论正确.所以正确1个,答案选A.【点睛】本题涉及的知识点较多,要熟悉平行四边形的常见判定;随机事件、必然事件、不可能事件等的区分;掌握方差的意义;会计算圆内接正多边形相关.8.某校九年级模拟考试中,1班的六名学生的数学成绩如下:96,108,102,110,108,82.下列关于这组数据的描述不正确的是()A.众数是108 B.中位数是105C.平均数是101 D.方差是93【答案】D【解析】【分析】把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110,求出众数、中位数、平均数和方差,即可得出结论.【详解】解:把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110,∴众数是108,中位数为1021081052+=,平均数为82961021081081101016+++++=,方差为()()()()()()222222182101961011021011081011081011101016⎡⎤-+-+-+-+-+-⎣⎦ 94.393≈≠;故选:D . 【点睛】考核知识点:众数、中位数、平均数和方差;理解定义,记住公式是关键.9.一组数据3、2、1、2、2的众数,中位数,方差分别是:( ) A .2,1,2 B .3,2,0.2C .2,1,0.4D .2,2,0.4【答案】D 【解析】 【分析】根据众数,中位数,方差的定义计算即可. 【详解】将这组数据重新由小到大排列为:12223、、、、平均数为:1222325++++=2出现的次数最多,众数为:2 中位数为:2方差为:()()()()()22222212222222320.45s -+-+-+-=+-=故选:D 【点睛】本题考查了确定数据众数,中位数,方差的能力,解题的关键是熟悉它们的定义和计算方法.10.2018年国务院机构改革不再保留国家卫生和计划生育委员会,组建国家卫生健康委员会,在修正人口普查数据中的低龄人口漏登后,我们估计了1982-2030年育龄妇女情况.1982年中国15-49岁育龄妇女规模为2.5亿,到2011年达3.8亿人的峰值,2017年降至3.5亿,预计到2030年将降至3.0亿.则数据2.5亿、3.8亿、3.5亿、3.0亿的中位数、平均数、方差分别是( ) A .3.25亿、3.2亿、0.245 B .3.65亿、3.2亿、0.98 C .3.25亿、3.2亿、0.98 D .3.65亿、3亿、0.245【答案】A 【解析】 【分析】根据中位数、平均数的定义和方差公式分别进行解答即可.【详解】把数据2.5亿、3.8亿、3.5亿、3.0亿按从小到大的顺序排列为:2.5亿,3.亿,3.5亿,3.8亿,最中间的两个数是3.0亿和3.5亿,所以,这组数据的中位数为:3.0+3.5=3.252亿 平均数为:2.5+3.8+3.5+3.0=3.24亿;方差为:S 2=14×[(2.5-3.2)2+(3.8-3.2)2+(3.5-3.2)2+(3.0-3.2)2]= 14×(0.49+0.36+0.09+0.04)=0.245 故选A. 【点睛】本题考查了中位数、平均数和方差,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);一般地设n 个数据,x 1,x 2,…x n 的平均数为x ,则方差S 2=()()()222121n x x x x x x n ⎡⎤-+-+⋯+-⎣⎦.11.为了迎接2022年的冬奥会,中小学都积极开展冰上运动,小乙和小丁进行500米短道速滑比赛,他们的五次成绩(单位:秒)如表所示:设两人的五次成绩的平均数依次为x 乙,x 丁,成绩的方差一次为2S 乙,2S 丁,则下列判断中正确的是( )A .x x =乙丁,22S S <乙丁B .x x =乙丁,22S S >乙丁C .x x >乙丁,22S S >乙丁 D .x x <乙丁,22S S <乙丁【答案】B 【解析】 【分析】根据平均数的计算公式先求出甲和乙的平均数,再根据方差的意义即可得出答案. 【详解】4563555260555x ++++==乙,则()()()()()2222221455563555555525560555S ⎡⎤=⨯-+-+-+-+-⎣⎦乙39.6=,5153585657555x ++++==丁,则()()()()()2222221515553555855565557555S ⎡⎤=⨯-+-+-+-+-⎣⎦丁 6.8=,所以x x =乙丁,22S S >乙丁,故选B . 【点睛】本题考查方差的定义与意义:一般地设n 个数据,1x ,2x ,…n x 的平均数为x ,则方差()()()2222121n S x x x x x x n ⎡⎤=-+-+⋅⋅⋅+-⎢⎥⎣⎦,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.12.某班有40人,一次体能测试后,老师对测试成绩进行了统计.由于小亮没有参加本次集体测试,因此计算其他39人的平均分为90分,方差239s =.后来小亮进行了补测,成绩为90分,关于该班40人的测试成绩,下列说法正确的是( ) A .平均分不变,方差变大 B .平均分不变,方差变小 C .平均分和方差都不变 D .平均分和方差都改变【答案】B 【解析】 【分析】根据平均数,方差的定义计算即可. 【详解】解:∵小亮的成绩和其他39人的平均数相同,都是90分, ∴该班40人的测试成绩的平均分为90分,方差变小, 故选:B . 【点睛】本题考查方差,算术平均数等知识,解题的关键是理解题意,灵活运用所学知识解决问题,属于中考常考题型.13.下面的统计图表示某体校射击队甲、乙两名队员射击比赛的成绩,根据统计图中的信息,下列结论正确的是( )A .甲队员成绩的平均数比乙队员的大B .乙队员成绩的平均数比甲队员的大C .甲队员成绩的中位数比乙队员的大D .甲队员成绩的方差比乙队员的大 【答案】D 【解析】 【分析】根据平均数、中位数和方差的计算公式分别对每一项进行分析,即可得出答案. 【详解】甲队员10次射击的成绩分别为6,7,7,7,8,8,9,9,9,10,则中位数882+=8, 甲10次射击成绩的平均数=(6+3×7+2×8+3×9+10)÷10=8(环),乙队员10次射击的成绩分别为6,7,7,8,8,8,8,9,9,10,则中位数是8, 乙10次射击成绩的平均数=(6+2×7+4×8+2×9+10)÷9=8(环), 甲队员成绩的方差=110×[(6-8)2+3×(7-8)2+2×(8-8)3+3×(9-8)2+(10-8)2]=1.4; 乙队员成绩的方差=110×[(6-8)2+2×(7-8)2+4×(8-8)3+2×(9-8)2+(10-8)2]=1.2, 综上可知甲、乙的中位数相同,平均数相同,甲的方差大于乙的方差, 故选D . 【点睛】本题考查了平均数、中位数和方差的定义和公式,熟练掌握平均数、中位数、方差的计算是解题的关键.14.某校男子足球队的年龄分布如图所示,则根据图中信息可知这些队员年龄的平均数,中位数分别是( )A .15.5,15.5B .15.5,15C .15,15.5D .15,15【答案】D 【解析】 【分析】 【详解】根据图中信息可知这些队员年龄的平均数为:132146158163172181268321⨯+⨯+⨯+⨯+⨯+⨯+++++=15岁,该足球队共有队员2+6+8+3+2+1=22人,则第11名和第12名的平均年龄即为年龄的中位数,即中位数为15岁,故选D.15.在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如下表所示:则这些运动员成绩的中位数、众数分别为()A.1.70,1.75 B.1.70,1.70 C.1.65,1.75 D.1.65,1.70【答案】A【解析】分析:找中位数要把数据按从小到大的顺序排列,位于最中间的一个数或两个数的平均数为中位数;众数是一组数据中出现次数最多的数据,注意众数可以不止一个.详解:共15名学生,中位数落在第8名学生处,第8名学生的跳高成绩为1.70m,故中位数为1.70;跳高成绩为1.75m的人数最多,故跳高成绩的众数为1.75;故选A.点睛:本题为统计题,考查众数与中位数的意义.众数是一组数据中出现次数最多的数.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.16.一组数据-2,3,0,2,3的中位数和众数分别是()A.0,3 B.2,2 C.3,3 D.2,3【答案】D【解析】【分析】根据中位数和众数的定义解答即可.【详解】将这组数据从小到大的顺序排列为:﹣2,0,2,3,3,最中间的数是2,则中位数是2;在这一组数据中3是出现次数最多的,故众数是3.故选D.【点睛】本题考查了众数与中位数的意义.将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数)叫做这组数据的中位数;如果中位数的概念掌握得不好,不把数据按要求重新排列,就会出错.17.某班统计一次数学测验成绩的平均分与方差,计算完毕以后才发现有位同学的分数还未登记,只好重新算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( ) A .1x x <,221s s = B .1x x =,221s s > C .1x x =,221s s < D .1x x =,221s s =【答案】B 【解析】 【分析】根据平均数和方差的公式计算比较即可. 【详解】设这个班有n 个同学,数据分别是a 1,a 2,…a i …,a n , 第i 个同学没登录, 第一次计算时总分是(n−1)x , 方差是s 2=11n -[(a 1−x)2+…(a i−1−x)2+(a i+1−x)2+…+(a n −x)2] 第二次计算时, x =()1n x x n-+=x ,方差s 12=1n [(a 1−x)2+…(a i−1−x)2+(a i −x)2+(a i+1−x)2+…+(a n −x)2]=1n n-s 2, 故221s s >, 故选B . 【点睛】此题主要考查平均数和方差的计算,解题的关键是熟知其计算方法.18.据统计,某住宅楼30户居民五月份最后一周每天实行垃圾分类的户数依次是:27,30,29,25,26,28,29,那么这组数据的中位数和众数分别是( ) A .25和30 B .25和29C .28和30D .28和29【答案】D 【解析】【分析】根据中位数和众数的定义进行求解即可得答案.【详解】对这组数据重新排列顺序得,25,26,27,28,29,29,30, 处于最中间是数是28, ∴这组数据的中位数是28, 在这组数据中,29出现的次数最多, ∴这组数据的众数是29, 故选D .【点睛】本题考查了中位数和众数的概念,熟练掌握众数和中位数的概念是解题的关键.一组数据中出现次数最多的数据叫做众数,一组数据按从小到大(或从大到小)排序后,位于最中间的数(或中间两数的平均数)是这组数据的中位数.19.下列说法正确的是()A.对角线相等的四边形一定是矩形B.任意掷一枚质地均匀的硬币10次,一定有5次正面向上C.如果有一组数据为5,3,6,4,2,那么它的中位数是6D.“用长分别为5cm、12cm、6cm的三条线段可以围成三角形”这一事件是不可能事件【答案】D【解析】【分析】根据矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义依次判断即可.【详解】A.对角线相等的平行四边形是矩形,故该项错误;B. 任意掷一枚质地均匀的硬币10次,不一定有5次正面向上,故该项错误;C. 一组数据为5,3,6,4,2,它的中位数是4,故该项错误;D. “用长分别为5cm、12cm、6cm的三条线段可以围成三角形” 这一事件是不可能事件,正确,故选:D.【点睛】此题矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义,综合掌握各知识点是解题的关键.20.某小组长统计组内6人一天在课堂上的发言次数分別为3,3,4,6,5,0.则这组数据的众数是()A.3 B.3.5 C.4 D.5【答案】A【解析】【分析】根据众数的定义,找数据中出现次数最多的数据即可.【详解】在3,3,4,6,5,0这组数据中,数字3出现了2次,为出现次数最多的数,故众数为3.故选A.【点睛】本题考查了众数的概念.众数是一组数据中出现次数最多的数据.。
数据分析与应用技能考试题(含答案)
数据分析与应用技能考试题(含答案)一、单选题(共78题,每题1分,共78分)1.下列选项不属于商务数据分析作用的是()。
A、现状分析B、原因分析C、预测分析D、生产分析正确答案:D2.对于以品牌曝光为营销目标的在线旅行网站来说,分析信息流账户时最可能关注的数据指标是()。
A、转化成本B、转化率C、平均点击价格D、展现量正确答案:D3.从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()。
A、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A4.商务数据统计与分析主要将大量复杂数据经过定量方法和应用分析转换为合理清晰,便于管理的信息,从而做出()的结果。
A、精简架构B、商业决策C、增加销量D、降低成本正确答案:B5.为了研究多个不同变量在不同样本中的相似性,适合采用的图表呈现形式是()。
A、环形图B、雷达图C、柱状图D、箱线图正确答案:B6.每月例会报告的经营指标汇总,属于()。
A、客户行为的数据挖掘报告B、原因分析报告C、描述性数据分析报告D、商品和行为倾向报告正确答案:C7.商务数据分析中,常被用作竞争环境分析的模型是()A、PEST模型B、SWOT模型C、逻辑树模型D、5W2H模型正确答案:B8.系列关于数据分析流程的说法,错误的是()。
A、模型评价能够评价模型的优劣B、分析与建模时只能够使用数值型数据C、需求分析是数据分析最重要的一部分D、数据预处理是能够数据建模的前提正确答案:B9.作为电子商务经营活动的关键能力之一,()的核心目标是如何付出最小的成本获取最多的客户。
A、产品盈利能力B、产品交易能力C、产品竞争能力D、产品获客能力正确答案:D10.SWOT分析法中,S代表的是()。
A、力量B、优势C、机会D、威胁正确答案:B11.企业在对供应商的数据进行分析后,确定了供应商考核的指标,其中最基本的指标是()。
A、质量指标B、交货指标C、服务指标D、价格指标正确答案:A12.以下属于分析竞争对手商品信息的角度的是()。
数据分析与应用试题(附参考答案)
数据分析与应用试题(附参考答案)一、单选题(共60题,每题1分,共60分)1、()是对商品为店铺销售或利润贡献能力的衡量,主要指标包括客单价、毛利率、成本费用利润率等。
A、商品获客能力B、商品盈利能力C、商品运营能力D、商品研发能力正确答案:B2、数据采集遵循的原则不包括()oA、最大数据原则B、数据安全原则C、目的限制原则D、D.合法、公开原则正确答案:A3、EXCE1描述统计结果中,不包括()指标。
A、峰度、偏度B、平均数、标准差C、加权算术平均数D、最大值、最小值正确答案:C4、下列方法中,不是数据规范化方法的是()oA、最大-最小规范化B、零-均值规范化C、平均值规范化D、小数定标规范化正确答案:C5、在网店内的客户交易订单详情表中,以下字段中可作为度量使用的字段是()oA、商品类别B、购买数量C、省份D、客户名称正确答案:D6、以下内容中,不可衡量产品竞争能力的是()。
A、成本优势B、质量优势C、管理人员创新能力D、技术优势正确答案:C7、迷你图与正常的图表功能相似,下列说法正确的是()oA、迷你图可以设置数据标记B、迷你图可以设置图例C、迷你图也有坐标轴D、迷你图占用空间小正确答案:D8、某食品网店3天的成交总额为12880元,这3天的成交商品数量分别为256、468、320件,其件单价为()。
A、17.5B、12.3C、15D、18正确答案:B9、系列关于数据分析流程的说法,错误的是()oA、需求分析是数据分析最重要的一部分B、模型评价能够评价模型的优劣C、分析与建模时只能够使用数值型数据D、数据预处理是能够数据建模的前提正确答案:C10、完成数据采集后对数据进行复查或计算,将其和历史数据进行比较。
同时还要检查字段的完整性,保证核心指标数据完整,属于()检查。
A、完整性检查B、B、准确性检查C、规范性检查D、D、以上都不是正确答案:AIK以下指标中,可以实时反映出账户的竞争力的是()oA、展现量B、点击率C、留存量D、转化率正确答案:A12、从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()oA、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A13、以下关于数据可视化说法错误的是()oA、数据可视化能够化繁为简,增加信息可读性和趣味性B、战略地图是对企业战略要素及其之间因果关系的可视化表示方法C、数据可视化是指通过图形、动画等更加形象、清晰的方法对数据大小进行体现,同时阐释数据间的关系和趋势,使数据分析后得出的结果更加容易使用和理解D、数据可视化由于要实现其功能用途,因此会令人感到枯燥乏味正确答案:D14、以下关于平均数的说法错误的是()oA、平均数一般是指算术平均数B、平均数是非常重要的基础性指标C、能代表总体的一般水平D、体现了总体内各单位的差异正确答案:D15、网站流量数据分析方法有数据清洗、数据提取、数据转化和()oA、数据计算B、数据核对C、数据检查D、数据评估正确答案:A16、从竞争对手分析的角度来看,不包括哪个步骤()oA、从网店整体情况分析B、不需要从评论分析C、从商品信息分析D、从详情页分析正确答案:B17、()是指通过统计、数学或计算的方法对现象进行系统的实证研究。
数据分析技术习题(含答案)
数据分析技术习题(含答案)一、单选题(共40题,每题1分,共40分)1、请看如下代码: import numpy as np arr = np.array([[6, 2, 7], [3, 6, 2], [4, 3, 2]] arr.sort() arr 对代码中的NumPy数组执行sort()方法结果正确的是()。
A、[[7 6 2] [2 3 6]]B、[[2 6 7] [2 3 6]]C、[[7 6 2] [6 3 2]]D、[[2 6 7] [6 3 2]]正确答案:B2、下列关于数据预处理的说法中,描述不正确的是()。
A、数据清洗的目的是为了提高数据质量B、异常值不一定要删除C、通过drop_duplicates()方法可以删除重复数据D、concat()函数可以根据一个或多个键将不同的DataFrame进行合并正确答案:D3、请阅读下面一段程序:import pandas as pd print(pd.DataFrame([[2, 3],] * 3, columns=['A', 'B']).apply(lambda x: x + 1)) 执行上述程序后,最终输出的结果为()。
A、A B0 3 21 3 22 3 2B、A B0 2 31 2 32 2 3C、A B0 3 41 3 42 3 4D、A B0 4 31 4 32 4 3正确答案:D4、下列pyplot模块的函数中,可以绘制条形图的是()。
A、pie()B、hist()C、bar()D、scatter()正确答案:C5、通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定产生多少个时间戳索引值?()A、freqB、periodsC、endD、start正确答案:B6、请阅读下面的程序: from pandas import Series import pandas as pd from numpy import NaN series_obj = Series([2, 1, NaN]) print(pd.isnull(series_obj)) 执行上述程序后,最终输出的结果为()。
中考数学复习《数据分析》专题训练含答案
中考复习专题训练数据分析一、选择题1.对于数据:80,88,85,85,83,83,84.下列说法中错误的有()(1).这组数据的平均数是84 (2).这组数据的众数是85(3).这组数据的中位数是84 (4).这组数据的方差是36A. 1个B. 2个C. 3个D. 4个2.下列统计图中,可以直观地反映出数据变化的趋势的统计图是()A. 折线图B. 扇形图C. 统形图D. 频数分布直方图3.数据-1,-3,0,2,7,15,-12的极差是()A. 3B. 18C. -27D. 274.已知一组数据:20、30、40、50、50、50、60、70、80,其中平均数、中位数、众数的大小关系是()A. 平均数>中位数>众数B. 平均数<中位数<众数C. 中位数<众数<平均数D. 平均数=中位数=众数5.一组数据5,1,x,6,4的众数是4,这组数据的方差是()A. B. 2.8 C. 2 D.6.我校准备在初二年级的四名同学中选拔一名参加我市“风采小主持人”大赛,选拔赛中每名学生的平均成绩及方差如表所示,若要选择一名成绩高且发挥稳定的学生参赛,则应选择的学生是()甲乙丙丁平均成绩8 9 9 8方差 1 1 1.2 1.3A. 甲B. 乙C. 丙D. 丁7.想表示某种品牌奶粉中蛋白质、钙、维生素、糖、其它物质的含量的百分比,应该利用( ):A. 条形统计图B. 扇形统计图C. 折线统计图D. 以上都可以8.下列四个统计图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()A. B.C. D.9.某校调查了20名男生某一周参加篮球运动的次数,调查结果如表所示,那么这20名男生该周参加篮球运动次数的平均数是()次数 2 3 4 5人数 2 2 10 6A. 3次B. 3.5次C. 4次D. 4.5次10.某水果经销商对四月份甲、乙、丙、丁四个市场每天出售的草莓价格进行调查,通过计算发现这个月四个市场草莓的平均售价相同,方差分别为S甲2=8.5,S乙2=5.5,S丙2=9.5,S丁2=6.4,则四月份草莓价格最稳定的市场是()A. 甲B. 乙C. 丙D. 丁二、填空题11. 某天的最低气温是﹣2℃,最高气温是10℃,则这天气温的极差为________℃.12.大润发超市对去年全年每月销售总量进行统计,为了更清楚地看出销售总量的变化趋势应选用________统计图来描述数据.13.某市某一周的日最高气温(单位:℃)分别为:25,28,30,29,31,32,28,这周的日最高气温的平均值是________.14.市运会举行射击比赛,校射击队从甲、乙、丙、丁四人中选拔一人参赛.在选拔赛中,每人射击10次,计算他们10发成绩的平均数(环)及方差如下表.请你根据表中数据选一人参加比赛,最合适的人选是________.甲乙丙丁平均数8.2 8.0 8.0 8.2方差 2.1 1.8 1.6 1.415.某工程队有14名员工,他们的工种及相应每人每月工资如下表所示:工种人数每人每月工资/元电工 5 7000木工 4 6000瓦工 5 5000现该工程队进行了人员调整:减少木工2名,增加电工、瓦工各1名,与调整前相比,该工程队员工月工资的方差________(填“变小”、“不变”或“变大”).16.已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据3x1﹣2,3x2﹣2,3x3﹣2,3x4﹣2,3x5﹣2的平均数是________.17.某工厂甲、乙两名工人参加操作技能培训,现分别从他们在培训期间参加若干次测试成绩中随机抽取8次,计算得两人的平均成绩都是85分,方差分别是S甲2=35.5,S乙2=41,从操作技能稳定的角度考虑,选派________参加比赛.18.数学老师布置了10道选择题,小颖将全班同学的解答情况绘成了下面的条形统计图,根据图表回答:平均每个学生做对了________道题,做对题目的众数是________,中位数是________.三、解答题19.去年,汶川地区发生特大地震,造成当地重大经济损失,在“情系灾区”捐款活动中,某同学对甲、乙两班情况进行统计,得到三条信息:①甲班共捐款300元,乙班共捐232元;②甲班比乙班多2人;③乙班平均每人捐款数是甲班平均每人捐款数的;请你根据以上信息,求出甲班平均每人捐款多少元?20.某中学开展“唱红歌”比赛活动,九年级(1)、(2)班根据初赛成绩,各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩如图所示.班级平均数(分)中位数众数九(1)85 85九(2)80(1)根据图示填写上表;(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;(3)计算两班复赛成绩的方差,并说明哪个班级的成绩较稳定.21.市政府决定对市直机关500户家庭的用水情况作一次调查,调查小组随机抽查了其中的100户家庭一年的月平均用水量(单位:吨),并将调查结果制成了如图所示的条形统计图.(1)请将条形统计图补充完整;(2)求这100个样本数据的平均数,众数和中位数.22.铜陵职业技术学院甲、乙两名学生参加操作技能培训.从他们在培训期间参加的多次测试成绩中随机抽取8次,记录如下:学生8次测试成绩(分)平均数中位数方差甲95 82 88 81 93 79 84 78 85 35.5乙83 92 80 95 90 80 85 75 84(1)请你在表中填上甲、乙两名学生这8次测试成绩的平均数、中位数和方差。
数据分析经典测试题含答案
5数据分析经典测试题含答案一 S 选择题1.样本数据3, a, 4, b, 8的平均数是5,众数是3,则这组数据的中位数是( )【答案】C 【解析】 【分析】先根据平均数为5得出a + b = 10,由众数是3知a 、b 中一个数据为3、另一个数据为7,再根据中位数的定义求解可得・【详解】解:•••数据 3, a, 4, b,.•.3 + a + 4+b + 8 = 25 >又众数是3,• •a 、b 中一个数据为3、则数据从小到大为3、3、 ・・・这组数据的中位数为4, 故选C.【点睛】 此题考查了平均数、众数和中位数,中位数是将一组数据从小到人(或从人到小)重新排 列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,众数是一组 数据中出现次数最多的数.2. 一组数据3、2. 1、2、2的众数,中位数,方差分别是:() A. 2, 1, 2B. 3, 2, 0.2 C ・ 2, 1, 0.4 D ・ 2, 2, 0.4【答案】D 【解析】 【分析】根据众数,中位数,方差的定义计算即可. 【详解】将这组数据重新由小到人排列为:1、2、2、2、3 2出现的次数最多,众数为:2 中位数为:2方差为:2)1(2一2)'+(2 —2)'+(2 —2)=(3 —2)' 故选:D 【点睛】A. 2B. 3C. 4D. 88的平均数是5,即 a + b = 10,另一个数据为7,4、 7、 8,平均数为:1+2+2+2+3-5本题考查了确定数据众数,中位数,方差的能力,解题的关键是熟悉它们的定义和计算方 法.3.某校组织“国学经典"诵读比赛,参赛10名选于-的得分情况如表所示:分数/分 80 85 90 95 人数/人3421那么,这10名选手得分的中位数和众数分别是()A. 85.5 和 80B. 85.5 和 85C. 85 和 82.5D. 85 和 85【答案】D 【解析】 【分析】众数是一组数据中出现次数最多的数据,注意众数可以不只一个;找中位数要把数据按从小到人的顺序排列,位于最中间的一个数(或两个数的平均数)为 中位数. 【详解】数据85出现了 4次,最多,故为众数;按人小排列第5和第6个数均是85,所以中位数是85. 故选:D. 【点睛】本题主要考查了确定一组数据的中位数和众数的能力.一些学生往往对这个概念掌握不清 楚,计算方法不明确而误选其它选项.注意找中位数的时候一定要先排好顺序,然后再根 据奇数和偶数个来确定中位数,如呆数据有奇数个,则正中间的数字即为所求.如果是偶 数个则找中间两位数的平均数.4.多多班长统计去年1〜8月“书香校园"活动中全班同学的课外阅读数量(单位:本), 绘制了如图折线统计图,下列说法正确的是()B. 众数是42D.每月阅读数量超过40的有4个月A.极差是47 C.中位数是58【答案】C 【解析】弼908D70s)a)403D2Dloo【分析】根据统计图可得出最大值和最小值,即可求得极差;出现次数最多的数据是众数:将这8 个数按人小顺序排列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月.【详解】A、极差为:83-28=55,故本选项错误;B、T58出现的次数最多,是2次,・••众数为:5&故本选项错误;C、中位数为:(58+58) *2=58,故本选项正确;D、每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误;故选C.5.某单位招考技术人员,考试分笔试和面试两部分,笔试成绩与面试成绩按6:4记入总成绩,若小李笔试成绩为80分,面试成绩为90分,则他的总成绩为()A.84 分B. 85 分C. 86 分D. 87 分【答案】A【解析】【分析】按照笔试与面试所占比例求出总成绩即可.【详解】根据题意,按照笔试与面试所占比例求出总成绩:6 480x —+ 90x —= 84 (分)10 10故选A【点睛】本题主要考查了加权平均数的计算,解题关键是正确理解题目含义.6.2022年将在北京--张家II举办冬季奥运会,很多学校为此开设了相关的课程,卞表记录了某校4名同学短道速滑成绩的平均数I和方差S?,根据表中数据,要选一名成绩好又发挥稳定的运动员参加比赛,应选择()A.队员1 B.队员2 C.队员3 D.队员4【答案】B 【解析】 【分析】根据方差的意义先比较出4名同学短道速滑成绩的稳定性,再根据平均数的意义即可求出 答案. 【详解】解:因为队员1和2的方差最小,所以这俩人的成绩较稳定, 但队员2平均数最小,所以成绩好,即队员2成绩好又发挥稳定. 故选B. 【点睛】本题考查方差的意义.方差是用来衡量一组数据波动人小的量,方差越人,表明这组数据 偏离平均数越大,即波动越大,数据越不稳定:反之,方差越小,表明这组数据分布比较 集中,各数据偏离平均数越小,即波动越小,数据越稳定.7.某校九年级模拟考试中,1班的六名学生的数学成绩如下:96, 10& 102, 110, 10& 82.下列关于这组数据的描述不正确的是( )A.众数是108B.中位数是105C.平均数是101D.方差是93【答案】D 【解析】 【分析】把六名学生的数学成绩从小到大排列为:82, 96, 102, 108, 108, 110,求出众数、中位 数、平均数和方差,即可得出结论. 【详解】解:把六名学生的数学成绩从小到人排列为:82, 96, 102, 10& 108, 110, 82 + 96 + 102 + 108 + 108+1106方差为[(82-101)2 +(96-101)2+(102-101)2+(108-101)2+(108-101)2 + (110-101)2]心94.3工93;故选:D. 【点睛】考核知识点:众数、中位数、平均数和方差;理解定义,记住公式是关键.&某班40名同学一周参加体育锻炼时间统计如表所示:・•・众数是108,中位数为 102 + 1082= 105平均数为= 101,那么该班40名同学一周参加体育锻炼时间的众数、中位数分别是()A. 17, 8.5B. 17, 9C. 8, 9D. 8, 8.5【答案】D【解析】【分析】根据中位数、众数的概念分别求得这组数据的中位数、众数.【详解】解:众数是一组数据中出现次数最多的数,即&由统计表可知,处于20, 21两个数的平均数就是中位数,8 + 9・•・这组数据的中位数为一^ = &5 ;2故选:D.【点睛】考查了中位数、众数的概念.本题为统计题,考查众数与中位数的意义,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.9. 一组数据5, 4, 2, 5, 6的中位数是()A. 5B. 4C. 2D. 6【答案】A【解析】试题分析:将题目中数据按照从小到大排列是:2, 4, 5, 5, 6,故这组数据的中位数是5,故选A.考点:中位数;统计与概率.销售量1 2 2 5 1(双)则这11双鞋的尺码组成的一组数据中,众数和中位数分别是()A. 25, 25B. 24.5, 25C. 25, 24.5D. 24.5, 24.5【答案】A【解析】【分析】【详解】解:从小到大排列此数据为:23.5、24、24、24.5、24.5、25、25、25、25、25、26, 数据25出现了五次最多为众数. 25处在第6位为中位数.所以中位数是25,众数是25.故选:A.11.为了迎接2022年的冬奥会,中小学都枳极开展冰上运动,小乙和小丁进行500米短道速滑比赛,他们的五次成绩(单位:秒)如表所示:设两人的五次成绩的平均数依次为范,】丁,成绩的方差一次为S:, S;,则下列判断中正确的是()A.乳乙=XT » SfvS;-B.兀乙=X丁,S; > S学C. x乙〉x丁, S; > S辛D. x乙vx丁,【答案】B【解析】【分析】根据平均数的计算公式先求出甲和乙的平均数,再根据方差的意义即可得出答案.【详解】-45 + 63 + 55 + 52 + 60 __X 乙=----------- :----------- =,则S£=|X^(45-55)2+(63-55)2+(55-55)2+(52-55)2+(60-55)2' =39.6,- 51 + 53 + 58+56+57 一XT = ----------------- -------------- = 3、,则S-:=£x[(51 —55『+(53 —55『+(58-55)'+(56 —55)' +(57-55打二6.8, 所以x乙=x r,> S 〒‘故选B.【点睛】本题考查方差的定义与意义:一般地设"个数据,人,心,...£的平均数为I,则方差,它反映了一组数据的波动犬小,方差越人,波动性越人,反之也成立.12.在5轮“中国汉字听写大赛"选拔赛中,甲、乙两位同学的平均分都是90分,甲的成绩方差是15,乙的成绩的方差是3,下列说法正确的是()A.甲的成绩比乙的成绩稳定B.乙的成绩比甲的成绩稳定C.甲、乙两人的成绩一样稳定D.无法确定甲、乙的成绩谁更稳定【答案】B【解析】【分析】根据方差的意义求解可得.【详解】•・•乙的成绩方差 < 甲成绩的方差,・•・乙的成绩比甲的成绩稳定,故选B.【点睛】本题主要考查方差,方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越人,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.13.己知一组数据d—2, 4+2。
中考数学专题复习《数据分析》测试卷-附带答案
中考数学专题复习《数据分析》测试卷-附带答案学校:___________班级:___________姓名:___________考号:___________1.为筹备毕业聚餐,班长对全班同学爱吃东北菜、川菜、湘菜、粤菜中的哪一种菜系的人数比较多做了民意调查.班长做决定最关注的统计量是()A.平均数B.中位数C.众数D.方差2.在一次演讲比赛中,小明对7位评委老师打出的分数进行了分析,如果去掉一个最高分和一个最低分后再次进行分析,那么这两组数据的下列统计量一定相等的是()A.中位数B.众数C.平均数D.方差3.一组数据23 27 20 18 x12 它们的中位数是21 则x的值为()A.21B.22C.23D.244.在某校举办的“中学生钢笔字书写”比赛中有15名同学参加比赛初赛成绩各不相同要取成绩前7名的同学参加决赛小亮已经知道了自己的成绩他想知道自己能否进入决赛只需要再知道这15名同学成绩的()A.平均数B.中位数C.众数D.以上都不对5.某校举办了主题为“赏中华诗词寻文化基因品文学之美”的古诗词知识竞赛进入决赛的10名学生成绩统计如下表这10名学生决赛成绩的中位数应是()决赛成绩/分9896959190人数/名12241A.91分B.92分C.93分D.95分6.某校举行以“我和我的祖国”为主题的演讲比赛7位评委给某同学打分(满分10分)该同学的得分情况是8 6 8 7 8 5 7.对于该组数据下列说法错误的是()A.平均数为7B.众数为8C.中位数为7D.方差为27.近日2024年郑州中考体育考试项目抽号结果出炉“1分钟跳绳”作为统考项目被抽中.八年级的小亮决定提前训练该项目小亮训练的前3次成绩如图所示若第四次的成绩为m个且这4个成绩的中位数和众数相同则m的值为()A.172B.173C.174D.1758.某轮滑队所有队员的年龄只有1213141516(岁)五种情况其中部分数据如图所示若队员年龄的唯一的众数与中位数相等则这个轮滑队队员人数最少是()A.10B.11C.12D.139.某服装店老板从批发市场购进了40件尺码不同的衬衫其中各种尺码的衬衫月销售量如表所示老板最关心的是衬衫尺码数据的()尺码S M L XL XXL XXXL月销售量/件2372062A.平均数B.加权平均数C.中位数D.众数10.某外贸公司要出口一批食品罐头标准质量为每听454克现抽取10听样品进行检测它们的质量与标准质量的差值(单位:克)如下:−10,+5,0,+5,0,0,−5,0,+5,+10.则可估计这批罐头质量的平均数为()A.454克B.455克C.456克D.453克11.某兴趣小组有5名成员身高(厘米)分别为:161,165,169,163,167.增加一名身高为165厘米的成员后现兴趣小组成员的身高与原来相比下列说法正确的是()A.平均数不变方差不变B.平均数不变方差变小C.平均数不变方差变大D.平均数变小方差不变.12.已知一组数据x1x2……x n记其平均数为x方差为s2则另一组数据2x1+b2x2+b……2x n+b的方差和平均数分别为()A.s2x+b B.4s22x+b C.s2x+b D.4s22x+b 13.如图是甲乙两人10次射击成绩(环)的条形统计图则()A.甲的平均成绩比乙好B.乙的平均成绩比甲好C.甲乙两人的平均成绩一样D.无法确定谁的平均成绩好14.甲乙丙丁四名射击运动员进行射击测试每人10次射击成绩的平均数x̅(单位:环)及方差S2(单位:环2)如表所示根据表中数据要从中选择一名成绩好且发挥稳定的运动员参加比赛应选择()甲乙丙丁x̅9998S2 6.5 2.4 1.60.3A.甲B.乙C.丙D.丁15.每年的12月4日是全国法治宣传日某校举行了演讲比赛演讲得分按“演讲内容”占40%“语言表达”占40%“形象风度”占10%“整体效果”占10%进行计算张欣这四项的得分依次为85,88,90,94则她的最终得分是()A.89.6分B.87.6分C.89分D.89.25分16.某超市招聘收银员一名对四名申请人进行了三项素质测试.四名候选人的素质测试成绩如下表.公司根据实际需要对计算机语言商品知识三项测试成绩分别赋予权4 3 2后录用最高分这四人中将被录用的是()素质测试测试成绩小赵小钱小孙小李计算机70906580语言50755560商品知识80358050A.小赵B.小钱C.小孙D.小李17.一枚质地均匀的正方体骰子(六个面分别标有数字1 2 3 4 5 6)投掷5次分别记录每次骰子向上的一面出现的数字.根据下面的统计结果能判断记录的这5个数字中一定没有出现数字1的是()A.中位数是4 众数是4B.平均数是3 中位数是3C.平均数是4 方差是2D.平均数是3 众数是2[(10−8)2+(9−8)2+(8−8)2+ 18.老师在黑板上写出一个计算方差的算式:S2=1n2×(6−8)2],根据上式还原得到的数据下列结论不正确的是()A.n=5B.平均数为8C.添加一个数8后方差不变D.这组数据的众数是6[(x1−2)2+(x2−2)2+⋅⋅⋅+(x5−2)2]则这组数据的总和19.已知一组数据的方差s2=15是()A.1B.2C.2.5D.1020.农科院的研究员种植了甲乙两块玉米试验田为了解试验田中玉米的长势情况研究员分别从两块试验田中随机抽取了7株玉米测量其高度(单位:cm)具体数据统计如下:试验田第一株第二株第三株第四株第五株第六株第七株平均数甲192187190188190192191190乙187192190186189193193190根据测量数据长势比较整体的是()A.甲试验田B.乙试验田C.两块试验田一样D.无法判断参考答案:1.解:由于众数是数据中出现次数最多的数故班长最值得关注的应该是统计调查数据的众数.故选:C.2.解:一列数去掉最大的和最小的众数可能会改变方差平均数都可能会改变只有中位数一定不会变.故选A.3.解:根据题意x的位置按从小到大排列只能是:12 18 20 x23 27.根据中位数是21 得出(20+x)÷2=21解得x =22. 故选:B .4.解:根据中位数是数据的中间数据回中间两个数据的平均数 故选B .5.解:先对这10位学生的成绩进行排序 ∴90 91 91 91 91 95 95 96 96 98 ∴处于中间位置的两位数是平均数为:91+952=93∴中位数为93. 故选:C .6.解:把这组数据从小到大排列为5 6 7 7 8 8 8 处在最中间的数是7 ∴这组数据的中位数为7 故C 不符合题意 ∴这组数据中8出现了3次 出现的次数最多 ∴这组数据的众数为8 故B 不符合题意 这组数据的平均数为5+6+7+7+8+8+87=7 故A 不符合题意这组数据的方差为 (5−7)2+(6−7)2+2×(7−7)2+3×(8−7)27=87≠2 故D 符合题意故选:D .7.解:∴中位数是中间两个数的平均数 众数是四个数中出现次数最多的数 又∴这4个成绩的中位数和众数相同 ∴第四次的成绩为m =173个 故选:B .8.解:由题图中数据可知:小于14的人有4人 大于14的人也有4人 ∴这组数据的中位数为:14∵队员年龄的唯一的众数与中位数相等 ∴众数是14 即年龄为14的人最多 ∴ 14岁的队员最少有4人 故选:C .9.解:∵众数体现数据的最集中的一点 这样可以确定进货的数量 ∴衬衫老板最喜欢的是众数.故选:D .10.解:根据10听罐头的质量与标准质量的差值 可得这10听罐头的质量依次为: 444 459 454 459 454 454 449 454 459 464. 所以 这批食品罐头平均每听的质量为:110×(444+459+454+459+454+454+449+454+459+464) =110×4550 =455(克)所以可估计这批食品罐头平均每听的质量为455克. 故选:B .11.解:x 原−=(161+165+169+163+167)÷5=165S 原2=15×[(161−165)2+(165−165)2+(169−165)2+(163−165)2+(167−165)2]=8x 新−=(161+165+169+163+167+165)÷6=165S 新2=16×[(161−165)2+(165−165)2+(169−165)2+(163−165)2+(167−165)2+(165−165)2]=203∴平均数不变 方差变小 故选:B .12.解:设一组数据x 1 x 2…的平均数为x 方差是s 2 ∴x =x 1+x 2+x 3……+x nn则另一组数据2x 1+b 2x 2+b ……2x n +b 的平均数为x 1 方差是s 12 ∴x 1=2x 1+b+2x 2+b+2x 3+b……+2x n +bn=2x +b∵s 12=1n[(x 1−x)2+(x 2−x)2+⋯+(x n −x)2] ∴s 12=1n[(2x 1+b −2x −b)2+(2x 2−1−2x −b)2+⋯+(2x n −1−2x −b)2] =1n[4(x 1−x)2+4(x 2−x)2+⋯+4(x n −x)2] =4s 2. 故选:B13.解:依题得:甲的平均成绩为8×4+9×2+10×44+2+4=9乙的平均成绩为8×3+9×4+10×33+4+3=9∵9=9∴甲乙两人的平均成绩一样故选:C.14.解:由表知甲乙丙的射击成绩的平均数相等且大于丁的平均数∴从甲乙丙中选择一人参加竞赛∴丙的方差较小∴丙的发挥稳定∴选择丙参加比赛.故选:C.15.解:由题意知最终得分为85×40%+88×40%+90×10%+94×10%=87.6(分)故选:B.16.解:由题意可得小赵:70×4+50×3+80×24+3+2=5909小钱:90×4+75×3+35×24+3+2=6559小孙:65×4+55×3+80×24+3+2=5859小李:80×4+60×3+50×24+3+2=6009∴5859<5909<6009<6559∴小钱被录用故选:B.17.解:当中位数是4 众数是4时记录的5个数字有可能为:1 2 4 4 5 故A选项不合题意当平均数是3 中位数是3时5个数之和为15 记录的5个数字可能为1 1 3 4 6 故B选项不合题意当平均数是4 方差是2时5个数之和为20 假设1出现了1次方差最小的情况下另外4个数为:4 4 5 6 此时方差s2=15×[(1−4)2+(4−4)2+(4−4)2+(5−4)2+(6−4)2]=2.8>2因此假设不成立即一定没有出现数字1 故C选项符合题意当平均数是3 众数是2时5个数之和为15 2至少出现两次记录的5个数字可能为1 2 2 4 6 故D选项不合题意故选:C.18.解:根据题意得:该组数据为10 9 8 6 6 共5个数平均数为8 故A B选项正确不符合题意添加一个数8后方差为1 6[(10−8)2+(9−8)2+(8−8)2+2×(6−8)2+(8−8)2]=16[(10−8)2+(9−8)2+(8−8)2+2×(6−8)2+0]≠S2即添加一个数8后方差改变故C选项错误符合题意这组数据6出现的次数最多即这组数据的众数是6 故D选项正确不符合题意故选:C19.解:∴数据的方差s2=15[(x1−2)2+(x2−2)2+⋅⋅⋅+(x5−2)2]∴这组数据共有5个其平均数为2∴这组数据的总和为5×2=10故选:D.20.解:∴甲试验田和乙试验田7株玉米高度的平均数都为:190∴甲试验田玉米高度的方差为:s 甲2=17[(192−190)2+(187−190)2+(190−190)2+(188−190)2+(190−190)2 +(192−190)2+(191−190)2]=227乙试验田玉米高度的方差为:s 甲2=17[(187−190)2+(192−190)2+(190−190)2+(186−190)2+(189−190)2 +(193−190)2+(193−190)2]=487∴22 7<487∴长势比较整体的是甲试验田.故选:A.。
[必刷题]2024七年级数学上册数据分析专项专题训练(含答案)
[必刷题]2024七年级数学上册数据分析专项专题训练(含答案)试题部分一、选择题:1. 下列数据中,众数是8的是()A. 2, 3, 5, 7, 8, 8, 9B. 1, 2, 3, 4, 5, 6, 7C. 6, 7, 8, 9, 10, 11, 12D. 4, 5, 6, 8, 8, 9, 102. 下列哪个统计量能够反映一组数据的平均水平()A. 众数B. 平均数C. 中位数D. 方差3. 一组数据的方差越小,说明这组数据的()A. 波动越大B. 波动越小C. 平均数越大D. 平均数越小4. 下列关于平均数、中位数、众数的关系,正确的是()A. 平均数总是大于中位数B. 中位数总是大于众数C. 平均数总是大于众数D. 三者之间的大小关系不确定5. 一个样本的数据为2, 3, 5, 7, 11,则这组数据的中位数是()A. 3B. 5C. 7D. 116. 下列哪个统计量不能反映数据的波动情况()A. 平均数B. 中位数C. 众数D. 方差7. 一组数据的方差为0,则这组数据()A. 平均数为0B. 所有数据都相等C. 中位数为0D. 众数为08. 下列关于众数的说法,错误的是()A. 众数是一组数据中出现次数最多的数B. 一组数据可以没有众数C. 一组数据可以有多个众数D. 众数必须小于平均数9. 要表示一组数据的波动情况,应选用()A. 平均数B. 中位数C. 众数D. 方差10. 一组数据的平均数为10,方差为4,则这组数据()A. 波动较大B. 波动较小C. 数据都相等D. 数据都大于10二、判断题:1. 一组数据的众数只有一个。
()2. 平均数、中位数、众数都是反映数据集中趋势的统计量。
()3. 方差越大,说明数据的波动越小。
()4. 一组数据的中位数等于这组数据排序后中间位置的数。
()5. 如果一组数据中有多个众数,那么这组数据的平均数等于众数。
()三、计算题:1. 已知一组数据:2, 3, 5, 5, 7, 8, 9,求这组数据的平均数。
数据分析本科试题及答案
数据分析本科试题及答案一、单项选择题(每题2分,共20分)1. 数据分析中,用于描述数据集中趋势的统计量是()。
A. 方差B. 标准差C. 平均值D. 极差答案:C2. 以下哪个选项不是数据清洗的目的()。
A. 去除重复数据B. 纠正错误数据C. 增加数据量D. 识别并处理缺失值答案:C3. 在数据分析中,相关系数的取值范围是()。
A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A4. 以下哪个算法不是监督学习算法()。
A. 决策树B. 支持向量机C. K-均值聚类D. 逻辑回归答案:C5. 数据可视化中,用于展示数据分布情况的图表是()。
A. 散点图B. 折线图C. 柱状图D. 直方图答案:D6. 以下哪个选项是时间序列分析中常用的模型()。
A. 线性回归模型B. 逻辑回归模型C. ARIMA模型D. 神经网络模型答案:C7. 在数据分析中,用于识别异常值的方法是()。
A. 箱线图B. 相关系数C. 回归分析D. 聚类分析答案:A8. 以下哪个选项是描述性统计分析的内容()。
A. 预测未来趋势B. 识别数据模式C. 建立因果关系D. 计算数据的平均值答案:D9. 在数据分析中,用于评估分类模型性能的指标是()。
A. 均方误差B. 精确率C. 召回率D. 以上都是答案:D10. 以下哪个选项不是数据预处理的步骤()。
A. 数据清洗B. 特征选择C. 数据转换D. 模型训练答案:D二、多项选择题(每题3分,共15分)11. 数据分析中,以下哪些是数据转换的常见方法()。
A. 归一化B. 标准化C. 离散化D. 数据清洗答案:ABC12. 在数据分析中,以下哪些是特征选择的目的()。
A. 提高模型的准确性B. 减少计算复杂度C. 降低模型过拟合的风险D. 增加数据量答案:ABC13. 以下哪些是数据可视化中常用的图表类型()。
A. 散点图B. 热力图C. 树状图D. 饼图答案:ABCD14. 在数据分析中,以下哪些是数据挖掘的常见任务()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A.甲优<乙优B.甲优>乙优C.甲优=乙优D.无法比较
【答案】A
【解析】
【分析】
根据中位数可得甲班优秀的人数最多有13人,乙班优秀的人数最少有14人,据此可得答案.
15.某中学为了了解同学们平均每月阅读课外书籍的情况,在某年级随机抽查了20名同学,结果如下表所示:
平均每月阅读本数
4
5
6
7
8
人数
2
6
5
4
3
这些同学平均每月阅读课外书籍本数的中位数和众数为( )
A.5,5B.6,6C.5,6D.6,5
【答案】D
【解析】
【分析】
根据中位数和众数的定义分别进行解答即可.
【点睛】
本题考查了平均数、中位数和方差的定义和公式,熟练掌握平均数、中位数、方差的计算是解题的关键.
13.样本数据3,a,4,b,8的平均数是5,众数是3,则这组数据的中位数是( )
A.2B.3C.4D.8【答案】C【解析】【分析】
先根据平均数为5得出 ,由众数是3知a、b中一个数据为3、另一个数据为7,再根据中位数的定义求解可得.
10.2018年国务院机构改革不再保留国家卫生和计划生育委员会,组建国家卫生健康委员会,在修正人口普查数据中的低龄人口漏登后,我们估计了1982-2030年育龄妇女情况.1982年中国15-49岁育龄妇女规模为2.5亿,到2011年达3.8亿人的峰值,2017年降至3.5亿,预计到2030年将降至3.0亿.则数据2.5亿、3.8亿、3.5亿、3.0亿的中位数、平均数、方差分别是( )
【详解】
A.打开电视机,正在播放“张家界新闻”是随机事件,故A选项错误;
B.天气预报说“明天的降水概率为65%”,意味着明天可能下雨,故B选项错误;
C.两组数据平均数相同,则方差大的更不稳定,故C选项错误;
D,数据5,6,7,7,8的中位数与众数均为7,正确,
故选D.
【点睛】
本题考查了概率、方差、众数和中位数等知识,熟练掌握相关知识的概念、意义以及求解方法是解题的关键.
A.3.25亿、3.2亿、0.245B.3.65亿、3.2亿、0.98
C.3.25亿、3.2亿、0.98D.3.65亿、3亿、0.245
【答案】A
【解析】
【分析】
根据中位数、平均数的定义和方差公式分别进行解答即可.
【详解】
把数据2.5亿、3.8亿、3.5亿、3.0亿按从小到大的顺序排列为:2.5亿,3.亿,3.5亿,3.8亿,最中间的两个数是3.0亿和3.5亿,所以,这组数据的中位数为:
这12名队员的年龄的平均数是:
故选:A
【点睛】
本题主要考查众数、平均数,熟练掌握众数、平均数的定义是解题的关键.
3.一组数据2, ,6,3,3,5的众数是3和5,则这组数据的中位数是()
A.3B.4C.5D.6
【答案】B
【解析】
【分析】
由众数的定义求出x=5,再根据中位数的定义即可解答.
【详解】
解:∵数据2,x,3,3,5的众数是3和5,
2.某实验学校女子排球队12名队员的年龄分布如图所示,则这12名队员的年龄的众数、平均数分别是()
A.15岁,14岁B.15岁,15岁
C.15岁, 岁D.14岁,15岁
【答案】A
【解析】
【分析】
根据众数、平均数的定义进行计算即即可.
【详解】
观察图表可知:人数最多的是5人,年龄是15岁,故众数是15.
【详解】
解:由表格可知,每班有27人,则中位数是排序后第14名学生的成绩,
∵甲班的中位数是104,乙班的中位数是106,
∴甲班优秀的人数最多有13人,乙班优秀的人数最少有14人,
∴甲优<乙优,
故选:A.
【点睛】
本题考查了中位数的应用,熟练掌握中位数的意义和求法是解题的关键.
9.一组数据3、2、1、2、2的众数,中位数,方差分别是:()
数据分析专项训练及答案
一、选择题
1.下面是甲、乙两人10次射击成绩(环数)的条形统计图,则下列说法正确的是()
A.甲比乙的成绩稳定
B.乙比甲的成绩稳定
C.甲、乙两人的成绩一样稳定
D.无法确定谁的成绩更稳定
【答案】B
【解析】
【分析】
【详解】
通过观察条形统计图可知:乙的成绩更整齐,也相对更稳定,
故选B.
【答案】D
【解析】
【分析】
根据已知条件表示出价格变化前后两种糖果的平均价格,进而得出等式求出即可.
【详解】
解:∵甲、乙两种糖果,原价分别为每千克a元和b元,
两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,
∴两种糖果的平均价格为: ,
∵甲种糖果单价下降15%,乙种糖果单价上涨20%,
∴两种糖果的平均价格为: ,
12.下面的统计图表示某体校射击队甲、乙两名队员射击比赛的成绩,根据统计图中的信息,下列结论正确的是( )
A.甲队员成绩的平均数比乙队员的大
B.乙队员成绩的平均数比甲队员的大
C.甲队员成绩的中位数比乙队员的大
D.甲队员成绩的方差比乙队员的大
【答案】D
【解析】
【分析】
根据平均数、中位数和方差的计算公式分别对每一项进行分析,即可得出答案.
∴x=5,
则数据为2、3、3、5、5、6,这组数据为 =4.
故答案为B.
【点睛】
本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键.
4.多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()
A.极差是47B.众数是42
【详解】
解: 数据3,a,4,b,8的平均数是5,
,即 ,
又众数是3,
、b中一个数据为3、另一个数据为7,
则数据从小到大为3、3、4、7、8,
这组数据的中位数为4,
故选C.
【点睛】
此题考查了平均数、众数和中位数,中位数是将一组数据从小到大 或从大到小 重新排列后,最中间的那个数 最中间两个数的平均数 ,叫做这组数据的中位数,众数是一组数据中出现次数最多的数.
平均数为: 亿;
方差为:S2= ×[(2.5-3.2)2+(3.8-3.2)2+(3.5-3.2)2+(3.0-3.2)2]= ×(0.49+0.36+0.09+0.04)=0.245
故选A.
【点睛】
本题考查了中位数、平均数和方差,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);一般地设n个数据,x1,x2,…xn的平均数为 ,则方差S2= .
再射击2次后的平均数::(6×3+7×1+8×2+9×1+10×3+7+9)÷12=8,
方差:S2= [(6﹣8)2×3+(7﹣8)2×2+(8﹣8)2×2+(9﹣8)2×2+3×(10﹣8)2]= ,
平均数不变,方差变小,
故选:D.
【点睛】
此题主要考查了方差和平均数,关键是掌握方差计算公式:S2= [(x1﹣ )2+(x2﹣ )2+…+(xn﹣ )2].
决赛成绩/分
95
90
85
80
人数
4
6
8
2
那么20名学生决赛成绩的众数和中位数分别是( )
A.85,90B.85,87.5C.90,85D.95,90
【答案】B
【解析】
试题解析:85分的有8人,人数最多,故众数为85分;
处于中间位置的数为第10、11两个数,
为85分,90分,中位数为87.5分.
故选B.
考点:1.众数;2.中位数
6.有甲、乙两种糖果,原价分别为每千克a元和b元.根据调查,将两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,取得了较好的销售效果.现在糖果价格有了调整:甲种糖果单价下降15%,乙种糖果单价上涨20%,但按原比例混合的糖果单价恰好不变,则 等于( )
A. B. C. D.
11.下列说法正确的是( )
A.打开电视机,正在播放“张家界新闻”是必然事件
B.天气预报说“明天的降水概率为65%”,意味着明天一定下雨
C.两组数据平均数相同,则方差大的更稳定
D.数据5,6,7,7,8的中位数与众数均为7
【答案】D
【解析】
【分析】
根据必然事件的意义、概率的意义、方差的意义、中位数和众数的概念逐一进行判断即可.
C.中位数是58D.每月阅读数量超过40的有4个月
【答案】C
【解析】
【分析】
根据统计图可得出最大值和最小值,即可求得极差;出现次数最多的数据是众数;将这8个数按大小顺序排列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月.
【详解】
A、极差为:83-28=55,故本选项错误;
14.在去年的体育中考中,某校6名学生的体育成绩统计如下表:
成绩
17
18
20
人数
2
3
1
则下列关于这组数据的说法错误的是( )
A.众数是18B.中位数是18C.平均数是18D.方差是2
【答案】D
【解析】
【分析】
根据众数、中位数的定义和平均数、方差的计算公式分别进行解答即可.
【详解】
A、这组数据中18出现了3次,次数最多,则这组数据的众数是18.故本选项说法正确;