大数据1+x理论题库单选题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据1+x理论题库单选题
1.在转换操作中,可以实现从一个字符串中截取特定长度的子串的操作为() [单选题] *
A. TermExtract
B. Substring(正确答案)
C. Tri
D. Concatenate
1.下列关于数据转换器说法正确的是() [单选题] *
A. ArraySplit是文本型转换器(正确答案)
B. Left是集合型转换器
C. Datelnc是集合型转换器
D. Formatdate转换器使用时可以不区分日期形式
1函数关系是一种确定性关系;2相关关系是一种非确定性关系;3回归分析是对具有函数关系的两个变量进行统计分析的一种方法;4回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.() [单选题] *
A.1,2
B.1,2,3
C.1,2,4(正确答案)
D.1,2,3,4
1.数据库中常用的数据类型包括:文本型、数字型、日期时间型、货币型等。
下列对应用途错误的是()。
[单选题] *
A. DATETIME的用途是时间值或持续时间(正确答案)
B.SMALLINT的用途是大整数值
C.VARCHAR的用途是变长字符串
D.TINYTEXT的用途是短文本字符串
1.关系数据库所谓的关系是指()。
[单选题] *
A.各记录中的数据彼此有一定关联
B.数据模型符合满足一定条件的二维表格式(正确答案)
C.某两个数据库之间有一定的关系
D.表中两个字段有一定的关系
1.关系型数据库中的“关系”是指存储数据的表,这个表类似于以下哪种样式?()[单选题] *
A.
B.(正确答案)
C.
D.
2.以下不属于关系型数据库的是()。
[单选题] *
A. DB2
B. HBase(正确答案)
C. MySQL
D. Oracle
2.以下不属于关系型数据库的是()。
[单选题] *
A.DB2
B. HBase(正确答案)
C.MySQL
A.Oracle
2.关联规则是()的工作流 [单选题] *
A.数据库
B.算法(正确答案)
C.转换
D.落地
2.清洗数据应使用() [单选题] *
A.ES落地
B.流转换
C.抽样
D.转换(正确答案)
3.注释是属于()工作流节点 [单选题] *
A.数据库
B.算法
C.转换
D.其他(正确答案)
3.有一个关系,课程目录(课程号,授课教师,所述专业),规定授课教师不能取空值,这一规则属于()。
[单选题] *
A.实体完整性约束
B.参照完整性约束
C.用户自定义完整性约束(正确答案)
D.关键字完整性约束
2. 全链路大数据分析流程包括六个步骤,这六个步骤的排列顺序是() [单选题] *
A. 数据汇集à数据源à数据湖à分析挖掘à数据加工à数据可视化
B. 数据汇集à数据源à分析挖掘à数据湖à数据加工à数据可视化
C. 数据源à数据汇集à分析挖掘à数据湖à数据加工à数据可视化
D. 数据源à数据汇集à数据湖à数据加工à分析挖掘à数据可视化(正确答案)
3. NumericToString是文本函数的一种,它的功能是()。
[单选题] *
A.把一个字符串转换为数值
B.把二进制转换为字符串
C.把一个CSN序列转换成字符串
D.把一个数值数据转换为字符串(正确答案)
4.()是从总体N个单位中随机地抽取n个单位作为样本的抽样方法。
每个单位被抽中的概率是相等的,属于“等概率抽样”。
[单选题] *
A. 方便抽样
B. 分层抽样
C. 整群抽样
D. 简单随机抽样(正确答案)
4.职工数据表中有一个反映职工受教育程度的特征列,其特征值包括:研究生、大学、高中、职高、其他。
在预测职工离职率时要使用此特征列的数据,并且需将其值先转换为1(研究生)、2(大学)、3(高中)、4(职高)、5(其他),则此转换的实现步骤应该是()
(1)右键连接上个节点到当前转换节点
(2)添加转换节点
(3)在当前转换节点的数据转换面板中,添加一个Choice、5个Constant
(4)右键连接5个Constant到Choice
(5)分别设置5个Constant的值为int型的1、2、3、4、5,保存设置结果
(6)在左侧的转换结果中新增一个列,重命名该列,设置好数据类型,并将设置好的Choice连接到该列
(7)在Choice中按题设要求进行转换设置 [单选题] *
A. (4)(5)(1)(2)(3)(6)(7)
B. (1)(2)(7)(4)(5)(3)(6)
C. (2)(1)(3)(5)(4)(7)(6)(正确答案)
D. (2)(1)(3)(4)(5)(7)(6)
5.Choice函数属于()函数 [单选题] *
A. 文本函数
B. 数值函数
C. 逻辑函数(正确答案)
D. 集合函数
5.数据转换器中数值类型的使用用途正确的是() [单选题] *
A. Calclation对应用途为四则运算(正确答案)
B. Abs对应途为定义一个常量,可以是不同类
C. Constant对应用途为返回大于或等于指定数值表达式的最小整数
D. Ceiling对应用途为绝对值
5.对于“出差天数累计大于500”筛选条件正确的是() [单选题] *
A. 累计出差天数>500
B. 累计出差天数.days>500(正确答案)
C. 累计出差天数。
Days>500
D. Days>500
5. 按性别对职工数据集进行汇总统计时,需要对性别列进行哪个操作才能完成统计汇总?() [单选题] *
A. 分组(正确答案)
B. 聚合
C. 排列
D. 统计
6.下面哪个函数可以计算两个日期之间的差() [单选题] *
A. DateFormat
B. DatePart
C. DateDiff(正确答案)
D. SystemDatetime
6.数据转换器中日期类型的使用用途正确的是() [单选题] *
A. DateDiff对应用途是将时间类型转换为字符类型
B. DateFomat对应用途是把一个日期值格式化为Date shire系统内部统一格式
C. String To DateTime对应用途是将字符串转换为日期时间(正确答案)
D. FormatDate对应用途为计算两个日期之间的差
6.一个关系只有一个()。
[单选题] *
A 外码
B 候选码
C 超码
6.对于缺失值的处理中,不属于数据补齐的是() [单选题] *
A. 热卡填充
B. 期望值最大化方法
C. 人工填写
D. 随机补充(正确答案)
6.为了返回组中所有值的和,应使用的聚合函数为()。
[单选题] *
A. AVG
B. SUM(正确答案)
C. COUNT
D.DISTINCT
7.下列不属于常用的聚合方式的是() [单选题] *
A. AVG
B. MIN
C. MAX
D. AND(正确答案)
7.数据库奠基人E.F.Codd从1970年起发表了多篇文章,主要论述的是()。
[单选题] *
A. 层次数据模型
B. 网状数据模型
C. 关系数据模型(正确答案)
D. 面向对象数据模型
7.现有的很多数据挖掘算法只能处理定量的属性,因此定量的属性数据是应用这些算法的前提。
请问下面哪种工作流节点可以将一些不具体、模糊的定性数据数值化?() [单选题] *
A. 规则化
C. 标准化
D. 关联
7.数据转换器中算法类型的使用用途正确的是() [单选题] *
A. InverseNormalizer对应用途是使用ModelSquid的Model给出输入数据的预测值
B. CsvAssemble对应用途是把多个字符串拼接成CSN格式的字符串
C. Tokenization对应用途是把文本按照分词规则转化为CSN(正确答案)
D. Predict对应用途是逆标准化
8. 针对下面的数据表说明,请选出下面哪个选项能筛选出班级为1班、语文成绩在100分以上的同学?() [单选题] *
A. class=”1班” OR Chinese>=100
B. 班 Chinese>=100
C. 班 OR Chinese>=100
D. class=”1班” AND Chinese>=100(正确答案)
8.以下关于关系数据模型的论述正确的是()。
[单选题] *
A.只能表示实体间的1:1联系
B.只能表示实体间的1:n联系
C.只能表示实体间的m:n联系
D.可以表示实体间上述三种联系(正确答案)
8.可视化是完成实验的最后一步,每一个可视化图都有它自己的名称,下列名称正确的是() [单选题] *
A. 图饼图
B.柱状图(正确答案)
C.热力图
D.面积图
9.()也称为非空约束,是为了给一列数据设置一个区间或者取值集合或设置不能是空值。
[单选题] *
A. 默认值约束
B. 检查约束(正确答案)
C. 唯一性约束
D. 外键约束
9.下列关于点图的说法中,正确的是() [单选题] *
A.点图的图形属性中包含颜色属性;(正确答案)
B.点图的图形属性中包含半径属性;
C.点图的图形属性中不包含大小属性;
D.点图的图形属性中不包含形状属性;
9.下列属于系统转换器的是() [单选题] *
A.DateDiff
B.FormatDate
C.DateInt
D.JobId(正确答案)
9. 对下表中的Grade列进行SUM聚合,得到的结果为() [单选题] *
A 715(正确答案)
B NULL
C 12
D 10
10. 将下面的a表转换成b表
形式,需要执行哪个操作() [单选题] *
A 数据聚合
B 数据标签化
C 数据画像
D 行列转换(正确答案)
10.以下哪个数据转换器常用于空值替换,作用为“如果v1为null,则输出v2,否则输出v1”。
() [单选题] *
A. Constant
B. Choice
C. Nvl(正确答案)
D. NumericCast
10.如何从数据库中抽取数据() [单选题] *
A.点击抽取(正确答案)
B.手动连线
C.点击预览
D.以上都不对
10. Calculation函数用以进行数学四则运算,当运算符为()时输入参数的顺序存在逻辑关系。
[单选题] *
A. 加
B. 减
C. 乘
D. 除(正确答案)
10.下列属于分组表中的是() [单选题] *
A. 形状(正确答案)
B. 风格
C. 背景
D. 标题
10.层次型、网状型、关系型数据库划分原则是()。
[单选题] *
A.记录长度(正确答案)
B.文件的大小
C.联系的复杂程度
D.数据之间的联系
11.在数据库中,能提高查询速度的是()。
[单选题] *
A.索引(正确答案)
B.视图
C.数据依赖
D.数据压缩
11.下列不属于工作流节点的有() [单选题] *
A.线性回归
B.抽样
C.标准化
D.参数(正确答案)
12.以下可表示变长度字符串的数据类型是()。
[单选题] *
A.TEXT
B.CHAR
C.VARCHAR(正确答案)
D.EMUM
12.数据源不会来自于() [单选题] *
A.课程文件
B.文件夹
C.自定义(正确答案)
D.FTP
12. 表格作为一个传统的数据展示形式,适用于需要直观地展示数据的统计结果或者明细数据的场景。
DEEP可视化中包含(1)分组表、(2)交叉表和(3)明细表三类数据表格,其中哪些表格是具有统计功能的表格?() [单选题] *
A(1)(2)(3)
B(1)(2)(正确答案)
C(1)
D(2)
13、某大数据分析人员想选择某图表类型来表示当前坐标范围内的各个点的权重情况,最适合的是() [单选题] *
A.点图
B.热力点图(正确答案)
C.面积图
D.雷达图
13.调试成功的颜色是() [单选题] *
A.绿色(正确答案)
B.红色
C.蓝色
D.灰色
13.聚合函数COUNT用于()。
[单选题] *
A. 计算元组个数
B. 计算属性的个数
C. 对一列中的非空值计算个数(正确答案)
D. 对一列中非空值和空值计算个数
14.什么类型的数据转换器可以连接多个数据转换器() [单选题] *
A.文本
B.数值
C.聚合
D.都可以(正确答案)
将a表和
b表进行内部连接,可作为连接条件的列是() [单选题] *
A. 左表的check_code列和右表的xzqu_code列
B. 左表的check_code列和右表的xzqu列
C. 左表的xzqh_code列和右表的xzqu_code列(正确答案)
D. 左表的xzqh_code列和右表的xzqu列
大数据分析人员小张发现,所在的互联网公司的注册人数往往会随着时间有一定的变化,为了更加直观展示这种趋势,最合适的图表是() [单选题] *
A.点图
B.热力点图
C.线型图(正确答案)
D.雷达图
15. 关于数猎云中的数据落地操作,不正确说法的是() [单选题] *
A. 落地表名只能是字母、数字、点、下划线的组合,且只能字母开头
B. 创建落地对象是由系统创建可用于存储落地数据的表对象
C. 创建落地对象时,若弹出已经存在落地表,说明数据库中已经存在与所设置的落地表名一致的表
D. 数猎云中不能设置批量落地,只能逐个创建落地对象。
(正确答案)
15.Concatenate函数的功能是()。
[单选题] *
A.把一个字符串按照指定字符串分隔成数组
B.提取出和正则表达式匹配的所有字符串组成数组
C.从一个字符串中截取特定长度的子串
D.把多个字符串按次序连接成一个字符(正确答案)
15. 对于二分类问题,线性分类器用一个超平面将两类样本分开,对于二维平面,这个超平面是一条( c ) [单选题] *
A.折线
B.曲线
C.直线(正确答案)
D.以上说法都不对
16、()常用于词云图的绘制,词云是一种直观展示数据频率的图表类型,可以对出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”,从而过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略重点。
[单选题] *
A.文本图(正确答案)
B.热力点图
C.面积图
D.雷达图
16.每做完一步后都习惯性检测自己前一步是否正确
,
下列步骤顺序正确的是() [单选题] *
A.设置查看器、设置目的地、调试、开始、停止
B.设置查看器、调试、开始、设置目的地、调试(目的地)、停止
C.设置查看器、调试、开始、停止(正确答案)
D.设置目的地、调试(目的地)、开始、停止
16. 在实际的问题中我们遇到的数据量往往是巨大的。
为了保证我们所用的方法能够在原始数据的支持下得以实现,我们必须要对数据进行()。
[单选题] *
A. 筛选(正确答案)
B. 离散化
C. 标准化
D. 量化
17.以下表示返回字符串长度的函数是()。
[单选题] *
A.Long
B.Left
C.Len
D.Length(正确答案)
17. 在对抽取数据进行过滤筛选时,可以使用边角运算符进行过滤筛选。
运算符“ !> ”的含义是()。
[单选题] *
A用于测试两个表达式彼此不相等的条件的运算符
B用于测试一个表达式是否不大于另一个表达式的运算符(正确答案)
C用于测试一个表达式是否小于或等于另一个表达式的运算符
D用于测试一个表达式是否大于另一个表达式的运算符
17. 最小最大正规化也称为离差标准化,是对一列原始数据的() [单选题] *
A.线性变换(正确答案)
B.线性回归
C.线性代数
D.矩阵
17.可视化中的组件样式不包括() [单选题] *
A.标题
B.自适应显示
C.标签(正确答案)
D.轴线
17. (3+2>3) AND (Abs(-3)=3)的计算结果是() [单选题] *
A. 3
B. -3
C. True(正确答案)
D. False
17、某销售人员拥有线索数据、商机数据、销售数据等各个阶段的占比情况,下面哪个图表最适合展示() [单选题] *
A.文本图
B.热力点图
C.面积图
D.漏斗图(正确答案)
18、下列关于仪表盘图的说法中,错误的是() [单选题] *
A.仪表盘图可以直观地表现出某个指标的进度或实际情况;
B.一个可视化组建中只能创建多个仪表盘
C.仪表盘中的仪表板最小值为目标值;(正确答案)
D.仪表盘中指针指向的位置为指针值,即当前值;
18.以下表示返回系统当前日期的函数是()。
[单选题] *
A. SystemDatetime(正确答案)
B. UnixtimeToDate
C. Datepart
D. FormatDate
18. 如下图所示,为()的计算公式。
[单选题] *
A. 算术平均值
B. 加权平均值(正确答案)
C. 几何平均数
D. 以上均不正确
18. 朴素贝叶斯是一种简单但是非常强大的() [单选题] *
A.线性分类器(正确答案)
B.分析器
C.逻辑分析器
D.以上说法都不对
18. 下面哪个函数可以将形如YYYY-MM-DD hh:mm:ss 日期时间转化为字符串()[单选题] *
A.DateToString
B.DateTimeToString(正确答案)
C.FormatDate
D.StringToDateTime
19.以下哪一项不属于连接种类()。
[单选题] *
A. 左外连接
B. 内连接
C. 中间连接(正确答案)
D. 交叉连接
19. 当数据经过设计好的流程处理后,接下来需要进行可视化展示。
在DEEP中需要将处理后的数据落地到(),就能在DEEP可视化模块中进行可视化展示。
[单选题] *
A.云数据库的表中(正确答案)
B.关系数据库
C.数据源
D.Excel的工作表中
20.有三个表,他们的记录行数分别是12行、2行、6行,三个表进行交叉连接后,结果集中共有()行数据。
[单选题] *
A.18
B.26
C.120(正确答案)
不确定
20. CsvAssemble数据转换器的作用是()。
[单选题] *
A. 数值组装
B. 把文本按照分词规则转化为CSN
C. 把多个字符串拼接成CSV格式的字符串(正确答案)
D. 逆标准化
20. CsvAssemble数据转换器的作用是()。
[单选题] *
A. 数值组装
B. 把文本按照分词规则转化为CSN
C. 把多个字符串拼接成CSV格式的字符串(正确答案)
D. 逆标准化
20.平均值很容易受()影响 [单选题] *
A平均值
B定变值
C极值(正确答案)
D以上说法都不对
21.关于分组表、交叉表、明细表、柱形图这四个图表类型,以下说法中错误的是() [单选题] *
A.分组表由一个维度、至少一个指标组成,可以清晰地展示出不同维度对应的数据
B.交叉表由一个维度、至少两个指标组成;(正确答案)
C.明细表展示的数据较为灵活,展示的结果可以扩展多列;
D.柱形图是较为传统、普遍的可视化方案的选择,其可以衍生出分区柱形图、堆积柱形图、多系列柱形图、对比柱形图等;
22.下列关于点图的说法中,错误的是() [单选题] *
A. 点图的图形属性中不包含颜色属性;(正确答案)
B. 点图的图形属性中不包含半径属性;
C. 点图的图形属性中包含大小属性;
D. 点图的图形属性中包含形状属性;
24.下列关于线形图的说法中,错误的是() [单选题] *
A.线形图是一种以直线的方式展示可视化结果的图表;(正确答案)
B.线形图中连线的线形包括折线、曲线以及垂直线;
C.我们可以为线形图中每一个连接的点打上标签,使其可以清晰地展示出对应的数值;
D.线形图可以清晰地反应事物随类别而变化的趋势,如增减趋势、增减速度等;
25.以下哪个组件样式是在所有的可视化图表中普遍存在的?() [单选题] *
A图例;
B轴线;
C标题;(正确答案)
D网格线;
27.下列关于饼图的说法中,错误的是() [单选题] *
A.饼图的数据项中允许有负值;(正确答案)
B.在设计饼图时,往往需要维护不同半径对应的标签以使不同半径数值直观化;
C.饼图通常适用于统计不同指标数据占比的情形;
D.饼图也被称为扇形统计图;
28.下列关于文本图的说法中,错误的是() [单选题] *
A.文本图不适合展示数据太少的数据集;
B.文本图不适用于展示无明显差异的数据集,因为无明显差异的数据集会使得出的文本图缺少关键词,无法带来突出感;
C.可以在文本图中添加标签以使可视化结果更为直观;(正确答案)
D.文本图又可称为词云图;
30.下列关于仪表盘图的说法中,错误的是() [单选题] *
A.仪表盘图可以直观地表现出某个指标的进度或实际情况;
B.一个可视化组建中只能创建一个仪表盘,无法同时展示多个仪表盘;(正确答案)
C.仪表盘中的仪表板最大值为目标值;
D.仪表盘中指针指向的位置为指针值,即当前值;
31.下列关于气泡图的说法中,错误的是() [单选题] *
A.气泡图中气泡的颜色是系统统一设置的,无法人为调整;(正确答案)
B.气泡大小的不同意味着所代表的的数值的不同;
C.气泡图中的图形形状不一定是圆形;
D.可以为每个气泡打上标签使其展示的数值更加直观化;
32.下列关于雷达图的说法中,错误的是() [单选题] *
A.雷达图也称为网络图,蜘蛛图,星图,蜘蛛网图等;
B.雷达图不适合展现某个数据集的多个关键特征;(正确答案)
C.雷达图中不同坐标的点之间以直线相连接;
D.雷达图常用于多项指标的全面分析,具有完整、清晰和直观的优点;
33.下列关于地图的说法中,错误的是() [单选题] *
A.地图是指使用地理地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分布通过颜色或者气泡等映射在地图上的一种图表;
B.地图适合带有地理位置信息的数据的展现,可以非常直观地展示出不同地理位置的数据信息,给人以空间感;
C.气泡地图中,即使相邻气泡所示数值很大,气泡间也不容易叠加;(正确答案)
D.地图可以分为气泡地图、颜色地图等;
35.下列关于“数据可视化”的说法中,正确的是() [单选题] *
A.数据可视化没有标准答案,不同的商业案例、原始数据均可能影响可视化图表的选择,最为重要的影响因素是:你想以怎样的形式向汇报对象展示结果;(正确答案)
B.数据可视化有标准答案,不同的商业案例、原始数据只能选择对应的一种可视化图表;
C.数据可视化是使数据以图表等方式展示的一种方法,EXCEL无法完成数据可视化操作;
D.数据可视化结果应当包含所有原始数据信息,需要向汇报对象展示出全部的数据结果;
36.下列说法中,错误的是() [单选题] *
A.可视化结果不应复杂,应遵循简单直接明了的原则,少说描述性语言,直奔主题
B.对于绝大多数企业而言,可视化在财务管理中的地位越来越重要,因为绝大多数的管理者仅愿意接受PPT及图表形式汇报工作,即:WORD
C.在世界五百强中,越来越多的弱化财务基础管理职能,更加注重财务价值创造、关键指标预警、监督等职能的实现,因此实务中要求财务的业务能力由“账房先生”向CFO职能转变,无法转变思路和技能的财务工作者终将在近几年被淘汰;
D.数据可视化在企业中主要由财务部负责使用,其他业务部门如营销部、人事行政部、成本管理部门等使用极少;(正确答案)
38.某公司财务总监在三季度总结会上的报告中,需要清晰地展示出本年累计净利润、营业额以及部门业绩合同的完成进度情况等,以下可视化图标中,他可以选择的是() [单选题] *
A.仪表盘;(正确答案)
B.线形图;
C.矩阵块图;
D.雷达图;
39.某公司营销总监在年度报告中,需要直观地展示出最近五年公司某产品的销售额变化趋势,以下可视化图表中,最适合他的是() [单选题] *
A.明细表;
B.热力点图;
C.线形图;(正确答案)
D.漏斗图;
41.在进行回归模型运行操作前,需要进行哪一步转换操作?() [单选题] *
A.数值组装(正确答案)
B.数值预测
C.模型训练
D.求绝对值
在进行回归模型运行操作前,需要进行哪一步转换操作?() [单选题] *
A.数值组装(正确答案)
B.数值预测
C.模型训练
D.求绝对值
43.房价是一个连续值,房价受多种因素的影响,假设你已经拿到房价在某市的数据,现需要你预测未来的房价走势。
进行算法转换之前应将原始数据进行组装,采用哪个算法类数据转换器进行数值组装?() [单选题] *
A.CsvAssemble
B.NullPercentage
C.NumericCast
D.NumAssemble(正确答案)
44.房价是一个连续值,房价受多种因素的影响,假设你已经拿到房价在某市的数据,现需要你预测未来的房价走势。
在完成数值组装之后,需要进行房价的预测。
此时,添加了一个新的转换节点,需要进行数值预测。
采用哪个算法类数据转换器进行数值预测?() [单选题] *
A. Tokenization
B. RulesQuery
C. Predict(正确答案)
D. Choice
45.假设超市经理甲想更多的了解顾客的购物习惯。
特别想知道哪些商品顾客可能会在一次购物时同时购买?为回答该问题,可以对商店的顾客事物零售数量进行购物篮分析。
该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。
这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。
下面哪个是DEEP平台中的关联规则数据转换器?() [单选题] *
A. RulesQuery(正确答案)
B. InverseNormalizer
C. NVL
D. Radians
46.CSV是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。
现在需要在DEEP平台中将多个字符串拼接成CSV格式的字符串。
请选择适用的数值转换器:() [单选题] *
A. Ceiling
B. CsvAssemble(正确答案)
C. CsnToString
D. TermExtract
47.某地准备投资建立光伏电站,但需要对投资回报和运营发电进行预测分析。
现有既往其他类似地区的发电量数据,计划采用线性回归算法将根据既有数据进行预测。
数值组装和电力输出预测会用到哪2个数值转换器?() [单选题] *
A. Choice、Predict
B. NumAssemble、Power
C. NumericCast、Power
D. NumAssemble、Predict(正确答案)
48.把基于使用DM Squid作为模型的Predict输出进行反向转换得到原始的标签值,会采用哪个数值转换器?() [单选题] *
A.Jobld
B.InverseQuantify(正确答案)
C.DM Squid
D.InverseNormalizer
49.原始数据中包含一个数值用于标准化模拟量信号(电流,电压,电阻或温度),这个数值代表被测量的参量,这个过程被称作标准化。
相反,原始数据是过程值,过程值被转换成数字信号,模拟量输出模块再将其转换成模拟量信号用来驱
动模拟执行器则为逆标准化。
那么如果做逆标准化的转换,需要哪个数值转换器?() [单选题] *
A.InverseQuantify
B.RulesQuery
C.Replicate
D.InverseNormalizer(正确答案)
50.NLP(natural language processing)是自然语言处理,NLP的首要任务就是将文本内容做标识化处理,也就是说我们将文本分割,例如一个单词或汉字为单位或者整个文本分成段落等,这样操作可以更集中的去分析文本信息的内容和文本想表达的含义。
如果需要把文本按照分词规则转化为CSN,会采用哪个数据转换器?() [单选题] *
A. PatternIndex
B. Tokenization(正确答案)
C. Round
D. Reverse
51.一个网络信息系统最重要的资源是() [单选题] *
A.数据库(正确答案)
B.计算机硬件
C.网络设备
D.数据库管理系统
52.下列关于大数据的分析理念的说法中,错误的是()。
[单选题] *
A. 在数据基础上倾向于全体数据而不是抽样数据
B. 在分析方法上更注重相关分析而不是因果分析
C. 在分析效果上更追究效率而不是绝对精确
D. 在数据规模上强调相对数据而不是绝对数据(正确答案)
53.下列关于网络用户行为的说法中,错误的是()。
[单选题] *。