20春学期《数据科学导论》在线作业.DA7F735C

合集下载

南开20秋学期《数据科学导论》在线作业

南开20秋学期《数据科学导论》在线作业

20秋学期(1709、1803、1809、1903、1909、2003、2009 )《数据科学导论》在线作业
对于k近邻法,下列说法错误的是()。

A:不具有显式的学习过程
B:适用于多分类任务
C:k值越大,分类效果越好
D:通常采用多数表决的分类决策规则
答案:C
以下哪个不是处理缺失值的方法()
A:删除记录
B:按照一定原则补充
C:不处理
D:随意填写
答案:D
在一元线性回归模型中,残差项服从()分布。

A:泊松
B:正态
C:线性
D:非线性
答案:B
一元线性回归中,真实值与预测值的差称为样本的()。

A:误差
B:方差
C:测差
D:残差
答案:D
Apriori算法的加速过程依赖于以下哪个策略( ) A:抽样
B:剪枝
C:缓冲
D:并行
答案:B。

2020年XXX 20春学期《数据科学导论》在线作业试题参考答案

2020年XXX 20春学期《数据科学导论》在线作业试题参考答案

2020年XXX 20春学期《数据科学导论》在线作业试题参考答案1.实体识别常见形式为属性不同。

2.将工资收入属性值映射到[-1,1]或[0,1]内属于数据变换中的规范化。

3.单层感知机模型属于二分类的线性分类模型。

4.通过变量标准化计算得到的回归方程称为标准化回归方程。

5.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于不一致的值。

6.缺失值的影响包括数据建模将丢失大量有用信息,数据建模的不确定性更加显著,以及包含空值的数据可能会使建模过程陷入混乱,导致异常的输出。

7.层次聚类适合规模较小的数据集。

8.处理缺失值的方法包括删除记录、按照一定原则补充和不处理,但随意填写是不可取的。

9.聚类的最简单最基本方法是划分聚类。

10.具有偏差和至少1个S型隐含层加上一个线性输出层的网络能够逼近任何有理数。

11.采用合并策略,由候选产生过程得到的4-项集不包含1,2,4,5.12.在k近邻法中,当选择较小的k值时,研究的“近似误差”会减小,而“估计误差”会增大。

13.手肘法的核心指标是SSE。

14.变量之间的关系一般可以分为确定性关系与非确定性关系。

15.以下哪一项不属于数据变换?答案为C,即属性合并。

16.以下哪一项不是特征选择常见的方法?答案为D,即开放式。

17.通过构造新的指标-线损率,当超出线损率的正常范围时,可以判断这条线路的用户可能存在窃漏电等异常行为,属于数据变换中的属性构造。

18.比如一张表,从业务上讲,一个用户应该只会有一条记录,那么如果某个用户出现了超过一条的记录,这就产生了重复值。

19.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y^=100-1.2X,这说明产量每增加一台,单位成本平均减少1.2元。

20.层次聚类对给定的数据进行层次的分解。

21.K-means聚类中K值选取的方法是手肘法和密度分类法。

奥鹏南开20春学期《数据科学导论》在线作业标准答案

奥鹏南开20春学期《数据科学导论》在线作业标准答案
【答案】:A.D
24. Apriori 算法的计算复杂度受()影响。 【选项】: A 支持度阈值 B 项数 C 事务数 D 事务平均宽度
【答案】:A.B.C.D
25. 距离度量中的距离可以是() 【选项】: A 欧式距离 B 曼哈顿距离 C Lp 距离 D Minkowski 距离
【答案】:A.B.C.D
【答案】:C
14. 层次聚类对给定的数据进行()的分解。 【选项】: A 聚合 B 层次 C 分拆 D 复制
【答案】:B
15. 层次聚类适合规模较()的数据集 【选项】: A大 B中 C小 D 所有
【答案】:C
16. 通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能 存在窃漏电等异常行为属于数据变换中的()
【答案】:D
21. 数据科学具有哪些性质() 【选项】: A 有效性 B 可用性 C 未预料 D 可理解
【答案】:A.B.C.D
22. 下列选项是 BFR 的对象是() 【选项】: A 废弃集 B 临时集 C 压缩集 D 留存集
【答案】:A.C.D
23. 多层感知机的学习过程包含()。 【选项】: A 信号的正向传播 B 信号的反向传播 C 误差的正向传播 D 误差的反向传播
【答案】:A.B.C
31. 利用 K 近邻法进行分类时,k 值过小容易发生过拟合现象。 【选项】: T对 F错
【答案】:A
32. Apriori 算法是一种典型的关联规则挖掘算法。 【选项】: T对 F错
【答案】:A
33. 贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布 有关。 【选项】: T对 F错
【选项】: A 简单函数变换 B 规范化 C 属性构造 D 连续属性离散化

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业答卷

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业答卷

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业
试卷总分:100 得分:100
一、单选题(共20 道试题,共40 分)
1.以下属于关联分析的是( )
A.购物篮分析
B.自动判断鸢尾花类别
C.股票趋势建模
D.CPU性能预测
答案:A
2.哪一项不属于规范化的方法()
A.零-均值规范化
B.最小-最大规范化
C.小数定标规范化
D.中位数规范化
答案:D
3.实体识别属于以下哪个过程()
A.数据集成
B.数据规约
C.数据清洗
D.数据变换
答案:A
4.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。

A.2,非线性
B.2,线性
C.1,非线性
D.1,线性
答案:D
5.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A.自然语言处理
B.聚类
C.分类
D.关联规则发现
答案:D
6.层次聚类适合规模较()的数据集
A.所有
B.小
C.大
D.中。

南开大学20春学期《大数据导论》在线作业

南开大学20春学期《大数据导论》在线作业

南开大学20春学期《大数据导论》在线作业
试卷总分:100 得分:100
一、单选题(共15 道试题,共30 分)
1.大数据的特点不包含
A.数据体量大
B.数据不统一
C.处理速度快
D.价值密度高
答案:B
2.基础设施即服务的英文简称是
A.SaaS
B.PaaS
C.IaaS
答案:C
3.下面哪一项不是中国发展大数据产业的基础()。

A.大数据技术创新取得明显突破
B.大数据应用推动势头良好
C.大数据产业支撑薄弱
D.信息化积累了丰富的数据资源
答案:C
4.数据清洗的方法不包括
A.重复数据记录处理
B.缺失值处理
C.噪声数据清除
D.一致性检查
答案:A
5.以下不是数据仓库基本特征的是()
A.数据仓库的数据是相对稳定的
B.数据仓库的数据是反映历史变化的
C.数据仓库是面向事务的
D.数据仓库是面向主题的
答案:C
6.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。

A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
答案:A
7.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。

大数据技术导论-202009国家开放大学2020年春季学期期末统一考试试题及答案

大数据技术导论-202009国家开放大学2020年春季学期期末统一考试试题及答案

是指同一类型的数据模型、不同型号的数据库系统。(
)
12. 数据规范化可将原来的度量值转换为无量纲的值,通过将属性数据按比例缩放,将一个函
数给定属性的整个值域映射到一个新的值域中,即每个旧的值都被一个新的值替代。( )
13. 数据挖掘主要注重解决分类、聚类、关联和定量定性预测等问题,其重点不是寻找未
知的模式与规律。(
)。
A. 事务处理应用
B. 日志数据存储
C. 数据分析应用
D. 互联网应用
8. 去重是指在不同的时间维度内,重复一个行为产生的数据只计人一次。按(
去重主要分为按小时去重、按日去重、按周去重、按月去重或按自选时间段去重。
A. 高维
B. 低维
c. 时间
D. 空间
9. 数据平滑法主要分为(
入指数平滑法和分箱平滑法。
是说,只有数据,无结构,例如图形、图像、音频和视频等 (3 分)。
22. 一个银行有上亿个储户,如果银行希望找到最高的存储金额是多少,结合下图,说明
基千 MapReduce 模型的寻找最大值的过程。
答:首先将数字分布存储在不同块中,以某几个块为一个 Map, 找出各个 Map 中最大的值
(3 分),例如最左列为 1000, 最右列为 985, 然后将每个 Map 中的最大值做 Reduce 操作,即找
抽取出新的 URL 放入待撩取 URL 队列心 图 网络爬虫工作原理
已棵取 URL 队列心
1293
28. 假设有 9 、 24 、 15 、 41 、礼 10 、 18 、 67 、 25 共 9 个数,分为 3 箱,各箱的数据分配如下:
箱 1:9 、 24 、 15 箱 2:41 、 7 、 10 箱 3:18 、 67 、 25 (1) 按箱平均值法,求箱 1 的平滑数据值。 (2) 按箱中值法,求箱 2 的平滑数据值。 (3) 按箱边界值法,求箱 3 的平滑数据值。

2020年奥鹏南开大学 20春学期《数据

2020年奥鹏南开大学 20春学期《数据

南开大学20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业试题参考答案相关题目如下1.实体识别的常见形式()【选项】:A 同名异义B 异名同义C 单位不统一D 属性不同【答案】:D2.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()【选项】:A 简单函数变换B 规范化C 属性构造D 连续属性离散化【答案】:B3.单层感知机模型属于()模型。

【选项】:A 二分类的线性分类模型B 二分类的非线性分类模型C 多分类的线性分类模型D 多分类的非线性分类模型【答案】:A4.通过变量标准化计算得到的回归方程称为()。

【选项】:A 标准化回归方程B 标准化偏回归方程C 标准化自回归方程D 标准化多回归方程【答案】:A5.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()【选项】:A 异常值B 缺失值C 不一致的值D 重复值【答案】:C6.以下哪些不是缺失值的影响()A 数据建模将丢失大量有用信息B 数据建模的不确定性更加显著C 对整体总是不产生什么作用D 包含空值的数据可能会使建模过程陷入混乱,导致异常的输出【答案】:C7.层次聚类适合规模较()的数据集【选项】:A 大B 中C 小D 所有【答案】:C8.以下哪个不是处理缺失值的方法()【选项】:A 删除记录B 按照一定原则补充C 不处理D 随意填写【答案】:D9.聚类的最简单最基本方法是()。

A 划分聚类B 层次聚类C 密度聚类D 距离聚类【答案】:A10.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。

【选项】:A 1,线性B 2,线性C 1,非线性D 2,非线性【答案】:A11.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()【选项】:A 1,2,3,4B 1,2,3,5C 1,2,4,5D 1,3,4,512.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

[南开大学]20秋学期(1709至2009 )《数据科学导论》在线作业-辅导资料答案1

[南开大学]20秋学期(1709至2009 )《数据科学导论》在线作业-辅导资料答案1

[南开大学]20秋学期(1709至2009 )《数据科学导论》在线作业提示:本资料为南开大学学习辅导资料,只做参考学习使用!!一、单选题 (共 20 道试题,共 40 分)1.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。

A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元【标准选项是】:C2.置信度(confidence)是衡量兴趣度度量( )的指标。

A.简洁性B.确定性C.实用性D.新颖性【标准选项是】:B3.实体识别属于以下哪个过程()A.数据清洗B.数据集成C.数据规约D.数据变换【标准选项是】:B4.在一元线性回归模型中,残差项服从()分布。

A.泊松B.正态C.线性D.非线性【标准选项是】:B5.手肘法的核心指标是()。

A.SESB.SSEC.RMSED.MSE【标准选项是】:B6.单层感知机模型属于()模型。

A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型【标准选项是】:A7.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理【标准选项是】:A8.下列两个变量之间的关系中,哪个是函数关系()。

A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度【标准选项是】:C9.聚类是一种()。

A.有监督学习B.无监督学习C.强化学习D.半监督学习【标准选项是】:B10.以下哪些不是缺失值的影响()A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出【标准选项是】:C11.多层感知机是由()层神经元组成。

奥鹏远程南开大学(本部)20春学期《大数据导论》在线作业标准答案

奥鹏远程南开大学(本部)20春学期《大数据导论》在线作业标准答案
【选项】:
A一个名字节点
B若干个名字节点
C一个数据节点
D若干个数据节点
【答案】:A.D
28.大数据在社交网络中的应用
【选项】:
A用户偏好、情感、社交网络结构
B用户画像、精准推荐
C舆情监控、突发事件预警
D预测外部趋势
【答案】:A.B.C.D
29.开放云()
【选项】:
A价值呈现:大数据应用价值呈现和创新不足
23.数据分析的类型根据数据分析深度可以分为()
【选项】:
A描述性分析
B预测性分析s
C规则性分析
【答案】:A.B.C
24.主流分布式计算平台有()
【选项】:
A g:A.B.D
25.交通数据分析可用于:
【选项】:
A交通流量实时分析
B合理进行道路规划
南开大学(奥鹏)网络教育
《大数据导论》在线作业
正确答案
参考资料试读一页
20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业
1.大数据的特点不包含
【选项】:
A数据体量大
B价值密度高
C处理速度快
D数据不统一
【答案】:D
2.基础设施即服务的英文简称是
【选项】:
A IaaS
【选项】:
A ggplot2
B network
C ggmaps
D animation
【答案】:D
12.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
【选项】:
A运营式系统阶段
B用户原创内容阶段
C感知式系统阶段
【答案】:B
13.哪个选项不属于大数据4V特点?

奥鹏远程南开大学(本部)20春学期《大数据导论》在线作业参考答案

奥鹏远程南开大学(本部)20春学期《大数据导论》在线作业参考答案
D健康档案数据
【答案】:C
14.大数据的特点不包含
【选项】:
A数据体量大
B价值密度高
C处理速度快
D数据不统一
【答案】:D
15.下列哪个工具常用来开发移动友好地交互地图()
【选项】:
A Leaflet
B Visual.ly
C BPizza Pie Charts
D Gephi
【答案】:A
16.医疗大数据的来源主要包括()
D巨量级数据分析
【答案】:
22.大数据在医疗中的应用有()
【选项】:
A流行性疾病预防
B慢性病健康管理
C临床决策支持
D医疗器械研发
【答案】:A.B.C.D
23.互连网上出现的海量信息可以划分为三种,分别为( )
【选项】:
A结构化信息
B非结构化信息
C半结构化信息
D特殊化信息
【答案】:
24. ##和##,它们把原数据变换或投影到较小的空间。
【选项】:
A小波变换
B中心化变换
C主成分分析
D对数变换
【答案】:
25.社会信号数据的特点有()
【选项】:
A规模大
B空间覆盖率广
C监测时间长
D实时性
【答案】:A.B.C.D
26.大数据存储的特点与挑战有()
【选项】:
A容量问题
B延迟问题
C安全问题
D成本问题
【答案】:A.B.C.D
27.数据预处理的过程主要是
【选项】:
T对
F错
【答案】:A
39. NAS代表的意思是网络附加存储
【选项】:
T对
F错
【答案】:A

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业【南开大学答案50032】

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业【南开大学答案50032】
20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业 红字部分为答案!
单选题 1.以下属于关联分析的是 A.CPU性能预测 B.购物篮分析 C.自动判断鸢尾花类别 D.股票趋势建模
2.哪一项不属于规范化的方法 A.最小-最大规范化 B.零-均值规范化 C.小数定标规范化 D.中位数规范化
13.一元线性回归中,真实值与预测值的差称为样本的。 A.误差 B.方差 C.测差 D.残差
14.以下哪个不是处理缺失值的方法 A.删关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一 张表中的数据,这时两张表中就有了不一致的数据,这属于 A.异常值 B.缺失值 C.不一致的值 D.重复值
10.为了解决任何复杂的分类问题,使用的感知机结构应至少包含个隐含层。 A.1 B.2 C.3 D.4
11.在回归分析中,自变量为,因变量为。 A.离散型变量,离散型变量 B.连续型变量,离散型变量 C.离散型变量,连续型变量 D.连续型变量,连续型变量
12.维克托迈尔-舍恩伯格在大数据时代生活、工作与思维的大变革一书中,持续强调了一个观点大数 据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关 系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘 A.K-means B.Bayes Network C.C4.5 D.Apriori
9.决策树的输入为训练集,输出为以node为根结点的一棵决策树 A.正确 B.错误
10.单层感知机对于线性不可分的数据,学习过程也可以收敛。 A.正确 B.错误
11.朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能 A.正确 B.错误

南开《数据科学导论》20春期末考核-00001参考答案

南开《数据科学导论》20春期末考核-00001参考答案
A.1,2,3,4
B.1,2,3,5
C.1,2,4,5
D.1,3,4,5
答案:C
15.单层感知机模型属于()模型。
A.二分类的线性分类模型
B.二分类的非线性分类模型
C.多分类的线性分类模型
D.多分类的非线性分类模型
答案:A
二、多选题(共5道试题,共10分)
16.系统日志收集的基本特征有()
A.高可用性
C.对整体总是不产生什么作用
D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
答案:C
13.下列两个变量之间的关系中,哪个是函数关系()。
A.人的性别和他的身高
B.人的工资与年龄
C.正方形的面积和边长
D.温度与湿度
答案:C
14.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
C.子集搜索
D.子集验证
答案:C
10.一元线性回归中,真实值与预测值的差称为样本的()。
A.误差
B.方差
C.测差
D.残差
答案:D
11.K-means聚类适用的数据类型是()。
A.数值型数据
B.字符型数据
C.语音数据
D.所有数据
答案:A
12.以下哪些不是缺失值的影响()
A.数据建模将丢失大量有用信息
B.数据建模的不确定性更加显著
B.无监督学习
C.强化学习
D.半监督学习
答案:B
4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()

南开20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业答案

南开20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业答案
18.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
A.1,2,3,4
B.1,2,3,5
C.1,2,4,5
D.1,3,4,5
A.最小-最大规范化
B.零-均值规范化
C.小数定标规范化
D.中位数规范化
答案:D
3.实体识别属于以下哪个过程()
A.数据清洗
B.数据集成
C.数据规约
D.数据变换
答案:B
4.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A.1,线性
B.2,线性
C.1,非线性
D.2,非线性
答案:A
答案:D
8.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
答案:A
9.只有非零值才重要的二元属性被称作:( ),其中购物篮数据就属于这种属性。
A.计数属性
B.离散属性
C.非对称的二元属性#对称属性
答案:C
10.为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。
C.组合方法
D.比较方法
答案:AB
25.相关性的分类,按照相关的方向可以分为()。
A.正相关
B.负相关
C.左相关
D.右相关
答案:AB
26.数据科学具有哪些性质()
A.有效性
B.可用性
C.未预料
D.可理解
答案:ABCD
27.k近邻法的基本要素包括()。

《数据科学导论》20春期末考核答卷

《数据科学导论》20春期末考核答卷

《数据科学导论》20春期末考核-00001
试卷总分:100 得分:70
一、单选题(共15 道试题,共30 分)
1.下面不是分类的常用方法的有()
A.K近邻法
B.朴素贝叶斯
C.决策树
D.条件随机场
标准答案:D
2.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
标准答案:A
3.聚类是一种()。

A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习
标准答案:B
4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值
标准答案:C
5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。

A.产量每增加一台,单位成本增加100元
B.产量每增加一台,单位成本减少1.2元
C.产量每增加一台,单位成本平均减少1.2元
D.产量每增加一台,单位平均增加100元
标准答案:C
6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

A.减小,减小
B.减小,增大
C.增大,减小
D.增大,增大。

《计算机科学导论》20春期末考核[辅导学习资料带答案]

《计算机科学导论》20春期末考核[辅导学习资料带答案]

南开大学《计算机科学导论》20春期末考核注:请认真核对以下题目,确定是您需要的科目在下载!!!一、单选题 (共 15 道试题,共 30 分)1.E中的任一实体可以通过R与F中的至多一个实体联系则R叫做E到F的() /A./一对一联系/B./多对一联系/C./多对多联系/D./非法联系注:本题为课程考试复习资料,只做学习使用[参考答案]:B2.数据库中的元祖是指/A./关系中除含有属性名所在行以外的其他行/B./关系中包含属性名所在行在内的所有行/C./关系中的任意一列/D./关系中的所有列注:本题为课程考试复习资料,只做学习使用[参考答案]:A3.打印机属于哪一种计算机硬件设备/A./输入设备/B./输出设备/C./存储设备/D./系统接口注:本题为课程考试复习资料,只做学习使用[参考答案]:B4.哪种关系操作不要求参与运算的两个关系具有相同的属性集合/A./并/B./交/C./差/D./笛卡尔积注:本题为课程考试复习资料,只做学习使用[参考答案]:D5.法国人Blaise Pascal建造了()/A./齿轮驱动机械/B./四则运算器/C./织布机/D./计算机注:本题为课程考试复习资料,只做学习使用[参考答案]:A6.3度布尔函数共有多少个/A./3/B./8/C./27/D./256注:本题为课程考试复习资料,只做学习使用[参考答案]:D7.下列哪种语言是面向对象的编程语言/A./Pascal/B./BASIC/C./C/D./C++注:本题为课程考试复习资料,只做学习使用[参考答案]:D8.以下哪个选项用于实现SQL语言的查询功能/A./selece/B./insert/C./delete/D./update注:本题为课程考试复习资料,只做学习使用[参考答案]:A9.以下哪项不属于冯诺依曼体系结构的核心部件/A./运算器/B./存储器/C./输入输出设备/D./控制器注:本题为课程考试复习资料,只做学习使用[参考答案]:C10.RGB表示法中某种颜色的份额通常在以下哪对数字之间/A./0-255/B./0-256/C./128-255/D./128-1024注:本题为课程考试复习资料,只做学习使用[参考答案]:A11.下列哪种存储器的读取速度最快?/A./主存储器/B./CPU寄存器。

奥鹏南开《数据科学导论》20春期末考核.doc

奥鹏南开《数据科学导论》20春期末考核.doc

1.下面不是分类的常用方法的有()A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场【参考答案】: D2.BFR聚类用于在()欧氏空间中对数据进行聚类A.高维B.中维C.低维D.中高维【参考答案】: A3.聚类是一种()。

A.有监督学习B.无监督学习C.强化学习D.半监督学习【参考答案】: B4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A.异常值B.缺失值C.不一致的值D.重复值【参考答案】: C5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。

A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元 C.产量每增加一台,单位成本平均减少1.2元 D.产量每增加一台,单位平均增加100元【参考答案】: C6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

A.减小,减小B.减小,增大C.增大,减小D.增大,增大【参考答案】: B7.在回归分析中,自变量为(),因变量为()。

A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量【参考答案】: D8.手肘法的核心指标是()。

A.SESB.SSEC.RMSED.MSE【参考答案】: B9.特征选择的四个步骤中不包括()A.子集产生B.子集评估C.子集搜索D.子集验证【参考答案】: C10.一元线性回归中,真实值与预测值的差称为样本的()。

A.误差B.方差C.测差D.残差【参考答案】: D11.K-means聚类适用的数据类型是()。

A.数值型数据B.字符型数据C.语音数据D.所有数据【参考答案】: A12.以下哪些不是缺失值的影响()A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出【参考答案】: C13.下列两个变量之间的关系中,哪个是函数关系()。

南开20秋学期《数据科学导论》在线作业参考答案

南开20秋学期《数据科学导论》在线作业参考答案
A.抽样
B.剪枝
C.缓冲
D.并行
答案:B
6.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值
答案:C
7.单层感知机模型属于()模型。
A.二分类的线性分类模型
B.二分类的非线性分类模型
答案:ABCD
23.K-means聚类中K值选取的方法是()。
A.密度分类法
B.手肘法
C.大腿法
D.随机选取
答案:AB
24.聚类的主要方法有()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类
答案:ABC
25.对于多层感知机,()层拥有激活函数的功能神经元。
A.输入层
B.隐含层
C.输出层
答案:BC
答案:C
10.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化
答案:B
11.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。
A.越小
B.越大
C.无关
D.不确定
答案:B
12.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
A.高可用性
B.高可靠性
C.可扩展性

奥鹏南开21春学期(2103)《数据科学导论》在线作业.pdf

奥鹏南开21春学期(2103)《数据科学导论》在线作业.pdf

1.BFR聚类是用于处理数据集()的k-means变体。

A.大B.中C.小D.所有【参考答案】:A2.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5【参考答案】:C3.以下哪一项不是特征选择常见的方法()A.过滤式B.封装式C.嵌入式D.开放式【参考答案】:D4.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化【参考答案】:B5.对于k近邻法,下列说法错误的是()。

A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则【参考答案】:C6.手肘法的核心指标是()。

A.SESB.SSEC.RMSED.MSE【参考答案】:B7.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

A.减小,减小B.减小,增大C.增大,减小D.增大,增大【参考答案】:B8.变量之间的关系一般可以分为确定性关系与()。

A.非确定性关系B.线性关系C.函数关系D.相关关系【参考答案】:A9.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。

A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元 C.产量每增加一台,单位成本平均减少1.2元 D.产量每增加一台,单位平均增加100元【参考答案】:C10.层次聚类对给定的数据进行()的分解。

A.聚合B.层次C.分拆D.复制【参考答案】:B11.下列两个变量之间的关系中,哪个是函数关系()。

A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度【参考答案】:C12.通过变量标准化计算得到的回归方程称为()。

[南开大学]20秋学期[2009]《数据科学导论》在线作业学习资料

[南开大学]20秋学期[2009]《数据科学导论》在线作业学习资料

[南开大学]20秋学期《数据科学导论》在线作业一、单选题 (共 20 道试题,共 40 分)1.对于k近邻法,下列说法错误的是()。

A项.不具有显式的学习过程B项.适用于多分类任务C项.k值越大,分类效果越好D项.通常采用多数表决的分类决策规则解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:C2.以下哪个不是处理缺失值的方法()A项.删除记录B项.按照一定原则补充C项.不处理D项.随意填写解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:D3.在一元线性回归模型中,残差项服从()分布。

A项.泊松B项.正态C项.线性D项.非线性解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:B4.一元线性回归中,真实值与预测值的差称为样本的()。

A项.误差B项.方差C项.测差D项.残差解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:D5.Apriori算法的加速过程依赖于以下哪个策略( )A项.抽样B项.剪枝C项.缓冲D项.并行解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:B6.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A项.异常值B项.缺失值C项.不一致的值D项.重复值解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:C7.单层感知机模型属于()模型。

A项.二分类的线性分类模型B项.二分类的非线性分类模型C项.多分类的线性分类模型D项.多分类的非线性分类模型解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:A8.层次聚类适合规模较()的数据集A项.大B项.中C项.小D项.所有解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:C9.通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A项.简单函数变换B项.规范化C项.属性构造D项.连续属性离散化解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:C10.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()A项.简单函数变换B项.规范化C项.属性构造D项.连续属性离散化解析:本题难度中等,请复习南开课程知识,并完成相应题目【正确选择】:B11.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y 的作用()。

南开21春学期(1709-2103)《数据科学导论》在线作业答案1

南开21春学期(1709-2103)《数据科学导论》在线作业答案1

南开21春学习(1709-2103)《数据科学导论》在线作业提示:本材料为21春南开课程辅导资料,仅供学习参考!!!!一、单选题 (共 20 道试题,共 40 分)1.单层感知机是由()层神经元组成。

【A】一【B】二【C】三【D】四[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:B2.K-means聚类适用的数据类型是()。

【A】数值型数据【B】字符型数据【C】语音数据【D】所有数据[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:A3.在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。

【A】最优回归线【B】最优分布线【C】最优预测线【D】最佳分布线[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:A4.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()【A】简单函数变换【B】规范化【C】属性构造【D】连续属性离散化[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:B5.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

【A】减小,减小【B】减小,增大【C】增大,减小【D】增大,增大[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:B6.聚类的最简单最基本方法是()。

【A】划分聚类【B】层次聚类【C】密度聚类【D】距离聚类[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:A7.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

【A】4【B】5【C】6【D】7[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:C8.在回归分析中,自变量为(),因变量为()。

【A】离散型变量,离散型变量【B】连续型变量,离散型变量【C】离散型变量,连续型变量【D】连续型变量,连续型变量[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:D9.哪一项不属于规范化的方法()【A】最小-最大规范化【B】零-均值规范化【C】小数定标规范化【D】中位数规范化[提示]:本题为课程学习资料,请认真复习并回答!【正确答案】:D10.单层感知机模型属于()模型。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线
作业
单层感知机是由()层神经元组成。

A:一
B:二
C:三
D:四
答案:B
多层感知机是由()层神经元组成。

A:二
B:三
C:大于等于二层
D:大于等于三层
答案:D
在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

A:减小,减小
B:减小,增大
C:增大,减小
D:增大,增大
答案:B
通过变量标准化计算得到的回归方程称为()。

A:标准化回归方程
B:标准化偏回归方程
C:标准化自回归方程
D:标准化多回归方程
答案:A
设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

A:4
B:5
C:6
D:7
答案:C
维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。

其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )
A:K-means
B:Bayes Network
C:C4.5
D:Apriori
答案:D
置信度(confidence)是衡量兴趣度度量( )的指标。

A:简洁性
B:确定性
C:实用性
D:新颖性
答案:B
以下哪一项不属于数据变换()。

相关文档
最新文档