宁波大学智能数据处理2019--2020年考博初试真题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
满足 F (ti ) di , for i 1,..., N ,显然是不切实际的,在这种情况下,请给
出一个合理的解决方案,并设计具体的学习算法。
(13 分)
3. Boltzmann 机是一个全相联的随机型神经网络,如果将其简化处理,限定为只
含一个可见层和一个隐单元层,取消层内连接,仅保留层间的加权连接,这种
(1)试画出 ER 图,并在图上注明属性、联系的类型。 (2)将 ER 图转换成关系模型,并注明主键和外键。
9.( 8%) 数 据 库 的 并 发 操 作 会 带 来 哪 些 问 题 ? 如 何 解 决 ?
10.(6%,每个小题 2 分)设有关系模式 R(职工编号,日期,日营业额,部门 名,部门经理),该模式统计商店里每个职工的日营业额,以及职工所在的部 门和经理信息。如果规定:每个职工每天只有一个营业额;每个职工只在一个 部门工作;每个部门只有一个经理。试回答下列问题: (1)根据上述规定,写出模式 R 的基本 FD 和关键码; (2)说明 R 不是 2NF 的理由; (3)分解 R 成 3NF 模式集。
层后,要求输出尽量与输入接近,其处理数据的效果非常类似于 PCA 分析, 请为 AutoEncoder 设计一个合理的学习算法(建议采用梯度下降法)。(12 分)
2. 假设一个含 M 单元的 RBF 网络的输出为
M
F (x) wj (|| x xj ||) , j0
对于 N 个不同的学习样本 ti , i 1,..., N ,如果 N M ,要实现精确的插值,即
第2页共2页
宁波大学 2019 年博士研究生招生考试初试试题(B 卷)
(答案必须写在考点提供的答题纸上)
科目代码: 3809 总分值: 100 科目名称:
智能数据处理
1. 自编码器 AutoEncoder 是一种无监督学习模型,一般具有如图所示的典型腰鼓 型结构,它的输出与输入具有相同的维数,输入数据经过相对较低维度的中间
(4)求年龄大于女同学平均年龄的男学生姓名和年龄。 (5)在 SC 中删除尚无成绩的选课元组。 (6)把 MATHS 课不及格的成绩全改为 60 分。
8.(12%,每个小题 6 分)设某商业集团数据库中有三个实体集。一是“商店” 实体集,属性有商店编号、商店名、地址等;二是“商品”实体集,属性有商 品号、商 品名、规 格、单 价等;三是“职工”实体集,属性有职工编号、姓名、 性别、业绩等。商店与商品间存在“销售”联系,每个商店可销售多种商品, 每种商品也可放在多个商店销售,每个商店销售一种商品,有月销售量;商店 与职工间存在着“聘用”联系,每个商店有许多职工,每个职工只能在一个商 店工作,商店聘用职工有聘期和月薪。
简化模型称为 Restricted Boltzmann Machines (RBMs)。对于其可见单元 v
和隐单元 h,如给定层间网络参数 W,联合概率计算公式如下:
p(v, h; W) exp( E(v, h; W)) Z
, 其中 Z exp( E(v, h; W))
vh
,
E(v, h; W) 为能量函数。
请为该自编码器设计一个自监督梯度下降学习算法,给出 具是 SVM?其基本思想是什么?什么是 Support Vector?如果不仅要 求 SVM 输出分类结果,还要求它输出对应的信心值,试给出一种方案。
6.(6%,每个小题 3 分)设关系数据库有三个关系: 学生表 S(S#,SNAME,AGE,SEX) 其属性分别表示学号、姓名、年龄、性别 选课表 SC(S#,C#,GRADE) 其属性分别表示学号、课号、成绩 课程表 C(C#,CNAME,TNAME) 其属性分别表示课号、课程名称、任课教师姓名 试用关系代数表达式表示下列查询语句: (1)检索 LIU 老师所授课程的课程号和课程名。 (2)检索姓名为张三的学生所学课程的课程名与任课教师名。
处理和分割,试设计一个采用 PCA 或者 SVD 的图像分析方法,能够高效率处理
宁波大学 2020 年博士研究生招生考试初试试题(B 卷)
(答案必须写在考点提供的答题纸上)
科目代码: 3809 总分值: 100 科目名称:
智能数据处理
1.(8%)近年流行的半监督学习(Semi-Supervised Learning)是什么?为什么会出现这一 类学习方法?其适用的场合有哪些?
2.(8%)什 么 是 前 馈 网 络 ? 什 么 是 反 馈网 络 ? 二 者 有 哪 些主 要 区 别 ? 各 自 最具 代 表性的神经网络模型及学习算法是什么?
请为其推导一个快速学习算法,如果将其用于深度学习,请设计一个合理的方案。 (13 分)
第1页共4页
宁波大学 2019 年博士研究生招生考试初试试题(B 卷)
(答案必须写在考点提供的答题纸上)
科目代码: 3809 总分值: 100 科目名称:
智能数据处理
4. 以下图所示的手写数字图像为例,如果已经采集了数百万的手写样本并已完成预
第1页共2页
宁波大学 2020 年博士研究生招生考试初试试题(B 卷)
(答案必须写在考点提供的答题纸上)
科目代码: 3809 总分值: 100 科目名称:
智能数据处理
7.(18%,每个小题 3 分)对上题中的三个关系,试用 SQL 语句表达下列操作: (1)检索年龄大于 23 岁的男学生的学号和姓名。 (2)检索至少选修 LIU 老师所授课程中一门课的女学生姓名。 (3)统计每个学生选 修课程的门数(超过 5 门的学生才统计)。要求输出学生学 号和选修门数,查询结果按门数降序排列,若门数相同,按学号升序排列。
3. (12%)Hopfield 网络是全相连的反馈型网络,可以用于实现“吸引子”联想记 忆,如果要使一个 Hopfield 网络 同时记住“ C”、“ A”、“I”三个字母( 3x4 点阵),试为其设计一个合理的结构,并给出学习算法和具体的网络权值。
4. (12%)假设一个自编码器结构为:n个输入, n/2个隐单元, n个输出, 如果其激活函数φ采用 如下简单函数: