2020年上海市高等学校信息技术水平考试试卷四级人工智能自然语言处理与识别方向模拟卷

合集下载

2020年上海市高等学校信息技术水平考试试卷三级信息系统与数据库技术A场

2020年上海市高等学校信息技术水平考试试卷三级信息系统与数据库技术A场

2020年上海市高等学校信息技术水平考试试卷三级信息系统与数据库技术(A 场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 15 道小题,每小题 1 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.考生到相关网站查看各高校历年的录取分数来辅助决策报考学校和专业,这个过程中考生获得________服务。

A.数字B.字符C.咨询D.信息2. 在如下图所示的电子路况指示牌中用不同的颜色来展示某路段的交通流量,这个指示牌是系统根据_______进行数据分析更新数据后展示的道路颜色。

A.实时采集的交通数据B.长期历史经验数据C.交通警察的预测D.现场指挥领导的决定3.在相关应用系统中,________不能唯一区分用户。

A.身份证号B.准考证号C.头像D.微信号4.滴滴出行系统改变了传统打车方式,提供了一种 O2O 服务,这里的 O2O 是指_______。

A.线上线下融合B.对象到对象C.起点到终点D.司机和乘客零距离5.某生直接向已创建的数据表中输入数据,中途出现"将截断字符串或二进制数据"或"Data too long"的报错信息,这可能是因为_______。

A.出现重复主键B.出现重复外键C.数据超出设定的长度D.数据为空6.某校学生的住宿标准是:本科生4人一间,硕士生2人一间,博士生1人一间,宿舍与学生之间形成的住宿联系是_______。

A.一对一联系B.一对四联系C.一对多联系D.多对多联系7.同一个关系模型的任意两条记录_______。

A.不能完全相同B.可以完全相同C.必须完全相同D.可以相同也可以不同8.在信息系统开发过程中,用户代表_______工作。

A.需要参与系统设计B.只需参与需求分析C.需要参与编程D.不需要参与测试9.同学们在讨论关系数据模型的构成要素,_______描述是正确的。

A.实体完整性、参照完整性、域完整性B.关系结构、关系操作、关系完整性约束C.数据增加、数据修改、数据查询、数据删除D.外模式、模式、内模式10.为控制两个表中数据的完整性和一致性,可以设置"参照完整性"约束,这要求两个表的相关联字段_______。

2020年公需课考试——人工智能技术及其发展趋势(93分)

2020年公需课考试——人工智能技术及其发展趋势(93分)

单选题:1.生物特征识别技术不包括()。

(3.0分)A.体感交互B.指纹识别C.人脸识别D.虹膜识别我的答案:A√答对2.()是人工智能的核心,是使计算机具有智能的主要方法,其应用遍及人工智能的各个领域。

(3.0分)A.深度学习B.机器学习C.人机交互D.智能芯片我的答案:B√答对3.下列选项中,不属于生物特征识别技术的是()。

(3.0分)A.步态识别B.声纹识别C.文本识别D.虹膜识别我的答案:C√答对4.()是自然语言处理的重要应用,也可以说是最基础的应用。

(3.0分)A.文本识别B.机器翻译C.文本分类D.问答系统我的答案:C√答对5.()是指直接通过肢体动作与周边数字设备和环境进行交互。

(3.0分)A.体感交互B.指纹识别C.人脸识别D.虹膜识别我的答案:A√答对6.立体视觉是()领域的一个重要课题,它的目的在于重构场景的三维几何信息。

(3.0分)A.人机交互B.虚拟现实C.自然语言处理D.计算机视觉我的答案:D√答对7.(),中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。

(3.0分)A.2018年3月15日B.2018年10月31日C.2018年12月31日D.2019年1月31日我的答案:B√答对8.()是通过建立人工神经网络,用层次化机制来表示客观世界,并解释所获取的知识,例如图像、声音和文本。

(3.0分)A.深度学习B.机器学习C.人机交互D.智能芯片我的答案:A√答对9.下列对人工智能芯片的表述,不正确的是()。

(3.0分)A.一种专门用于处理人工智能应用中大量计算任务的芯片B.能够更好地适应人工智能中大量矩阵运算C.目前处于成熟高速发展阶段D.相对于传统的CPU处理器,智能芯片具有很好的并行计算性能我的答案:C√答对10.关于专用人工智能与通用人工智能,下列表述不当的是()。

(3.0分)A.人工智能的近期进展主要集中在专用智能领域B.专用人工智能形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能C.通用人工智能可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题D.真正意义上完备的人工智能系统应该是一个专用的智能系统我的答案:D√答多选题:1.目前,深度学习主要包括()。

2020年上海市高等学校信息技术水平考试试卷 四级 基础软件(A 场)

2020年上海市高等学校信息技术水平考试试卷 四级 基础软件(A 场)

2020年上海市高等学校信息技术水平考试试卷四级基础软件(A 场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 25 道小题,每小题 2 分,共 50 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.在一个能提供多个用户同时直接输入、调试和运行自己程序的计算机系统中应配置________。

A.分时操作系统B.批处理操作系统C.实时操作系统D.嵌入式操作系统2.若P、V操作的信号量S初值为2,当前值为-2,则表示有________个等待进程。

A.2B.1C.0D.33. 假设下述四个作业同时到达,当使用最高优先数优先调度算法时,作业的平均周转时间为________小时。

A.10.25B.10.5C.4.75D.4.54.进程存在的唯一标志是________。

A.PCBB.FCBC.JCBD.SJT5.在虚拟存储系统中,假设某程序的页面访问序列为:1、2、3、4、5、2、3、l、2、3、4、5、1、2、3、4 ,且开始执行时主存中没有页面,则在分配给该程序的物理块数是3,且采用FIFO方式时缺页次数是________。

A.13B.11C.12D.106.进程和程序的一个本质区别是________。

A.前者为动态的,后者为静态的B.前者为静态的,后者为动态的C.前者在一个文件中,后者在多个文件中D.前者分时使用 CPU,后者独占 CPU7.一棵二叉树的前序遍历序列为1234567,它的中序遍历序列可能是________。

A.1234567B.3124567C.4135627D.21536478.当问题的输入规模为n时,算法增长率最快的是________。

A.n!(n!表示n的阶乘)B.nC.2^n(2^n表示2的n次方)D.n^5(n^5表示n的5次方)9.假设某无向图G有23条边,度为4的顶点有5个,度为3的顶点有4个,其余都是度为2的顶点,则图G有________个顶点。

2020年上海市高等学校信息技术水平考试试卷 二三级 Python程序设计及应用(B 场)免费下载

2020年上海市高等学校信息技术水平考试试卷 二三级 Python程序设计及应用(B 场)免费下载

2020年上海市高等学校信息技术水平考试试卷二三级 Python程序设计及应用(B场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 10 道小题,每小题 1.5 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.下列语句中,______在Python中是非法的。

A.x=y=z=1B.x=(y=z+1)C.x,y=y,xD.x+=y2.欲从s='Hello world'字符串中切片出子串'Hlwl',正确的切片表达式为_______。

A.s[::3]B.s[:3:2]C.s[3:11:3]D.s[3::3]3.若Tup=(2,(2,1),(2,(2,1)),(2,(2,1),(2,(2,1)))),则下列叙述正确的是_______。

A.Tup[3][2]的值为(2,1)B.元组Tup的长度为5C.Tup[3]的值是(2,(2,1),(2,(2,1)))D.Tup[2]的值是(2,1)4.若列表score = [60,70,60,60,70,90],则执行操作score.remove(score[-2])后score 的值是 ______。

A.[60, 60, 60, 70, 90]B.[60, 70, 60, 60, 70]C.[70, 60, 60, 70, 90]D.[60, 70, 60, 60, 90]5.以下说法正确的是__________。

A.values()方法将字典中的值以可迭代的dict对象返回B.del命令不能删除整个字典C.在字典中,某个键相关联的值可以通过赋值语句来修改,如果指定的键不存在,则会添加新的键值对D.update()方法将另一个字典中的所有键值对一次性地添加到当前字典中,如果两个字典中存在有相同的键,则会出错6.下面程序代码中______的分支是不需要条件判断的。

score = int(input())if score >= 60:if score>= 90:print('优秀')elif score >= 75:print('良好')else:print('及格')elif score < 60:print('不及格')A.if score>= 90B.elif score >= 75C.elseD.elif score < 607.下列说法正确的是________。

2020年上海市高等学校信息技术水平考试试卷二三级Python程序设计及应用A场

2020年上海市高等学校信息技术水平考试试卷二三级Python程序设计及应用A场

2020年上海市高等学校信息技术水平考试试卷二三级 Python程序设计及应用(A 场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 10 道小题,每小题 1.5 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.已知 x, y = 1, 2,那么执行x, y = y, x 之后,x的值为__________。

A.1B.(1, 2)C.不符合语法,报错D.22.已知 x = 'abcdefg',若要得到'defgabc'结果,应使用表达式___________________。

A.x[3:] + x[:3]B.x[:3] + x[:3]C.x[3:] + x[3:]D.x[:3] + x[3:]3.执行结果为[1, 2, 3, 1, 2, 3, 1, 2, 3] 的表达式是______________________。

A.[1,2,3]+ [1,2,3]B.['1','2','3']+ ['1','2','3']+ ['1','2','3']C.[1, 2, 3]**3D.[1, 2, 3]*34.表达式 (1, 2, 3)+(4, 5) 的值为__________________。

A.(5,7,3)B.(1, 2, 3, 4, 5)C.(1,6,8)D.(15,)5.下列关于字典对象方法的描述,不正确的是________。

A.方法get()可以获取指定“键”对应的“值”,并且可以在指定“键”不存在的时候返回指定值,如果不指定则返回NoneB.方法items()返回字典中的“键-值对”列表C.方法keys()返回字典的“键”列表D.“字典[键]”的表达式(例如dict['name'])的结果与方法get()的结果完全相同6.Python的分支语句可使用关键字_______。

上海市高中学业水平考试《信息科技》试卷及答案

上海市高中学业水平考试《信息科技》试卷及答案

第一套 第I 部分统一模块:信息科技基础说明:本模块共30题,总分75分。

题型有单项选择题和填空题,每题 2.5分。

1. 一位科学家对一群老年人说: “在不久的未来,为了避免孤独,老人可能面临这样的选择,是选择一只宠物狗,还是选择一个数码伴侣?”他又解释说:“所谓数码伴侣,就是具有人工智能的电脑或机器人。

” 在场的老人对这个话题非常感兴趣,议论纷纷。

下列说法中,属于最不了解信息科技发展情况的是()A.我不相信数码伴侣能够帮我找到去公园或医院的路B.现在的智能手机就已经具备了数码伴侣的某些功能C.我期待数码伴侣能够跟我聊天,我一定会选择它D.我猜想,数码伴侣离不开网络支持,否则就会变“傻”【参考答案】A盖越来越广,表示 技术的普及和发展。

在下面的两幅图片中我们可以看到,同是观看歌星的表演,今 天的情景与二十年前大不一样。

很多观众带着智能手机和 iPad 等移动设备,一边观看,一边上网,在 上 发表评论,上传现场拍摄的照片和视频,与网友共享艺术盛宴。

请将下面合适选项的标号填入上面的空中,每空填一项。

A .路由器;B.存储;C.有线网;D.软键盘; E .无线网;F.微博;G .集线器;H .通信【参考答案】E ; H ; F3 .小华的父亲保存了很多老照片和旧的文字手稿,有些手稿还是用毛笔写的,他想与自己的亲朋好友在网 上共享这些珍贵的历史资料,为此小华提出了一些建议。

以下建议可行的有( )。

①用绘图仪将这些老照片和旧文稿转换成图片文件,再传到网上 ②用数码相机拍摄这些老照片和旧文稿,将照片文件传到网上 ③用数码摄像机拍摄这些老照片和旧文稿,将视频文件传到网上 ④通过扫描仪将这些老照片和旧文稿变成电子图片文件,再传到网上A.②③④B.①②③C.①③④D.①②④【参考答案】A4 .为了提醒行人安全过马路,一些路口的交通信号灯在显示绿灯的同时,还会发出“嘟嘟”的声音。

这里 用光或声音表示信息主要体现了信息的()。

2020年上海市高等学校信息技术水平考试试卷四级大数据与云计算A场

2020年上海市高等学校信息技术水平考试试卷四级大数据与云计算A场

2020年上海市高等学校信息技术水平考试试卷四级大数据与云计算(A 场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 18 道小题,每小题 1 分,共 18 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.Sqoop底层运行的任务是____。

A.map task和reduce taskB.map taskC.reduce taskD.sink task2.设森林F对应的二叉树为B,它有m个结点,B的根为p,p的右子树结点个数为n,森林F 中第一棵子树的结点个数是____。

A.m-nB.m-n-1C.n+1D.条件不足,无法确定3.Docker容器中解决资源(CPU、内存)可配额的技术是____。

A.cgroupsB.aufsC.kernel namespaceD.device mapper4.已知表emp存在字段name1,以下语句能够正常运行的是____。

A.alter table emp rename to emp1B.alter table emp rename emp to emp1C.alter table emp change column name1 to name2D.alter table emp change name name125.如果用含有隐变量的概率模型来建模问题,那么该问题的最有可能的解法是____。

A.EM算法B.Logistic回归C.协同过滤D.高斯过滤6.对于分布式缓存数据库Redis,说法错误的是____。

A.Redis支持多线程处理B.Redis可以持久化数据C.Redis支持的数据类型包括String、List、SetD.Redis集群之间是异步复制的7.虚拟化的主要特征不包括____。

A.实现简单B.高扩展性C.高实用性D.高安全性8.与云计算相比,____不是云计算的特征。

A.适合紧耦合科学计算B.资源高度共享C.支持虚拟机D.适合商业领域应用9.下列说法中有误的是____。

高中信息技术《人工智能》练习题(附答案解析)

高中信息技术《人工智能》练习题(附答案解析)

高中信息技术《人工智能》练习题(附答案解析)学校:___________姓名:___________班级:_____________一、选择题1.小明同学晚自习回到家,喊了一句“嘿Siri,打开大灯”。

客厅的灯就立刻亮了起来。

这里用到了()A.手写识别技术B.语音识别技术C.机器学习技术D.指纹识别技术2.使用微信二维扫描扫码时,获取了信息。

这主要应用了人工智能技术的()A.模式识别B.智能代理C.机器博弈D.机器翻译3.现在很多智能手机提供了语音输入功能,从而大大提高了汉字输入的速度。

语音输入法主要运用的技术是()A.机器翻译B.多媒体C.模式识别D.专家系统4.怎么判定机器是否具有了智能,最早提出的测试方法是()A.机器学习B.吴氏方法C.图灵测试D.人机对弈5.以下实际生活场景中,①疫情防控期间,进入公共场合通过“人脸识别登录验证”申领核酸码。

②智能手机打电话。

③Windows 10系统中集成了个人智能助理“Cortana”,它可以与用户对话并理解语义,与用户交互。

④驾驶搭载自动驾驶技术的汽车。

⑤利用打印机打印文稿。

其中涉及到人工智能技术的是() A.①③④B.①②④C.③⑤D.①②③④⑤6.下列应用中采用了人工智能技术的是()A.手机采用人脸识别技术解锁B.网络课堂直播时老师与学生进行实时语音交流C.采用5G+8K实时直播2019年乌镇互联网大会过程D.用Word软件“拒绝修订”功能,自动恢复修订内容7.晓丽爸爸为自家大门安装了智能锁,家人可以通过指纹、语音、人脸识别等方式解锁进入屋内。

这主要应用的人工智能技术是()A.模式识别B.计算机博弈C.机器翻译D.智能代理8.下列选项中,不属于人工智能技术范畴的是()A.手机的人脸识别解锁技术B.使用在线翻译技术,将场景中的日文翻译成中文C.与好友在微信中视频聊天D.AlphaGo击败世界围棋冠军李世石9.下列关于图灵测试说法错误的是()A.图灵测试是测试机器是否具有智能唯一的方法B.图灵测试会在测试人在与被测试者(一个人和一台机器)隔开的情况下,通过此装置(如键盘)向被测试者随意提问,测试者根据问答判断被测试者是人还是机器C.图灵测试由“现代计算机理论之父”图灵提出D.通过问答的方式能通过图灵测试,不代表这个机器能具备像人一样的心智10.下列不属于...人工智能技术应用范畴的是A.使用OCR软件识别文字B.汉字语音输入系统C.使用文字翻译软件翻译外文D.与同学下棋11.AI的英文缩写是()A.Artificial Intelligence B.Automatic IntelligenceC.Automatic Information D.Artificial Information二、填空题12.机器学习的一般过程为:用采集到的数据进行训练,以建立一个模型,再对模型进行( ),然后投入应用。

2020年信息技术学考试题分类整理及解析——选择题(1-40)

2020年信息技术学考试题分类整理及解析——选择题(1-40)

2020年信息技术学考试题分类整理及解析——选择题(1-40)2020年信息技术学考试题分类整理及解析——选择题(1-40)1、现代战争中使⽤的⾃动作战指挥系统(C4ISR),能够利⽤分散在不同空间位置的计算机,协作完成同⼀数据处理任务。

C4ISR主要体现哪⼀⽹络应⽤功能?( D )A、虚拟现实B、信息检索C、数据通信D、分布处理解析:分布处理:通过⽹络将⼀件较⼤的⼯作分配给⽹络上多台计算机去共同完成。

虚拟现实:虚拟现实技术是⼀种可以创建和体验虚拟世界的计算机仿真系统,它利⽤计算机⽣成⼀种模拟环境,是⼀种多源信息融合的、交互式的三维动态视景和实体⾏为的系统仿真使⽤户沉浸到该环境中。

2、办公室的计算机⽆法访问互联⽹,经检查发现,是TCP/IP属性设置有错误,如下图所⽰。

改正的⽅法是( C )A.IP地址改为192.168.10.11,其它不变B.⼦⽹掩码改为192.168.10.1,其它不变C.IP地址与⼦⽹掩码交换D.默认⽹关改为255.255.255.0,其它不变解析:根据图中显⽰,IP地址和⼦⽹掩码的位置反了。

数据格式是正确的。

所以,本题答案为:IP地址与⼦⽹掩码交换3、下列关于密码设置表述错误的是( A )A.为了⽅便记忆,密码可以使⽤姓名汉语拼⾳的缩写B.定期更换密码,以防密码泄露C.⼀般不要设置和账号相同的密码D.密码设置越长,⽤穷举法破解的概率越低解析:密码的设置不能过于简单,最好不要使⽤姓名的拼⾳,⽣⽇,⾝份证号,⼿机号等有规律的设置。

也不要设置和账号相同的密码。

尽量定期更换密码。

4、根据⽹址“/doc/56de2966e718964bcf84b9d528ea81c758f52e36.html ”可以推断该⽹站的类型是( B )A、科研机构B、民间团体或⾮营利性组织C、教育机构D、政府部门解析:.AC 科研机构.COM⼯商、⾦融等企业.EDU 教育机构.GOV 政府部门.NET 互联⽹络、接⼊⽹络的信息中⼼(NIC)和运⾏中⼼(NOC).ORG各种⾮营利性的组织5、某班进⾏电脑制作⽐赛,评⽐成绩表如下图表⽰,使⽤函数计算总分和平均分,D5单元格的数值发⽣变化时,下列单元格中数值不变的是( C )A、D6B、F6C、C5D、F5解析:F5=SUM(B5:E5)D6=AVERGE(D3:D5)F6=SUM(F3:F5)或=SUM(B6:E6)C5和D5是并列的两种平等的不相⼲的数据6、分析下图,表述正确的是( C )A、必须更换浏览器B、地址栏输⼊了/doc/56de2966e718964bcf84b9d528ea81c758f52e36.htmlC、需要诊断⽹络问题D、⽹络是畅通的解析:图中“⽆法显⽰该⽹页”,遇到这种问题,⾸先要考虑⽹络连接是否出现了问题。

上海市高中学业水平考试信息科技试卷及答案(有详解。)

上海市高中学业水平考试信息科技试卷及答案(有详解。)

上海市高中学业水平考试信息科技试卷及答案(有详解。

)1.以下说法错误的是:B.电子邮件中的文字是信息载体。

改写:电子邮件中的文字不是信息载体,而是信息的内容。

信息载体指的是传递信息的媒介,如电子邮件、手机短信等。

2.有效的方法是:②发送电子邮件③在聊天工具上留言。

改写:___可以通过发送电子邮件或在聊天工具上留言的方式与好友保持联系。

3.正确的说法是:①机器人能“感受”光、声、温度和外力,②机器人不“抱怨”重复工作,③机器人可以完成许多人难以胜任的工作。

改写:机器人具有感知环境的能力,能够感受光、声、温度和外力;机器人不会像人类一样抱怨重复工作,可以完成许多人难以胜任的工作。

4.不属于信息数字化过程的选项是:A.在Photoshop上修饰一幅图片。

改写:在Photoshop上修饰一幅图片不是信息数字化的过程,而是对现有信息进行处理和编辑的过程。

5.将十进制数31转换成二进制数为:.改写:十进制数31的二进制数为.6.肯定能成立的表达式是:②□□□B=7,④□□□B<=7.改写:一个三位的二进制数最大为111B,因此表达式②和④肯定能成立。

7.它们之间的大小关系满足:B.“G”>“a”>“7”。

改写:英文字母“G”的ASCII码大于“a”和“7”的ASCII码。

8.汉字编码占用空间较大的根本原因是:A.汉字的笔划较多。

改写:汉字的笔划较多,因此需要更多的二进制位来表示一个汉字。

而英文字符只需要表示26个字母和一些常用符号,因此只需要一个字节的空间就可以存储。

9.正确的表述是:图像数字化是将一幅图像分割成许多纵横分割的像素点,并将每个像素点的颜色信息转换成数字信号进行存储。

改写:图像数字化是将一幅图像分割成许多纵横分割的像素点,并将每个像素点的颜色信息转换成数字信号进行存储。

图像分割越精细,像素越多,需要的存储空间也越大。

16.可信度最高的信息是___网站发布的最新高校招生计划。

网络论坛中发布的___的捐款方式可能存在虚假信息,不明来历电子邮件中的保健品广告和陌生人发送的中奖手机短信都可能是诈骗信息。

上海市高等学校信息技术水平考试

上海市高等学校信息技术水平考试

上海市高等学校信息技术水平考试考试大纲(2020年试行版)目录1.一级《大学信息技术+数据分析与可视化基础》(2020年试行版) 12.一级《大学信息技术+数字媒体基础》(2020年试行版) 63.一级《大学信息技术+人工智能基础》(2020年试行版)124.二三级《C程序设计及应用》(2020年试行版)175.二三级《C#程序设计及应用》(2020年试行版)226.二三级《Python程序设计及应用》(2020年试行版)277.三级《数据科学技术及应用》(2020年试行版)318.二三级《物联网技术及应用》(2020年试行版)349.二三级《区块链技术及应用》(2020年试行版)3710.二三级《人工智能技术及应用》(2020年试行版)4111.四级《人工智能》(2020年试行版)4512.四级《大数据与云计算》(2020年试行版) 5213.四级《基础软件》(2020年试行版)55上海市高等学校信息技术水平考试(一级)《大学信息技术+数据分析与可视化基础》考试大纲(2020年试行版)一、考试性质上海市高等学校信息技术水平考试是上海市教育委员会组织的全市高校统一的教学考试,是检测和评价高校信息技术基础教学水平和教学质量的重要依据之一。

该项考试旨在规范和加强上海高校的信息技术基础教学工作,提高学生的信息技术应用能力。

考试对象主要是上海市高等学校学生,每年举行一次,通常安排在当年的十月下旬、十一月上旬的星期六或星期日。

凡考试成绩达到合格者或优秀者,由上海市教育委员会颁发相应的证书。

本考试由上海市教育委员会统一领导,聘请有关专家组成考试委员会,委托上海市教育考试院组织实施。

二、考试目标考试的目标是测试考生掌握信息技术基础知识、数据分析方法与数据可视化技术的程度和应用信息技术解决问题的能力,以使学生能跟上信息技术的飞速发展,适应新时代和信息社会的需求;通过考试在教学上提高教学质量,使教学能适应上海市教育委员会提出的大学信息技术课程教学要求,即显著提升大学生信息素养,强化大学生计算思维,培养大学生应用信息技术解决学科问题的能力,并为后继课程和专业课程的信息技术融合应用奠定基础。

2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用A场

2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用A场

2020年上海市高等学校信息技术水平考试试卷三级数据科学技术及应用(A 场)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 15 道小题,每小题 1 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.下面关于数据科学与大数据之间关系描述错误的是________。

A.大数据属于数据科学的范畴B.大数据分析遵循数据科学的基本工作流程C.大数据分析采用的方法完全不同于数据科学技术D.大数据技术是指数据量达到某种规模时引入的分布式存储、计算和传输方法2.下面关于DataFrame存储表结构数据的说法,错误的是________。

A.通常使用行存储一条数据,列存储该数据的各个特征项B.DataFrame对象只能使用行、列索引对进行数据切片,不能使用位置序号C.从DataFrame对象中取出一列,得到Series对象D.Series对象可以使用Numpy的函数进行统计分析3.统计量“方差”描述了________。

A.样本的平均值B.样本的离散程度C.样本中不同的值占样本容量的比例D.样本中出现次数最多的值4.CSV文件是常用的数据文件格式,可以使用_______查看。

A.文本编辑器、ExcelB.photoshopC.powerpointD.画图工具5.students对象数据如下:age height weight1 19 170 682 20 165 653 18 175 65下面语句筛选出_______。

>>>[students['height']<170, 'weight']A.身高小于170同学的体重B.身高小于170同学的信息C.身高大于170同学的体重D.身高小于170同学的身高6.为描述高校教师学历占比情况,适合的图形是_______。

A.散点图B.曲面图C.直方图D.饼图7.目前人工智能技术,特别是机器学习,主要模拟了人的_________过程。

2020年上海市高等学校信息技术水平考试试卷四级人工智能自然语言处理与识别方向模拟卷

2020年上海市高等学校信息技术水平考试试卷四级人工智能自然语言处理与识别方向模拟卷

2020年上海市高等学校信息技术水平考试试卷四级人工智能(自然语言处理与识别方向模拟卷)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 15 道小题,每小题 1 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.在回归模型中,下列____在权衡欠拟合和过拟合中影响最大。

A.多项式阶数B.更新权重 w 时,使用的是矩阵求逆还是梯度下降C.使用常数项D.增加数据量2.A和B分别代表两个事件,如果P(A, B)降低,同时P(A)上升,____是正确的。

A.P(B|A)降低B.P(A|B)降低C.P(B)降低D.P(B)上升3.癌症检查数据样本有10000个,其中10个数据祥本是有癌症,其它是无癌症。

假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1 。

则该分类模型的F1-score为____。

A.62.07%B.99.89%C.47.36%D.76.27%4.在测试一假设h时,发现在一包含n=1000个随机抽取样例的样本s上,它出现r=300个错误, 计算errors(h)的标准差为____。

A.0.0145B.0.145C.1.45D.14.55.下表为某训练集数据,其中X1,X2为特征,Y为分类标记,则使用该训练集学习到的朴素贝叶斯分类器对x = (1,M) 的分类结果为____。

A.0B.1C.不确定D.0和1都有可能6.关于主成分分析算法,以下步骤____是错误的。

A.对所有样本进行去中心化B.计算样本的协方差矩阵C.对协方差矩阵做特征值分解D.取最大的低维空间维数特征值所对应的特征向量输出投影矩阵7.四个点坐标为(1,1),(1,0),(-1,-1),(-1,0),用 SVM 分类的决策边界是____。

A.x = 0B.y = xC.y = -xD.y = 08.在大数据集上训练决策树,为减少训练时间,可使用以下________方法。

2020年上海市高等学校信息技术水平考试试卷 二级 Python程序设计(A 场)

2020年上海市高等学校信息技术水平考试试卷 二级 Python程序设计(A 场)

2020年上海市高等学校信息技术水平考试试卷二级 Python程序设计(A 场)(本试卷考试时间 120 分钟)一、单选题 ( 本大题 10 道小题,每小题 1.5 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.已知 x, y = 1, 2,那么执行x, y = y, x 之后,x的值为__________。

A.1B.(1, 2)C.不符合语法,报错D.22.已知 x = 'abcdefg',若要得到'defgabc'结果,应使用表达式___________________。

A.x[3:] + x[:3]B.x[:3] + x[:3]C.x[3:] + x[3:]D.x[:3] + x[3:]3.执行结果为[1, 2, 3, 1, 2, 3, 1, 2, 3] 的表达式是______________________。

A.[1,2,3]+ [1,2,3]B.['1','2','3']+ ['1','2','3']+ ['1','2','3']C.[1, 2, 3]**3D.[1, 2, 3]*34.表达式 (1, 2, 3)+(4, 5) 的值为__________________。

A.(5,7,3)B.(1, 2, 3, 4, 5)C.(1,6,8)D.(15,)5.下列关于字典对象方法的描述,不正确的是________。

A.方法get()可以获取指定“键”对应的“值”,并且可以在指定“键”不存在的时候返回指定值,如果不指定则返回NoneB.方法items()返回字典中的“键-值对”列表C.方法keys()返回字典的“键”列表D.“字典[键]”的表达式(例如dict['name'])的结果与方法get()的结果完全相同6.Python的分支语句可使用关键字_______。

2020人工智能试题及答案

2020人工智能试题及答案

2020人工智能试题及答案(共9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--1.()是普遍推广机器学习的第一人。

(分)A.约翰·冯·诺依曼B.约翰·麦卡锡C.唐纳德·赫布D.亚瑟·塞缪尔2.当我们需要寻求健康咨询服务时,应该拨打的热线电话是()。

(分)3.()由于产品全球化市场竞争加剧和信息技术革命的推动, 围绕提高制造业水平的新概念和新技术不断涌现, 在此背景下, 将新兴的人工智能技术应用于制造领域使“智能制造”的概念孕育而生, 并促进了智能制造技术和智能制造系统的研究。

(分)世纪70年代世纪80年代世纪90年代世纪初4.我国于()年发布了《国务院关于印发新一代人工智能发展规划的通知》。

(分)5.在农业领域的()环节,智能的农业机器人可以利用图像识别技术获取农作物的生长状况,判断哪些杂草需要清除,判断哪里需要灌溉、施肥、打药,并立即执行。

(分)A.产前B.产中C.产后D.全程6.()是人工智能发展的硬道理,没有它的人工智能是没有用的。

(分)A.数据B.应用C.逻辑D.算法7.新生儿的正常脉搏为每分钟()次。

(分)~80~90~100~120年8月,日本电视台报道称,东京大学医学研究所通过运用IBM的人工智能平台Watson仅用10分钟就诊断出了资深医师难以判别出来的()。

(分)A.甲状腺癌B.胰腺癌C.淋巴癌D.白血病9.智能制造的本质是通过新一代信息技术和先进制造技术的深度融合,实现跨企业价值网络的横向集成,来贯穿企业设备层、控制层、管理层的纵向集成,以及产品全生命周期的端到端集成,而()是实现全方位集成的关键途径。

(分)A.标准化B.数据化C.流程化D.网络化10.目前,人工智能发展存在的问题不包括()。

(分)A.泡沫化B.重复化C.与应用结合不够紧密D.缺乏热情11.《献血法》规定,两次献血采集间隔期要不少于()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020年上海市高等学校信息技术水平考试试卷四级人工智能(自然语言处理与识别方向模拟卷)(本试卷考试时间 150 分钟)一、单选题 ( 本大题 15 道小题,每小题 1 分,共 15 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择一个正确答案。

1.在回归模型中,下列____在权衡欠拟合和过拟合中影响最大。

A.多项式阶数B.更新权重 w 时,使用的是矩阵求逆还是梯度下降C.使用常数项D.增加数据量2.A和B分别代表两个事件,如果P(A, B)降低,同时P(A)上升,____是正确的。

A.P(B|A)降低B.P(A|B)降低C.P(B)降低D.P(B)上升3.癌症检查数据样本有10000个,其中10个数据祥本是有癌症,其它是无癌症。

假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1 。

则该分类模型的F1-score为____。

A.62.07%B.99.89%C.47.36%D.76.27%4.在测试一假设h时,发现在一包含n=1000个随机抽取样例的样本s上,它出现r=300个错误, 计算errors(h)的标准差为____。

A.0.0145B.0.145C.1.45D.14.55.下表为某训练集数据,其中X1,X2为特征,Y为分类标记,则使用该训练集学习到的朴素贝叶斯分类器对x = (1,M) 的分类结果为____。

A.0B.1C.不确定D.0和1都有可能6.关于主成分分析算法,以下步骤____是错误的。

A.对所有样本进行去中心化B.计算样本的协方差矩阵C.对协方差矩阵做特征值分解D.取最大的低维空间维数特征值所对应的特征向量输出投影矩阵7.四个点坐标为(1,1),(1,0),(-1,-1),(-1,0),用 SVM 分类的决策边界是____。

A.x = 0B.y = xC.y = -xD.y = 08.在大数据集上训练决策树,为减少训练时间,可使用以下________方法。

A.减少树的深度B.增加树的深度C.增加学习率D.减少树的数量9.关于偏差和方差,以下说法不正确的是____。

A.如果能保证或验证一批训练集来自同一个分布,算法在这批训练集上的学习结果会是一致的B.偏差-方差分解试图对学习算法的期望泛化错误率进行拆解C.泛化误差可以分解为偏差、方差和噪声之和D.方差与偏差通常是有冲突的,其中方差刻画数据扰动造成的影响,偏差刻画的是学习算法本身的拟合能力10.下列哪个神经网络结构会发生权重共享________。

A.卷积神经网络和循环神经网络B.卷积神经网络C.循环神经网络D.全连接神经网络11.Shanghai和Beijing的编辑距离是____。

A.7B.8C.11D.1512.在自然语言处理中,实体关系学习是指____。

A.发现文本中的有效实体B.实体识别与链接C.研究如何从文本中抽取事件信息并以结构化的形式呈现出来D.检测文本中的实体是否具有某种预定义的关系13.在文本挖掘中,可以使用____命令完成将文本转换为tokens,然后将其转换为整数或浮点向量的操作。

A.CountVectorizerB.TF-IDFC.词袋模型(Bag of Words)D.NERs14.主题模型是自然语言处理中的常见的一类统计模型。

对于常用的两类主题模型BTM、LDA,下列____不是BTM相较于LDA模型的优点。

A.计算速度快B.适用于短文本C.占用空间少D.解决稀疏性问题15.以下关于神经网络自然语言模型的评述,错误的是_____。

A.BERT模型可用作特征提取B.神经网络语言模型可解决维数灾难的问题C.GPT和ELMo使用整个模型的全部参数来表示词向量D.BERT是一个双向注意力模型二、多选题 ( 本大题 6 道小题,每小题 2 分,共 12 分),从下面题目给出的A、B、C、D四个可供选择的答案中选择所有正确答案。

1.关于朴素贝叶斯分类方法描述正确的有____。

A.需要计算先验概率B.对缺失数据敏感C.对小规模的数据表现很好D.算法成立的前提是假设各属性之间互相独立2.正则化能处理过拟合的原因是________。

A.惩罚了模型的复杂度,避免模型过度学习训练集,提高泛化能力B.正则项降低了每一次系数w更新的步伐,使参数更小,模型更简单C.正则化使得训练集和测试集数据分布更为接近,因而避免了在训练集上过拟合D.贝叶斯学派的观点,认为加入了先验分布(l1拉普拉斯分布,l2高斯分布),减少参数的选择空间3.通过监督学习进行二分类模型训练过程中,可能会遇到正负样本分布不均的情况(比如正样本有50万但是负样本有100万),下列____方法可以进行恰当处理。

A.将所有的数据加入训练集,充分利用所有数据B.从100万负样本中随机抽取50万C.正样本权重设置为2,负样本权重设置为1D.复制两份正样本参与到训练中去4.可以实现关键词提取任务的常见算法包括( )。

A.TF/IDFB.SVMC.TextRankD.最短编辑距离5.对语义关系进行分类可以帮助我们更好理解语义关系的含义及特性,语义关系包括()。

A.因果关系B.上下位关系C.部分整体D.实体来源6.评价一个推荐系统输出的Top-N推荐列表的好坏,常见的指标有:()。

A.准确率PrecisionB.召回率RecallC.F1值D.转化率三、是非题 ( 本大题 15 道小题,每小题 1 分,共 15 分),从下面题目给出的两个可供选择的答案中选择一个正确答案。

1.如果决策树对训练集拟合不足,通过缩放输入特征可以有效改善。

A.正确B.错误2.Boosting和Bagging都是组合多个分类器投票的方法,二者都是根据单个分类器的正确率决定其权重。

A.正确B.错误3.如果两个变量的 Pearson 相关性系数为零,则它们不相关。

A.正确B.错误4.当不知道数据所带标签时,可以使用分类技术促使带同类标签的数据与带其他标签的数据相分离。

A.正确B.错误5.回归问题和分类问题都有可能发生过拟合。

A.正确B.错误6.向量x=[1,2,3,4,-9,0]的L1范数是1。

A.正确B.错误7.神经网络中激活函数引入了非线性。

A.正确B.错误8.参数化的方法可以使得类条件概率估计简化,但是估计结果的准确性严重依赖于所假设的概率分布形式是否符合真实数据分布。

A.正确B.正确9.假设我们有三个簇中心μ1=[1;2],μ2=[-3 ;0];,μ3=[4 ;2]。

此外,我们还有一个训练示例x(i)=[-2;1]。

则在一个集群分配步骤之后,c(i)将会是2。

A.正确B.错误10.评价规则优劣的标准应该优先考虑规则准确率,同时考虑覆盖样例数和属性次序。

A.正确B.错误11.逆文档频率(IDF)的作用是减少常用词的权重,增加文档中不常用词的权重。

A.正确B.错误12.将词表示成向量被称为神经词嵌入(Neural Word Embeddings)。

A.正确B.错误13.信息抽取是指对源语言的长文本进行压缩,提取出关键句子的短文本的技术。

A.正确B.错误14.在给到任何神经网络之前,Tokens都会被转换成数字。

A.正确B.错误15.Word2Vec包含CBOW和Skip-gram这两个模型,其中CBOW模型是输入当前词的词向量,输出周围词的词向量,而Skip-gram模型正好相反。

A.正确B.错误四、操作题素材、样张、KS目录均在zip文件中,可双击此图标41C.zip打开以下第(一)题(案例应用题)题目请在文件“C:\KS\人工智能-自然语言处理与理解-答题纸.docx”中作答。

(一)案例应用题(共20分)虽然近年来智能对话系统取得了长足的进展,但是针对专业性较强的问答系统,如何准确的判别用户的输入是否为给定问题的语义等价问法仍然是智能问答系统的关键。

举例而言,“请问什么是公益诉讼?”和“什么是公益诉讼?”可以认为是语义上等价的问题,而“请问什么是公益诉讼?”和“检察机关发起公益诉讼是什么意思?”则为不等价的问题。

针对问题等价性判别而言,除去系统的准确性外,系统的鲁棒性也是很重要。

问题:现有某人工智能公司开发的自动问答系统用于某市法院的微信服务号,自动回答市民关于法律方面的常见问题。

假设收集的提问数据集格式如下,数据以问题组的形式提供,每组问句又分为等价部分和不等价部分,等价问句之间互相组合可以生成正样本,等价问句和不等价问句之间互相组合可以生成负样本。

请设计一个方案,用于预测一组文本是否为等价问法。

提示:这道题可能会有多种思路,建议使用基于BERT预训练的文本相似度预测思路。

相关文档
最新文档