云计算课程设计要求文档
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程设计要求:
1、必须出勤,每次课程有老师考勤。缺勤一次扣5分。迟到与早退一次扣5分。
2、每个人一个题目,如果题目相同,实现方案不能相同。每人上交相应的课程设计说明书。按照给你们的课程设计模板来撰写与排版。上交时间为第20周的周四。
3、课程设计成绩评定
4、选题要求
Hadoop环境下基于决策树算法的网络入侵检测系统
●入侵检测(应用领域)
●决策树算法(解决问题的应用算法,hadoop中调用mahout,spark调
MLlib)
●数据集
/ml/
/cn/public-data-sets/
https:///competitions
/datasets/index.html
/databases/kddcup99/kddcup99.html
●数据分布式存储(云系统搭建,数据加载Hbase,hive)●算法参数选择(参考论文中的设置)
●数据调用(编程)
●算法处理数据(云web要有任务过程)
●算法结果保持(云端保存)
●系统优化(包括数据处理,数据库优化,算法效率优化)参考书:
《spark高级数据分析》TP274/LZ
《spark机器学习》TP181/PTLS
《Hadoop实战》TP274/LM
《Hadoop大数据处理》TP274/LJ
《R与Hadoop大数据分析实战》TP312/PJPT
《Hadoop应用开发技术详解》TP274/LG
参考论文:
/kns/default.htm