课程实验与课程设计内容与要求

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 系统安装运行的情况
2. 实验数据说明(下载的什么网页数据,多少个HTML或text文件)
3. 程序运行后在Hadoop Web作业状态查看界面上的作业运行状态屏幕拷贝 4. 实验输出结果开头部分的屏幕拷贝 5. 实验体会
6. 实验报告文件命名规则:MPLab1-学号-姓名.doc
7. 实验报告提交至:FTP: 114.212.209.146, 用户名:hadoop 口令:hadoop 8. 实验完成时间:10天, 4月11日前完成并提交报告
6. 实验报告文件命名规则:MPLab3-学号-姓名.doc
7. 实验报告提交至:FTP: 114.212.209.146, 用户名:hadoop 口令:hadoop 8. 实验完成时间:4月29日前完成并提交报告
实验内容与要求
1. 在Eclipse环境下编写实现Wiki网页数据集的PageRank算法,实验数
实验内容与要求
1. 在Eclipse环境下编写WordCount程序,统计所有除Stop-Word(如a, an, of,
in, on, the, this, that,…)外所有出现次数k次以上的单词计数,最后的结果 按照词频从高到低排序输出 2. 在集群上运行程序,对莎士比亚文集文档数据进行处理 3. 可自行建立一个Stop-Word列表文件,其中包含部分停词即可,不需要列出 全部停词;参数k作为输入参数动态指定(如k=10) 4. 实验结果提交:要求书写一个实验报告,其中包括:
1. 实验设计说明,包括主要设计思路、算法设计、程序和各个类的设计说明
2. 程序运行和实验结果说明和分析
3. 性能、扩展性等方面存在的不足和可能的改进之处 4. 5. 6. 7. 8.
源程序 ,执行程序,停词列表文件 运行结果文件 实验报告文件命名规则:MPLab2-学号-姓名.doc 实验报告提交至:FTP: 114.212.209.146, 用户名:hadoop 口令:hadoop 实验完成时间:4月22日前完成并提交报告
实验内容与要求
1. 编写所介绍的带词频属性的文档倒排索引程序,在单机上用 小数据集调试通过 2. 在集群上运行程序,对莎士比亚文集文档数据进行倒排索引 处理,结果输出到指定文件 3. 实验结果提交:要求书写一个实验报告,其中包括:
1. 实验设计说明,包括主要设计思路、算法设计、程序和各个类的设计说明 2. 程序运行和实验结果说明和分析 3. 性能、扩展性等方面存在的不足和可能的改进之处 4. 源程序 ,执行程序 5. 运行结果文件
据从FTP上下载 2. 在集群上运行程序,对Wiki网页数据集进行处理 3. 实验结果提交:要求书写一个实验报告,其中包括:
1. 实验设计说明,包括主要设计思路、算法设计、程序和各个类的设计说明 2. 程序运行和实验结果说明和分析,包括前30个最高Rank的网页信息输出列表 3. 性能、扩展性等方面存在的不足和可能的改进之处 4. 源程序 ,执行程序 5. 运行结果文件 6. 实验报告文件命名规则:MPLab4-学号-姓名.doc 7. 实验报告提交至:FTP:114.212.209.146 用户名:hadoop 口令:hadoop 8. 实验完成时间:5月18日前完成并提交报告
课题报告文件命名规则:课程设计报告-组号-组长姓名.doc 课题报告提交至:FTP:114.212.209.146, 用户名:hadoop 口令:hadoop 提交截止时间:8月20日前完成并提交报告
课程实验与课程设计 内容与要求
鸣谢:本课程得到Google公司(北京) 中国大学合作部精品课程计划资助
实验内容与要求
1. 每人在自己本地电脑上正确安装和运行伪分布式Hadoop系统 安装操作手册和本课程课件请从ftp://cs.nju.edu.cn/incoming 下的MapReduce课程目录下载。 2. 安装完成后,自己寻找一组英文网页数据,在本机上运行Hadoop 系统自带的WordCount可执行程序文件,并产生输出结果 3. 实验结果提交:要求书写一个实验报告,其中包括:
开题报告文件命名规则:开题报告-组号-组长姓名.doc 课题报告提交至:FTP:114.212.209.146 审阅意见返回:6月22日
用户名:hadoopHale Waihona Puke Baidu口令:hadoop
课程设计(研究生)
最终课题完成与提交
课程设计结果提交(以下内容打包提交)
课程设计报告,内容包括 1. 小组信息(人员,学号,联系信息) 2. 课题小组分工:需要明确说明各成员在整个课题中分工负责完成的内容 3. 课程设计题目 4. 摘要 5. 研究问题背景 6. 主要技术难点 7. 主要解决方法和算法设计思想 8. 详细设计说明,包括详细算法设计、程序框架、功能模块、主要类的设计说明 9. 程序运行和实验结果说明和分析 10. 总结:特点总结,功能、性能、扩展性等方面存在的不足和可能的改进之处 11. 参考文献 源程序 执行程序 运行结果文件
课程设计(研究生)
开题报告
目的:为了评估课程设计选题的内容和难度是否达到一定要求,需要提交
开题报告 主要内容 小组信息(人员,学号,联系信息) 课题分工:各个成员初步的课题分工计划 研究题目 研究问题背景 主要技术难点 主要解决方法和算法设计思路 提交时间:6月15日
相关文档
最新文档