游戏系统项目计划报告
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
游戏推荐系统项目计划报告小组成员:邓鹏鹏郭文嘉蔡竹华刘强
项目动机:
目前游戏种类众多,游戏玩家面对此现状,往往难于选择。故亟需一种这样的系统:能根据玩家的一些简单输入,返回玩家可能喜欢的游戏列表。
项目目标及意义:
本系统搜集游戏网站上的信息,并通过信息检索,提取,分类等技术形成一个数据库,为用户的查询返回合适的结果。我们最后期望达到的效果是用户输入一系列游戏的关键词,系统会根据查询作相似度计算,返回用户可能喜欢的游戏列表。
这是一个很有趣并且有一定实际意义的系统,通过本系统的实现,我们希望可以深入的了解和体会搜索引擎的各方面知识,并且学以致用,在实践中锻炼自己。
基本技术路线;
系统主要由三大模块组成:
1.网页抓取模块Crawler
实现功能:把网站入口地址以string形式传给Crawler,返回网站的html文档。该模块采取多线程异步和异步IO实现。
2.文本提取模块IE
实现功能:将Crawler返回的html文档作为输入,经相应的词法和语法分析和分词处理,过滤掉注释,提取出需要的属性。
技术难点:因为不同的html页面有不同的组织结构,不能用统一的wrapper去处理,并且对于游戏属性等关键字的提取涉及到自然语言处理。
3.文档分类模块: 对游戏的厂商,类别,系列,发布时间等属性赋予一定的权重,根据用户所查询的游戏名称,系统列出用户可能最喜欢的几种游戏。
模块结构如下:
项目进度:
:需求分析,系统架构;
:系统开发编码,实现原形系统;
:系统测试并改进系统。
项目分工:
1.刘强负责网页抓取模块Crawler
2. 蔡竹华负责文本提取模块
3. 郭文嘉和邓鹏鹏负责文档分类模块,处理查询和评价系统模块.