推荐算法实施方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推荐算法实施方案
一、目的
为了使平台功能更加多样化,多方面满足平台用户的需求,配合目前流行的机器学习方法,增加推荐功能,使用python实现推荐算法,通过用户的详细信息和使用习惯,智能化推送平台相关内容,实现用户个性化定制,带动平台发展,最大程度化推广平台。
二、运用场景
场景1:基于超市平台,根据企业的经营范围、简介、地域等相关信息,通过计算平台上所有机构与该企业相关信息的相似性,将匹配度高的服务机构推荐给该企业。
场景2:基于超市平台,省平台根据需求列表,通过计算需求的内容和供给资源内容的相似度,将相似度高的资源展示在该需求旁,同理技术资源也可如此展示。
场景3:基于智能制造平台,为了推荐符合企业需求的政策服务,可以提供中文分词技术,提取出政策中的关键词,并将其和企业所需的政策内容关键词进行匹配,推荐其相似度高的政策。
……
三、流程规划
1. 数据收集:前期准备工作,收集大量相关数据,大规模数据能增加自主学习的准确率
公司简介(主要)
用户输入
地域
其他
数据构成
服务机构(主要) 平台功能
政策(主要)
供需
新闻、通知公告
其他
2. 数据清洗:
1)无效数据、空数据处理,格式标准统一;
2)挑选有分析价值的数据,以公司简介为例,描述字符要大于25个,后期会根据实验需求,对各类特征数据标准进行调整;
3)jieba 分词:将收集好的中文数据进行分词,此算法帮助去除一些无效字符,提取段落关键字,初步为相关对象打上关键字标签。
3. 数据分析:
根据处理好的信息,进行分析,比如地域分析,经营状况分析,还有分词后的关键字分析,目的主要是为了模型的特征提取。特征的可靠性越高,模型
评分更高,表示模型更优化。
4.模型导入:
此处即导入算法模块,选择合适的算法,结合用到最终模型。此处会用到的算法:
1)词袋模型:用一个向量来代表一个文档
2)向量空间变换:TF-IDF模型和LSI模型
3)推荐算法:前期主要是基于内容的推荐,主要原因是前期的用户行为数据不够;后期可结合用户行为和物品的相关数据运用协同过滤算法,做更贴切,精准需求的推荐。
5.评估分析:
根据分好的训练数据集和测试数据集,将模型导入,从:用户满意度、预测准确度、推荐物品的多样化等方面观察并评估结果。
6.应用实践:
确定好模型,将模型与项目结合。
四、实施环境
1.编写语言:python(模型),java(嵌入项目)
2.工具:Anaconda
3.环境:Window10,或Ubuntu系统。
五、人员支撑
在具体项目中,需依据项目详情与开发相关人员进行沟通对接,以获得相关支撑。