推荐算法实施方案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

推荐算法实施方案

一、目的

为了使平台功能更加多样化,多方面满足平台用户的需求,配合目前流行的机器学习方法,增加推荐功能,使用python实现推荐算法,通过用户的详细信息和使用习惯,智能化推送平台相关内容,实现用户个性化定制,带动平台发展,最大程度化推广平台。

二、运用场景

场景1:基于超市平台,根据企业的经营范围、简介、地域等相关信息,通过计算平台上所有机构与该企业相关信息的相似性,将匹配度高的服务机构推荐给该企业。

场景2:基于超市平台,省平台根据需求列表,通过计算需求的内容和供给资源内容的相似度,将相似度高的资源展示在该需求旁,同理技术资源也可如此展示。

场景3:基于智能制造平台,为了推荐符合企业需求的政策服务,可以提供中文分词技术,提取出政策中的关键词,并将其和企业所需的政策内容关键词进行匹配,推荐其相似度高的政策。

……

三、流程规划

1. 数据收集:前期准备工作,收集大量相关数据,大规模数据能增加自主学习的准确率

公司简介(主要)

用户输入

地域

其他

数据构成

服务机构(主要) 平台功能

政策(主要)

供需

新闻、通知公告

其他

2. 数据清洗:

1)无效数据、空数据处理,格式标准统一;

2)挑选有分析价值的数据,以公司简介为例,描述字符要大于25个,后期会根据实验需求,对各类特征数据标准进行调整;

3)jieba 分词:将收集好的中文数据进行分词,此算法帮助去除一些无效字符,提取段落关键字,初步为相关对象打上关键字标签。

3. 数据分析:

根据处理好的信息,进行分析,比如地域分析,经营状况分析,还有分词后的关键字分析,目的主要是为了模型的特征提取。特征的可靠性越高,模型

评分更高,表示模型更优化。

4.模型导入:

此处即导入算法模块,选择合适的算法,结合用到最终模型。此处会用到的算法:

1)词袋模型:用一个向量来代表一个文档

2)向量空间变换:TF-IDF模型和LSI模型

3)推荐算法:前期主要是基于内容的推荐,主要原因是前期的用户行为数据不够;后期可结合用户行为和物品的相关数据运用协同过滤算法,做更贴切,精准需求的推荐。

5.评估分析:

根据分好的训练数据集和测试数据集,将模型导入,从:用户满意度、预测准确度、推荐物品的多样化等方面观察并评估结果。

6.应用实践:

确定好模型,将模型与项目结合。

四、实施环境

1.编写语言:python(模型),java(嵌入项目)

2.工具:Anaconda

3.环境:Window10,或Ubuntu系统。

五、人员支撑

在具体项目中,需依据项目详情与开发相关人员进行沟通对接,以获得相关支撑。

相关文档
最新文档