网络零售平台商品分类项目介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CNN配置
训练过程
Baidu Nhomakorabea
THANKS
网络零售平台商品分类
目标
来自不同网上零售平台的商品 500 万个,其中有 50 万个带有 商品的标签信息,剩余的 450 万个无标签信息。建立一种分类模 型,利用 50 万个商品包含的标签信息,对剩余的 450 万个商品 进行合理的标签判定且该模型具有较高的准确性和高效性。
解决思路
商品的描述信息和商品类别信息均为本文信息,进行文本预处 理,选择合适的分类模型,对未带标签的商品进行分类。
问题分析
• 数据量大,带标签数据远远小于不带标签数据 • 商品描述信息存在无用信息且长度较短 • 商品类别存在多级类别
解决方案
• 过滤商品信息中无用数据将数据转化为词向量 • 按照商品类别的整体类别进行分类 • 使用合适的CNN模型
技术路线及技术实现方案
使用tensorflow框架,首先将商品信息进行预处理,去除无用 部分,将数据转化为词向量输入到CNN网络进行训练。
业务模式
本项目主要由前端界面和后端的数据预测组成,前端接受用 户输入的商品描述,显示后端传回的标签;项目的主要工作在后 端,包括分类模型的建立、训练和接受前端的商品描述,并根据 训练好的模型预测出商品描述数据是属于哪种标签
可行性分析
取部分数据应用于当前模型具有较高的准确率和较低的损失。
环境
• Python 3 • TensorFlow 1.3以上 • numpy • scikit-learn • scipy • Django
相关文档
最新文档