基于深度学习的社交媒体分析与推荐系统设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解已有研究方向和研究成果, 确定具体的实现方法, 制定实验方案; 查阅 MATLAB 的相关知识,为实验做好准备;最后按照实验方案完成实验,撰写论文。 主要研究手段: 掌握深度学习基础模型, 利用基础模型提取数据的抽象特征; 学习链接预测的机器学习算法以及相关的评价指标; 最终在 MATLAB 上实现整个 方案,并进行实验。 五、进度安排 1)2014 年 12 月 20 日——2015 年 1 月 18 日:查阅相关资料,明确课题方 向,了解课题的研究内容和研究方法,并撰写开题报告。 2)2015 年 1 月 19 日——2015 年 2 月 15 日:制定详细的实现计划以及社 交网络数据的采集与整理。 3)2015 年 2 月 16 日——2015 年 3 月 1 日:利用机器学习的分类算法实现 基于社交网络拓扑信息的链接预测。 4)2015 年 3 月 2 日——2015 年 4 月 15 日:利用深度学习提取拓扑信息的 抽象特征,实现基于拓扑信息抽象特征的链接预测。 5)2015 年 4 月 16 日——2015 年 5 月 15 日:利用深度学习提取拓扑信息 和用户标签信息的抽象特征,实现基于多类抽象特征的链接预测。 6)2015 年 5 月 16 日——2015 年 6 月 6 日:按要求完成毕业设计论文、准 备答辩。 六、研究条件和可行性分析 本课题的核心是将深度学习应用于社交网络的链接预测, 以达到更好的推荐 效果。首先,社交网络的链接预测在计算机领域已经早有一些研究,各类方法的 基本原理也较为成型,许多学者的研究论文都可提供有益的指导。其次,深度学 习虽然从 2006 年才引起人们的关注,但之后学术界和工业界对其的火热程度, 使得深度学习发展得非常快速,已经形成实际可行的框架。最后,最重要的是, 在实验室的优良氛围下,导师、师兄师姐们耐心热情的支持和引导下,我有信心 如期完成课题设计。 软件条件:实验主机为 Windows 8.1 操作系统,装有 MATLAB 2014a 等其他 相关软件。 七、参考文献 [1] 余凯, 贾磊, 陈雨强, 等, 深度学习的昨天, 今天和明天[J]. 计算机研究与发 展, 2013. 50(9): 第1799-1804页. [2] 刘建伟, 刘媛, 罗雄麟, 深度学习研究进展[J]. 计算机应用研究, 2014. 31(7).
本科生毕业设计说明书
学 专 年 姓
Βιβλιοθήκη Baidu
院 业 级 名
电子信息工程学院 通信工程 2011 级 胡博宏 金志刚
指导教师
2015 年 6 月 9 日
本科生毕业设计任务书
题目:基于深度学习的社交媒体分析与推荐系统设计
学生姓名
胡博宏
学院名称 电子信息工程学院 专 学 业 号 通信工程 3011204125 金志刚 教授
二、参考文献
[1] 中 国 互 联 网 络 信 息 中 心 ( CNNIC ) .2011. 第 29 次 中 国 互 联 网 发 展 状 况 统 计 报 告 . http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/201201/P020120709345264469680.pdf [2] 刘鸿宇, 赵妍妍, 秦兵, 等. 评价对象抽取及其倾向性分析 [J]. 中文信息学报, 2010 (1): 84-88. [3] Esuli A, Sebastiani F. Sentiwordnet: A publicly available lexical resource for opinion mining[C]//Proceedings of LREC. 2006, 6: 417-422. [4] Fayyad U, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery in databases[J]. AI magazine, 1996, 17(3): 37. [5] 杜阿宁. 互联网舆情信息挖掘方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2007. [6] 孔祥成, 石建, 苏春萍. 基于因特网信息的挖掘与评价研究[J]. 现代图书情报技术, 2002, 4: 019. [7] Ricci F, Rokach L, Shapira B. Introduction to recommender systems handbook[M]. Springer US, 2011.
基于深度学习的社交媒体分析与推荐系统设计 电子信息工程学院 胡博宏 专业名称 指导教师 通信工程 金志刚
深信度网络(Deep Belief Networks,DBN) 、卷积神经网络(Convolutional Neural Networks,CNN) 。 卷积神经网络适合日常自然图像的特征表示,自编码器的拓展 栈式自编码器(Stacked Auto Encoder,SAE)和深信度网络常用于普通数据的特 征表示。深度学习的基本训练方法为两步:自下而上的非监督学习和自上而下的 监督学习。其中,自下而上的非监督学习从底层开始,一层一层向上传递,得到 各层的参数(相当于获得一个较优的参数初始化,使参数能快速收敛) ;而自上 而下的监督学习则用带标签的数据训练,误差自上而下传播,微调各层参数,进 行全局优化,主要算法有反向传播(Back Propagation,BP)算法。 目前国内外将深度学习应用于链接预测的研究并不多。 Salakhutdinov 和 Ruslan Mnih 等人提出用限制玻尔兹曼机实现协同过滤,学习用户与电影评分的 联合分布,进而预测用户对电影的评分;Liu Feng 和 Liu Bingquan 等人提出用深 信度网络学习社交网络拓扑结构的特征表示, 进而用机器学习中的逻辑回归进行 链接预测;Zhaoquan Yuan 和 Jitao Sang 等人总结了社交网络分析存在的挑战,提 出了基于关联生成深信度网络的社交网络分析的统一框架, 并进行了链接预测和 图像检索的社交网络应用实验。 三、研究目标和内容 本课题的研究目标是通过将深度学习应用于社交网络的链接预测, 进而提高 链接预测的准确度等指标。 社交媒体推荐系统需要根据用户间的关联信息和用户 的基本信息、兴趣爱好等信息,为用户推荐未关注但是有较高关注概率的其他用 户,帮助用户发现其感兴趣的信息。因此,本课题运用深度学习突出的抽象特征 表示能力,提取社交网络中的深层特征,并对提取的特征进行分析,实现更优的 链接预测。 本课题的主要研究内容如下: 1)学习链接预测的相关算法、思想; 2)学习深度学习的基本思想、算法,掌握深度学习基础模型的使用; 3)利用机器学习中的分类算法实现基于社交网络拓扑信息特征值的链接预 测; 4)将深度学习的模型用于提取社交网络拓扑信息的抽象特征,基于该抽象 特征实现链接预测; 5)添加用户标签的特征,用深度学习提取拓扑信息和用户标签信息的抽象 特征,基于多种特征实现链接预测; 四、研究方法和手段 本课题的研究方法:通过阅读深度学习和链接预测两方面的论文和资料,了
指导教师 职 称
一、原始依据 1、工作基础与背景 随着 Web2.0 的快速发展,今天的互联网已经超越了门户时代、搜索时代, 进入了社交媒体时代。社交媒体已成为人们日常生活中获取信息、分享信息的重 要平台,与博客、BBS 论坛等传统网络应用形式相比,社交网络的复杂性和大量 的非传统、 多模态特征致使传统的理论与模型难以描述社交网络中的用户行为方 式。 微博(microblog)正在成为互联网中越来越重要的信息交流平台,以新浪微 博为例,根据新浪 2011 年第四季度财报, 其注册用户已经突破 3 亿大关,用户 每日发布信息量超过 1 亿条。 微博在大量热点事件中扮演了传统媒体所不具有的 信息快速发布的传播的角色,同时,微博平台可以在极短时间内汇聚相当数量的 用户对同一热门事件的讨论信息,如 2011 年的“7.23 温州动车追尾事故” 、 “郭 美美事件” 、 “药家鑫事件” 都是在微博平台首先发布并获得大量用户的迅速关注。 这些特点是其它传媒平台所难以企及的。 从微博信息抽取热门词语可以了解微博 信息动态,掌握舆论动向。 机器学习领域中一个叫“深度学习”的课题受到学术界广泛关注,到今天已 经成为互联网大数据和人工智能的一个热潮。2013 年 4 月, 《麻省理工学院技术 评论》 (MIT Technology Review)杂志将深度学习列为 2013 年十大突破性技术 之首。深度学习的概念源于人工神经网络的研究,通过组合低层特征形成更加抽 象的高层表示,以发现数据的分布式特征表示。深度学习的多层非线性映射的结 构,可以完成复杂的函数逼近,具有复杂特征的表示能力。 2、研究条件 目前,实验室已具备进行本课题的各项条件。硬件方面有运算存储功能强大 的服务器支持,软件方面 eclipse,java 已经安装调试完毕,其他基本软件也已经 完备。 3、应用环境 本课题构建出来的关系分析和自动推荐的方法可以广泛应用,为观点挖掘、 观点分类、观点检索等提供了依据。此外,本课题完成的高质量代码可以直接使 用。 4、工作目的 通过将深度学习应用于社交网络的链接预测, 进而提高链接预测的准确度等 指标。社交媒体推荐系统需要根据用户间的关联信息和用户的基本信息、兴趣爱 好等信息,为用户推荐未关注但是有较高关注概率的其他用户,帮助用户发现其 感兴趣的信息。
天津大学本科生毕业论文开题报告
课题名称 学院名称 学生姓名
一、课题来源及意义 随着 Web2.0 的快速发展,今天的互联网已经超越了门户时代、搜索时代, 进入了社交媒体时代。社交媒体已成为人们日常生活中获取信息、分享信息的重 要平台,与博客、BBS 论坛等传统网络应用形式相比,社交网络的复杂性和大量 的非传统、 多模态特征致使传统的理论与模型难以描述社交网络中的用户行为方 式。 2006 年以来, 机器学习领域中一个叫 “深度学习” 的课题受到学术界广泛关 注,到今天已经成为互联网大数据和人工智能的一个热潮。2013 年 4 月, 《麻省 理工学院技术评论》 (MIT Technology Review)杂志将深度学习列为 2013 年十大 突破性技术之首。深度学习的概念源于人工神经网络的研究,通过组合低层特征 形成更加抽象的高层表示,以发现数据的分布式特征表示。深度学习的多层非线 性映射的结构,可以完成复杂的函数逼近,具有复杂特征的表示能力。因此,基 于深度学习挖掘社交网络中的复杂信息、分析数据中隐含的特有属性,对于用户 的个性化推荐等问题,具有重要研究意义与应用价值。 二、国内外发展状况 国内外对于社交网络链接预测的研究已有一段历史, 方法大致可以分为三大 类,第一类是基于特征值的分类方法,第二类是基于贝叶斯网络的方法,第三类 是基于概率相关模型的方法。 基于特征值的分类方法着重于根据特征值对节点进 行分类,这是一种典型的二分类问题,可以使用逻辑回归(Logistic Regression, LR) 、支持向量机(Support Vector Machine,SVM)等流行方法,但是这种方法的 难点在于特征值的正确选取; 基于贝叶斯的监督模型的核心点是获得节点对同时 存在的后验概率,此模型的优点是得分本身可以作为分类的特征;基于概率相关 模型的方法不少是围绕节点相似性和节点属性的链接预测, 这些链接预测方法可 以获得较好的精确度,但是如何有效的结合节点的各个属性,从而达到最好的性 能是该算法的一个难点所在,而且这些方法不是普适的,不适用于所有的场合。 深度学习方面, 其基础模型主要有以下几种: 自编码器 (Auto Encoder, AE) 、
三、设计(研究)内容和要求
1、设计与研究内容 1) 学习链接预测的相关算法、思想; 2) 学习深度学习的基本思想、算法,掌握深度学习基础模型的使用; 3) 利用机器学习中的分类算法实现基于社交网络拓扑信息特征值的链接预 测; 4) 将深度学习的模型用于提取社交网络拓扑信息的抽象特征,基于该抽象 特征实现链接预测; 5) 添加用户标签的特征,用深度学习提取拓扑信息和用户标签信息的抽象 特征,基于多种特征实现链接预测; 2、主要指标和技术参数 1) 设计和实现基于深度学习的链接预测 2) 设计和实现自动分类方法 指导教师(签字) 年 审题小组组长(签字) 年 月 日 月 日