一种新的新浪微博好友推荐算法
机器学习在推荐系统中的应用
机器学习在推荐系统中的应用随着互联网的迅猛发展和数据量的爆炸性增长,推荐系统成为了电商、社交媒体、音乐、电影和新闻等领域中的重要组成部分。
推荐系统可以为用户提供个性化的推荐内容,帮助用户快速找到自己感兴趣的产品或信息。
而机器学习技术的应用,则是推荐系统实现个性化推荐的基础和核心。
本文将探讨机器学习在推荐系统中的应用,并介绍一些常用的机器学习算法和推荐系统案例。
一、机器学习算法在推荐系统中的应用1. 协同过滤算法协同过滤算法是推荐系统中最经典和常用的算法之一。
其基本思想是通过分析用户的历史行为和兴趣偏好,从而找到与用户具有相似兴趣的其他用户,将这些用户喜欢的物品推荐给目标用户。
这种算法不需要依靠事先定义的特征,能够自动发现用户之间的相似性。
协同过滤算法包括基于用户的协同过滤和基于物品的协同过滤两种方式。
2. 基于内容的推荐算法基于内容的推荐算法是一种将物品的特征与用户的兴趣进行匹配的算法。
它通过分析物品的原始内容或者标签来刻画物品的特征,然后将用户的兴趣和物品的特征进行匹配,得出一个推荐结果。
这种算法可以减轻数据稀疏性的问题,但是依赖于特征的提取和匹配,需要充分了解用户和物品的特性。
3. 隐语义模型算法隐语义模型算法是通过隐藏的特征来描述用户和物品的关系,将用户和物品映射到一个隐含的向量空间中,然后利用这些向量进行推荐。
这种算法可以解决用户相似度计算和物品特征提取的问题,提高了推荐效果。
常见的隐语义模型算法包括矩阵分解和潜在狄利克雷分配(Latent Dirichlet Allocation,简称LDA)等。
二、机器学习在推荐系统中的案例1. 亚马逊的个性化推荐亚马逊是全球最大的电子商务公司之一,其个性化推荐系统被广泛应用于商品推荐。
亚马逊的推荐系统基于协同过滤算法,通过分析用户的购买历史和浏览行为,找到与用户相似的其他用户,从而向用户推荐感兴趣的商品。
亚马逊的个性化推荐系统可以大大提高用户购物体验,增加销售额。
基于隐性评分的微博关注推荐方法研究
基于隐性评分的微博关注推荐方法研究刘维;雷兵【摘要】当前微博已成为网民互相传播和获取信息的一个主要平台.随着微博用户数据的急剧增长,海量的数据使用户无法获取其感兴趣的信息,如何向用户进行更精准、高效的个性化推荐,是微博取得效果的关键.协同过滤推荐算法是目前被广泛采用的算法,它的基础是用户对项目的评分数据,而微博用户对其关注对象进行直接评分,从微博用户行为如“@提醒”、“转发”、“评论”等推进,可以更好地发挥微博精准推荐的功能.【期刊名称】《江苏商论》【年(卷),期】2018(000)001【总页数】4页(P36-39)【关键词】微博用户属性;微博关注推荐;隐性评分;协同过滤算法【作者】刘维;雷兵【作者单位】河南牧业经济学院物流与电商学院,河南郑州450044;河南工业大学管理学院,河南郑州450001【正文语种】中文【中图分类】F713.36一、引言本文采用基于协同过滤的推荐技术,从用户的历史行为数据中发现规律,根据用户不同的偏好采取不同的系统如新闻推荐系统GroupLens、电影推荐系统Movielens、音乐推荐系统Ringo等进行精准推荐。
为了解决协同过滤中针对数据冷启动问题,Xia在协同过滤算法中引入支持向量,Buhwan在基于内存的推荐方法中融入用户信任的等级,Sarwar等通过奇异值分解技术来减少向量空间的维数。
针对用户评分数据的稀疏性,Jin-Min等将用户的偏好加入相似性评价矩阵。
另外,一些学者采用多种算法组合来改进协同过滤算法。
为了提升推荐技术的精准性,Wang Xin等将基于用户与基于项目的协同过滤算法组合进行改进,提出一种最大熵的Web推荐方法。
余力等通过基于内容的推荐与协同过滤算法相结合,来提高推荐质量,梁昌勇等提出结合领域专家法的群体用户推荐算法来改进协同过滤算法。
部分学者通过预测评分、隐性评分与降维等方法来改进协同过滤中的数据稀疏性问题。
邓爱林等通过基于项目评分预测的协同过滤,张峰、常会友通过神经网络,翁小兰、庄永龙通过基于预测评分的相似性度量方法,刘旭东等通过基于群体兴趣偏好度的协同过滤等预测评分来降低数据的稀疏性。
一种改进的微博用户影响力评价算法
i d e a o f t r a d i t i o n a l P a g e Ra n k a l g o r i t h m i s u s e d t o i mp r o v e a n e w i n l f u e n c e r a n k i n g a l g o r i t h m ( Us e r
i S e f f e c t i v e . Ke y wo r d s: mi c r o b o l g;us e r i n f l ue n c e; P a g e Ra n k a l g o r i t hm ;u s e r i n lu f e n c e r a n k a l g o r i t h m
0 引言
微博, 即微型 博客 ( m i c r o b l o g ) 的简 称 , 是 一个 基 于用户 关系 的信息 分享 、 传播 以及 获取平 台 , 是一种 传 播 及互 动性极 快 的新兴 网络 应用 。用 户在微 博 中可 以 随时 编 写简 短 文本 ( 1 4 0字左 右 ) , 并 根 据 自己 的意
I n l f u e n c e Ra n k) .C o mp a r e d t h r o u g h e x p e r i me n t s wi t h t r a d i t i o n a l a l g o r i t h m,t h e p r o p o s e d a l g o r i t h m
愿 公开 发布 。它允 许任 何人 阅读 或者 只能 由用户 选择 的群组 阅读 。随着 技 术 的发 展 , 微博 消 息 可 以被 很 多方式 传 送 , 包 括 网页 、 实 时 消 息软 件 、 电子 邮件 或短 信 , 某 些 微 博 也 可 以发 布 多 媒 体 , 如 图 片或 影 音 剪
社交网络数据分析及其应用研究
社交网络数据分析及其应用研究社交网络已经成为人们日常生活中不可或缺的一部分,它已经深刻地改变了人们的交流方式和社交方式。
随着社交网络用户数量和数据量的增加,如何分析和利用这些数据已经成为了重要的研究方向。
本文将简要介绍社交网络数据分析及其应用研究。
一、社交网络数据的分类社交网络数据主要包括用户个人信息、用户关系信息和用户行为信息。
用户个人信息包括用户基本信息、用户兴趣和爱好等;用户关系信息包括用户之间的关注、好友、粉丝和兴趣社区等关系;用户行为信息包括用户发布的内容、留言、转发、评论等行为。
二、社交网络数据分析技术社交网络数据分析技术包括数据收集、数据清洗、数据挖掘和数据可视化等环节。
其中数据收集是指从社交网络中获取数据的过程;数据清洗是指对获取到的数据进行筛选、清理和去重等操作;数据挖掘是指利用机器学习、数据挖掘等技术对社交网络数据进行分析和挖掘;数据可视化是指将分析结果以图表、地图等形式呈现给用户。
三、社交网络数据分析应用研究1.社交网络推荐系统社交网络数据分析在推荐系统中应用广泛。
通过分析用户的行为数据和兴趣偏好,推荐系统可以为用户提供个性化的推荐服务。
例如,新浪微博的“微博推荐”功能,即根据用户的兴趣和行为数据,为用户推荐感兴趣的微博内容。
2.社交网络营销社交网络中很多用户都喜欢分享、评论和点赞有趣、有用的内容。
因此,社交网络成为了企业宣传和营销的一个重要平台。
例如,淘宝商城的“微淘”功能,即利用微博的社交功能,让商家在社交网络上开展活动,增加产品曝光和销售量。
3.社交网络社会关系分析社交网络中的用户关系网络很复杂,通过对用户关系网络的分析可以研究用户之间关系的强度、稳定性和影响力等。
例如,豆瓣网的“口碑榜”功能,即根据用户的影响力和评价对电影、图书等产品进行排行,并推荐给感兴趣的用户。
四、社交网络数据分析面临的问题1.数据隐私社交网络用户的个人信息和行为数据涉及到重要的隐私问题。
因此,如何在保证数据安全和隐私的同时,进行数据分析和运算是一个挑战。
机器学习技术在推荐系统中的实际应用案例
机器学习技术在推荐系统中的实际应用案例在当今信息爆炸的时代,人们面临着无数的选择和决策。
为了帮助用户在海量的产品和服务中找到最符合个人需求的内容,推荐系统应运而生。
推荐系统通过分析用户的历史行为和兴趣,利用机器学习的方法,为用户提供个性化的推荐结果。
本文将介绍一些机器学习技术在推荐系统中的实际应用案例,并探讨其对用户体验和商业价值的影响。
1. 亚马逊电子商务平台的商品推荐作为全球最大的在线零售平台之一,亚马逊成功地应用了机器学习技术来推荐商品。
亚马逊的推荐系统使用了协同过滤算法,并结合了内容过滤和基于模型的方法,以提供个性化的商品推荐。
例如,当用户浏览一件商品时,系统会分析用户的历史购买和浏览记录,并找出与该商品相似的其他商品。
通过不断收集和分析用户的反馈数据,亚马逊的推荐系统可以不断优化推荐结果,提高用户购物体验,同时也为亚马逊带来了巨大的商业价值。
2. Netflix的电影和电视节目推荐Netflix是全球最大的在线影片和电视节目提供商之一,其成功的秘诀之一是其卓越的推荐系统。
Netflix的推荐系统使用了深度学习技术,其中最著名的是“贝叶斯个性化排名(Bayesian Personalized Ranking)”。
该算法通过分析用户的观看历史、评分和偏好,为每个用户生成独特的推荐结果。
据统计,Netflix的推荐系统每天能够为用户节省超过10亿小时的观看时间,因此极大地提高了用户的满意度和忠诚度。
3. 阿里巴巴的个性化推荐阿里巴巴作为全球最大的电子商务平台之一,其推荐系统的成功对于在线购物的用户体验和商业价值至关重要。
阿里巴巴的推荐系统利用机器学习技术,分析用户的购买历史、搜索行为和浏览偏好,以预测用户的兴趣和需求。
该系统使用了多种机器学习算法,包括矩阵分解、随机森林和深度神经网络,以提供精准的个性化推荐结果。
阿里巴巴的推荐系统在消费者购买转化率、浏览深度和用户留存率等关键指标上表现突出,为阿里巴巴带来了巨大的商业价值。
社交媒体平台的推荐算法分析
社交媒体平台的推荐算法分析一、背景介绍社交媒体平台作为当代人们最主要的社交渠道之一,为人们的交流、信息传播、社交互动等方面提供了极大的便利。
而随着用户规模的不断扩大,这些平台的推荐算法也变得越来越重要。
本文将介绍几种社交媒体平台经常采用的推荐算法,以及这些算法的特点和优缺点。
二、基于关注列表的推荐算法基于关注列表的推荐算法是一种最为直观且传统的算法。
简单来说,这种算法通过分析用户的关注列表,从中推荐与用户兴趣相关的内容。
这种算法最早用于Twitter社交平台,成为Twitter推荐机制的核心。
随着Twitter的发展,这种算法在其他平台中也逐渐得到应用。
这种算法的优点在于准确性高,因为它只针对用户自己选择的感兴趣的内容进行推荐。
然而,这种算法的不足之处在于它旨在推荐更加深入的用户兴趣领域,并会忽略那些可能使用户获得不同视角的内容。
三、基于共现分析的推荐算法基于共现分析的推荐算法是一种将用户推荐到之前没有关注的内容的算法。
这种算法可以将不同的用户内容通过共同的特点进行组合,从而推荐符合用户兴趣的内容。
这种算法是Facebook的重要推荐机制之一。
这种算法的优点在于它适用于那些具有深度兴趣和较长阅读时间的用户。
这种算法还可以帮助那些在平台上还没有足够关注列表或个人主页的新用户发现更多的内容和活动。
四、基于协同过滤的推荐算法基于协同过滤的推荐算法是一种利用其他用户的喜好和行为进行推荐的算法。
这种算法将用户分为不同的组,并将这些组中具有相同兴趣的用户放在一起,然后根据同样喜好的行为向用户分配推荐内容。
这种算法常用于YouTube和Amazon相似商业平台的推荐算法中。
这种算法的优点在于它可以将新的和现有的内容结合在一起,从而提供给用户更多可能感兴趣的内容。
这种算法的不足在于它容易出现过度推荐相同类型的内容,并有可能降低用户的多样性。
五、基于强化学习的推荐算法基于强化学习的推荐算法是一种以最大化用户满意度为目标的算法。
基于LDA的微博用户实时个性化推荐算法
文章编号 : 1 0 0 7 — 1 4 2 3 ( 2 0 1 7 ) 1 4 — 0 0 3 0 — 0 4
二
D OI : 1 0 . 3 9 6 9 6 . i s s n . 1 0 0 7 — 1 4 2 3 . 2 0 1 7 . 1 4 . 0 0 6
基于 L D A的微博用户 实时个性化推荐算法
近几年来 . 微 博 已 成 为 重 要 的社 交 网 络 服 务 之 一 . 对社 会 上 各 行 各 业 产 生 了重 要 的影 响 微 博 用 户 可 以 通 过网页或移动客户 端等工具发布长 度在 1 4 0字 以 内 的 微博 信 息 . 这 些 信 息 可 以在 用 户 关 系 网 中 传 播 . 从 而 实 现 信 息 的及 时共 享 微 博 用 户 除 了 可 以 接 收 所 关 注 的 用 户 的动 态 消 息 以外 .还 可 以接 收 微 博 平 台推 荐 的
微 博 推 荐 算 法 。文 献 『 5 1 对 用 户 个 人 简 介 中 的词 语 和标 签 之 间 的 关 系 进 行 建 模 并 利 用 社 交 网 络结 构 作 为 模 型 的正 则 化 因 子 。文 献 『 6 1 以L D A模 型推 断 微 博 的 主 题 分 布 和 用 户 兴 趣 取 向 .提 出 了 微 博 系 统 用 户 兴 趣 微 博 的
序. 为 目标 用 户 推 荐 前 N 个 潜 在 用 户 的 微 博 信 息 。 文 献
『 3 1 结合协同过滤的思想和 T F — I D F模 型计算微博 信息流 的相似性从 而评估用户 的兴趣 度进而优化用 户微博信 息排序 。文献『 4 1 分析了影响用户对特 定微博兴趣 的若 干 因素 .提 出了融合显式特征 和潜在特征 的社 区热点
一些社交网络好友推荐方法概述
一些社交网络好友推荐方法概述作者:暂无来源:《发明与创新·大科技》 2018年第3期摘要:基于用户兴趣偏好是现有社交网络好友推荐中应用最广泛的一种方法,但该方法忽略了用户的网络行为和所处环境对好友推荐的潜在影响。
本文综述了基于用户行为和基于地理位置两种好友推荐方法的最新研究,旨在提高好友匹配的准确性。
关键词:好友推荐;用户行为;地理位置社交网络中的好友推荐一般是通过运用算法和构建模型来计算和预测用户之间的隐藏链接关系,并按照与当前社交圈的亲密度进行降序排列,为社交网络用户推荐他们感兴趣的或可能认识的朋友,并引导他们建立新的好友关系,这表现在社交网络模型中,即建立新的节点连边。
已有的社交网络好友推荐方法为我们提供了多种考量用户关系的思路,其中研究最广泛的是基于用户兴趣偏好的方法,其他还包括基于用户社会关系的方法、基于用户社会影响力的方法、基于好友信任度的方法等。
上述方法往往忽略了用户作为社交网络主体的一些网络行为和所处环境可能对好友推荐的结果产生潜在影响。
因此,笔者选取了社交网络好友推荐方法中研究较少的两种思路,即基于用户行为和基于地理位置的方法,对国内这两个领域已产生的最新研究进行综述。
近年来,多样化的社交网络衍生出了纷繁复杂的用户在线互动行为,除了传统的浏览、评论、转发、回复外,还增加了点赞、@、评分等。
此外,社交网络用户行为具有实时更新不易把控的特点,考量起来有一定难度,而基于用户行为的方法为社交网络好友推荐提供了很好的借鉴。
吴不晓[1]以用户标注行为为本,使用词频-逆向文件频率(TF-IDF)将用户标签以语义相似度聚类成不同的话题,并据此推荐具有相同兴趣爱好的潜在好友的算法——基于用户标注行为的好友推荐算法(FRBT)。
李全乐[2]研究了基于用户@行为的好友推荐问题,他使用机器学习排序框架(LearningToRank),并引入概率图模型思想,将用户@行为的好友推荐问题转化成二分类问题。
数字人营销成功案例
数字人营销成功案例
数字人营销是一种新兴的市场营销方式,通过智能化的算法,将产品或服务推荐给潜在客户,实现精准营销。
以下是几个数字人营销成功案例:
1. 美团外卖
美团外卖利用数字人营销,根据用户的历史订单、搜索记录等数据,向用户推荐个性化的菜品及优惠活动,提高用户复购率,增加收益。
2. 滴滴出行
滴滴出行利用数字人营销,根据用户的出行需求、历史订单等数据,向用户推荐最优的出行方案及优惠券,提高用户满意度和忠诚度。
3. 京东商城
京东商城利用数字人营销,根据用户的浏览记录、购买记录等数据,向用户推荐个性化的商品及优惠活动,提高用户购买意愿和购买频率。
4. 新浪微博
新浪微博利用数字人营销,根据用户的用户画像、兴趣标签等数据,向用户推荐最相关的内容及广告,提高广告点击率和转化率。
数字人营销的优势在于,可以根据用户的行为数据进行精准营销,提高营销效果和ROI。
随着人工智能和大数据技术的不断发展,数字人营销将在未来继续发挥重要的作用。
- 1 -。
大数据技术在新媒体时代的应用发展
大数据技术在新媒体时代的应用发展在新媒体时代,大数据技术成为了媒体行业最为重要的工具之一。
大数据技术通过对庞大的数据进行分析,提供了对受众需求、社会事件、市场情况等的深度理解能力,从而提高了新媒体的运营效率、精准度和产出效益。
一、大数据技术在新媒体时代的应用1.数据采集在新媒体时代,不同类型的数据呈现爆炸式增长。
为了应对数据量的增加,新媒体平台需要建立强大的数据采集系统。
通过采集用户访问、行为、交互等数据,平台可以获取用户兴趣、喜好、浏览习惯等信息,从而更好地了解受众需求和市场趋势。
2.数据分析大数据技术为新媒体提供了全面、深度的数据分析能力。
通过比较和分析大量数据,新媒体可以识别出受众群体的基本特征、兴趣点等特征,从而定位受众、制定策略、优化产品。
同时,大数据技术也可以帮助新媒体完善营销策略、投放广告、优化内容等。
3.内容精准推荐大数据技术可以通过数据挖掘和机器学习算法识别出用户的兴趣点,进而推荐符合用户口味的内容。
这不仅可以提高用户的满意度,更可以提高用户的活跃度、转化率等指标。
二、大数据技术的发展趋势1.深度学习深度学习是一种基于神经网络的机器学习方法,目前已经被广泛应用于图像识别、语音识别、自然语言处理、推荐系统等领域。
在新媒体领域,深度学习可以帮助新媒体提高内容推荐的准确性和精准度,提高用户的满意度和粘性。
2.人工智能人工智能可以帮助新媒体生成符合用户口味的内容,提高内容的质量和效果。
人工智能还可以帮助新媒体实现智能客服、话务处理、危机管理等功能。
3.区块链区块链技术可以为新媒体提供更为安全、可靠的数据存储和交换方式,从而保护用户隐私和版权安全。
同时,区块链技术也可以为新媒体提供更为严格的数据审核和认证机制,提高数据的真实性和可信度。
三、大数据技术的应用案例1.谷歌AdWords广告投放系统谷歌AdWords广告投放系统利用大数据技术对账户历史数据进行分析,从而预测用户行为和点击概率,并根据这些预测结果为不同类型的广告推荐不同的投放策略。
基于社交网络和协同过滤的微博好友推荐算法
基于社交网络和协同过滤的微博好友推荐算法汪毓铎;黄太波【摘要】微博作为近年来用户数量较多的社交应用,其用户的信息压力也相对较大,推荐技术对于微博用户的体验和推广有很明显的帮助.本文将针对微博平台的好友推荐进行研究,分别采用基于社交网络分析和基于协同过滤技术的推荐算法.经过两种算法的实验对比得出结论:基于协同过滤的好友推荐算法具有较好的性能,在推荐好友数量较多的情况下依然具有较高的综合评价指标,提高了好友推荐的质量.【期刊名称】《北京交通大学学报》【年(卷),期】2016(040)005【总页数】6页(P70-75)【关键词】推荐技术;微博;社交网络;协同过滤【作者】汪毓铎;黄太波【作者单位】北京信息科技大学信息与通信工程学院,北京100101;北京信息科技大学信息与通信工程学院,北京100101【正文语种】中文【中图分类】TP391随着微博用户人数的增加,用户发布的微博量更是不计其数,信息量的急剧增长导致人们越来越难获取到自己真正感兴趣的内容,这就是所谓的信息过载效应[1].解决信息过载的手段主要有搜索技术和推荐技术.相比搜索技术,推荐技术具有更好的过滤效果、灵活性及推广能力,因此被广泛应用于各大电商门户网站及手机APP,如国内的淘宝网、京东网及国外的Amazon等.互联网和移动终端设备的飞速发展,导致用户对于社交网络服务的需求也呈现急剧增长的趋势.网络社交已经成为人们日常生活中的重要组成部分.在国外著名的社交网站主要有Facebook和Twitter等;在国内著名的社交网站主要有新浪微博、腾讯微博和人人网等.目前新浪微博的用户总数量和用户活跃数量均为国内同类产品之最,本文选择新浪微博作为好友推荐的研究平台.在微博社交网络中,用户获取自己感兴趣的用户主要有以下几种方式:1)通过自己感兴趣的微博内容来关注发布此内容的用户,但在海量的信息中,通过这种方式来寻找自己感兴趣的用户并不容易;2)通过设置不同特征条件对所有微博用户进行检索,这种方式往往会返回大量的结果,使用户无法进行甄别和选择;3)由微博运营平台推荐好友,目前主要的推荐方式为给目标用户推荐其好友最近关注的用户,这种推荐方式相对比较简单和盲目,其效果并不理想.因此,如何从海量的微博用户中,挖掘出目标用户感兴趣的用户,并精准地推荐给目标用户,是微博推荐系统中的一个很有意义的研究内容.在微博推荐领域,已有许多人展开研究并获得一定成果.比如根据用户关注的群体来推测用户的偏好,或者根据用户的评论和参与的话题来预测用户的关注点,然后为其推荐可能感兴趣的用户及话题[2-3].在具有社交功能的应用场景里,用户推荐是很重要的功能之一.目前微博用户的推荐方法主要有以下几种: 1)社交网络推荐一般都是通过对用户好友的关注关系网进行分析并推荐,由于用户与其好友的关系建立并不都是基于共同兴趣,因此推荐准确率较低;2)基于内容的推荐不依赖于用户的评分数据,而是根据用户的历史行为来判断是否对用户进行推荐,在动态预测推荐方面具有优势;3)协同过滤推荐是推荐系统中最常用的方法,通过用户之间的评分数据来进行相似度计算进行推荐,具有良好的操作性及推荐效果,被广泛应用于各大网站;4)混合推荐将多种推荐算法应用于推荐系统中,可以使不同推荐算法的优点结合起来进行推荐,具有良好的推荐效果.协同过滤是利用与用户兴趣行为相似的最近的邻居的偏好信息向当前用户产生推荐结果,以解决用户所面临的信息过载的问题[4].协同过滤这一概念最先由Goldberg[5]等提出,并将其应用于基于协同过滤的推荐系统Tapestry中,这是一个邮件处理系统,用来帮助用户从每天接收的大量邮件中筛选和分类邮件.在协同过滤推荐算法中,有很重要的一个步骤,就是根据目标用户对于目标项目的评价行为找出与其兴趣相似的用户.尽管根据用户对项目的评价行为确实可以在一定程度上找出兴趣相似的用户,但这种做法却忽略了用户之间的社交关系[6].在社交网络上往往越靠近的用户越具有相同的兴趣爱好[7],所以将用户之间的社交关系融入到协同过滤算法当中来是非常有必要的,这就要利用到社交网络分析的知识. 社交网络分析是数据挖掘的一个分支学科,它是一种链接分析技术,意在分析社交网络中的结构和行为[8].在社交网络上,学者们已经对利用社交关系进行个性化推荐做出了各种尝试.Spertus[9]等使用了不同的相似度计算策略在在线社区Orkut 上进行个性化推荐.Geyer[10]等在网络社区上根据社交网络信息实现的话题推荐被证实比基于内容的推荐具有更好的效果.综上所述,社交网络分析对于个性化好友推荐是一个非常重要的方法和影响因素.而协同过滤算法则是推荐系统中经典且高效的推荐算法.本文作者将采用基于社交网络分析和基于协同过滤两种算法来对于微博平台上的好友推荐进行研究.基于社交网络分析的微博好友推荐算法.利用目标用户的关注关系数据,统计出每个用户的关注用户和粉丝用户数据,计算用户的相似群体,根据相似度排序向用户做好友推荐.1.1 算法步骤描述算法的具体步骤描述如下:1)从数据集中提取出所有用户关系的子数据集,并对子数据集进行预处理;2)计算预处理后的子数据集中所有用户间的相似性;3)对用户相似群体进行相似度排序,获取目标用户的相似群体;4)取相似群体中相似度最高的前N个用户的关注对象来对目标用户进行推荐.1.2 相似性度量社交网络中没有评分数据,但却包含着非常丰富的用户社交关系数据.在微博的社交网络中,用户关注的好友并不是在现实生活中熟悉的朋友,很大程度上是因为对其某些言论的认同或者兴趣才建立的社交关系.这种社交关系包括互相关注关系和单向关注关系.常见的用户相似性度量方法,如余弦相似度、Pearson相关系数及修正的余弦相似度等,对于用户项目的评分向量比较依赖.考虑到微博中并没有用户评分机制,故这里采用不同用户节点的“出度”和“入度”来进行相似度计算.这里的“出度”指的就是目标用户的关注用户集合,“入度”指的是目标用户的粉丝用户集合.具体的相似性度量方法为:假设用户u的出度为out(u),入度为in(u);用户v的出度和入度分别为out(v)和in(v).则用户u与用户v的相似性sim(u, v)的计算有以下几种方法.1)in方法,计算公式为2)out方法,计算公式为[11]3)采用in方法和out方法,计算公式为协同过滤推荐算法分为两种,分别为基于内存和基于模型.基于内存的协同过滤算法也分为两种,分别为基于用户和基于项目[12].本文研究的是微博平台的好友推荐,故采用基于用户的协同过滤算法来对目标用户进行好友推荐.基于用户的协同过滤算法的原理为,根据当前用户的邻居用户的偏好信息来对当前用户进行推荐.所谓邻居用户,指的是对于某些项目的评分与目标用户比较接近的用户.基于用户的协同过滤算法可分为:表示阶段、计算邻居用户阶段和推荐结果生成阶段3个阶段[13].1)表示阶段.C(n ,m)是一个n×m阶矩阵.协同过滤推荐算法所要处理的数据形式就是与此类似的用户-项目评分矩阵[14],用下式表示为式中:n表示用户数;m表示项目数;矩阵元素cij表示用户i对项目j的评分;与喜欢程度成正比.评分可以采用不同的分制,如用1和0分别表示喜欢和不喜欢,或者用10分制来度量喜欢的程度.利用协同过滤算法在进行微博好友推荐时,表示阶段的矩阵应为用户-用户评分矩阵,矩阵的每个元素是由对应用户间的关注关系量化而来的评分数据,比如,当用户i和用户j的关系为相互关注时,对应的矩阵元素cij为1,否则cij为0.2)计算邻居用户阶段.计算邻居用户阶段是基于用户的协同过滤算法中的关键阶段.在此阶段中,算法通过计算不同用户关注关系的相似度来衡量不同用户兴趣的相似度.相似度的取值范围为[-1,1],其大小表示用户的邻近程度.因此相似度越接近1表示用户兴趣越相似,即为邻居用户.在表示阶段,已经将用户的关注关系量化为评分形式的用户-用户评分矩阵.矩阵的每一个行向量表示对应用户对集合中所有用户的评分.则用户之间的相似度可以用余弦相似度进行计算.设I为所有用户的集合,向量u和v分别表示用户u和v在I 上的所有评分信息.于是,用户u和v之间的余弦相似度表示为式中,Rui和Rvi分别表示用户u对项目i的评分和用户v对项目i的评分.3)推荐结果生成阶段.在对用户的相似度进行排序后即可得到目标用户的邻居用户集合.不同于为相似用户推荐项目,这里并不需要进行目标项目的评分计算.采用的推荐方式为给当前用户推荐与兴趣最相似的N个邻居用户有互相关注关系的用户.3.1 实验数据本文实验数据来自于数据堂,数据集为63 641个用户的新浪微博数据集,包括微博信息、微博转发关系、用户信息和用户好友关系等数据.本文主要利用用户的互相关注数据来对用户进行相似度计算和好友推荐,故实验采用的数据为用户好友关系数据.3.2 数据预处理原始数据为两列用户的uid数据(每一个用户拥有一个唯一的身份识别码),表示第1列用户关注第2列用户,故需要对原始数据进行预处理和过滤操作.1)在基于社交网络分析的推荐算法实验中,由于微博用户存在好友数量异常的垃圾用户及粉丝过多的认证用户,这些用户对于实验对象的一般性有所影响,故在原有数据集中去除这部分用户.原始数据中用户的关注关系数据共有1 391 718条,从这些关注关系数据统计得到有关注的用户为61 972个,有粉丝用户为24 890个.为了提高实验的准确性和用户的普遍性,选取了关注人数大于20且小于500,粉丝人数大于20人且小于5 000的用户作为研究目标用户,最终的目标群体为3 104位用户.2)在基于协同过滤的推荐算法实验中,为了提高实验的精度,从用户数据集中选取了互相关注人数大于10的用户,共有1 044位用户作为最终的研究目标,与这一群体有关注关系的用户共有5 311位.由于微博平台中并没有用户对于用户的评分,所以本文将用户之间的相互关注关系作为评分来构建用户-用户评分矩阵.在本实验中,则是根据1 044位用户和涉及到的5 311位用户的互相关注关系来构建一个1044×5311用户-用户评分矩阵.矩阵的某一行为对应用户对于集合中所有用户的评分向量.3.3 评价指标采用Top-N推荐中的准确率(Precision)、召回率(Recall)和F度量(F-measure)作为衡量算法的评价指标[15].通过基于社交网络的好友推荐算法(in法和out法)和基于协同过滤的好友推荐算法进行准确率、召回率和F值的比较来对算法进行评价.准确率定义为召回率定义为式中:U表示所有用户合集;R(u)表示推荐算法生成的推荐列表;T(u)表示用户实际的好友列表.将准确率P和召回率R值融合成一个度量值,就是F度量.其定义为式中,α为参数,当α=1时,则认为准确率和召回率的权重是一样的.常用的F度量为F2 和F0.5.F2表明召回率具有更高的权重,F0.5则表明准确率具有更高的权重.在微博好友推荐场景下,推荐的准确率应该比召回率更加重要,这时就应该调整参数α的取值.本实验中取α=0.5.3.4 结果分析使用了两种推荐算法分别在数据集上进行实验,并进行实验结果的对比.第1种是基于社交网络的好友推荐算法,其中采用了两种不同的相似度计算方法(in方法和out方法)进行比较,在实验中分别被简称为SN-in方法和SN-out方法.第2种是基于协同过滤的好友推荐算法(简称CF方法).1)给出了基于社交网络的推荐算法的SN-in方法和SN-out方法的准确率与召回率对比如图1所示.图1中从准确率对比可以看出:1)SN-in方法的准确率和召回率均相对高于SN-out方法.2)随着推荐人数的增加,准确率逐渐下降,相反召回率则逐渐上升,且两个指标最终都趋于平稳.由此说明,准确率和召回率是一对相互制约的评价指标,而且推荐人数增加到一定数量时,准确率和召回率都不再变化,算法同时也达到极限.2)给出了SN-in方法和SN-out方法的F值对比如图2所示.从图2中可以看出,随着推荐人数的增加,F值达到峰值后略微下降,最终趋于平稳.SN-in方法在平均推荐人数为50人时,F值达到峰值0.193 8.SN-out方法在平均推荐人数为60人时,F值达到峰值0.152 9.这里可以看到,SN-in方法的F值始终高于SN-out方法,所以根据微博用户的粉丝群体相似度计算来进行推荐的效果要好于根据用户的关注群体进行推荐.3)给出了基于协同过滤的好友推荐算法(CF方法)的准确率、召回率及F0.5度量与推荐邻居数的对应关系,如图3所示.通过对数据集的计算,在不同邻居数的情况下,1 044位用户分别可以得到长度不同的用户推荐列表.为了便于进行不同算法的推荐性能对比,实验中使邻居数不变,将所有用户的推荐人数相加后做平均计算即可得到邻居数与实际推荐人数的对应数据.如表1所示.结合表1和图3可以看出,CF方法在推荐人数较多的情况下,F值依然没有趋于恒定.由于SN-in方法和SN-out方法推荐好友的方式是根据用户与其关注或粉丝群体中个体的相似度进行计算和排序,然后选择最相似的前K个用户进行推荐,而CF 方法则是直接计算某用户与邻居用户之间的相似度并排序,然后将与邻居用户互相关注的用户推荐给该用户,具体推荐人数的多少与推荐邻居数的多少并不成正比例关系.4)在对比这3种方法时,根据CF方法不同邻居数对应的推荐人数取出了前两种方法在同样推荐人数下的F值数据来进行对比.给出了SN-in、SN-out和CF方法在推荐人数统一的情况下的F值对比如图4所示.结合表1和图4可以看出,在推荐人数比较多的情况下,SN-in和SN-out方法的F值均不再变化,算法在曲线趋于恒定的临界点上达到推荐人数的极限.CF方法在同样的情况下,依然具有变化的F值,不仅没有达到算法的极限而且CF方法的F值在临界点之前都高于SN-in和SN-out方法.由此可以看出,CF方法的性能要优于其他两种算法,而且在推荐人数较多的情况下,CF方法将拥有比其他两种方法更加优秀的推荐质量.1)对于基于用户的协同过滤算法进行适用于好友推荐的改进,把传统方法中的用户-项目(user-item)评分矩阵转换为用户-用户(user-user)关系描述矩阵,使得用户之间的关注关系量化为矩阵中的对应元素,用户相似度的计算量化为矩阵行向量的余弦相似度计算.从大量的用户关系数据中进行挖掘和计算来获取推荐结果,推荐结果全面且不失个性化.2)在数据集上进行实验,通过实验和对比可以看到基于协同过滤的好友推荐算法(CF算法)具有较好的性能.由图4可以看出,在推荐好友数量为75时,SN-in、SN-out和CF方法的F度量值分别为0.190 6、0.152 7和0.238 9,此时SN-in 和SN-out方法的推荐效果都已达到最佳,但是F度量值均小于CF方法.实验结果说明,在推荐人数较少时,CF方法具有更好的性能.同样由图4可以看到,在推荐好友数量较多的情况下,CF方法依然具有较高的综合评价指标,比传统的基于社交网络的好友推荐算法有着更好的推荐效果,在一定程度上提高了好友推荐的质量.在研究过程中遇到数据集不够完美,算法实验难以进行统一度量对比等问题.但在信息急剧膨胀的时代,本文的研究具有一定的积极意义.【相关文献】[1] BAWDEN D, HOLTHAM C, COURTNEY N. Perspectives on information overload[C]. Aslib Proceedings, 2013, 51(8): 249-255.[2] 王晟, 王子琪, 张铭. 个性化微博推荐算法[J]. 计算机科学与探索, 2012, 6(10): 895-902. WANG Sheng, WANG Ziqi, ZHANG Ming. Personalized recommendation algorithm on microblogs[J].Journal of Frontiers of Computer Science and Technology, 2012, 6(10): 895-902.(in Chinese)[3] 郑志娴. 微博个性化内容推荐算法研究[J]. 电脑开发与应用, 2012, 25(12): 23-25. ZHENG Zhixian.A personalized recommendation algorithm on microblogs[J].Computer Development & Applications, 2012, 25(12): 23-25.(in Chinese)[4] 杨博, 赵鹏飞. 推荐算法综述[J]. 山西大学学报:自然科学版, 2011, 34(3): 337-350. YANG Bo, ZHAO Pengfei. Review of recommendation algorithms[J]. Journal of Shanxi University: Nat Sci Ed, 2011, 34(3): 337-350.(in Chinese)[5] GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave aninformation tapestry[J]. Communications of the ACM, 1992, 35(12): 61-70.[6] KAUTZ H, SELMAN B, SHAH M. Referral Web: combining social networks and collaborative filtering[J]. Communications of the ACM, 1997, 40(3): 63-65.[7] 秦继伟, 郑庆华, 郑立德,等.结合评分和信任的协同推荐算法[J]. 西安交通大学学报, 2013,47(4): 100-104. QIN Jiwei, ZHENG Qinghua, ZHENG Lide, et al. Collaborative recommendation algorithm based on rating and trust[J].Journal of Xi'an Jiaotong University, 2013, 47(4): 100-104.(in Chinese)[8] 韩慧, 王建新, 孙俏,等. 数据仓库与数据挖掘[M]. 北京: 清华大学出版社, 2009. HAN Hui, WANG Jianxin, SUN Qiao, et al. Data warehouse and data mining[M]. Beijing: Tsinghua University Press, 2009.(in Chinese)[9] SPERTUS E, SAHAMI M, BUYUKKOKTEN O. Evaluating similarity measures: a large-scale study in the Orkut social network[C]. Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining, 2005: 678-684. [10] GEYER W, DUGAN C, MILLEN D R, et al. Recommending topics for self-descriptions in online user profiles[C]. Proceedings of the 2008 ACM Conference on Recommender Systems, 2008: 59-66.[11] 贺银慧, 陈端兵, 陈勇,等. 一种结合共同邻居和用户评分信息相似度算法[J]. 计算机科学, 2010, 37(9): 184-204. HE Yinhui, CHEN Duanbing, CHEN Yong, et al. Similarity algorithm based on user's common neighbors and grade information[J]. Computer Science, 2010, 37(9): 184-204.(in Chinese)[12] 邓爱林, 朱扬勇, 施伯乐. 基于项目评分预测的协同过滤推荐算法[J]. 软件学报, 2003, 14(9): 1621-1628. DENG Ailin, ZHU Yangyong, SHI Bole.A collaborative filtering recommendation algorithm based on item ratingprediction[J]. Journal of Software, 2003, 14(9): 1621-1628.(in Chinese)[13] 吴振慧. 推荐技术的比较研究[J]. 计算机光盘软件与应用, 2011(19): 44-45. WU Zhenhui. Comparative study of the recommendedtechniques[J]. Computer CD Software and Applications, 2011(19): 44-45.(in Chinese)[14] 张超. 结合社交网络分析和协同过滤技术的推荐算法研究[D]. 吉林: 吉林大学, 2013. ZHANG Chao.Research on recommendation algorithm based on social network analysis and collaborative filtering[D]. Jilin: Jilin University,2013.(in Chinese)[15] 石丽丽. 面向微博用户的内容与好友推荐算法研究与实现[D]. 北京: 北京邮电大学, 2014. SHI Lili.Research and implementation of content and friend recommendation algorithm for microbloggingusers[D]. Beijing: Beijing University of Posts and Telecommunications,2014.(in Chinese)。
社交网络中的推荐算法使用教程
社交网络中的推荐算法使用教程在当今信息爆炸的时代,我们每天都要面对大量的信息,无论是在社交网络上浏览朋友的动态,还是在电商平台上购物,都面临着选择困难症。
为了解决这个问题,社交网络中的推荐算法应运而生。
推荐算法能够根据用户的兴趣和行为,帮助用户发现他们可能感兴趣的内容。
在本篇文章中,将向您介绍社交网络中常见的推荐算法以及它们的使用教程。
一、基于内容的推荐算法基于内容的推荐算法是根据用户过去的行为以及他们对某个内容的喜好来推荐类似的内容。
这种算法的核心思想是将内容转化为特征向量,并计算用户和内容之间的相似度。
根据相似度的大小,系统为用户推荐相似度最高的内容。
使用基于内容的推荐算法时,一般需要完成以下几个步骤:1. 数据收集:收集用户的行为数据,包括点击、喜欢、评论等信息,并将内容转换为特征向量。
2. 特征工程:选择合适的特征以及特征表示方法。
可以使用传统的文本表示方法,如词袋模型或TF-IDF计算,也可以使用深度学习模型来提取特征。
3. 相似度计算:根据用户行为数据和特征向量计算相似度。
常用的相似度计算方法包括余弦相似度、皮尔逊相关系数等。
4. 推荐生成:根据相似度计算的结果,为用户推荐与其兴趣相似度高的内容。
二、协同过滤算法协同过滤算法是通过分析用户与项目之间的关系,找到与用户相似的其他用户或与项目相似的其他项目,以实现推荐的。
协同过滤算法可以分为基于用户的协同过滤和基于项目的协同过滤。
基于用户的协同过滤算法的使用教程如下:1. 相似度计算:通过计算用户之间的相似度,选择与目标用户最相似的一组用户。
2. 目标用户选取:根据目标用户的兴趣和行为,在相似用户中挑选出与目标用户最相似的一组用户。
3. 评分预测:根据相似用户对项目的评分,预测目标用户对尚未评分的项目的评分。
4. 推荐生成:选择预测评分最高的项目,为目标用户生成推荐。
基于项目的协同过滤算法使用教程与基于用户的类似,只是在相似度计算和目标用户选取步骤中,将用户换成了项目。
一种相关话题微博信息的筛选规则学习算法
t e d s o u s a t lsg i c n e t h s r .S n e a t e s e te ey s o t o t i i g l s n o m a in a d r n s i f s b t n i i n f a c o t e u e s i c we t i x r m l h r ,c n an n e s i f r t n a i o t x u 1 e t r s o t i e h h r we t e o s ac al n ei h t h r d to a t x ls i c to sn o — e t a f a u e ,h w o fl rt e s o tt e s b c me h l g n t a e ta i n 1 e tca sf a in i o ln t e t i i
Ab ta t sr c :M ir b o s a n w o ilme i ly r n r mp ra t r l i u r n i u o is r a i , c o l g a e s ca d a p a s mo e a d mo e i o t n o e n c r e tl e d e t t e lt f me
信 息熵 的规 则 学 习算 法 。通 过 实 验 , S 与 VM 分 类 算 法相 比 , 于规 则 的本 文算 法 和 C AR算 法分 类 基 P 效果均 比 S VM 算法 效 果 好 ( 浪微 博 数 据 中 , 新 F值
分 别 为 9 . 1 ,7 7 % , 6 6 %) 同时 本 文算 法 8 0 9 . 7 9 . 1 , 学 习 出 的 筛 选 规 则 取 得 了更 好 的 效 果 。最 后 , 在
人工智能在社交媒体中的实时推荐算法
人工智能在社交媒体中的实时推荐算法随着社交媒体的兴起,人们对于信息的获取需求也变得越来越迫切。
然而,社交媒体上的信息量庞大,用户往往需要花费大量时间和精力去寻找自己感兴趣的内容。
为了解决这一问题,人工智能技术应运而生,通过实时推荐算法,帮助用户在社交媒体上快速找到符合自己兴趣的内容。
人工智能在社交媒体中的实时推荐算法主要依靠大数据分析和机器学习技术。
首先,社交媒体平台会收集用户的个人信息、浏览记录以及与其他用户的互动数据等,形成用户画像。
然后,通过分析这些数据,人工智能算法能够准确地了解用户的兴趣爱好、偏好以及社交关系,并根据这些信息为用户进行个性化的推荐。
在实时推荐算法中,时间因素是非常重要的。
社交媒体上的信息更新非常迅速,用户希望看到的是最新、最热门的内容。
因此,实时推荐算法需要能够快速地对海量的信息进行处理和分析,准确地判断哪些内容是用户感兴趣的。
这就要求算法具备高效的计算能力和智能的筛选机制。
除了时间因素,用户的个性化需求也是实时推荐算法需要考虑的重要因素之一。
每个用户的兴趣爱好都是不同的,因此,算法需要根据用户的个人特点进行推荐。
例如,对于喜欢音乐的用户,算法可以根据他们的历史收听记录和评分,推荐相似风格的音乐;对于喜欢旅游的用户,算法可以根据他们的地理位置和朋友圈的推荐,推荐附近的旅游景点和热门旅游线路。
通过个性化的推荐,算法能够更好地满足用户的需求,提高用户的满意度。
此外,社交媒体中的实时推荐算法还需要考虑用户的社交关系。
社交媒体的本质就是连接人与人的平台,用户之间的互动和交流是非常重要的。
因此,算法需要根据用户的社交关系,推荐与他们有关的内容。
例如,如果用户的好友在社交媒体上发布了一篇文章或者分享了一段视频,算法可以将这些内容优先推荐给用户,增加用户与好友之间的互动。
然而,人工智能在社交媒体中的实时推荐算法也面临一些挑战。
首先,用户的个人信息和隐私问题需要得到保护。
尽管算法需要根据用户的个人特征进行推荐,但是用户的个人信息不能被滥用,否则会引发用户的不满和隐私泄露的风险。
基于大数据的个性化推荐算法在微博中的应用
基于大数据的个性化推荐算法在微博中的应用随着社交媒体的普及和发展,人们每天都会在微博等网站上产生大量的内容,使得信息爆炸现象愈发严重。
在这样的背景下,如何能够从海量的信息中筛选出用户真正感兴趣的内容,成为了一个亟待解决的问题。
基于大数据的个性化推荐算法在微博中的应用,就是为了解决这一问题而提出的一种解决方案。
个性化推荐算法是一种根据用户的历史行为和偏好,利用大数据分析技术,将用户感兴趣的内容推荐给他们的算法。
在微博中,个性化推荐算法的应用可以帮助用户更好地使用平台,帮助平台提高用户活跃度和用户粘性,进而推动平台的发展。
首先,基于大数据的个性化推荐算法可以帮助用户在海量的信息中发现自己感兴趣的内容。
微博作为一个社交媒体平台,每天都会有数以百万计的用户在上面发布各种各样的信息,包括文字、图片、视频等。
如果用户需要浏览所有的信息来找到自己感兴趣的内容,无疑是一项繁琐且耗时的工作。
而基于大数据的个性化推荐算法可以通过分析用户的历史行为和偏好,将用户感兴趣的内容推荐给他们,帮助他们更快地找到自己想要看的内容。
这种个性化的推荐方式,不仅可以提高用户的使用体验,还可以节省用户的时间和精力。
其次,基于大数据的个性化推荐算法可以提高用户的参与度和粘性。
在微博中,用户往往通过关注其他用户或者加入话题来参与讨论。
然而,由于信息过载的问题,用户可能会错过一些他们感兴趣的内容,导致他们的参与度和粘性下降。
而个性化推荐算法可以帮助用户发现他们可能会感兴趣的用户和话题,提高他们的参与度和粘性。
例如,算法可以根据用户的历史行为推荐与他们兴趣相关的用户,使他们更容易找到志同道合的人,加深彼此的互动。
这种个性化的推荐方式,可以帮助用户更好地参与到微博的内容创作和讨论中,提高他们的用户体验。
再次,基于大数据的个性化推荐算法还可以帮助微博平台提高广告投放效果。
作为一个商业化的平台,微博靠广告收入维持运营。
然而,广告主往往面临着如何将广告投放给真正感兴趣的用户的问题。
基于六度分割理论的社交好友推荐算法研究
基于六度分割理论的社交好友推荐算法研究杜淑颖;丁世飞【摘要】为了更好地拓宽用户社交圈并且通过新朋友获取更多的信息资源,好友推荐成为社交网络最为青睐的对象.该文在分析现有朋友推荐算法的基础上,提出基于六度分割理论的社交好友推荐算法.首先,该方法以好友分级思想为基础,根据用户的历史行为对用户进行评级,将评级相似的用户合并为一个群组,以减少进行大规模好友推荐时的时间代价;其次,考虑用户之间的共同关注关系,以及用户与好友交流的时间差额,计算用户与好友之间的相似程度.采用新浪微博数据集验证算法的性能,最终实验证明:该算法准确性和召回率都得到了提升.【期刊名称】《南京理工大学学报(自然科学版)》【年(卷),期】2019(043)004【总页数】6页(P468-473)【关键词】好友推荐;六度分割算法;好友分级;社交网络【作者】杜淑颖;丁世飞【作者单位】中国矿业大学计算机科学与技术学院,江苏徐州221116;徐州生物工程职业技术学院财经信息系,江苏徐州221000;中国矿业大学计算机科学与技术学院,江苏徐州221116【正文语种】中文【中图分类】TP391目前,移动社交网络正随着计算机网络技术的发展而逐渐成为人们日常交友的主流平台。
在移动社交中,好友圈的发展不仅仅局限于现实生活中的好友、同事或亲戚成员,还可以在网络平台根据兴趣爱好以及日常行为选择目标用户添加好友[1],同时也可以通过社交好友平台查找专业性相关的好友群落,通过垂直社交方式的交流研究,合作解决专业性相关问题。
在享受移动社交网络便利的同时,如何有效准确地实现好友推荐则是本文所要研究讨论的问题。
目前,常用的好友推荐算法大多朝着基于聚类[2],或协同过滤[3]这两大方向研究发展,在研究用户与好友间的特征规则以及兴趣行为[4]爱好时,可以很明显地发现其好友推荐与用户兴趣标签之间的关系符合密切度。
并且,在好友推荐读取个人信息资料以及兴趣标签时,难以避免对用户隐私[5-6]和用户数据的脱敏处理,以及对于用户好友的精准推荐处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2. 1
好友推荐算法
微博社区模型
微博依靠其关注、 转发、 评论等功能建立了用户之间强大的 [10 ] 。通过研究用户之间的交互频率可以发现微博网
互动关系
, 文中提出词语的距离和词语的相似度存在着密切的关
络中存在了许多复杂的社区结构 , 在同一社区里的用户相比于 [5 ] 社区间的用户的交互更加频繁 , 联系更加紧密 。 图 1 所示为 简易的微博网络社区结构示意图 , 从图 1 中可以很容易地发现 而社区之间联系比较稀 社区 A 和 B 内部节点联系非常密切 , 转发、 评论他人的博文进行 疏。微博上的用户通过发布新博文 、 交互的, 交互频繁的用户成为好友的可能性更大 。 从社区内的 关系密切及社区间的关系稀疏 , 可以推断社区内的用户之间更 有可能成为好友, 这为我们向目标用户推荐好友提供了基础 , 缩 。 , 小了搜索范围 因此 本文的好友推荐模型是在微博社区中进 行的, 微博社区的相关研究及发现方法本文作者已有研究 , 参考 5] 。 文献[
二者是一对词语相同关系特征的不同表达形式 。 给定两个 系, Sim( W1 , W2 ) 表示二者的相似度, Dis ( W1 , W2 ) 词语 W1 和 W2 , 表示二者的词语距离, 则词语间的相似度定义如下 : Sim( W1 , W2 ) = α Dis( W1 , W2 ) + α ( 1)
[14 ] 13] 了衡量。文献[ 结合 PageRank 算法 的思想, 设计了 TwitterRank 算法来评价一个用户在某一主题范围内的影响力 。 文
户的兴趣度和用户间的信任度等包含用户个性化特色的信息得 到了广泛的关注。 社区结构是网络的一大特性 , 微博网络中也存在许多大大 社区内的用户在某种意义上具有兴趣爱好相似的 小小的社区, 可能性更大
Abstract
In view of the deficiencies of existing friends recommendation mechanism of Sina microblogging,we propose a new Sina microb-
logging friends recommendation algorithm. We study the influences of microblogging community structure and authoritative users on friends recommendation. The algorithm recommends the friends in same microblogging community by searching the authoritative users and combining the interest similarity and the trust degree between users. In recommendation process,the interest similarity between users is calculated twice and the propagation model of the trust degree between users is introduced as well. By tracking a couple of targeted user groups in Sina microbwe compare the friends recommending list provided by the Sina microblogging with the friends list recommended by the proposed algologging , rithm,the experiments show that the proposed algorithm has a better recommendation effect. Keywords Microblogging community Authoritative users Interest similarity Trust degree Friend recommendation
[5 ]
。另外不同的用户有不同的推荐效果 , 其中权威
[6 ]
[7 ] 和 HITS 算法及其相关改 进的算 法 是 最 常 见 的 基 于 链 接 的 用 户 权 威 度 排 序 算 法 。 肖
用户有更大的影响力。 PageRank 宇
[8 ]
15] 提出根据用户影响力和用户活跃度来挖掘权威用户 。 献[ 16] 文献[ 利用社会网络分析工具 , 根据点度中心衡量用户在网 络中的权威性。 综合上述对于权威用户影响力的研究发现 , 影响力排名靠 前的用户几乎是各行业的名人 。新浪微博中有一项官方认证即 “V” 加 用户, 这些用户是用自己的真实信息通过新浪微博系统 验证的名人。根据这项功能, 本文简化了权威用户的搜索过程 , 即: 在一个社区的范围内, 首先查找出所有的加“V ” 用户, 然后 利用兴趣相似度的计算方法 ( 下文将介绍 ) 提取与目标用户兴 趣最相似的前 N 位权威用户成为我们算法中所需要的权威用 户。而权威用户推荐的是其所关注的用户 。
其中, α 是一个可调节的参数。 [18 ] “个人标签 ” 本文使用了 WordSimilarity 来计算 之间的相 似度, 它是根据上述刘群发表的文章中的原理编写的 。 通过其 输入词语就可以直接得到两者之间的相似度 ( 数值为 0 到 1 之 对于字数较多的字段可以利用文本输入进而得到 间的实数) , 相似度。
通过分析用户的内容信息或链接信息 , 对用户的权威度进 [9 ] 。 Romero HITS 等 基于 算法提出了 InfuencePassivity 算 行排序 法, 对 Twitter 中的用户按影响力进行排序 。 本文基于用户的兴趣度和用户间的信任度研究及权威用户 影响力的研究, 提出了一种新的新浪微博好友推荐算法 , 主要做 了以下几个方面的研究工作 : ( 1 ) 微博社区模型的研究; ( 2 ) 社区中的权威用户的搜索和权威用户推荐 ; ( 3 ) 用户之间兴趣相似度的计算 ; ( 4 ) 用户的信任度传播模型 ; ( 5 ) 结合上述研究提出一种新的新浪微博好友推荐算法 。
256
计算机应用与软件
2014 年
相近的最近邻集合, 根据最近邻对产品的评分预测目标用户对 这些产品的评分, 将评分最高的前 N 项产品推荐给目标用户 。 后者是推荐与目标用户之前选择的产品相似的产品 , 系统通过 学习用户已经评价过的产品数据来获得用户的兴趣描述 , 再将 待推荐产品数据资料与用户兴趣描述匹配 , 决定是否推荐。 随 基于微博系统推荐的研究也越 着个性化推荐系统的广泛应用 , 来越多, 如标签推荐
第 31 卷第 7 期 2014 年 7 月
计算机应用与软件 Computer Applications and Software
Vol. 31 No. 7 Jul. 2014
一种新的新浪微博好友推荐算法
杨长春 杨 晶 丁 虹
( 常州大学信息科学与工程学院 江苏 常州 213164 )
摘
要
鉴于新浪微博现有好友推荐机制的不足 , 提出一种新的新浪微博好友推荐算法 。 研究微博社区结构和权威用户对好友
2. 3
用户兴趣相似度的计算
用户的兴趣相似度在好友推荐模型中占有很重要的地位 。 “个人标签” , 新浪微博中用户有 这是最具用户个性化特色的信 最能表达用户的兴趣爱好 。 本文提取用户个人标签中的信 息, , 进而得到用户的兴 息 利用语义分析工具进行词汇相似度分析 , 趣相似度值。 刘群、 李 素 建 发 表 了 基 于《知 网 》 源自词汇语义相似度计 算文献标识码
A NEW FRIENDS RECOMMENDATION ALGORITHM FOR SINA MICROBLOGGING
Yang Changchun Yang Jing Ding Hong
( School of Information Science and Engineering,Changzhou University,Changzhou 213164 , Jiangsu, China)
0
引
言
置附近的用户进行推荐 。( 5 ) 微博会员优先推荐。 新浪微博系 用户一旦成为会员, 将会得到系统优先将其 统推出了微博会员, 推荐为好友的特权。 上述好友推荐算法是从全局的微博网络着手进行搜索得到 好友推荐列表, 具有一定的参考价值, 但都没有考虑微博社区结 构对好友推荐的影响, 忽略了在同一社区内的用户更有可能成 为好友的现象, 也没有考虑到权威用户在推荐中的特殊影响力 , 因此推荐结果具有一定的盲目性和广泛性 。本文研究了微博社 区结构和权威用户对好友推荐的影响 , 在此基础上结合用户的 提出了一种新的新浪微博好 兴趣相似度和用户之间的信任度 , 友推荐算法。
[3 ] [4 ] 、 微博内容推荐 等。 在这些研究中, 用
, 星效 应。 例 如 新 浪 微 博 用 户“吴 奇 隆 ” 他的粉丝数是 8 982 432 , 他关注的人数是 518 , 他发布的博文大多在十几分钟 内就会发生上千次转发和评论 。 由于权威用户的巨大影响力 , “关注 ” 普通用户对他们感兴趣的可能性就比较高 , 很有可能去 他们, 而且普通用户对他们的信任度也会比对其他普通用户高 , 考虑到权威用户在推荐过程中起的作用 , 本文将权威用户的搜 索和权威用户推荐应用到好友推荐算法中 。 11]对 Twitter 中 用 户 的 影 响 力 进 行 了 研 究 。 文 献 文献[ [ 12] 利用粉丝的数量和微博转发的数量对用户的影响力进行
微博已经成为时下最流行的大众化信息传播媒介 , 通过微 博平台用户可以轻易地完成各类信息的获取 、 生产、 分享和传 播。微博的另一大魅力是可以在这个虚拟网络中认识更多的朋 “你可能感兴趣的人 ” 友, 以新浪微博为例, 用户可以通过 这个 模块中由系统推荐的用户 , 找到志趣相投的人。 目前, 新浪微博用于推荐好友的算法大致包括以下五种情 况: ( 1 ) 根据教育信息进行基本信息相似推荐 。 用户信息中有 填写教育背景的, 系统会根据入学时间、 学校、 所学专业等信息 进行同类匹配, 选择匹配度较高的进行推荐 。 ( 2 ) 根据标签、 关 键词进行兴趣相似推荐 。大多数用户都会填写具有自我个性化 特色的标签, 此类标签可以代表用户的兴趣爱好方向 , 系统会根 据这些信息进行兴趣相似度查找 , 选择兴趣相似度高的进行推 荐。( 3 ) 根据共同关注的人进行推荐 。根据两个人之间所关注 的共同好友的数量可以判断二人的共同兴趣 。如果二人之间共 同关注的人很多, 那么此二人拥有相同兴趣的可能性就很大 , 那 么可以将二人互相推荐为好友 。( 4 ) 根据地理位置进行就近推 荐。此处的地理位置包含两点 : 一是用户信息中的所在地 ; 二是 用户当前登录的 IP 地址。 系统会根据这两者信息选择地理位