基于标签法的微博分类的研究:以新浪微博为例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论文名称:基于标签法的微博分类的研究:以新浪微博为例
拟研究的主要内容和思路:
1.引言
2.新浪微博的分类方法
2.1新浪微博用户自助实现的分类
2.2新浪微博系统提供的分类
3.微博标签生成方法
3.1标签生成方法设计思路
3.2用户微博管理方法
3.3运用层次分析法设置各个标签的权重
3.3.1AHP方法:
3.3.2微博三级标签体系
4.总结及申明
基于标签法的微博分类的研究:以新浪微博为例
朱洋
(华中师范大学信息管理学院)
摘要:微博在我国快速发展,成为大众传播信息的重要载体、及时反映社情民意的网络平台,更是构架党和政府部门与普通民众交流的桥梁和纽带。本文以新浪微博为例,对标签法在微微博内容的分类与检索进行研究,运用层次分析法建立三级标签体系,将综合发布者的微博标签、转发者和收藏者添加的微博标签来自动生成系统标签的方法为标准对微博进行了分类,以方便用户进行管理微博和检索微博。
关键词:微博标签法
1.引言
微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。从 2006 年 Twitter 网站推出至今,微博发展迅速,在国内发展最好的是新浪微博。新浪微博()是新浪旗下网站,是中国最具影响力的社会化媒体平台,是一个基于用户关系的信息分享、传播以及获取的平台。新浪微博于2009年8月14日开始内测。根据新浪公布的最新数据,截至2012年5月16日,新浪微博注册用户数已增至3.24亿。
由于微博具有单一性、迅捷性、碎片化、个性化、开放性、整合性、实时性和跟随性等特点,使得微博存在信息冗余、自发的组织性不强等问题,其所负载和传播的内容也呈现碎片化,给人良莠不齐、垃圾信息泛滥的印象。因此,需要不断改善微博信息资源的组织方式,才能不断提高其生存能力。对微博网站信息分类问题进行研究,不仅可以指导微博网站对信息的分类组织,也可以促进对网站信息分类问题研究的深入。
已有学者对微博进行了研究,主要集中在其传播机制、盈利、应用等问题上。近年来,有一些学者开始对微博的信息组织问题进行研究:柯芳微认为博客作为一个信息生产系统,其由“混沌”到组织化的过程,其实可以看作一个“信息自组织”过程,信息会不断地有向聚合——群组界面信息聚合,个人界面信息聚合。吴胜和苏琴根据微博的实时性、碎片化、跟随性特点,认为用户是微博网站信息分类时考虑的重要要素,提出了直接法、职能法、网战法、矩阵法四大微博网站信息分类模式,得出职能法是微博网站中使用频率最高的分类模式的结论。刘乙坐和黄奇杰从传播的角度对微博进行分类,分为个人用户微博和组织用户微博。陈渊,林磊,孙承杰和刘秉权通过对用户特征的分析,提出了给用户推荐标签,将用户
标签化,这样来达到微博信息组织化的目的。
目前,基于标签法的微博分类的研究几乎是一片空白,原因在于微博网站作为web2.0网站,用户的交互性非常强,没有一个很好的机制能够对发布的微博进行主题和内容进行分类。而现在一些web2.0网站的普遍做法是鼓励用户在发布内容时能够自定义主题或者贴上主题标签。然而仅仅是靠发布者提供的主题给微博进行分类是很不可靠很不切实的。
微博网站信息标签分类问题进行研究,不仅可以指导微博网站对信息的分类组织,也可以为用户提供一个自行管理微博和检索的机制。本文首先回顾已有的网站信息分类、博客信息分类研究成果;在此基础上,提出由发布者——转发者——收藏者对微博进行标签化分类的机制。考虑到微博网站的相似性,本文以新浪微博为样本对标签法在微博分类上的应用进行研究。
2.新浪微博的分类方法
新浪微博目前提供的微博分类主要突显在用户管理微博和微广场的几个应用功能上。
2.1新浪微博用户自助实现的分类
用户可以对自己所关注的微博账号进行分组,将所关注的人和组织进行统一分类,如图1是某微博账号上的分组。分为相互关注、特别关注、名人明星、同事等。新浪微博提供多个标签的分组,比如可以把某账号同时分到特别关注和名人明星中。新浪微博的分组功能基本上可以满足用户对关注者分组的需求。
图1
用户对微博的分类表现在发布微博和收藏微博时可以选择添加标签。在发表微博时不会提示添加标签,在发表之后可以给微博进行添加标签;在发表微博时可以在最前面加上“#主题#”表示微博的主题。新浪微博没有在发表微博时提供标签是考虑到用户提供标签往往不够准确,而且标签没有必要给发布者的粉丝看到。在收藏微博时系统会提示添加标签,可以添加最多两个标签,这样方便用户进行微博管理和查找微博。如图2所示:
图2
2.2新浪微博系统提供的分类
新浪微博的广场一栏中有多个功能应用,其中名人堂、微话题、热门微博等提供了对微博进行分类的检索功能。
如下图3所示,用户可以在名人堂中对名人进行搜索,可以再搜索框中输入搜索,也可以点击分类标签一层层搜索。
图3
如下图4所示,用户可以通过“微话题”来搜索感兴趣的微博。
图4
如图5所示,用户可以在“热门微博”中找到时下热门话题。热门话题的分类简单,每一大项最多分为三类。如体育的下一层分类是全部、名人、媒体。
图5
最直接的搜索方式是通过新浪微博的搜索框进行主题搜索,作为中国最大门户网站新浪网的子品牌,新浪微博的搜索功能还是很强大的,但是往往搜索得到的微博数量过多而不够准确。
可以发现,新浪微博虽然提供了多种多样的检索方式,但是没有一个很合理的机制对微博进行统一分类。
3.微博标签生成方法
根据上面的论述,在微博发展的现阶段,急需建立一个微博分类的机制,而研究表明标签法检索是可行的,下文将详细探讨这一方法。