面向Web3.0的分众分类研究(一)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

面向Web3.0的分众分类研究(一)
摘要]在全面分析Web3.0及分众分类的基本特征的基础上,针对Web3.0的的核心理念和目前分众分类存在的局限性,从微内容的自由整合与过滤、微内容的标准化与结构化、标注的规范控制、标签的基本属性、标签分类与聚类、标签间的关联、标签与本体的结合等方面探讨面向Web3.0的分众分类未来研究方向,最终实现分众分类体系的优化。

关键词]Web3.0分众分类标签
随着互联网技术的迅猛发展,Web2.0以应用的开放性、信息传播的交互性、读写并存的表达方式、社会化的联合方式和便捷化的体验方式,使得越来越多的网民参与到互联网信息的创造及发布中。

然而,随着信息发布量的快速增长,由此衍生的信息杂乱无章、信息的纯净度和可信度大大降低、搜索引擎精准度下降等问题相继出现在互联网用户面前,网民越来越期待及时准确地获得切合自身需求的信息和知识,以及便捷的互动交流和信息的协同共享。

面对这一问题,网络模式急需更新换代,能够为用户提供一种更加高效、精确和个性化的互联网平台的Web3.0模式成为首选的解决方案。

1Web3.0及其特征
Web3.0是新一代互联网应用的统称,它是建立在Web2.0的基础上,包含了Web2.0的所有特点,但同时为了让人们更好地利用网络资源,Web3.0提供了一种方便管理、方便查找信息资料,能够自己控制一切的全新的服务:网站内的信息可以直接和其他网站相关信息进行交互,能够对多家网站的信息进行整合使用,并能根据用户需求,智能化处理互联网海量信息的整合,最终聚合用户个性化的需求,同时实现真正意义上的互联互通。

总之,相对于Web1.0的“浏览和下载”、Web2.0的“参与、展示和互动”,Web3.0的核心理念是“个性、精准和智能”。

其主要特征表现如下:
1.1个性化信息聚合
Web3.0最大的特点在于信息的聚合以及提供个性化的信息服务,真正的Web3.0时代不仅仅是按照用户需求提供综合化服务,创建综合化服务平台,更关键的是,把散布在互联网上的各种信息点以及用户的需求点聚合和对接起来,提供基于用户偏好的个性化聚合服务。

1.2信息检索的高精准度
Web3.0在对于UGC(用户生产内容)筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC发布源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要感兴趣的信息内容,避免了大量信息带来的搜索疲劳。

1.3搜索引擎的智能化
Web3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台。

在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用户可以提出完整的问题,通过搜索获得一些问题的解决方案。

1.4多种终端平台、跨网站和跨语言信息交互
Web3.0不仅能够实现不同网站间的信息交互,而且还能实现不同终端的兼容。

通过互联网与通信的融合,用户可以用所有智能终端(固定电话、移动电话、PC、IPTV以及其他智能终端)轻松享受看得见、听得到、用得好、即时交互的信息服务。

另外,Web3.0的智能翻译引擎突破了国家、语言的限制,使用户用自己的母语可以与全世界所有人进行交流,实现了更大范围内的信息交流与共享。

2分众分类及其特征
分众分类(Folksonomy)是随着Web2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,
并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。

其实质就是以词为类,但其类目却是平面的、非等级的,它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。

2.1分众分类的优势
与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。

分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。

其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容;其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改;第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容。

2.2分众分类的局限
作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:
2.2.1标签的多样性由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。

标签的多样性极大的影响系统的检全率。

2.2.2标签的模糊性分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。

标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。

2.2.3标签的扁平化组织分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。

因此,系统无法识别各个标签之间的等级层次联系。

一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。

同时,信息越多利用标签直接找到相关信息就越困难。

2.2.4系统间的交互性很低很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和代理软件的自动化处理,同时也引发了一系列检索方面的问题。

另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低。

2.2.5标签问语义关系缺乏分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。

3Web3.0对分众分类的需求Web3.0的基础是Web2.0,因而,分众分类也是Web3.0的一种主要的信息组织方式。

但是目前分众分类所具有的上述局限性显然阻碍了Web3.0的核心理念——“精准、个性和智能”的真正实现,Web3.0的发展需求决定了分众分类的发展方向,因而,未来的分众分类还需要在以下几个方面进一步拓展。

相关文档
最新文档