社交媒体档案化管理研究与实践综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
社交媒体档案化管理研究与实践综述
作者:尚珊陈晶晶
来源:《兰台世界·上半月》2018年第01期
摘要社交媒体信息是互联网时代下社交媒体平台生成的信息资源,社交媒体档案是其中具有查考和凭证价值的部分。
本文通过对国内外学术文献和实践成果的梳理和分析,从主题和内容方面探讨目前社交媒体档案研究已取得的进展和成果,并在此基础上提出社交媒体档案管理的难点及今后研究的方向,以此推动社交媒体档案有效管理及实践。
关键词社交媒体信息社交媒体档案档案管理微博微信
中图分类号 G271 文献标志码 A 收稿日期 2017-09-18
Abstract Social media information is the information resource generated by social media platform in the Internet era, and social media archives are the part which has reference and proof value. By combing and analyzing the domestic and foreign academic literature and practice, this article aims to explore progress and result of the current social media archives study from the perspective of theme and content, and on this basis, put forward the difficulty and future research direction of social media archives management, in order to promote the efficient management and practice of social media archives.
Keyword social media information; social media archives; archives management; Micro-blog; WeChat
随着移动互联网的发展和广泛应用,社交媒体工具已经迅速渗透到我们日常工作和生活中,并对人类的交流方式和生活习惯产生重要影响。
社交媒体是互联网时代人们彼此之间用来分享意见、见解、经验和观点的工具和平台,现阶段主要包括微博、微信、博客、论坛、播客等等[1]。
在Web2.0环境下,公众对于信息的生成和传播具有更大的主动权和更高的参与积极性,机构、组织或个人都可借助社交媒体平台产生并分享其信息。
社交媒体中具有保存和利用价值的信息资源归档后,我们称之为社交媒体档案。
国家档案局在《全国档案事业发展“十三五”规划纲要》中提出,要研究制定关于社交媒体文件的归档和管理办法,这说明社交媒体信息资源的档案化工作将被提上日程。
笔者对国内外有关社交媒体档案已发表的学术文献和已开展的实践项目进行梳理和分析,以概括当前研究的主要内容和取得的成果。
一、文献统计分析
本文的研究对象是以微信、微博为主要代表的社交媒体,探析对其信息资源档案化的研究文献。
首先,由于笔者所处检索环境和平台的限制,仅在Web of Science数据库中检索题名中包含“social media archive”、“social media records”、“social media files”的英文文献,人工筛选出21篇相关的英文文献,学术文献的数量存在些许不足,仅用于定性分析国外研究学者的研究
进展。
同时,通过中国知网学术资源检索平台检索中文文献,利用其高级检索中的专业检索功能,以篇名中包含“社交媒体”、“社会化媒体”、“微信”、“微博”和“档案”、“收集”、“归档”、“保存”、“管理”的检索词进行组合式标题检索,其检索式为:TI=(‘社交媒体’+‘社会化媒
体’+‘微博’+‘微信’)AND TI=(‘档案’+‘收集’+‘归档’+‘保存’+‘管理’),在档案及博物馆学科分组下共检索到41篇中文文献。
1.总体趋势。
从图1所示的国内外已发表文献年份—数量统计来看,关于此类研究的文献主要是从2010年左右开始出现,说明此类型档案在档案学领域是一个相对新颖的研究方向。
此后,国外文献数量每年趋于平缓稳定的增长状态,国内文献数量呈上升的趋势。
2.主题分析。
目前国外许多档案机构已对社交媒体档案化工作有成功的实践经验,政府部门也出台相关政策和法规对归档的流程进行指导,因此检索到的21篇英文文献研究主题主要集中于管理和利用方面,主要包括社交媒体数据挖掘和分析、社交媒体档案的新型管理制度、社交媒体信息采集过程中隐私保护、社交媒体文件归档流程优化等方面的问题。
为摸清国内近年来关于社交媒体档案研究的主题,提取检索到的41篇中文文献的关键词,统计关键词出现的频次。
首先,对所有关键词进行规范化整理,将词义相同或相近的词合并,如“社交媒体”和“社会化媒体”、“归档”和“归档保存”、“推特”和“Twitter”;然后利用Excel 的去重、排序功能,对词频大于2的关键词绘制社交媒体档案研究关键词分布表和分布图,见表1和图2。
如果从更宽泛的角度分析以上十个关键词,微博和推特均属于社交媒体的代表,可并入社交媒体研究范围。
但作为两种国内外典型的社交媒体平台,为使研究主题更为清晰和具体,分析各自在本国的传播力和影响力,因此分为不同类别进行分类研究。
通过关键词词频分布可得出,当前研究主题主要集中于对社交媒体文件和信息资源的档案化管理。
目前国内对于社交媒体档案的研究还处于初始阶段,主要是分析与借鉴国外Twitter、YouTube等社交媒体文件的归档项目,以及结合国内实际情况对社交媒体信息在采集、归档、保存、管理等方面作出探讨。
二、社交媒体档案研究的主要内容
1.社交媒体档案化的必要性研究。
探讨社交媒体信息是否存在档案化的必要和价值,是研究社交媒体档案的第一步。
陈祖芬认为社交媒体档案具有十分重要的社会价值,因此有必要对社交媒体信息进行价值引导、筛选鉴定和加工编辑,从而发挥其文化传承的功能[2]8。
姬申建和路江曼也强调了“微博档案”的凭证和参考价值,认为其是社会记忆的重要构成[3]10。
研究学者还从档案资源系统化、结构化的角度进一步拓展社交媒体信息档案化的必要性。
王兰成和黄永勤提出有必要对社交媒体信息进行保存并设计档案化媒体整合系统框架,规范档
案信息组织、开发和利用路径[4]73。
冯惠玲教授在2012年全国档案工作者年会上所作的主题演讲《社交媒体与档案社会化》提出社交媒体档案化的重要性,并指出应以更新、更全面、更恰当的方式和方法思考档案资源结构和构建的方式[5]8。
从社交媒体档案不同的利用角度分析,多位学者也发表对社交媒体信息档案化必要性的看法。
周文泓借鉴InterPARES的电子档案要素分析模板,对政务微博信息进行要素析取,讨论了政务微博信息档案化的必要性[6]71。
Cheong M提出利用推特信息探测和记录公民应对恐怖主义时的情绪,能够为决策者和当局在此情况下安抚民众并作出快速反应提供辅助资料
[7]45,从社交媒体档案的情报价值判定保存社交媒体信息的重要性。
2.社交媒体信息的采集研究。
国外社交媒体发展早于国内,对其应用及研究也相对较为成熟。
国外的众多图书馆、档案馆等记忆机构已经在社交媒体信息采集的实践研究上取得一定进展和成果,美英加澳四国是其中的典型代表,相应实践项目开展情况见表2。
从国外已有的项目实践成果分析,采集社交媒体信息首先应从主体、范围、方式、方法和技术等角度考虑。
首先,社交媒体信息量大且结构复杂,档案部门主动采集的难度较大。
例如,美国Twitter存档项目采用LC、Twitter、Gnip三方合作的模式进行,Twitter是tweets的捐赠方,LC是tweets的保存主体并且提供Twitter档案库的访问利用,而Gnip是负责tweets 的收集组织并向图书馆移交的传送代理商[8]8。
其次,从档案的完整性角度考虑,应对社交媒体信息进行广泛收集,并根据目前已有的技术能力、人员设置、资金条件等方面考虑信息采集的时间间隔[3]11。
社交媒体信息的采集方式主要分为按主题采集和发布者采集,主题采集的典型案例是加拿大哈利法克斯省档案馆利用Twitter统一标签的方式,采集哈利法克斯大爆炸事件的相关信息。
其采集流程为:明确征集主题——利用微博平台宣传——微博用户自发参与故事的讲述——档案部门将同一主题微博收集归档[9]45。
关于社交媒体信息采集方法和技术,目前最常用的有三种:网络爬虫采集、API接口传输数据、截图工具。
网络爬虫采集属于主动采集方式,通过制定元数据编目规则,包括抓取资源的格式、编排的结构等,利用网络爬虫程序(如Gooseeker)抓取社交媒体的文字、图像和视频信息,并对其进行内容解析。
Littman J推荐使用基于API的社交媒体采集作为存档的一种形式[10]1,API捕获数据能够对内容进行精确的裁剪,以满足版权限制与用户利用需求,并可连同元数据一同捕获[11]99,使采集的效率和效能更高。
也有学者认为使用截图工具采集到的图片不易更改,能保证较高的原始记录性[3]12。
3.社交媒体信息的鉴定研究。
社交媒体信息的鉴定是社交媒体档案化管理中非常重要的一个环节。
与电子文件相似,社交媒体信息也是依附于电子载体生成的信息,可参照电子文件以及传统的档案鉴定标准。
哈罗德·瑙格勒撰写的“文件与档案管理规划(RAMP)”调研报告指出,电子文件鉴定时除了应分析电子文件的内容外,还应从文件的记录方式和载体性质出发对电子文件进行技术鉴定[12]35。
内容分析可以从与主题的关联性、信息的紧迫性、信息源的权
威性等角度入手,以达到信息过滤的目的[13]。
由于大部分档案工作者对于新兴的信息技术并不熟悉,承担技术鉴定工作有一定的难度,由此导致了将技术人员引进鉴定队伍中的做法,如美国国家档案馆将技术鉴定工作交给了电子文件中心来做[12]36。
国内研究学者主要对社交媒体信息的内容鉴定提出了一些见解,包括鉴定主体、鉴定原则、鉴定标准等方面。
万凯莉认为社交媒体档案鉴定主体应由社交媒体用户、档案部门和档案工作者、社交媒体平台及其技术人员、第三方技术公司及其技术人员共同承担[14]62。
曹文译指出在社交媒体鉴定时应注意以下几个问题[15]20:①运用来源原则保持信息间的历史联系;
②运用档案真实性的辩证立场对待虚假信息;③运用前端控制思想保证信息凭证价值。
在社交媒体信息的真伪问题上,万凯莉也提出了强调信息价值、弱化信息真伪的观点,同时建议按照社交媒体信息的来源和反映的事件、主题制定相应的鉴定标准[14]63。
此外,周文泓强调了个人档案鉴定标准需个性化与普适性相结合[16]116。
4.社交媒体信息的归档研究。
国外档案机构对于其社交媒体文件存档规则和流程已出台一系列政策指南,例如美国得克萨斯州信息资源部颁布的《社交媒体指南》,加拿大颁布的《元数据框架及资源发现》、《数字出版物的资源著录、政策和建议》等,通过具体的政策对新型档案的归档工作提供指导。
例如NARA在2010年10月发布的《web2.0/社交媒体平台管理指南》,从对美国联邦档案的归档范围提出建议,通过以下五个方面判定社交媒体上的信息是否应归为联邦机构的档案:①信息是否是唯一的并且没有其他获取渠道;②是否包含一个机构的政策、业务或任务等信息;③此社交媒体工具是否被用于该机构的工作;④该机构是否有此社交工具的使用授权;⑤是否包含业务需求信息。
社交媒体运营商也在积极地探索如何归档个人社交媒体信息,以及构建用户个人社交媒体档案库以提供利用,如Twitter证实已经推出推文归档下载功能,用户可以通过该功能下载本人账户所有的推文记录。
Marshall C C和Shipman F M从社交媒体的内容特征、技术能力、用户隐私、合法权利等不同角度探寻了制度化的社交媒体归档工作,并提出应加强对系统和社交媒体资源背景信息的管理和控制,着眼于系统设置和元数据著录规则设定[17]1。
在归档方式上,澳大利亚图书馆使用数字归档系统PANDAS对采集到的社交媒体信息进行自动归档,用以减轻档案人员的工作量和主观因素带来的影响。
5.社交媒体档案的管理研究。
社交媒体档案的管理要考虑管理方式的转型和变革,考虑到社交媒体档案内容鉴定的复杂性、信息源的广泛性、数据结构的复杂性、信息的交互性和变化性、信息参差不齐性的特点[18]74,因此不能套用传统档案的管理方式对新型档案进行管理。
周文泓提出的基本管理要求包括保证社交媒体档案的原始性、真实性、完整性、可靠性、有用性、安全性、可信性[19]84。
社交媒体信息因为平台限制,信息通常是碎片化的非结构化信息,通过聚合才能最大限度发挥其功能和价值,需要对已收集到资源进行整合和挖掘。
Cheong M和Lee V C提供智能数据挖掘、可视化和过滤的方法对采集到的社交媒体数据进行整理[20]45。
Thomson S D和Kilbride W认为可与社交媒体平台协商合作,共享其信息资源管理的工具、技术和方法[21]261。
国外档案馆体制主要分集中式和分散式两种类型,美国对社交媒体文件的归档由各个联邦机构自行完成,NARA负责制定规则与监管,并负责保存各机构移交的需要永久保存的政务社交媒体文件,属于分散式的社交媒体管理体制[11]100。
而英国国家档案馆统一对社交媒体档案进行管理,是典型的集中式管理模式。
王良辰在新时期档案服务模式上提出了应构建中国公共档案资源云共享,作为档案服务能力的新探索,提高公共服务能力,从而对社会各方面发挥更强的影响力和更大的贡献率[5]9。
这再一次涉及各档案馆、机构、组织之间合作与共享的问题,如何将分散的社交媒体档案资源集中起来。
6.社交媒体档案的利用研究。
归档和管理社交媒体文件的最终目的在于未来存在信息需求时能提供利用。
Maynard D从情感分析的角度认为,个人社交媒体文件掺杂了不合语法的文本、不文明用语或者讽刺性语言,通过对已有信息的挖掘,能帮助解决歧义并提供更多的情感方面潜在信息[22]。
Woodford D认为评估有价值的社交媒体档案资源,能够给参与预测市场的人员提供情报优势[13]。
比如运动员赛前在社交媒体上透露的伤痛、情绪给未来的比赛结果带来的影响。
基于社交媒体互动和分享的特点,Thomson S D和Kilbride W提出利用社交媒体档案可以追踪用户之间潜在的关系[21]263。
(1)政府机构社交媒体档案的利用。
政府机构通过社交媒体发布政府部门制定的政策方针、最新的工作动态、征求民众的意见和建议等。
这些政务信息往往带有明确的政策或指令,是民众维护自身权益、进行监督的有效凭证。
政务社交媒体档案是日后查考、研究、争辩、处理问题的重要依据,可用于解决纠纷、维护自身权益[23]27。
(2)企业、机构等组织社交媒体档案的利用。
企业利用社交媒体展示企业活动策划或提供有趣的资讯,增强与消费者之间的互动与联系,社交媒体平台甚至能够记录新兴企业整个发展历史。
企业社交媒体档案亦可作为企业竞争情报,为决策人员提供判断依据。
Madhava R从法律诉讼和监管听证的凭证性角度论述企业、机构等组织保存社交媒体信息的价值和意义[24]45。
日前,最高人民法院、最高人民检察院、公安部联合下发《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》,明确了网页、博客、微博客、朋友圈、贴吧、网盘等网络平台发布的信息属于电子数据[25]。
这说明社交媒体档案可作为证据被利用。
(3)个人社交媒体档案的利用。
社交媒体个人用户一般利用社交媒体平台抒写个人生活历程、发表个人观点、反映个人意识[26]57。
IBM研究人员表示,仅仅分析大约200条具有实质内容的微博,就可以勾画出该用户的个性。
Zhao X等学者认为随着时间的推移,社交媒体可能会成为一个具有重要意义的个人档案库[27]2431。
对个人社交媒体信息进行选择、保存、管理的目的是建立完善的查询机制,并在日后提供可靠的参考信息。
三、总结与展望
纵观现有研究成果可发现,目前国内外均对社交媒体信息档案化的重要性和必要性持统一意见。
从社交媒体平台经常能够发现实时事件的第一目击者提供的第一手资料,这是对社会生活最原始、最直接的反映,不仅可以揭示当代政治、经济、文化和社会等方面的主题以及预测
未来发展趋势、动态,还能够作为历史资料的原始凭证,具有科学研究价值和潜在经济价值,政府机构、企业组织,甚至个人都有必要归档其社交媒体信息。
从档案采集的方式来看,主题采集方式可充分调动群众参与档案工作的积极性,但对用户所提交内容的真实性、完整性、可靠性还需要一定考量。
按发布者采集社交媒体信息则是更符合逻辑思维且容易收集的一种方式,但在信息资源内容聚集上又存在一定缺陷,可按照具体情况选择不同的采集方式,或将两种采集方式相结合达到最佳采集效果。
当前关于社交媒体的研究集中于对微博、微信等典型媒体,博客、论坛等社交媒体是否需要进行归档保存,其是否适应于微博、微信的研究方案也需要考量。
1.社交媒体信息资源管理研究的难点。
(1)可信性。
传统档案作为一种权威与核心的信息资源,新时代的社交媒体档案也应具备这种能力。
但当下社交媒体平台参与门槛较低,用户的言论较为自由,用户实名认证机制还没有完全普及,导致了大量虚假信息在社交媒体平台传播,为公众获得有效信息造成一定困惑,甚至可能会造成危害,如何保证社交媒体档案的可信度是值得我们思考的问题。
一般来说,经社交媒体平台官方认证的机构和组织所发布的信息相对更为可靠,其中以政务媒体为代表,因其言论受政府宣传部门的监督与管理。
因此在收集社交媒体信息之前,收集人员应先对收集对象进行慎重选择,确认其内容的真实有效性,这是保证可信度的第一步。
在社交媒体数据采集完成之后,需要档案人员对其进行选择和鉴定,利用一定的技术检测手段,如果发现数据遭到篡改、伪造或者无法确定真伪的社交媒体信息不应归档。
社交媒体平台生成消息的来源和渠道有时并不是很明确,致使社交媒体信息作为档案时的完整性和可信性方面存在一定问题和缺陷,因此不是所有信息都值得归档与保存,应对其进行合理的筛选后再进行后续整理。
对社交媒体信息可提供三种处理方式:①作为档案保存:对可信度和完整度十分明确的社交媒体信息,比如经过官方平台认证的微博和微信公众号所发布的信息,其信息可以追溯到具体的发布者和发布渠道,可初步筛选为可归档信息,经判断能在今后具有利用价值的这类信息可作为档案进行归档和整理;②作为资料保存:对目前信息的来源和发布渠道尚不被认可且存有疑问的社交媒体信息,不具有作为凭证的功能,但并不排除信息在今后调查中具有的真实性与可靠性,为防止遗漏信息带来的失误,这类信息应作为资料进行保存;③直接舍弃:对于显而易见的广告信息、乱码信息、垃圾信息等错误信息,认定其不具有保存价值,则可直接舍弃。
(2)价值性。
社交媒体档案的价值性判断应不同于以往档案,这是因为社交媒体信息的形成者存在差别。
除了政府、企业等机构的信息资源,社交媒体个人信息也被纳入档案管理。
社交媒体上的个人用户一般分为知名人士和普通民众。
一般来说,知名人士的社交言论信息更具有权威性和影响性,能代表时代发声,价值性相对较高。
而普通民众则在社交媒体发表自己生活动态的个人信息,这些信息对记录自身发展也具有意义,不能说毫无价值。
关于个人信息的价值判断应集思广益,参考更多人的意见,制定大众能普遍认同的标准。
(3)归档范围。
从宏观层面讲,为确保信息内容的完整性,政府机构、企事业单位,甚至个人在社交媒体平台生成的信息都值得保存,但考虑到目前资金、技术、能力等方面的问题,其归档的范围应适当缩小,以更多的精力去保存对国家和社会更具有参考意义的信息资源。
从微观层面讲,社交媒体信息的归档范围缺少详细的规则,比如社交媒体信息包含的类型、社交的相关评论是否应被归档,这些问题都应被考虑。
2.社交媒体档案未来的研究展望。
对于社交媒体档案在未来的研究,应在以下几个方面进行考虑。
(1)政策法规的制定。
目前国内没能展开社交媒体档案化工作的原因之一,就是没有社交媒体档案相应的法规与政策,在具体的归档规则和流程上也没有专门机构监督和指导。
如果社交媒体档案各方对于档案化标准不统一,会给日后归档和管理带来阻碍,利用也会存在困难。
因此应尽快制定适合我国国情政策的社交媒体档案方面的政策法规,从采集、归档、管理、利用等方面给予指导。
这是社交媒体档案化中十分重要的环节,有利于明确社交媒体档案的责任各方,为各方协同配合提供专业性指导,从而将社交媒体档案化工作真正提上日程。
(2)技术的提升和人员的配合。
传统的纸质档案一般是由官方档案部门负责归档和管理的,新时期的社交媒体档案不仅数量庞大、类型多样、结构复杂,而且需要新的技术和设备进行管理,单靠档案部门的一己之力恐难以胜任,需要社会各方的参与和支持。
官方档案部门应培训档案人员运用新技术的能力,使之能在新条件下适应新型档案的管理;商业机构具有平台、资源、技术等方面的优势,社交媒体既是平台提供商,供用户发布与分享信息,又与用户共同构成信息管理者,有监控和管理社交言论的职责,参与协作档案管理必能事半功倍;学术机构和研究者可按照国内实际情况分析和解决社交媒体档案管理的流程问题;公众是社交媒体档案的形成者和传播者,若他们能有意识地对社交媒体信息进行规范和整理,档案管理会更加容易。
目前,国内社交媒体档案的管理处于探索阶段,没有具体的实践项目,官方档案机构、商业机构、公益机构和公众的参与度不高,且各方均有自己的职能和需求,如何从行政、经济、文化等不同方面平衡各方利益使各方相互协作,仍然是需要思考的问题。
(3)公民大众的参与。
社交媒体档案主要是由社交媒体用户共同创造的信息资源,应该让公民也参与到新型档案的管理环节中来。
公民作为社交媒体档案的形成者和传播者,如果能在信息产生的源头就进行前端控制,对于后续的管理和利用将会更为有利。
这需要培养公民大众的档案意识,规范其发布的言论和传播的内容。
如何使公民主动参与到社交媒体信息档案化的过程中来,需要我们继续探讨。
四、结语
社交媒体档案利用文字、图片、音频、视频等多种记录手段,能够更好地还原真相、记录历史,将成为未来档案构成的重要部分。
尽管目前国内社交媒体档案研究已取得一定成果,但各项具体归档和管理工作还不成熟。
档案部门应合理借鉴国外已有的理论和实践成果,并结合国内档案工作的实情,参考国内研究人员的管理意见和建议,积极开展相关档案研究工作。
笔。