浅谈大数据时代的三大悖论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈大数据时代的三大悖论
【摘要】大数据时代正在来临,它深刻改变着我们的政治、经济和社会生活的样态。大数据的支持者们用最美好的言辞描述着大数据时代的光明图景。但对大数据的狂热进行冷静和批判性反思非常有助于大数据美好蓝图的实现,同时坚守我们社会的核心价值。其中大数据时代的三大悖论值得我们认真反思,因为任何科技的进步都是一把双刃剑。
【关键词】大数据;透明化悖论;身份悖论;权力悖论
一、引言
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡公司,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”①大数据作为云计算、物联网之后信息技术行业又一大颠覆性的技术革命。
大数据的热情支持者们认为,大数据分析能力强大,可以为解决许多社会问题提供全新路径;而且以大数据为基础的决策过程能够给我们做出更准确的预测,如大学招生、企业用工,甚至于情人约会。它还能帮助我们更好地保护珍贵资源、文化遗产和帮助治疗致命性疾病,从而使我们的生活变得更加安全高效。在他们看来,大数据的用途不仅局限于大型机构,随着智能手机普及,手机和可携带传感器能够收集个人信息,让“数据化自我”成为可能,为改善睡眠质量和提高健康水平提供保证。最新研究表明,对于个人信息的搜集,如在美国进行的大规模电话窃听计划,这些大数据还可以使我们预防恐怖主义袭击。
瑞克·斯莫伦在《大数据时代的人类面孔》一书中开宗明义,非常肯定的指出:“大数据是一场非同寻常的知识革命,它悄无声息、范围广大,涉及商业、学术、管理、医疗和日常生活等领域。……地球上每一个有生命和无生命的物体不久都将数字化,包括我们的家园、汽车还有我们的身体。”②从这个信誓旦旦的宣言中,让我们不仅看到了大数据的光明前景,还让我们隐约感受到了它的潜在危险。然而,迄今为止,对于大数据的论述耽于溢美之词,然而对它的潜在危险并没有太多有意义的分析。所以,让我们静下心来以更加理性的批判思维来考察一下大数据是十分必要的。
我们尤其想在当下对大数据溢美之词甚嚣尘上的气氛中去强调大数据的三大悖论,以便帮助我们更彻底的理解大数据的未来景观。首先是大数据时代,信息透明化要求与搜集信息秘密进行之间的悖论,我们称之为“透明化悖论”;其次,大数据需要识别个人身份,而识别个人身份需要牺牲个人或者群体的身份隐私,我们称之为“身份悖论”;第三,大数据是改造社会的强大力量,这种力量的发挥是以牺牲个人权利,而让社会中各大权力实体独享特权,我们称之为“权力悖论”。
认清大数据时代危险与潜力相随的悖论,将帮助我们更好的理解这一伟大的信息化社会变革。它也能够使我们去构思解决这些悖论的最佳方案,使得大数据拥护者们所预言的美好的未来真正成为现实。
二、大数据时代的三大悖论
(一)透明化悖论
大数据分析是建立在小数据输入基础之上的,它们可以为传感器、手机、甚至于电脑键盘的点击模式所搜集。这些小的数据聚集起来就组成了大的数据组,分析技术可从中寻求洞见和启迪。然而数据搜集是在悄悄进行的,而且在不断加剧。在未来从“物联网”到“万物互联”,思科公司预计:截至2020年将有370亿智能设备与互联网连接。这些设备和传感器驱动着指数级增长的移动数据流;2012年的数据流量和2000年相比,几乎翻了12倍。高度安全的数据中心将这些数据集存放在高效能、低成本的设备中,能够实时或近于实时的数据分析。
然而,这里就出现了透明化悖论。大数据承诺应用数据将使世界变得更加透明,但数据的搜集却是在悄悄进行的,而且数据搜集技术和工具也是不见光的,隐藏在物理的、法律的和秘密技术的层层保护之下。如果大数据招致了个人隐私的终结,那么,大数据革命还有什么必要再秘密中进行呢!
(二)身份悖论
大数据的目标是致力于身份识别,但它也威胁着个体身份。这就是身份悖论。我们都本能的渴望对我们的个体身份进行控制。然而,隐私的重要权利来自于个人的独处权,身份的权利来源自由选择我们是谁的权利,也就是界定“我是谁”的权利。我就是我,我无名无姓,我就在那儿或这儿存在着,我观看、我购物、我是个支持者、我是个评论家、我在投票、我在放弃、我反对、我赞成、我喜欢、我不喜欢、我是来自国外的永久性居民、我是个中国市民等。
那么,我们的身份权利即我们说“我是我自己”的权利在大数据时代的状况会是如何呢?即使对大数据库的基本接入,如电话记录、上网记录、上网史、购物史、网络社交网贴等,诸如“我是”和“我喜欢”恐怕也会成为“你是”和“你喜欢”。每一个百度用户已经被来自于百度定制的搜索结果数据库“输入—反馈”系统所影响。安德鲁·雷纳德在他的文章“奈飞公司是如何把观众变成木偶的?”一文中,做了如下阐释:“知道如何从数据中产生情报的企业了解我们胜过我们自己了解自己。而且,如果我们无依无靠的话,将会精巧地使用工具推动我们向他们所期望的方向走,而不是走向我们想要去的地方。”③由于现在并没有发展大数据的身份保护,“你是”和“你喜欢”恐怕要变成“你不能”和“你不会喜欢”。大数据因此是运用信息去推动、去劝说、去影响个人,甚至去限制我们的身份。
对个人和集体身份的如此影响是冒着腐蚀我们社会的核心价值和活力的风险。如果我们缺乏每个人都能说“我是谁”的权利,如果非人格化的建议暗中破坏着我们的智力选择,我们将被识别,但却失去了我们的身份,这种身份是我们过
去所界定和珍视的。
(三)权力悖论
权力塑造着我们的身份,这就产生了大数据的第三个悖论。大数据常被奉为力量强大的工具,能够使它的使用者把这个世界图景看得更清晰、更透彻。例如,许多阿拉伯春天抗议者和评论员赞颂社交媒体,因为它的帮助下抗议者组织起了。但是,大数据的传感器和大数据库主要掌握在强力的机构手中,而不是在不同的个人手中。这就是权力悖论。大数据将会产生赢家和输家,但大数据利益的天平倾向于拥有对个体拥有控制权的机构,他们被发掘、被分析、被分类。如果不了解什么是恰当的法律边界和技术边界,每一方都将处在被猜测的状态中。一方面个体会因屈服而否认;另一方面会因政府和公司机构违约而侥幸成功,但一旦丑闻曝露于众,他们就会摇摇欲坠,自食其果。其结果不但让人心神不定,而且会带来社会混乱,对任何方面都不利:个人的权利受到侵蚀,我们社会的核心价值受到削弱。