大数据时代的社会科学研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据时代的社会科学研究

摘要:大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在数据中的模式、趋势和相关性,揭示社会现象与预知社会发展规律,需要我们拥有更好的数据洞察力。社交网络、移动互联网和物联网的兴起为社会科学研究提供了新的科学发展观和方法论。大数据对社会生活、媒介生态和商业带来机遇与挑战是颠覆性的,大数据同时带来了社会科学研究的春天,我们必须拥抱大数据,拓展射虎科学研究新疆界,勇于创新,迎接挑战。

关键词:大数据、社会科学研究、影响

社会科学是在近代以来逐渐形成的,它以社会现象为研究对象,力求揭示社会生活的本质和发展规律,对社会生活做出科学的说明与合理的评价。人类文明的进步为社会科学的发展提供了前提条件,而社会科学的发展又为人类文明的进步提供了思想指导。社会科学研究通过对社会历史的回溯与反思,对现实社会的批判与构建,力求提升社会的自我认识能力,使人类文明发展行进在正确的方向和轨道上。

马克思主义社会科学方法论是在实践基础上的辩证的、唯物的方法论,是批判地继承了以往优秀学说的新产物,有其重要的理论和实践作用,开创了科学认识人类社会的新路径。马克思主义社会科学方法论是从马克思主义学说中提炼出来的,以辩证唯物主义和历史唯物主义为根本方法。

近年来,信息技术的快速发展,特别是信息获取技术、物理信息系统、互联网、物联网、社交网络等技术的突飞猛进,引发了数据规模的爆炸式增长,大数据已经普遍存在,能源、制造业、交通运输业、服务业、科教文化、医疗卫生等领域都积累了TB级、PB级乃至EB级的大数据,这些数据已经开始造福于人类,成为信息社会的重要财富。大数据蕴含着巨大的价值,对社会、经济、科学研究等各个方面都具有重要的战略意义,为人们更深入地感知、认识和控制物理世界提供了前所未有的丰富信息,为社会研究提供了更广阔的发展空间。

一、大数据的定义与特点

1、大数据的定义

当今社会,数据量正在以爆炸方式迅猛增长,数据表示形式千变万化,标志着我们已经进入了大数据时代。云计算、三网融合、物联网、移动互联网的出现,更加催生了大数据时代的产生。维基百科对大数据的定义是:数据增长如此之快,以至于难以使用现有的数据库管理工具进行快速的数据获取、存储、搜索、共享、分析和可视化等操作,这些数据量是如此之大,已经不是以传统的GB和TB为单位来衡量,而是以PB(1PB=1024TB)、EB(1EB=1024PB),甚至是以ZB(1ZB=1024EB)、YB(1YB=1024ZB)为计量单位,所以称之为大数据。

2、大数据的特点

(1)“多带来不同”

大数据具有最显著特征之一就是多带来不同。传统的思维方式更倾向于线性思维,线性的就是直线的,直线的就是简单的因果关系。我们已经进入一个复杂科学领域,随着云计算、云存储、物联网、二维码技术和LBS(基于位置的服务)的互联网技术广泛应用,人类的各种社会互动、沟通设备、社交网络和传感器正在生成海量数据。商业自动化导致海量数据存储,但用于决策的有效信息又隐藏在数据中,如何从数据中发现知识,以数据挖掘为代表的大数据分析技术应运而生。

(2)重发现非实证

传统的实证研究,强调在理论的前提下建立假设,收集数据,证伪理论的适用性,采用随机抽样的定量调查问卷获取数据,验证假设。这是一种自上而下的决策和思维过程。大数据时代的社会科学研究重在发现知识,预知未来,为探索未知的社会现象带来机遇。这种预见性是一种自下而上的知识发现过程,是在没有理论假设的前提下去预知社会和洞察商业趋势、规律。

(3)重关系非因果

大数据重关系而不关心因果,问什么而不问为什么是另一个重要特征。因果关系并非来自统计,而是来自研究者的理论和假设。但是大数据分析更关注数据的相关性测量和商业应用价值。大数据是发现那些不能靠直觉发现的信息和知识,甚至是违背直觉的,有时候越是出乎意料可能越有商业价值。

(4)重全体轻抽样

大数据是商业自动化存储的数据,在软硬件满足的条件下可以分析海量数据。随着存储和软硬件的经济性和工具的先进,海量数据的处理能力得到提升,数据挖掘算法不断改进和丰富,特别是统计分析和机器学习的神经网络建模技术发展,抽样并非是必要的手段和方法论。尽管大数据不一定是总体,理论上讲再大的局部也没有随机抽样更具代表性,但是大数据分析技术也需要抽样,随机抽样和过度抽样也是必要的建模过程和方法论。

二、大数据对社会科学研究的影响

1、大数据对社会科学研究的积极影响

(1)提高预测和决策的准确率

凯恩斯与哈耶克的市场与政府之争是20世纪经济学界最为重要的论战之一。这两位经济学家在理论和政策主张上的差异,深刻影响了20世纪各国经济政策制定和改革。比如,在20世纪早期,哈耶克的自由市场理念一度占据支配地位。二战后到20世纪70年代凯恩斯主义的政府干预政策更多地被采纳。在哈耶克批评计划经济的非可行性和低效率过程中,一个立足点就是“有限理性”:哈耶克从认识论角度提出计划制定者无法了解经济运行中每一个阶段的最终均衡状态。这种

经济运行过程中信息的瞬息万变,会导致不可能建立全能式的生产、决策和分配等。

不过,大数据的出现有可能对“有限理性”的观点形成新的挑战。尽管目前大数据并不能实时提供市场运行中的全部信息,但大数据的方向和现代信息技术的指数式增长,有可能为哈耶克的论敌以及凯恩斯主义者提供新的反驳证据:当未来大数据对市场运行中的信息捕捉达到了空前的覆盖和密度,那么预测和决策就有了比哈耶克时代甚至当代高得多的准确率。

(2)拓展社会科学经典理论的验证空间

大数据作为一种全新的资料,以其超越传统调查数据的样本量和时间跨度,为社会科学经典理论的验证和拓展提供了更多空间。因此,大数据在延伸和重新检视经典学说方面有着相当大的潜力。比如说,经典时期的社会学家以其深刻的洞察力为人们留下了丰富的理论遗产,不过由于理论的宏观性和复杂性,通过传统的截面数据、面板数据等抽样样本的分析,无法在经验层次上对这些理论进行检验。而大数据的出现为当今的社会科学界提供了前所未有的大跨度范围的社会数据、资料和信息,使得重新审视和延伸经典理论,尤其是宏观理论成为可能。

(3)或缓解定量与定性之间的分歧

定量研究与定性研究是两种不同取向的研究策略,其背后蕴含着本体论、认识论和方法论上的差异。定量研究者和定性研究者常常相互指责对方的局限性,然而大数据的出现为他们提供的数据规模和全新的数据特征,在某种程度上可能会缓解分歧,甚至重构两者的关系。对定性研究者而言,大数据可以通过海量规模的样本直接展示和发现出社会现象的规律,既不需要控制变量来检验关联,更避免了定性方法在案例选择方面的样本偏差。对于定量研究者而言,目前的可用大数据往往并非专门为回归分析而设计,因此依据大数据很难进行传统意义上的回归分析和因果推断。但由于数据的海量甚至全样本的性质,一旦把基于大数据的简单关联分析或时间序列分析结果与文献中的传统回归分析进行比对,就能形成具有说服力的证据链。

(4)为学科融合提供机遇

近代科学在理性化的指引下不断提升专业化程度,以至于不同学科之间形成了鲜明的边界。尽管这种进程大大提高了研究效率和学术领域内的交流评估质量,但也逐渐形成了各自为政的不足。研究者在获得相当的深度的同时,往往失去了对广度的把握,并且学科边界之间形成了许多空白地带。而大数据则为学科融合提供了难得的机遇。这主要是因为,大数据的获取和分析,往往需要有别于传统社会科学训练的方法和工具。这使得原本在计算机、人工智能甚至物理、数学等领域具有专长的学者,在有意无意中不断参与到社会现象的分析队伍中来。

相关文档
最新文档