大数据时代下软件工程关键技术分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据时代下软件工程关键技术分析

作者:王符伟

来源:《电子技术与软件工程》2015年第23期

摘要随着社会经济和科学技术的不断发展,我国已经开始进入大数据时代。对信息的处理和掌控能力是国家是否强大的标志之一。大数据下不仅需要描述大量的数据,还对数据的处理速度提出了更高的要求。本文对大数据时代下的软件工程关键技术进行了分析,旨在促进我国软件工程领域的发展,提高我国综合国力。

【关键词】大数据软件工程关键技术

随着我国计算机技术的不断发展,软件的作用越来越广泛,从计算、存储到整个IT环境,在硬件平台的基础上,越来越多的功能是通过软件实现的。大数据时代是人类社会发展的必然途径,是在人们适应和改造世界过程中的产物,是人们生产生活在网络上的投影。因此,在进行软件设计时,必须要考虑到大数据时代的整体背景。软件的发展是一个不断进步的过程,传统的结构化信息资源已经逐渐淘汰,对信息处理的要求越来越高,逐渐和网络结合在一起。

1 大数据时代下的软件工程服务工程和群体软件工程

在软件工程的发挥在那中,近几年来面向服务的软件工程越来越多,即软件服务工程。以服务为建设的基本原则,根据实际需要进行变化,通过分布式的应用和互操作性虚拟化管理对对软件工程进行维护。通过这种方式,能够有效将网络中的软件虚拟化,强调互操作性,解决分布、动态变化情境下和异构环境下数据,解决的系统集成和协作的问题。在多个新兴领域中得到广泛的应用,例如云计算、移动互联网、大数据等。

随着网络化、服务化的大环境,软件开发也逐渐变得开放,通过信息共享、学术交流,进行协同开发合作,在用户评价的基础上建设性价比较高的软件。其中,开源软件是目前较为成功的软件习作模式。因此,开源社区中的合作模式、结构等,也是学术界的研究重点。但是,常规的研究方法并没有较大的突破,一些学者开始使用社会网的方法对数据进行分析。发现在一些规模较大的项目中,开发组的结构逐渐从核心成员趋向外围开发者,并产生了更多模块化的特征。

除了开源软件具备一定的典型性之外,群体软件工程中更提倡的是建立在众包基础上的开发方式。众包是一种分布式的解决方式和生产模式,无论是开源软件还是其他的商业软件都可以通过网络进行责任分配、提出创意或解决问题等。因此,在进行软件设计时,无论哪个阶段,都可以通过众包的方式对重难点问题进行分析。

2 众包软件服务工程中的大数据

在软件服务工程中会产生大量的密集型数据,包括历史密集型数据和流式密集型数据。目前国际上已经有很多学者在关注众包软件服务工程中出现的密集型数据和流式数据,尤其是在线服务。如何将密集型数据的分析、价值、平台、基础设施等作为服务,是目前大数据时代背景下软件服务工程的核心问题。从众包软件服务工程来看,不管是服务消费方、众包服务开发提供方,还是平台管理和运营方,都有着离线密集型数据和在线的流式密集型数据。这些数据的传输直接决定了软件的服务寿命,和众包软件能否进行良好的开发协作、正常运行管理有着重要的关系。这些密集型数据,本质上仅仅对内容的数量进行了描述,但是并没有标注出内容的特点,缺少语义化单位矢量。因此在对密集型数据进行分析时,不仅仅要对原生数据进行分析,还要对密集型数据的主体——数据所属领域的专家进行分析。以知识为核心,对密集型数据进行分析,保证软件服务的寿命。

3 密集型数据科研第四范式

在2007年,吉姆·葛雷提出了数据密集型科研发现“第四范式”的愿景。提出在进行密集数据的研究时,要建立统一的理论和研究方法,强调了大数据存储在计算机发展中的重要性。在实践研究中,传统的一、二、三范式的研究方法难以对密集型数据进行有效的分析,目前大多数的软件也无法在短时间内将这些信息进行有效的存储、管理为有效的服务信息。我国有学者在2012年,在进行大数据方面的研究时,不能仅仅局限在计算机模拟,即第三范式中。要建立独立的科研第四范式对密集型数据进行研究。其主要原因是密集型数据所需的研究方式和传统的研究方式有较大的区别,不仅要在研究方式上进行转变,还要转变思维模式。在进行研究时,首先要建立科学、完整的第四范式,当有了完整、统一的理论体系之后再逐步转变为第三范式。因此,在进行大数据的研究时,首先要确认第四范式的方法以及结构,并对存在的关键性问题进行分析。

在对第四范式进行研究建设时,首先要对大数据整合驱动的软件服务价值进行分析。在对密集型数据进分析时,传统的数据生命期信息学流程已经难以适用,无法对大数据进行有效的模拟。要由原本的数据、信息、模型、模拟推演的过程逐渐转变为数据、信息、知识、价值服务、策略意义的第四范式模型。在全新的研究模式中,要对数据整合驱动、需求度量价值、情境约束等进行分析。其中,知识及价值服务是整个研究的基础和重点,要针对密集型数据整合服务领域,对密集型数据将的处理、管理、分析、应用等多个方面进行研究,建立统一的理论体系和研究方法,提高密集型数据生命期信息学流程驱动软件的服务生命期,对目前第四范式建立存在的问题进行针对性的解决,适应大数据时代的发展。

4 结语

在大数据时代下,软件工程的发展涉及到多个领域,需要具备高度的专业性和实践性。在软件工程中,要在实践中进行研究,而不是在研究中进行实践,核心在于如何对传统的软件理论进行创新突破。在其中就涉及到有关大数据第四范式的理论和研究方法的问题,如何将其和第一、二、三范式的理论、算法、技术标准等进行融合。大数据在最初提出时具备三种特征:体量、增速和多样。随着时代的不断发展,大数据的特征也越来越多,如价值、真伪性、可证

性、可变性等,对软件工程的发展有着重要的影响。在软件工程的研究中,要不断的创新传统的软件技术,解决限制软件工程发展的客观条件,结合互联网的发展,对大数据时代下的密集型数据进行有效的处理,促进行业发展。

参考文献

[1]韩晶.大数据服务若干关键技术研究[D].北京邮电大学,2013.

[2]吴月红.分析软件工程化的基本形式和关键技术[J].电子技术与软件工程,2015,11:52-53.

作者简介

王符伟(1980-),男,大学本科学历。现为内蒙古鄂尔多斯市符尔锡科技信息有限公司工程师。研究的方向为软件工程。

作者单位

内蒙古鄂尔多斯市符尔锡科技信息有限公司内蒙古自治区鄂尔多斯市 017000

相关文档
最新文档