大数据与宏观经济分析研究综述_刘涛雄
大数据时代与社会科学研究范式变革
开展的研究得以开展,同时也带来新的挑战。大数据 可揭示一切问题,理论变得可有可无。这一观点撼动
其量之大超出一般传统统计软件所能处理的范围, 了不少社会科学研究者,使他们开始憧憬“传统方法
而且解释变量增加会导致高维数据中的“维数灾 的终结”。此外,不少研究者至今仍然认为大数据虽
难”,解决这些问题需要新的分析方法和工具。三是 然不是绝对精确,但由于数据量极大,所以误差必然
〔收稿日期〕2017-09-10 〔基金项目〕国家社会科学基金重大项目“基于大数据的中国宏观经济景气衡量方法研究”(16ZDA008),负责人刘涛雄。 〔作者简介〕刘涛雄(1973-),男,湖北崇阳人,清华大学社会科学学院教授、博士生导师,主要研究方向为宏观经济、大数据
经济分析、产业经济等。 尹德才(1982-),男,山东临沂人,清华大学社会科学学院博士后,主要研究方向为宏观经济、大数据。
析人员和技术实践者对大数据有不同的定义。从狭 所带来的无意的或未经设计的结果。”〔5〕7 各种社会
义上讲,大数据是指数据量的大小超过了传统意义 现象可视为已发生的不可控试验,其背后存在某种
上的尺度,一般的工具难以进行捕捉、存储、管理和 潜在的本质规律或因果关系。考虑到因果联系的普
分析。〔1〕该定义仅仅描述了大数据的“大”,没有涉及 遍性和复杂性,数据作为对不可控试验的特殊描述
改进加快了大数据的处理速度。社会科学研究如何 具有理论意义和理论突破的研究,小数据可能比大
吸收和利用这些强大的技术手段,使之成为社会科 数据更适合〔9〕。另外,很多时候我们采集到的大数据
学家工具箱中的利器是未来社会科学家们必须面对 并非真正的全样本数据,它可能是总体中某一部分
的问题。〔 4〕
的数据,比如就互联网上的在线数据而言,网民并不
基于大数据技术的宏观经济分析
基于大数据技术的宏观经济分析随着信息技术的不断发展,大数据技术已经在许多领域得到应用。
它的应用对于宏观经济分析来说也是很重要的,因为这种技术可以帮助我们更好地理解和预测经济变化。
本文将介绍一些基于大数据技术的宏观经济分析方法及其应用。
一、宏观经济模型的构建宏观经济模型是一种用来预测经济变化的工具。
这些模型通常基于经济学理论,可以用来分析货币、物价、就业等各种经济指标。
最近,大数据技术已经开始被应用到宏观经济模型的构建中,以解决传统方法中存在的某些问题。
例如,基于大数据技术的宏观经济模型可以考虑更多的因素,比如社交媒体、电子商务和搜索引擎等,这可能会导致更精准的预测结果。
同时,这种模型还可以更好地处理经济变化的不确定性,因为它可以更快地获取和分析新的数据。
二、网络分析网络分析是一种将数据转换为网络结构的技术。
通过这种方法,我们可以更好地理解不同数据之间的联系,并且可以更好地预测宏观经济指标的变化。
例如,我们可以将生产商、供应商和消费者之间的关系转换为一个网络图表,以更好地了解不同企业之间的联系,并理解它们对整个经济体系的影响。
另外,网络分析也可以用于预测企业破产或财务危机。
通过分析经济体系中的人际关系网络,我们可以识别可能出现破产的企业,并监测它们的财务状况。
这种分析方法可能会比传统的财务分析更高效、更准确。
三、情感分析情感分析是一种根据文本数据中的情感内容来判断人们对某一事物的看法和态度的技术。
这种技术在宏观经济分析中也有很多应用。
例如,我们可以分析新闻报道、社交媒体和博客等数据,以评估人们对某个国家、行业或企业的信心水平。
这种方法可以帮助我们更好地预测经济趋势,并提前发现经济危机。
四、时空数据分析时空数据分析涉及到一种基于地理位置信息和时间的数据分析。
通过这种技术,我们可以更好地理解人们的生活方式和行为,并更好地预测市场需求和供应。
这种分析方法可以使用地理信息系统(GIS)工具,以帮助我们更好地理解消费群体的行为,预测他们的需求,更好地布置商业场所的位置,以确保商业场所在目标市场中最具竞争力。
一种基于在线大数据的高频CPI指数的设计及应用
Design and Application of Novel CPI Based on
Online Big Data
作者: 刘涛雄[1,2];汤珂[1,2];姜婷凤[3];仉力[4]
作者机构: [1]清华大学社会科学学院经济学研究所;[2]清华大学创新发展研究院;[3]对外经济贸易大学金融学院;[4]中国社会科学院世界经济与政治研究所
出版物刊名: 数量经济技术经济研究
页码: 81-101页
年卷期: 2019年 第9期
主题词: 在线大数据;iCPI;实时高频指标;宏观现时预测
摘要:在数字经济时代探索如何运用在线大数据编制实时高频物价指标。
研究方法:设计了中国第一套基于互联网在线大数据的居民消费价格指数,从多方面分析指数质量及其应用。
研究发现:在线iCPI可实现各层次类别的日、周、月指数无滞后实时更新;指数数据从采集、清洗到加工和发布均由计算机自动进行,既节省人力又减少人为干预因素;指数在代表一般物价变化、精准捕捉典型事件影响、现时预测通货膨胀、实时监测宏观经济形势等方面表现突出。
研究创新:首次采用在线大数据编制CPI,弥补了中国尚无实时高频物价指标的空白。
研究价值:在线iCPI是传统CPI的有益补充,其编制思维和方法可用到更多高频宏观经济指标的构建上。
基于大数据平台的宏观经济分析
基于大数据平台的宏观经济分析随着信息化、智能化的快速发展,基于大数据平台的宏观经济分析也越来越受到重视。
大数据技术的应用,使得以前很难收集、整理的数据现在可以被快速获取和处理,从而改善了宏观经济分析的可行性和精度。
本文将从大数据平台的构建、数据处理、模型建立三个方面来探讨基于大数据平台的宏观经济分析。
一、大数据平台的构建大数据平台是通过一系列技术手段,对数据进行收集、存储、处理、分析和应用的支撑平台。
要构建一个高效的大数据平台,需要有以下几个关键组件。
首先是数据收集组件。
数据收集组件主要负责采集各种类型的数据,包括结构化和非结构化数据。
结构化数据包括数据库中存储的数据、各种业务系统生成的数据等,而非结构化数据包括社交媒体数据、新闻数据、图片、音频、视频等。
数据收集组件需要具备高效的数据采集能力,快速处理大规模数据的能力,以及与数据源实时交互的能力。
其次是数据存储组件。
数据存储组件负责将采集到的数据持久存储下来,以便后续的数据处理和分析。
此外,数据存储组件还要支持数据的备份和恢复,保证数据的安全性和可靠性。
数据存储组件可以采用关系型数据库、分布式文件系统等多种技术进行搭建。
最后是数据处理和分析组件。
数据处理和分析组件负责对存储在平台中的大数据进行挖掘和分析。
这部分工作涉及到数据清洗、数据统计、数据关联等多种技术手段,并且需要具备较高的计算能力和算法支持。
二、数据处理经济数据在大数据平台中具有多样性和复杂性,因此需要对数据进行有效的处理和加工。
数据的处理流程一般包括以下步骤。
首先是数据清洗。
数据清洗是指对数据中存在的噪声、不完整性、重复性、冲突性等进行清理和去除。
通常需要借助人工审核和算法审核来完成。
数据清洗的目的是保证数据的准确性和完整性。
其次是数据集成。
数据集成是指将来自不同数据源的数据进行整合和融合。
在宏观经济分析中,需要将来自国家统计局、财政部、人力资源和社会保障部等多个部门的数据进行整合,以形成更全面和准确的宏观经济分析报告。
新常态下中国经济增长需警惕哪些风险
新常态下中国经济增长需警惕哪些风险
刘涛雄
【期刊名称】《人民论坛》
【年(卷),期】2016(0)16
【摘要】随着中国经济进入新常态,长期增长速度放缓.长期增长放缓的总背景既会滋生风险,也会导致抗风险能力的下降.经济结构调整进展不畅,创新驱动没有达到预期,以及金融体系的系统性风险、政府债务与财政风险、政策逆转与官员不作为的风险,这些方面是值得高度重视的主要风险来源.
【总页数】3页(P66-68)
【作者】刘涛雄
【作者单位】清华大学经济所
【正文语种】中文
【中图分类】F120
【相关文献】
1.新常态下国企需健全法律风险防范机制r——以杭州市属国企为例
2.经济新常态下需防范风险
3.疫情时期需警惕的网络安全风险及相关启示
4.对产业链转移风险需保持警惕
5.经常心慌?需警惕脑梗风险
因版权原因,仅展示原文概要,查看原文内容请购买。
大数据的经济学研究文献综述
大数据的经济学研究文献综述学院:金融学院班级:13金融学硕姓名:熊美兰摘要:本文从传媒经济本体研究、产业经济学视角下的传媒经济研究、传媒经济研究工具的创新等方面来管窥近年来该领域的主要关注点以及新趋势和新突破,同时关注传媒经济学科体系研究的最新发展。
本年度传媒经济研究主题较为集中,主要是探讨传媒产业的数字化生存、全媒体转型策略与路径。
演化经济学、制度经济学、计算机和通信技术等视角和方法的引人,更加凸显了传媒经济学“跨学科”和“融合”的特征。
关键字:全媒体;三网联合;大数据;云计算;传媒经济学一、引言2012年,Twitter上每天发布超过4亿条微博,Facebook上每天更新的照片超过1000万张,Farecast公司用将近10万亿条价格记录来预测机票价格,准确率高达75%,采用该系统购票,平均每张机票可节省50美元Gartner 预测未来5年全球大数据将会增加8倍,其中80%是非结构化数据2013年世界上存储的数据将达到1.2ZB(1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB),如果将这些数据刻录到CDR只读光盘上,并堆起来,其高度将是地球到月球距离的5倍2011年,麦肯锡公司对全世界大数据的分布作了一个研究和统计,中国2010年新增的数据量约为250PB,而欧洲约为2000PB,美国约为3500PB,大数据已经深深地充斥了人类经济社会的许多角落。
著名未来学家阿尔文托夫勒(1980)[1]很早就在其经典著作《第三次浪潮》中,将大数据热情地赞誉为第三次浪潮的华彩乐章,但是大数据成为高频词是最近一两年的事情。
随着社交网络“物联网”云计算的兴起,数据规模越来越大,2011年5月,全球知名咨询公司麦肯锡(Mckinsey andCompany)发布了《大数据: 创新、竞争和生产力的下一个前沿领域》[2]报告,标志着“大数据”时代的到来,指出数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素; 而人们对于海量数据的运用,将预示着新一波生产率增长和消费者盈余浪潮的到来,2012年世界经济论坛发布了《大数据、大影响》[3]的报告,从金融服务、健康教育农业、医疗等多个领域阐述了大数据给世界经济社会发展带来的机会。
基于大数据的宏观经济分析研究
基于大数据的宏观经济分析研究在当今全球化、信息化的时代,经济发展的速度越来越快,经济变化的幅度也越来越大。
因此,了解和分析宏观经济变化的趋势和规律,对于政府、企业以及个人都至关重要。
随着互联网和移动互联网技术的发展,大数据分析逐渐成为研究宏观经济的有效工具。
本文将探讨基于大数据的宏观经济分析研究的现状和未来发展趋势。
一、大数据在宏观经济分析中的应用大数据分析是指通过各种技术手段,对海量数据进行多维度分析、挖掘和应用。
它能够帮助我们更加全面、准确地了解宏观经济的状况和变化趋势。
目前,大数据在宏观经济分析中已经有了广泛的应用,主要包括以下几个方面。
1. 用大数据分析宏观经济形势宏观经济形势是指一个国家或地区的总体经济状况,它的变化对于政府的宏观调控和企业的战略决策都有着重要的影响。
采集、整合和分析大量的社会经济数据,可以更加客观、准确地反映宏观经济形势,为制定经济政策和战略提供依据。
2. 用大数据分析宏观经济结构宏观经济结构指的是一个国家或地区的经济产业结构、用工结构、消费结构等方面的特征和变化。
通过分析大数据,可以更加深入地了解宏观经济的结构特征和演变趋势,发现不同行业和群体之间的联系和规律,提供更为精准的政策建议和商业决策支持。
3. 用大数据分析宏观经济风险宏观经济风险是指某一时期内宏观经济运行中存在的各种不确定性和潜在的危险因素,如金融风险、环境风险、地缘政治风险等。
通过分析大数据,可以预测和评估宏观经济风险,提前制定应对措施,降低风险对经济运行的不利影响。
二、基于大数据的宏观经济分析面临的挑战尽管大数据分析在宏观经济研究中具有巨大的潜力和优势,但也面临着一些挑战和限制。
1. 原始数据质量不高大数据需要收集和整合大量的原始数据,但是这些数据质量良莠不齐,有些数据可能存在错误或者缺失,或者数据来源不可靠。
因此,对于原始数据的质量控制和处理成为了大数据分析面临的一个问题。
2. 难以建立量化模型相比于传统的统计分析方法,大数据分析更加依赖数据挖掘和机器学习等技术,难以建立精准的量化模型。
基于大数据技术的宏观经济分析应用研究
基于大数据技术的宏观经济分析应用研究当前,计算机和互联网等信息技术正在改变着世界。
借助云计算和大数据方式,生产和生活方式、经济流动和消费过程中的线上交易与资金结算量呈迅猛增长之势。
从目标上看,宏观经济分析旨在通过深入把握和分析研究财政、投资、金融、消费等数据指标,并针对指标变化特点,研判经济发展趋向,预测宏观经济未来,从而为政府提前制定对应经济对策提供参考。
大数据背景下,传统的宏观经济分析方法因其时效性、关联度欠缺而难以满足社会经济发展需求。
而基于大数据技术的宏观经济分析方法,则恰巧弥补了这一不足。
现代信息技术在旅游、农业、医疗、交通等领域的广泛应用,客观上也推动了大数据在宏观经济分析研究工作中的应用,提高了宏观经济分析的参考价值。
一、宏观经济分析中的大数据技术价值大数据以其时效、海量、关联的特性,赋予了宏观经济分析更多元的价值。
(一)基础数据详实而保真宏观经济分析工作对基础数据的依赖性极强,但在实际研究过程中,由于涉及范围广、类别杂、干扰因素多,基础数据的客观全面性和准确度、时效性难以得到保证。
而大数据应用,则是凭借计算机网络技术,把传统人工的方式难以获得的数据信息,在短时间内,科学地搜集、分类、处理具体数据,迎合了宏观经济分析对基础数据的严格要求,对宏观经济分析结果的科学性、有效性、权威性起到了关键作用。
(二)分析手段丰富而有效传统的宏观经济分析,多采用统计分析建模形式,它总体是根据抽取的样本数据开展分析。
虽然样本分析具有一定的实用性,但如果样本或者取样过程出现问题,容易造成分析结果和客观事实之间相互矛盾的问题。
而应用大数据技术,则可以搜集到庞大的基础数据量,通过构建完善的分析模型和引进先进的识别技术,在数据之间关联起共性,进而快速分析研判具体行业行情,为宏观经济分析提供更加准确、科学的建议。
(三)信息关联科学而迅速在海量信息面前,传统的统计分析方式常常束手无策。
而根据实际需求将庞大的数据量进行运算处理和分析,通过特定规则对其进行管理,使碎片化信息之间建立起强大的关联,是大数据技术的特长所在。
大数据分析技术在宏观经济预测中的应用研究
大数据分析技术在宏观经济预测中的应用研究第一章:引言随着信息技术的发展和应用,大数据分析技术逐渐成为了宏观经济预测的重要工具。
大数据分析技术利用计算机技术和数据挖掘技术等方法,从大规模的数据中挖掘出有用的信息、关联和规律,对经济运行状态进行分析和预测,为政府制定经济政策、企业决策等提供了有力的参考。
本文将从大数据在宏观经济预测中的应用出发,探讨其技术原理、应用现状及未来发展趋势。
第二章:大数据分析技术的原理大数据分析技术包括数据采集、数据存储、数据处理和数据分析等步骤。
数据采集是其基础步骤,通过数据的采集,可以收集到大量的数据资源。
数据存储是指将采集到的数据进行存储和管理,保证数据的完整性和安全性。
数据处理是对采集的数据进行清洗、转换和加工,以获得可用于分析的数据集。
数据分析是利用分析模型和算法对处理好的数据进行分析,抽取有用的信息和规律。
在数据分析时,需要综合考虑多源数据、多维数据等信息,进行综合分析。
大数据分析技术的核心是机器学习,利用机器学习算法进行数据分析和预测。
机器学习是一种人工智能技术,可以利用数据进行自我学习,从而达到预测、分类、识别等目的。
在大数据的应用中,机器学习算法可以识别多种复杂的模式和规律,建立统计模型,进而进行数据分析和预测。
第三章:大数据分析技术在宏观经济预测中的应用现状当前,大数据分析技术在宏观经济预测中已成为重要的工具之一。
在数据采集方面,政府、企事业单位及相关机构可以利用公开数据、统计数据、互联网数据等,建立数据源。
在数据存储和处理方面,可以通过云计算、分布式存储等技术实现大数据的存储和管理。
在数据分析方面,则可以利用机器学习算法和数据挖掘技术等方法,进行大数据分析,发现数据内在的复杂规律和关联,进而进行宏观经济预测,提供不同角度的分析和预测。
大数据分析技术在宏观经济预测中主要应用于以下方面:1.经济增长预测。
利用大数据分析技术,可以分析GDP、消费、投资等宏观经济数据,预测未来经济增长趋势。
浅谈大数据时代经济普查数据分析与研究
浅谈大数据时代经济普查数据分析与研究大数据时代经济普查数据分析与研究,是指在大数据时代背景下,通过对经济普查数据的收集、整理、分析与研究,来获取对经济发展情况的深入理解与洞察。
经济普查是国家或地区针对经济数据展开的一项全面调查,其数据涵盖了各行各业的企业和市场信息,是研究和了解经济现象的重要信息来源。
在大数据时代,经济普查数据的规模和质量更加庞大和精准,为经济分析和研究提供了极大的机会与挑战。
大数据时代的经济普查数据分析可以帮助深入了解经济的产业结构和企业发展情况。
通过对各个行业的企业数量、规模、产值等信息进行分析,可以了解不同行业的发展现状和趋势,进而推断出不同行业的发展潜力和竞争力。
通过对企业的地域分布和集聚情况进行研究,可以揭示出不同地区的产业特色和优势,为地方经济发展和区域协调发展提供决策支持。
大数据时代的经济普查数据分析可以帮助预测和评估经济的发展趋势和风险。
通过对历史数据和趋势进行分析,可以预测未来经济的增长速度和波动情况。
通过对行业和企业的财务状况进行分析,可以评估其经营风险和发展潜力,为风险投资和经济政策制定提供参考。
大数据时代的经济普查数据分析还可以帮助发现和研究经济的问题和挑战。
通过对经济普查数据的多维度和交叉分析,可以揭示出不同行业、不同地区存在的问题和矛盾,并提出相应的解决方案。
通过与其他数据的整合和比对,可以挖掘出不同因素之间的关联和影响,为经济政策的制定和调整提供决策支持。
大数据时代经济普查数据分析与研究具有重要的意义和价值。
它不仅可以帮助深入了解经济的产业结构和企业发展情况,理解经济的就业状况和劳动力市场情况,预测和评估经济的发展趋势和风险,还可以发现和研究经济的问题和挑战。
在未来的发展中,大数据时代的经济普查数据分析将发挥越来越重要的作用,为经济的可持续发展和高质量发展提供有力支撑。
大数据与宏观经济分析
大数据与宏观经济分析作者:张亚军来源:《智富时代》2016年第01期【摘要】大数据时代的到来,宏观经济的分析走入了一个新的时代,也为各行各业的提供了机遇和挑战。
本文就是针对大数据对经济分析的意义,研究分析所面临的机遇和挑战,从而提出大数据对宏观经济分析的对策,进行实际的分析和佐证。
【关键词】大数据;宏观经济;对策前言传统的宏观经济的分析方式主要是通过对比来对宏观经济的发展趋势进行预测。
但是经济的发展变化是复杂的,仅仅通过简单的对比不能够对宏观经济发展趋势有一个很好的判断。
大数据时代的到来,就充分的解决了传统方式的不足,提高了经济分析的准确性和时效性。
一、大数据对宏观经济分析的意义(一)大数据开启了巨大的时代转型大数据时代给宏观经济的分析方式发生了巨大的转变,它所带来的转变是具有革命性的意义的。
可以通过数据来进行准确的分析和判断,做出具有时效性的宏观经济发展政策。
大数据时代信息的来源渠道更加广了,海量的数据使宏观经济的分析变得更加有据可依,在电子商务网站上交易的信息都可以在网络上显示出来,大而全的数据能够给宏观数据的分析提供更加准确的预测。
(二)大数据时代信息传播速度提升大数据时代的信息传播速度有了明显的提高,传统的分析方法往往会有时滞性,很多信息不能及时的进行预测和判断。
而大数据时代的信息传播速度就十分迅速,例如利用物联网或互联网就可以随时随地的进行数据的传送,而其他人就可以实时的接受这些数据,及时对数据进行分析和预测,对实时的经济情况进行政策上的制定,所以大数据时代在信息数据的传播速度上有了巨大的变化,对宏观经济的分析工作也带来了很快速的影响。
(三)大数据对宏观经济分析方法的改变大数据时代的到来推进了宏观经济分析方法的改进。
传统的分析计量模型是通过统计学中抽样的方法来进行的,通常是以假设作为分析方式。
但是大数据下的宏观经济分析方法实现了从样本分析到总体分析的飞跃,摒弃了假设检验的方式,信息处理的能力得到了大大的提升。
基于大数据的宏观经济分析与
基于大数据的宏观经济分析与预测随着信息技术的快速发展和数据的爆炸增长,大数据已经成为了信息化时代的核心资源。
在经济学领域,大数据分析被广泛应用于宏观经济分析与预测,为国家和地区的决策者提供了有力的支持。
本文将探讨基于大数据的宏观经济分析与预测的方法和应用,并分析其中的挑战与机遇。
一、大数据的宏观经济分析方法宏观经济分析是指对一个国家或地区的整体经济状况进行评估和研究的过程。
传统的宏观经济分析主要依赖于经济统计数据和调查问卷等传统研究方法。
然而,这些传统方法往往受限于样本容量的大小和调查精度的问题。
而基于大数据的宏观经济分析则通过利用海量的数据来进行经济现象的观察和分析,从而能够更准确地捕捉经济运行的动态特征。
基于大数据的宏观经济分析主要包括以下几个方面的方法和技术:1. 数据挖掘:通过挖掘大数据中的有用信息和模式,发现经济运行的规律和趋势。
比如利用大数据分析消费者购买数据,可以发现不同地区和时期的消费特点和消费趋势,从而为制定经济政策和商业战略提供参考。
2. 机器学习:通过机器学习算法对大数据进行模式识别和预测分析,从而实现对宏观经济的预测和预警。
比如借助深度学习技术,可以构建经济指标的复杂非线性模型,提高宏观经济预测的准确性。
3. 文本分析:通过对新闻、社交媒体和互联网评论等文本数据的分析,获取人们对经济状况的态度和情绪,从而作为宏观经济预测的参考指标。
比如通过对社交媒体上关于就业、通胀、政策等方面的评论进行情感分析,可以预测经济指标的变化趋势。
二、基于大数据的宏观经济预测应用基于大数据的宏观经济分析与预测已经在各个领域得到广泛应用。
以下是几个典型的应用场景:1. 经济增长预测:通过分析大数据中的各种经济指标,如GDP、工业产出、进出口数据等,可以预测一个国家或地区未来的经济增长趋势。
这对于制定经济政策和进行产业调整具有重要意义。
2. 汇率预测:利用大数据分析外汇市场中的海量数据,如汇率波动、国际贸易数据、政策变化等,可以预测不同货币之间的汇率变动趋势,为企业和个人的外汇交易提供参考。
基于大数据的宏观经济运行分析
基于大数据的宏观经济运行分析随着科技的不断进步和应用,大数据作为一种新兴的技术手段,正逐渐渗透到各行各业之中。
在经济领域中,大数据的应用也已经成为了时代的潮流。
基于大数据的宏观经济运行分析,正成为了当今经济学研究的热点。
一、基于大数据的宏观经济运行分析的概念基于大数据的宏观经济运行分析,是指利用先进的大数据处理技术,对经济领域中大量的数据进行收集、整理、加工和分析,来揭示宏观经济运行的规律、趋势和周期性,分析市场动态和预测未来变化,对制定经济政策和调整经济结构起到重要的指导作用。
二、基于大数据的宏观经济运行分析的特点1、数据量大:大数据处理的数据量是传统数据处理的几倍甚至百倍以上,数据来源也十分丰富,涉及到全球各个领域。
2、速度快:大数据处理的速度快,计算和分析能力较强,能够快速处理大量的数据,并在较短时间内给出分析结果。
3、多维度:大数据处理可以从多个维度对数据进行分析,从而更全面、更深入地了解经济运行的变化和趋势。
4、实时性:基于大数据的宏观经济运行分析可以实时收集、处理和分析数据,及时把握市场变化和发展趋势,对决策具有更高的实时性和准确性。
三、基于大数据的宏观经济运行分析的应用场景1、经济风险预警:可以利用大数据处理技术,对宏观经济的各个方面进行数据分析,及时报告风险情况,为政策制定和市场预警提供重要参考。
2、投资决策:可以通过大数据的分析和处理,了解市场需求、供求情况以及行业发展趋势,从而准确把握投资机会,优化投资组合,实现更有效的投资决策。
3、财务管理:可以通过分析企业财务数据,找到优化现金流的方法,预测企业未来的盈利能力,实现财务管理的科学化、精细化。
4、产业结构调整:可以通过分析行业数据,识别优势产业和劣势产业,为制定产业政策和调整产业结构提供重要参考和支持。
四、基于大数据的宏观经济运行分析的挑战和应对策略1、数据安全:大数据处理的大量数据涉及隐私和商业机密,需要加强数据安全保护,避免数据泄露和滥用。
大数据与宏观经济的分析与研究
大数据与宏观经济的分析与研究刘锋昌(陕西省工程咨询中心,陕西 西安 710016)[摘 要]计算机的广泛应用和云时代的来临,使得大数据受到越来越多行业和人群的关注。
大数据技术的战略意义不仅在于获取海量的数据信息,而且能够对这些看似毫无关联的信息进行专业化处理和分析归类,从而为某一行业发展提供必要的数据支持。
将大数据技术应用到宏观经济中,对宏观经济的政策制定、数据挖掘、发展分析提供参考性依据,有利于提高宏观经济分析的时效性和准确性。
因此,必须重视大数据在促进宏观经济发展中的积极作用。
[关键词]大数据;宏观经济;机遇与挑战;分析[DOI]10 13939/j cnki zgsc 2016 42 028 2015年9月份,国务院与工信部联合印发了《促进大数据发展行动纲要》,明确要求在“十三五”规划中重点推动大数据的发展和应用,建立运行平稳、安全高效的经济运行新机制,这也为在大数据时代下更加精准、更加高效地开展宏观经济分析提供了政策保障。
1 大数据在宏观经济分析中的重要作用1 1 为宏观经济分析提供丰富的数据支持我国经济发展正处于“三期叠加”的关键时期,影响宏观经济发展的因素也是多种多样,要想保证宏观经济分析结果的准确性和时效性,就必须以大量的数据信息做样本,对数据样本进行客观、专业的处理和评估。
传统的宏观经济数据获取方式存在诸多弊端:一方面是数据样本数量有限,难以反映出影响宏观经济发展的整体因素;另一方面是数据获取途径少,时效性低,往往与现阶段的经济发展现状不相符合。
而大数据技术借助于计算机、互联网和电子信息技术,能够在短时间内获取各个部门、各个行业的经济发展数据,例如全国旅游消费总额、全国商品房年销售总量等。
可以说,只要数据分析部门获取了相应的数据调查权限,就可以随时调用管辖范围内与宏观经济分析相关的数据内容,从而极大地丰富了宏观经济分析所需的样本容量和样本种类,确保了宏观经济分析的准确性和时效性。
宏观经济分析如何借助大数据
宏观经济分析如何借助大数据打开文本图片集大数据时代对数据的挖掘、处理和分析的方式,对于传统的宏观经济分析,无疑是一次大的革新在新常态下,我国经济面临的形势和任务更加复杂艰巨,政府宏观决策对宏观经济分析的准确性和时效性提出了更高的要求。
随着大数据时代的到来,借助大规模数据生产、分享和利用,以崭新的思维和技术去分析,将揭示海量数据背后所隐藏的宏观经济运行模式。
大数据方法和技术不仅可以被深度地应用在微观分析、行业研究领域,也可以运用在宏观决策之中。
未来,大数据既是企业占领市场、赢得机遇的利器,也是政府进行宏观调控、国家治理、社会管理的信息基础。
而大数据时代对数据的挖掘、处理和分析的方式,对于传统的宏观经济分析,无疑是一次大的革新。
大数据应用于宏观经济分析的趋势传统的宏观经济分析通常是通过对比主要宏观经济指标、建立宏观经济计量模型、仿真宏观经济动力系统,对宏观经济形势及未来发展趋势进行判断与预测。
在当前的大数据时代,越来越多的宏观经济政策制定者和相关专家学者都已经意识到,大数据对宏观经济分析有着革命性的影响。
目前,在宏观经济分析及预测中运用大数据方面,无论是国外还是国内,从新型宏观经济指数构建,到建立新型大数据宏观经济预测模型,各方面都取得了一定的进展。
早期大数据在宏观经济分析领域的应用,主要集中在建立新的宏观经济指数,以便更加准确的反应宏观经济运行状况。
这方面的工作主要基于个人的交易记录,包括像一些欧洲国家将销售点扫描数据纳入CPI指数编制。
特别引起关注的是麻省理工学院的经济学家利用网上购物交易数据创建的BBP项目(BillionPricesProject),基于不断变化的一篮子商品所计算的日度通胀指数。
这种实时的通货膨胀指数能够比相应的官方数据更好地反映实际经济运行的情况。
当年,在雷曼兄弟公司倒闭后,BPP的数据显示,大部分美国企业几乎立刻开始削减价格,这就表明总需求已经减弱。
而相比之下,官方通胀机构公布的数据直到当年11月,即在10月CPI数据公布后,才对通货紧缩有所反应。
《2024年文本大数据分析在经济学和金融学中的应用_一个文献综述》范文
《文本大数据分析在经济学和金融学中的应用_一个文献综述》篇一文本大数据分析在经济学和金融学中的应用_一个文献综述文本大数据分析在经济学和金融学中的应用:一个文献综述一、引言随着互联网的飞速发展,大数据已成为现代社会的基石。
特别是在经济学和金融学领域,文本大数据分析技术已经取得了显著的进步。
这种技术通过分析大量的文本数据,提供了更深入、更全面的市场洞察和决策支持。
本文旨在综述文本大数据分析在经济学和金融学中的应用,为相关领域的研究者提供参考。
二、文本大数据分析的基本原理和方法文本大数据分析是一种通过计算机技术对大量文本数据进行处理、分析和挖掘的技术。
其基本原理包括文本预处理、特征提取、模型训练和结果解释等步骤。
在经济学和金融学中,常用的文本大数据分析方法包括情感分析、主题模型、实体关系抽取等。
三、文本大数据分析在经济学中的应用1. 市场趋势预测:通过分析大量的新闻报道、社交媒体帖子等文本数据,可以预测市场趋势和消费者行为,为企业的市场决策提供支持。
2. 政策影响分析:政策变动往往会对经济产生深远影响。
通过分析政策相关的文本数据,可以了解政策对经济的影响,为政策制定提供参考。
3. 企业声誉管理:企业的声誉对其经济表现具有重要影响。
通过分析媒体报道、社交媒体评论等文本数据,可以了解企业的声誉状况,为企业声誉管理提供支持。
四、文本大数据分析在金融学中的应用1. 股票市场预测:通过分析新闻报道、公司公告等文本数据,可以预测股票市场的走势,为投资者提供决策支持。
2. 风险评估:金融机构需要对贷款、投资等业务进行风险评估。
通过分析相关的文本数据,可以了解借款人的信用状况、投资项目的风险等信息,为风险评估提供支持。
3. 欺诈检测:在金融领域,欺诈行为频繁发生。
通过分析交易记录、用户行为等文本数据,可以检测出异常交易和欺诈行为,保障金融安全。
五、挑战与展望虽然文本大数据分析在经济学和金融学中取得了显著的成果,但仍面临一些挑战。
探索宏观经济分析中的大数据应用
探索宏观经济分析中的大数据应用作者:易永根来源:《环球市场》2019年第16期摘要:互联网时代背景下,整个网络环境中所产生的信息呈爆炸式上涨,数据交互量需要用PB单位进行计量,与此同时宏观经济对大数据分析技术的应用也有迫切需求,文章对宏观经济的发展趋势展开分析,探究大数据在宏观经济分析中价值和作用的体现,思考宏观经济分析中大数据的有效应用策略。
希望本文的观点能为关注此话题的研究者提供参考意见。
关键词:宏观经济;数据采集;全生命周期当前人类社会已正式进入大数据时代,处理体量巨大、多样化的数据集,对主流软件的能力有很高要求,改进处理信息的工具是当前阶段的迫切任务。
就经济体制转变而言,大数据时代的到来意义重大。
应用大数据技术经历的步骤有数据的收集、存储、分析和运用。
能实现对市场主体的行为的有效引导,也能颠覆传统经济体制的运行模式,增强宏观经济预测的准确性和时效性。
一、宏观经济发展趋势分析(一)能源消耗大、附加值小的产业逐渐丧失发展优势我国经济发展产业结构和经济格局正在发生改变,这意味着宏观经济的发展将会出现很多的新形势,表现之一是在经济发展的过程中,能源消耗较大的工业和附加值较小的产业在经济新常态下优势逐渐消失。
这是因为在经济新常态下,传统工业和技术的含量比较低的产业浪费了大量的资源,对周围的生态环境造成不良影响,无法有效促进经济发展质量的提升。
在供给侧结构性改革的作用下,这一类产业的经济发展优势逐渐丧失。
对此经济发展应该重视对创新的有效应用,在此基础上增加技术含量,使得经济发展的整体附加值能够有所提升。
在如今的经济形势下,中国开始实施实体经济结构转型工作,重视经济活动创新。
通过上述手段提升经济新常态经济发展的速度,使得新常态下的经济发展的速度能够有所提高。
同时也增加经济提升的效益,在经济发展的过程中实现对统计分析的深入研究和良好应用。
(二)经济新常态下金融资本市场发展速度加快金融资本市场是促进和助力实体经济发展的关键力量,经济新常态下金融资本市场的良好运作能起到促进经济发展的作用。
大数据与宏观经济监测预测文献综述
大数据在宏观经济预测分析中的 作用
1、提高预测精度
大数据技术的应用可以帮助宏观经济预测分析更加精准。通过收集和分析海 量数据,运用数据挖掘和机器学习等技术,我们可以发现隐藏在数据中的模式和 规律,从而对未来经济发展趋势做出更准确的预测。例如,通过分析历史贸易数 据,可以预测未来一段时间内的进出口情况,为政策制定提供有力支持。
结论
本次演示通过对大数据在宏观经济监测预测中作用和意义、数据来源及采集 方法、算法和模型以及应用案例和效果评估等方面的综述,总结了前人研究的主 要成果和不足之处。尽管大数据技术在宏观经济监测预测中的应用已经取得了很 多成果,但仍存在一些问题和挑战,如数据质量保障、模型泛化能力提升、隐私 保护等。
数据处理是宏观经济监测预测的核心环节,包括数据挖掘、统计分析和可视 化等步骤。数据挖掘是通过算法和模型从大量数据中发现隐藏规律和趋势的过程; 统计分析是对数据进行统计描述和推断,以揭示数据背后的经济现象;可视化是 将数据处理结果以图表、图像等形式展示,便于理解和分析。
数据分析是宏观经济监测预测的关键步骤,包括时间序列分析、回归分析、 聚类分析等。时间序列分析用于研究经济时间数据的特征和规律,如GDP增长、 物价指数等;回归分析用于研究变量之间的关系,如消费、投资和经济增长之间 的关系;聚类分析用于将经济现象分类,如不同行业的经济增长情况。
引言
随着大数据技术的发展,其在宏观经济监测预测中的应用逐渐受到。大数据 技术具有处理海量、多样化数据的能力,能够更好地捕捉经济现象中的微观细节 和趋势,从而为政策制定者和企业决策者提供更为准确的经济预测。本次演示将 重点探讨大数据在宏观经济监测预测领域的应用,综述相关文献并对其进行评述。
文献综述
大数据与宏观经济监测预测文 献综述
大数据时代宏观经济分析面临的挑战探究
大数据时代宏观经济分析面临的挑战探究作者:秦臻来源:《商场现代化》2021年第21期摘要:在现代社会发展的背景下,中国信息技术发展迅速,互联网广泛应用于各个领域。
这表明大数据技术的广泛应用是企业经营发展的强大动力,是宏观经济分析的有力技术保障。
然而,在大数据时代,宏观经济分析也面临诸多挑战。
本文详细阐述了这一问题,并制定了有效措施,以期对应对大数据时代宏观经济分析面临的挑战有所帮助。
关键词:大数据;宏观经济分析;机遇与挑战中国的宏观经济运行面临许多新问题和挑战,迫切需要做好应对措施储备,而根据统计大数据对宏观经济发展的长期审查和评估稍显滞后。
而大数据分析方法的引入可以在一定程度上弥补这些局限性,以市值计算,阿里巴巴是全球第五大互联网公司,它汇集了大量经济数据,并进行了有益的研究,以便将大量数据应用于宏观经济研究,如工业分析、财富评估和经济预测,从中总结经验。
一、大数据时代的特点分析1.数据量相对庞大在互联网和大数据背景下,能够支撑海量的信息资源有效传递,并且自己拥有十分巨大的知识库。
并且,通过进一步的分析和研究我们可以了解到,它最为主要的技术特点之一就是信息数据极其巨大。
结合数据整体开发的历史过程,我们可知,最初对于信息的要求仅需要按MB 为计算单位的信息尺寸即可以得到充分的满足。
然而,随着不断发展,TB 和PB 能力单元逐渐地向生活和工作中转移,这增加了他们获取信息的渠道,同时信息技术和移动电话智能的不断发展导致了一定数量的数据有效传播。
在市场的顶端,有各种各样的应用程序使信息以前所未有的方式传播成为可能,而腾讯、阿里巴巴等公司的不断发展和进步也在很大程度上引领了信息时代的发展,因此必须加强大数据的开发,以便更好地处理和解决这些数据问题。
2.数据类型具有较强的多样性随着时代的发展,人们在追求物质的同时也越来越追求精神活动。
因此,在现实经济发展中,人们对个性化服务也提出了更高的要求。
为不同群体提供不同的信息渠道是其最明显的特点之一,在大数据时代,数据传输渠道多样性强,范围相对较广,许多数据平台根据用户信息准确计算,提供更多信息。
大数据时代宏观经济分析面临的机遇与挑战
大数据时代宏观经济分析面临的机遇与挑战随着Internet、社交媒体、移动设备和物联网技术的普及,数据的数量和种类都呈现爆炸式增长。
如今,越来越多的公司和政府开始重视数据在经济决策和管理中的作用,因为传统的数据分析方法不能完全满足大数据时代的需求。
在宏观经济学领域,大数据的应用为经济分析带来了机遇和挑战。
首先,大数据可以为宏观经济学研究提供更多的数据来源。
以前,经济学家主要依据政府部门和其他传统机构公布的数据来研究宏观经济。
而现在,因为互联网上有各种各样的在线市场和社交媒体平台,这些平台的数量和规模不断增加,经济学家有更多的数据来源,可以更好地了解市场的运作与趋势。
例如,分析电子商务平台的大量数据可以了解各种商品、品牌、价格、地区和用户等属性的变化趋势,从而了解消费者前往购物平台的行为和购买意愿的变化。
其次,大数据可以提高宏观经济分析的预测能力。
大数据分析可以通过运用复杂的计算机算法来检测出之前未被发现的现象,如人们在社交媒体上公开表达对某个品牌的厌恶情绪,这可能对该品牌的销售甚至是该公司的股票价格造成影响。
此外,还有更多的数据源可以用于宏观经济领域的预测,如政府开放的数据资源、各种事件热点等等。
大数据分析为经济学家带来了更大的预测能力和更好的实时决策支持。
然而,使用大数据进行宏观经济分析也会遇到很多挑战。
其中最重要的问题是难以处理大量的非结构化数据。
新生代的数据分析大多数时候处理的是非结构化数据,例如文字、图像以及声音等带有强烈主观色彩的数据,这些数据具有更高的复杂性,无法采取传统的统计方法来处理。
为此,需要大量的计算机技术支持来处理这些数据,如人工神经网络、支持向量机和巨量处理等。
另一个问题是,在使用大数据进行宏观经济分析的过程中,需要确保数据的准确性和可靠性。
由于大数据的来源多样化,数据的质量和可靠性往往难以保证,这就需要采取各种措施来确保数据的准确性,包括建立数据审核机制、抽样验证等方法,尽可能保证数据的质量和准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据与宏观经济分析研究综述*刘涛雄徐晓飞[内容提要]大数据对宏观经济分析具有革命性的意义。
在大数据时代,纷繁复杂的数据实时可得,整个社会经济产生了根本的变化。
大数据在宏观经济分析应用中最活跃也是最重要的四个领域为:宏观经济数据挖掘、宏观经济预测、宏观经济分析技术和宏观经济政策。
本文对大数据背景下宏观经济数据挖掘的来源和宏观经济预测方法进行了评述,探讨了大数据分析技术如何将机器学习算法引入宏观经济分析,利用LASSO 算法解决“维数灾难”。
本文还研究了大数据对宏观经济政策制定的影响,并在此基础上对大数据背景下的中国宏观经济分析提出了对策建议,认为政府应加大扶持力度,搭建平台,及早建立基于大数据的宏观经济分析模型,并加强学科和专业教育。
[关键词]大数据宏观经济数据挖掘机器学习算法预测*本文为中国博士后科学基金面上项目“大数据与宏观经济现时预测研究”(2014M560068)的阶段性成果。
一、引言随着互联网的普及,信息总量正以空前的速度爆炸性增长,人类社会进入了一个以“PB ”(1PB =1024TB ,1TB =1024GB )为单位的数据信息新时代,即大数据时代。
大数据,是指巨大而多样化的数据集①,这些数据的处理超出了目前主流软件的能力,因此必须改进处理数据的工具。
“大数据”术语最早可以追溯到Apache 公司的开源项目Nutch (一个开源软件实现的搜索引擎),伴随谷歌的Ma-pReduce (映射和归约,是一种编程模型,用于大规模数据集的并行运算)和GFS (可扩展的Google 文件系统),大数据不仅代表着数据规模,而且包含了数据处理的速度。
②目前一般认为,大数据的典型特点可以用“4V ”即大量化(Vol-ume )、快速化(Velocity )、多样化(Va-—75—学科前沿riety)和价值化(Value)来概括。
一是数据体量巨大。
据估计,人类至今生产的所有印刷材料的数据量大约为200PB,而历史上全人类说过的所有的话的数据量大约为5EB(1EB=1024PB)。
当前互联网上的数据以每年50%左右的速度增长,人类90%以上的数据都是最近几年产生的,到2013年,全球存储的数据预计能达到约1.2ZB(等于270个字节,约10亿TB)。
二是处理速度快。
在如此海量的数据面前,处理数据的效率就是企业的生命。
社交媒介、移动设备、网上交易和网络设备更新的速度非常快,巨大的数据流会导致传统数据分析的软硬件被淘汰,产生从快速生成数据中实时获取价值的专门技术和数据分析系统。
三是数据类型繁多。
构成大数据的信息类型来源不同,包括网络日志、音频、视频、图片、地理位置信息等。
其中大概只有约10%属于结构化数据适合整齐地进入相关数据库的行和列,其余90%是非结构化数据。
四是价值密度低。
价值密度的高低与数据总量大小成反比。
例如,一部1小时的视频,在连续不间断监控过程中,可能有用的数据只占一两秒时间。
如何通过强大的机器算法更迅速地完成数据的价值“提纯”变得十分重要,也是数据挖掘的关键。
③大数据正在深刻地影响着整个社会和经济的发展。
从经济分析的角度看,国际上的大数据研究首先在行业研究、商务分析和企业应用层面快速发展,并逐渐影响到经济分析的各个领域。
当前,在宏观经济分析中如何充分利用大数据方法和技术已经开始在国际上引起重视,从国内的情况来看,将大数据与宏观经济联系起来的研究还鲜有见到,宏观经济政策制定者对此也重视不够,而这正是本综述的目的和意义所在。
二、大数据对宏观经济分析的革命性意义大数据开启了巨大的时代转型,就宏观经济分析而言,大数据时代带来的转变是重大且具有革命意义的。
首先,大数据极大地拓宽了信息来源。
大数据时代的重大变化是海量的可得数据。
传统经济分析依靠的数据主要是样本,而在大数据时代,得到的数据可能就是总体本身,例如就物价而言,每一笔在电子商务网站成交的交易信息都能记录在案。
大而全的可得数据对宏观经济分析是极其重要的,可以准确了解宏观经济形势,正确做出宏观经济发展预测,合理制定宏观经济政策。
这些优势是传统经济分析方法无法想象和实现的。
其次,大数据时代信息获得的速度大大提高,很多信息实时可得。
传统的经济分析主要依靠结构化数据,这些数据最明显的缺陷就是具有很强的时滞性。
例如,政府公布的季度GDP往往会有1个月的滞后期,而反映全面经济社会状况的统计年鉴的滞后期会达到3个月左右,这对及时了解宏观经济形势、预测与预警都是非常不利的。
大数据时代信息产生和传递的速度空前加快,如互联网上的大量信息是实时的,移动互联网和物联网使每个人随时随地都可能制造数据。
大数据经济模型可以充分利用数据的实时性,提高分析或预测的时效性,为经济预警和政策制定提供最快速的资料和依据。
第三,大数据带来宏观经济分析的方法论变革。
传统的经济计量模型建立在抽样统计学的基础上,以假设检验为基本模式。
随着信息量的极大拓展和处理信息能—85—国外理论动态·2015年第1期力的极大提高,经济分析可能从样本统计时代走向总体普查时代。
这一点对宏观经济分析意义重大,因为宏观经济系统纷繁复杂,如果能将对整体宏观经济变量的分析建立在尽可能多的关于经济主体行为的信息以及其他诸多经济变量的信息的基础上,甚至抛弃原有的假设检验的模式,无疑将会极大地提高宏观经济分析的准确性和可信度。
同时,经典计量模型以因果检验为核心,而大数据分析则往往将相关性发掘作为首要任务。
在复杂的宏观经济系统中,当许多宏观经济中的因果关系往往难以准确检验、因果结论经常广受质疑时,更重视可靠相关关系的发掘,充分利用相关关系对于经济预测、政策制定与评估的作用,无疑为宏观经济分析打开了另一片广阔的空间。
正因为如此,维克托·迈尔-舍恩伯格(Victor Mayer-Schon-berger)与肯尼思·库克耶(Kenneth Cukier)认为建立在相关关系分析基础上的预测是大数据的核心。
第四,大数据促进了宏观经济分析技术的革新。
传统的分析技术基于关系型宏观经济数据,而分析模型主要基于统计数据,而大数据中的大量信息是非结构化的,数据的来源和形式复杂多样。
如互联网信息包含文本、图片、影音等多种形式,在此状况下进行宏观经济分析,有必要借鉴计算机领域已经出现、但在现有经济领域还少有应用的数据处理技术,例如机器学习。
机器学习已经在图像识别、语音识别、自然语言处理、智能机器人等领域取得了巨大成功,是当前进行大数据分析的基本手段。
此类技术在宏观经济领域的应用会极大地提高经济分析的能力,改进分析结果、提升分析价值。
另外,传统的经济计量对海量数据难以分析,发展适合大数据的分析模型是经济计量面临的重大挑战。
④国际学术界和宏观经济政策制定者已经意识到大数据对宏观经济分析的革命性影响,将大数据的概念、方法、技术和宏观经济分析结合起来的做法正逐步得到重视,一些意义深远的研究工作逐步兴起。
综合起来看,这些研究主要集中在宏观经济数据挖掘、宏观经济预测、宏观经济分析技术和宏观经济政策四个领域。
三、宏观经济数据挖掘数据挖掘正在成为一个热门行业。
简单地说,数据挖掘就是大数据时代的统计调查。
随着互联网信息技术的逐步发展,获取的数据种类越来越多,数量越来越庞大,更新速度越来越快,数据中有大量“噪声”存在。
显然,传统的统计调查方法不能适应大数据时代信息收集的需要,比如在内容形式上,互联网上的诸多信息是以多媒体方式存在的,统计调查无从下手;面对海量信息,统计调查速度慢,效率低。
因此,充分依靠计算机进行信息收集的各种新技术应运而生,被称为“数据挖掘”。
数据挖掘多在利用网络爬虫软件的基础上建立机器学习模型。
其过程一般包括:先利用网络爬虫软件将原始信息从网上抓取下来;然后通过一定方法对这些数据进行清洗,将大量内容无用的“噪声”过滤掉,保留值得加工的信息;最后对剩下的内容进行加工提取,并转化为一定程度结构化的可用数据,如标准化为时间序列等。
这一过程已经成为大数据方法中的标准程序之一。
从宏观经济分析的角度,根据信息来源的种类,数据挖掘大体可分为两类。
—95—学科前沿第一类是对数量信息的收集整理。
这一类工作要解决的问题是信息来源量大面广和快速更新的问题,比如麻省理工学院的“10亿价格项目”(The Billion Prices Project,BPP)。
研究团队在经济学家阿尔伯托·卡瓦洛(Alberto Cavallo)和罗伯托·瑞格本(Roberto Rigobon)的带领下,通过“网络抓取技术”(web scrap-ing),利用网上购物交易数据计算日常通胀指数,收集世界来自70个国家、300个零售商、共500万种在线商品的价格,建立了通胀指数的日发布系统。
相比传统CPI的月发布机制,“10亿价格项目”仅有3天的滞后期,几乎实现了通货膨胀的实时预测。
第二类是对非数量信息的收集整理。
比如如何从文本、图片、视频等素材中挖掘出结构化、数量化的信息。
这类工作除了要解决前述问题,还面临将非结构化数据转化为结构化数据这一更困难的艰巨任务。
对一项典型的文本数据挖掘工作而言,假定任务是从日常的新闻报道中挖掘出媒体对经济的信心指数,那么基本过程包括四步。
⑤第一步是选取部分文本,请专业人士进行标注以便分类,如可分类为“乐观、中性、悲观”三类,同一个文本可由三人分别标记,然后采取一定方法来计算语料标注的一致性,只有通过,方能被用于观点分类。
第二步是对文本进行特征抽取和选择,特征抽取方法包括基于规则的特征抽取和基于统计的特征抽取。
第三步是在特征抽取信息的基础上建立分类器,可同时考虑来源单位、作者身份、文本性质这三类信息,对已标注文本通过机器学习(如采用支持向量机算法)建立分类器。
第四步是将此分类器应用于分类未标注文本,并将分类结果转化为时间系列数据。
数据挖掘是在借鉴众多领域研究思想的基础上逐步发展的,借鉴了统计学的抽样估计、人工智能和机器学习的搜索算法、建模技术和学习理论,还借鉴了信息论、最优化、可视化、信号处理和信息检索等思想。
目前广为接受的数据挖掘处理模型是法耶德(Usama Fayyad)等人设计的多处理阶段模型。
利用该模型数据挖掘,意在集中寻求数据挖掘过程中的可视化方法,便于人机交互;利用该模型也可以增强对多媒体数据、文本数据和图像数据等各种非结构化或半结构化数据挖掘的准确性。
四、大数据与宏观经济预测大数据时代信息的实时和快速为及时高效的预测提供了可能,信息的规模庞大为准确合理的预测提供了机会。
大数据背景下的宏观经济预测将更加有效、实用。
国际上利用大数据进行经济分析与预测取得了一定的进展。
BPP项目利用网上购物交易数据计算日常通胀指数。
例如,BPP的数据显示,在雷曼兄弟公司2008年9月倒闭后,大部分美国企业几乎立刻开始削减价格,这表明总需求已经减弱。