运营商PB级大数据服务能力外部引入研究

合集下载

2023 通信行业:数据要素助力运营商更大发展,通信算力网络产业链拓展更大空间

2023 通信行业:数据要素助力运营商更大发展,通信算力网络产业链拓展更大空间

2023通信行业:数据要素助力运营商更大发展,通信算力网络产业链拓展更大空间一、运营商在数据要素充当重要角色,深入数据全产业链 (2)(一)三大运营商深度参与数据要素市场,掌握数据全产业链 (2)(二)三大运营用户连接数量基数规模大 (3)二、三大运营商云业务加速迈向第一阵营,发展可期 (4)(一)三大运营商云业务加速 (4)(二)中国移动:移动云业务表现突出 (5)(三)中国电信:天翼云业务发展较快 (5)(四)中国联通:边缘计算业务延伸助力合作发展 (6)三、云网基石夯实催化大数据应用成为增收新动能 (6)(一)新兴业务较快增长,大数据业务成为运营商增收新动能 (6)(二)中国移动:推进信息技术与数据要素的融合,助力数字化转型升级 (7)(三)中国电信:大数据平台和天翼云深度融合,领衔云产业国家队 (8)(四)中国联通:深度参与数据挖掘与应用市场 (9)四、算力网络新变革助力数据要素市场向好发展 (10)(一)三大运营算力推进布局,规模持续扩大 (10)(二)运营商数据产品及服务发展潜力较大 (11)(三)运营商净资产对比 (12)五、通信行业年报及季报:营收持续高增,看好算力+ (13)(一)板块营收普增,智能卡、5G应用等领域2022全年量价齐升 (13)(二)工业互联网、IDC及温控等板块23Q1迸发新机遇 (15)六、风险提示 (18)一、运营商在数据要素充当重要角色,深入数据全产业链(一)三大运营商深度参与数据要素市场,掌握数据全产业链数据产生:手机号卡、物联网、智慧城市等终端数据传输:基站、WIFI 、FTTX 、传输网路、核心网络提供全程全网数据安全调度数据存储和分析应用:拥有最大的IDC和云计算资源池,数据安全、可靠存储和应用。

在业务模式方面,数据出售、提供大数据行业解决方案、提供大数据平台服务、提供数据脱敏等数据交易服务成为运营商可能的商业模式方向。

图1:三大运营商数据产业链手机号卡物联网智慧城市智慧安防表1:三大运营商主要数据来源身份信息、消费信息(ARPU 值、DOU、通话时长)、终端信息、IMEI、IMSI、终端机型、积分、是否VIP、投诉情况等CRM(客户关系管理)、BOSS (业务运营支撑系统)、计费系统精准营销、信贷分析、保险风控、个人消费能力分析无线基站光纤FTTX承载网核心网支撑云业务云IDC 云上网行为、信令、位置、访问日志数据、精准营销、开店选址、舆URL解析数据、APP DPI、网关数据情分析、城市规划、网络优化、企业获客应用解析数据、网络轨迹、WLAN解析等内部财务、绩效、人ERP、DSS、OAS、MIS内部应用、提升运营商内力、项目管理数据等等系统数据部管理效率(二)三大运营用户连接数量基数规模大工信部数据,2021年电信行业移动用户16.4亿户、宽带用户5亿户、蜂窝物联网用户14亿户,全年移动互联网接入流量2216亿GB,运营商作为关键基础设施,拥有庞大用户基数。

大数据的四个基本特征

大数据的四个基本特征

大数据的四个基本特征大数据的四个基本特征 1某种程度上,大数据是数据分析的前沿技术。

简而言之,从各类数据中快速获取有价值信息的能力,就是大数据技术。

理解这一点非常重要,也正是这一点,使得这项技术有可能走向很多企业。

2001年,高德纳分析员道格·莱尼在一份与其2001年的研究相关的演讲中指出,数据增长有三个方向的挑战和机遇:量(Volume),即数据多少;速(Velocity),即资料输入、输出的速度;类(Variety),即多样性。

在莱尼的理论基础上,IBM提出大数据的4V特征?得到了业界的广泛认可。

第一,数量(Volume),即数据巨大,从TB 级别跃升到PB级别;第二,多样性(Variety),即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,速度(Velocity),即处理速度快;第四,真实性(Veracity),即追求高质量的数据。

虽然不同学者、不同研究机构对大数据的定义不尽相同,但都广泛提及了这4个基本特征。

1、大容量根据马的说法,天文学和遗传学是最早产生大数据变化的领域。

2000年,当斯隆数字巡天项目启动时,新墨西哥州的望远镜在短短几周内收集的数据比天文学历史上的数据还多。

一旦2016年智利大型全景巡天望远镜投入使用,5天内收集的信息量将相当于前者10年的信息档案。

2003年,人类第一次破译人体基因密码时,用了10年才完成了30亿对碱基对的排序;而在10年之后,世界范围内的基因仪15分钟就可以完成同样的工作量。

随着各种便携设备、物联网、云计算、云存储等技术的发展,人和事的所有轨迹都可以被记录,于是数据被大量产生。

移动互联网的核心网络节点是人,不再是网页。

人人都成了数据生产者,短信、微博、照片、视频都是它的数据产品。

数据来自众多的自动传感器、自动记录设备、生产监控、环境监控、交通监控、安全监控等。

从自动流程录音、刷卡机、收银机、电子收费系统、互联网点击、电话拨号等设施,以及各种服务流程登记等。

《PB级多源异构大数据平台构建和数据开放及规模化运营系列标准》

《PB级多源异构大数据平台构建和数据开放及规模化运营系列标准》

种 数据 的格 式、语义 、加工周期等 ,并规范 了基 于元数
据 的数 据质 量追 溯机 制。
用合 作。
80
企 业 动态 Bu s i n e s s D y n a mi c s
P B 级 多 源异构 大 数 据平 台构 建和 数 据 开放 及规 模化 运 营 系列 标 准 获2 0 1 6 年 中国通信标 准化协会科学技术奖 二等奖
主要完成单位 :中国联合网络通信集 团有 限公司
主要完成人 :魏进武 、张云 勇、范济安 、李卫 、王志 山、靳淑娴 、裴小燕 、霍玉嵩 、顾霞 、陈 勇
据建模 以及数据结果安全输 出的大数据纵 向服务框架 。 2 ) 在流程方面 ,规范 了大 数据平台能力开放 ,数据 采集到运营 的管理 、业务 两类流程的协 同和穿透 ,形成 了大数据开放 的运营体 系与业务开展 的标准化流程 。 3 ) 在数据方面 ,覆盖运营商全 网5 种数据 ,规范 了5
据 平 台 的功 能 体 系 和技 术 架 构 ,构 建 了 从 资 源 供 给 到 数
4社会效 益 1 ) 公 共 治理 :服 务于 国家 统计 局 、公安 、政 府应 急 、国家旅游局等8 个 以上部委办 。 2 ) 便民服务 :环沈 阳经济 圈出行易、乘车易 以及停 车 、出行等服务 。 3 ) 对外推广 :入选 “ 大 数据 治国理政案例” ,获得 T MF “ 以客户 为中心”卓越奖 ;在第 二、第三届世界 互 联 网 大会 上 发布 1 5 项沃 指数 产 品和多项 行业大 数据应
4 ) 在开放服务 方面 ,规范了云化大数据平 台内部各 个 关键 模块 之间以及平台与外部系统之 间的接 口,规范 了数据 开放服务和交付 ,促进跨行业数据 的融合开放 , 带 动产业发展新型业务形态。 2具体成果 该项 目累计 输 出行业 标准 ( 含 立项 及报 告) 4 5 项, 主导 完成 国际 建 议 1 1 项 , 附加 知 识 产权 包 括 受 理 发 明专 利 1 0 8 项( 其 中1 5 项 已授 权 ) ,授权 软件 著作 权3 8 项 ,出版 专著4 部 ,发表 论文4 1 篇 ,并将落地成果 推向 H a d o o p 、Op e n t a c k 等开源社 区。 3经济效益 1 ) 收入 贡献 :对企业 内部实现 了精准 营销、存量经 营、数据合作等 ,辅助拉动主营业务 的营收。 2 ) 成本节约 :实现 了基础资源环 境的 自动化部署能

大数据处理平台(完整版)

大数据处理平台(完整版)

动态位置信息
位置数据规范化
更多…
热点分析
号码信息 用户信息 业务位置信息 更多信息
输出
标准的位置应用
基础统计分析 用户分类 更多…
谢谢!
对系统资源消耗严重。
数据采集面临巨大压力
接口单元名称
类别 数据量(天)
网络数据类信令
Gb/Gn接口 1.65T/Day
用户动态呼叫、短信、位置、 切换、开关机行为信息
A接口
3.3T/Day
WAP日志
WAP网关 300G/Day



1 运营商大数据背景 2 大数据平台介绍
3 应用案例
大数据平台规划
聚类
分类
信息统计
4
日志 汇总
用户 行为
网站
分类
访问 内容 主题
访搜问 索 关键 字
基础分 析能力
文本挖掘
数据挖掘
HIVE
HADOOP平台
云ETL 管理 应用 开发 应用 监控 应用 调度
M/R
ETL-基于流程的ETL工具
1. 云ETL基于Oozie工作流,提供ETL任务编排、任务调度、任务监控等功能。 2. 管理与监控提供平台应用层自管理能力,包含数据质量管理、安全管理、告警管理、日志管理、系统
设计更好的流量套餐、 终端和互联网业务
为用户精确地进行推荐, 及时地进行服务
更多…
用户的行为是什么
都是哪些用户在使用移 动互联网,都有什么样 的特征? 都在干什么? 行为模式如何? 占用了多少资源或流量? 对网络影响如何? 如何牵引用户行为改变 对网络的影响?
实 现
互联网内容分析基础服务
输出
互联网内容抓取

联通容器化大数据云平台技术实践

联通容器化大数据云平台技术实践
Twitter、Apple、Airbnb、Yelp等
技术生态支持
CNCF组织,由Google公司牵头组织
主要由Mesosphere公司贡献
技术实现
开源产品种类繁多,实现难度低,成熟度较高
原生框架实现难度高编排Docker需要Marathon实现调度功能
通过研究、探索和实践,我们发现Kubernetes+Docker的技术路线更契合联通的实际需求。它几乎支持了所有的容器业务类型,包含长期伺服型(long-running)、批处理型(batch)、节点后台 支撑型(node-daemon)和有状态应用型(stateful application),也正是因为这个特点,k8s能够支持当前 大多数常见的大数据处理场景,如分布式数据存储(HDFS、Hbase)、离线分析(hive/Spark)、实时处理(Sparkstreaming)、数据挖掘(SparkMLlib),及深度学习框架(Tensorflow)等。
大数据的目标是充分挖 掘海量数据中的信息, 以发现数据中的价值云计算的目标是通过资 源共享的方式更好地调 用、扩展和管理计算和 存储等方面的资源和能 力,以提高资源利用率, 降低企业的IT成本云计算可以为大数据平 台的计算和存储提供资 源层的灵活性大数据组件部署到云平 台上,作为通用PaaS能 力,为用户带来使用上 的便利和高效
实时计算
构建一站式数据仓库服务,提供数据 整合、加工、分析等全套数仓构建服 务,帮助打造数据核心。包括HDFS、 Hive、Spark等组件。
数据仓库
数据挖掘开发平台,可进行机器学习 和AI应用的开发和训练,支持对各类 数据实现高度智能化的处理。包括 Tensorflow、MxNet等组件。
数据挖掘
1.1 大数据与云计算的发展历程

大数据赋智数字能力,大连接创造数字价值

大数据赋智数字能力,大连接创造数字价值

数据业务
感知指标
81000
51300
63.33%
感知指标
81000
65497
80.86%
+MR+投诉
语音业务
感知指标
81000
50500
62.35%
感知指标
81000
66048
81.54%
+MR+投诉
02 用户画像 专家经验
根据专家经验,选取小区语音业务、数据业务和无线质量共13项指标进行单项指标评价;采用用户感知评价中单项感知指标的AI赋权结果,计算小区感知综合得分。 语音业务单项感知评分:VoLTE始呼网络接通率得分 =( VoLTE始呼网络接通率-90)/(99-90)*100,… 数据业务单项感知评分:视频卡顿率得分 = (视频卡顿率-73)/(0-73)*100,…… 无线质量单项感知评分: MR覆盖率得分 =1- | (MR覆盖率-95%) | /(95%-60%)*100,……综合得分 = VoLTE始呼网络接通率得分 *f%+……+视频卡顿率得分 *a%+……+ MR覆盖率得分 *j% 全量识别质差小区:基于xDR感知指标和无线质量的小区感知评估模型可全量识别质差小区。分等分级派单管控:由小区汇聚到网格、场景、地市进行感知评估,结合质差用户占比、小区业务量分优先级对接工单系统进行派单,感知修复驱动闭环管控。
01 项目简介 创新点
02
主要做法
数据处理用户画像多维图谱应用
02 数据处理 大数据关联分析
采集XDR、TRACE 、MR、KPI等PB级海量数据,运用大数据技术关联分析,实现数据变现
数据加工处理
数据整合
感知数据

大数据中心建设方案

大数据中心建设方案
统一运维子平台·功能架构
统一运维平台负责对县级大数据资源平台内的所有基础资源,系统模块,系统运行行情况提供整体的监控告警,运维视图、巡检等工具承载,使得可以快速发现县级大数据资源平台上的各种异常,及时发现并告知维护人员,快速恢复,提升平台内外客户感知。
日常巡检管理
平台运维管理
平台故障管理
平台数据安全管理方案
数据治理子平台·数据应用开发整体流程
数据治理子平台·可视化、流程化数据开发
数据工厂
支持可视化的程序编排,数据处理流程开发,使程序开发更简便,降低数据开发周期、开发成本;平台提供数据处理各项能力的开发功能,提供包括数据采集、处理、装载、分发、校验等功能开发平台具备执行标准的开源 Hadoop 接口调用能力,以及基于个性化 Hadoop 接口封装能力;根据不同的数据生产环境,具备不同的数据处理能力,可根据自身需求,基于平台扩展自主的数据处理功能可视化程序开发可结合数据标准化体系,整体数据开发流程与标准化管控切实对接。
信息资源平台
逐步实现立体化、多层次、全方位的数据服务体系有效支持电子政务公共服务能力提升
横向协同
纵向联动
专主题建设规划·支撑精准社会服务与科学管理
宏观数据分析应用
城市R口分析规划
R口迁移分析人群特征分析人群发展预测……
社会安防
环保数据
金融数据
公共服务
交通数据
医疗数据
社保数据
公共安全分析预测
建筑安全评估人流分析预警……
公共数据
社会数据
通过平台数据开放应用,形成“公共数据服务社会应用、社会数据反哺公共数据”的良性循环促进机制
金融机构
航空公司
延误旅客数据
出行数据
个人信用评级

《信息资源管理》期末复习知识点资料

《信息资源管理》期末复习知识点资料

《信息资源管理》期末复习知识点资料信息安全可以从两个角度来理解信息安全,面向数据的安全包括数据的保密性、完整性和可获性;面向使用者的安全则是鉴别、授权、访问控制、抗否认性和可服务性以及基于内容的个人隐私、知识产权等的保护。

总之,现代信息安全是物理安全、网络安全、数据安全、信息内容安全、信息基础设施安全与公共信息安全的总和。

安全问题的解决一方面要依靠技术手段,如密码技术、身份验证技术、防火墙技术、防病毒防黑客入侵等安全机制,更需要的是一个良好的政策法规环境做保障。

信息安全政策法规是一个国家或国际组织在一定时期内为处理信息自由传播与有限利用的矛盾而制定的一系列行政规范和法律制度的总和,它以国家意志为后盾,以政策为指导、法律为手段,对一定范围内的信息安全管理具有宏观导向和监督制约作用。

自由词与受控词标引区别所谓标引即在文献的处理过程中,对文献的内容特征和外部特征用检索标识符加以标识的过程。

其目的在于使文献管理者能够有效地组织文献并使文献的利用者能够迅速地查找文献。

受控词是一种事先规范化的语言,取自于主题词表、叙词表、分类表等。

所谓自由词,顾名思义,是不受词表控制的词,取自于文献篇名、文摘和非受控索引字段,如作者字段、机构字段等。

自由词标引,它是直接使用未经规范化处理的自然语言词汇, 作为描述和表达文献内容主题的一种标引。

受控词标引,它是经过优选和规范化处理的自然语言词汇,作为描述和表达文献内容主题的一种标引。

进行自然语言与受控语言的比较:自然语言在这里是指索引词汇直接来自系统所处理的文献或提问本身,使用前未经优选和规范化处理的一类检索语言。

受控语言指索引词汇在使用前经过优选和规范化处理,并且整个语言经常处于某种权威机构或检索系统的管理和控制之下的各种检索语言的总称,又称规范化语言。

受控语言按索引词汇的组配特征来划分,又可分为先组式语言和后组式语言两大类型。

控制索引词汇的目的是消除或减少它们的歧义性,保证信息表示的一致性和准确性,使词间语义关系由隐含的转变为显性的,并把全部索引词汇组织成某种知识体系,以便使其具有良好的表达和组织功能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

运营商PB级大数据服务能力外部引入研究作者:唐懿黄倚霄张攀翔付文武宋炜来源:《中国新通信》2015年第21期【摘要】运营商利用大数据对内实现网络配置优化、对外实现精准营销及价值变现的需求迫切,与自身大数据分析服务能力不足的现状形成强烈的供需反差。

在运营商亟需采用自建加外部引入模式建设大数据能力的背景下,提出运营商引入外部PB级大数据能力的应用场景、引入模式及引入策略。

【关键词】 PB级大数据一、概述随着大数据时代的到来,互联网公司和电信运营商都积极投入力量进行大数据分析,充分利用企业数据,深入挖掘数据价值,对内支撑市场经营、网络优化,对外提供数据分析服务,实现数据价值变现。

例如Telefonica(西班牙电信)通过与市场研究机构GFK合作,进行数据分析和打包工作,让这些数据变得更加易用,产生了巨大的经济价值。

然而由于运营商的“先天缺陷”,与大数据平台应用成熟的互联网公司相比,存在大数据人才不足、研发能力薄弱、应用复杂度高等问题,导致当前大数据平台存在建设缓慢,大数据能力形成时间长等问题,这与日益增长的互联网大数据能力需求形成强烈的供需反差。

与此同时,国内外领先互联网公司在内部运用大数据平台的同时也对外提供海量的大数据服务能力,因此运营商在努力打造自身大数据平台的同时,需要极开展外部引入PB级大数据服务能力的研究,借鉴外部成熟经验,通过自建+外部能力引入相结合的方式迅速提升自身的大数据服务能力。

二、运营商外部引入大数据能力的驱动力2.1大数据应用需求迫切大数据是运营商面对OTT冲击,实现收益持续增长和企业转型的重大契机,对此业内已经形成共识。

移动互联网时代,随着数据爆炸式的增长,大数据已经引爆了全球热情。

对于运营商而言,数据对内能够实现网络配置优化、降低成本,对外能够通过位置数据、精准营销等数据分析实现海量数据的价值变现,因此大数据应用的需求极为迫切。

2.2运营商自身大数据平台发展缓慢相比业内领先互联网公司已经形成了完善的大数据金字塔,运营商在建设自身大数据平台之时起步较晚,大部分还未实现数据统一存储、用户唯一ID和统一画像等大数据发展的基础建设。

与此同时,运营商在数据结构、应用复杂度等方面更高,大数据自研和运维能力也相对较为薄弱,因此运营商在构建自身大数据平台时发展缓慢。

2.3外部大数据分析能力已经成功转化为生产力国内外互联网巨头如Amazon,Google、阿里巴巴、腾讯等公司均已经成功将大数据平台转化为生产力,在企业内部成功实现数据价值变现的同时,纷纷对外提供大数据分析服务,以期占据更多的大数据市场蛋糕。

综上所述,一方面为应对不断增长的庞大的大数据分析能力需求,另一方面又面临着自身能力不足,大数据平台建设缓慢的现实困境。

运营商需要以互联网开放、共享和合作的思维发展大数据业务,考虑引入外部大数据能力与自建的大数据能力有机融合,探索内外兼修的大数据能力构建新思路,有助于尽快提升和丰富运营商的大数据服务能力。

运营商自建+外部引入大数据平台的融合目标架构如图1所示。

三、运营商PB级大数据能力外部引入方案3.1外部PB级大数据能力引入资源分析从技术上看,下述大数据处理平台均能够提供PB级的在线数据存储分析能力,包括Google的BigQuerry、Amazon的EMR、Splunk、阿里ODPS等。

3.1.1 SplunkSplunk使用MapReduce模型,及通过许多计算机组成的集群分散处理,加速计算,在Splunk中,成为分布式搜索,在搜索结果用映射函数和化简函数形式表达后,建立简介改搜索集群的网络连接,然后使用时间MapReduce方案开始处理集群,当数据流返回至启动搜索的实例时,数据存入硬盘,进行简化函数运算。

3.1.2 BigQuerryGoogle发布的BigQuerry解决了海量数据存储和快速处理问题。

BigQuerry 的这些技术包括Google文件系统GFS、分布式计算变成模型MapReduce、分布式锁服务Chubby、分布式结构化数据表Bigtable、分布式存储系统Megastore以及分布式监控系统Dapper,Google的BigQuery使用流程如下图所示:3.1.3阿里ODPSODPS的体系架构由四部分组成,分别是客户端、接入层、集群调度和计算集群。

用户可以基于ODPS开发自己的应用,STful请求访问ODPS RESTful API、通过ODPS CLT、通过ODPS SDK是对RESTful API的封装,并非是一一对应的映射方式,而是提供了更高层次的抽象,以便于用户理解并运用ODPS中的概念,ODPS SDK按功能划分了Tables、Jobs、Resources、Authorization、Registration等包,ODPS CLT是基于SDK的开发的一个Windows/Linux命令工具,用户可以以命令的方式运行作业。

3.2外部大数据能力引入应用场景考虑到用户隐私和信息安全,建议可以在非关键应用的离线分析和常规报表统计输出等应用中引入外部大数据能力满足日常统计分析工作的需求。

不建议在精准营销、触点服务等涉及用户、位置等敏感信息且实时性要求高的业务场景中使用。

主要的业务场景如下:(1)批量离线分析:基于MR的传统批量离线分析应用,主要用于产生统计分析结果用于后续的业务开发,如用户离网率分析、用户投诉分析等.(2)简单键值对查询:基于HBase的简单键值对查询应用,如传统的话费详单查询等。

(3)准实时查询:基于流计算的准实时营销和网络保障等应用,如终端营销、内容营销等。

(4)复杂即席查询:基于Hive的定制化查询,需要整合用户常用数据,形成数据宽表,用户可灵活定制查询条件及导出结果,并支持高级SQL编辑功能,如HLR用户数据宽表、PS 用户行为明细宽表等。

3.3外部大数据能力引入模式分析(1)模式一:购买大数据分析能力此模式是租用外部互联网公司的大数据存储分析能力,将数据源导入到相关处理平台,具体的数据处理分析模型仍旧由运营商自身负责搭建,由外部平台进行处理分析后输出所需的结果。

为了保障数据的安全性和传输速率,可通过专线实现与外部互联网公司大数据分析平台的互通,运营商通过专线将需存储处理的数据源导入外部大数据处理分析平台,运行自有的算法分析模型,得到所需的分析结果。

此模式可快速解决当前运营商大数据分析处理能力不足的问题,并且可以将技术人员快速地投入到大数据分析的实践中,同时可以培养广东移动自有的数据建模分析能力。

(2)模式二:购买大数据分析服务与模式一相比,模式二除了购买外部大数据处理分析能力之外,数据分析模型搭建的工作也由第三方专业数据分析公司提供,运营商只需负责提供待处理的数据源以及需实现的数据分析功能需求即可,经外部专业数据分析公司的大数据处理平台处理分析后,直接输出运营商所需的结果(也可与第三方公司共同开发)。

相比较而言,此模式是实现运营商引入外部PB级大数据服务能力最快捷有效的方式,外部专业数据分析服务公司可根据运营商的需求定制开发数据处理分析模型,运营商通过专线向第三方大数据分析平台提供数据源即可。

此模式的缺点是大数据分析能力主要依靠第三方公司,无法培养运营商自有的大数据平台搭建、运营能力,不利于长远的发展和公司人才的培养,且成本较高。

并且由于数据分析模型也由第三方公司提供,运营商无法根据变化的需求,灵活地更改调整数据分析模型,存在建模分析周期不可控等弊端。

(3)模式三:合作共建模式三的侧重点在合作共建,购买专业数据分析公司的技术服务,指导运营商的大数据分析平台建设工作。

运营商负责提供机房、服务器、网络设备等物理资源,引入专业第三方数据分析公司先进的大数据平台搭建技术和部署经验,合作完成数据分析模型的建模,形成运营商自有的大数据平台搭建和运营能力以及数据分析模型建模能力,同时也可以进一步培养运营商自有的大数据人才。

该模式较好地平衡了快速引入大数据平台能力和自有大数据分析能力培养建设的需求,既可以较快速地解决现有大数据能力不足的问题,也有助于向未来自有大数据平台能力的过渡和打造专业数据价值挖掘的专业团队。

(4)模式四:大数据贸易共享当运营商自有大数据分析平台发展到一定规模的时候,可以借助引入外部大数据服务能力的契机,考虑另一形式的“外部大数据分析能力引入”,即建设开放共享的数据贸易平台,让数据资源变得像电商产品一样可视化、可交易化,实现运营商与第三方企业之间、第三方企业与第三方企业之间的数据互通及贸易共享,两两或多方合作共享,让数据的交换和合作产生更大价值,该模式属于外部大数据能力引入的高级形式,属于后期发展的目标。

综上所述,以上四种模式各有优劣,分别适用于运营商不同阶段应用,各模式的对比分析如下表1所示。

3.4外部大数据能力引入策略分析(1)初期:由于运营商匮乏大数据平台分析能力以及算法分析师人才,为应对迫切的大数据分析需求,可采取模式一和模式二并重的方式,一部分数据推送至外部成熟大数据分析公司的平台(带算法模型)直接获取所需的分析结果,另一部分数据推送至类似阿里ODPS的大数据处理平台,运营商开发自有的算法分析模型,并在ODPS平台上进行分析处理,然后获取所需数据。

(2)中期:可考虑引入外部大数据平台技术支撑服务,进行合作共建,由专业大数据解决方案提供商协助运营商建设自有大数据平台,并指导算法分析模型的搭建工作,培养运营商自有架构师、分析师等高端大数据人才,最终形成运营商自己的大数据分析解决能力。

(3)后期:在运营商大数据平台发展到一定规模和能力之后,可考虑数据进行对外贸易共享,两两结合或多方结合,让数据的交换和合作产生更大价值,并且可以将大数据平台处理能力和数据作为能力开放的资源对外开放,吸引更多优秀的分析模型进行数据价值变现。

四、结束语大数据时代的到来,面对外部PB级大数据能力产品的不断涌现,运营商在探索打造自身大数据服务平台的同时,也应积极加强对外部商用产品的研究,根据不同的应用场景和风险管控需要灵活采用能力引入、合作共建等模式,通过自建+外部服务引入相结合的方式快步提升自身能力。

参考文献[1]刘智慧.张泉灵.大数据技术研究综述[J].浙江大学学报:工学版,2014,48(6):1-16[2]赵清,唐菁.电信业数据仓库体系结构及关键技术研究[J].信息通信技术,2013,7(6):15-19。

相关文档
最新文档