大数据在中国电信的应用实践(大数据能力开放)
运营商网络运营大数据应用实践研究
运营商网络运营大数据应用实践研究摘要:以电信运营商的大数据资源为基础,对网络运营大数据平台所要汇聚的数据范围、系统定位及功能架构进行了分析,并与4 G网络的建设和推广相联系,说明了怎样才能更好地运用网络运营大数据平台的大量数据资源,来对移动互联网的业务进行全面的评估,同时还可以对网络运营大数据平台在网络精细化运营中所具有的价值进行挖掘,为运营数据资源的内部应用提供借鉴。
关键词:运营商;网络运营;大数据平台;数据资源1.网络运营大数据概述1.1客户信息由顾客的实际注册信息、业务定单、消费、付款、投诉等信息构成,该信息以顾客关系管理(CRM)和客服系统为主,以“客户/人”为“主KEY”进行相关聚合,并体现出该用户所使用的电信服务的基础信息。
1.2用户实时业务信息具体包含了用户的实时位置信息、正在使用的业务类型、业务内容、 APP名称、终端型号版本、业务使用感知(时延、成功率、速率)等内容,它的主要作用是对用户的行为进行描述,能够反映出用户使用业务时实时体验的动态信息。
通常情况下,运营商会使用部署探针、镜像抓包等方式来对其进行捕捉和存储,之后再对其进行分析。
1.3网络/设备运行信息:具体内容有:反映各设备/各端口/各链路的速率、带宽、抖动、延时等硬件运行情况的信息,还有能够反映网络情况的业务统计信息(例如,无线信号强度/覆盖/干扰等一系列指标、各端口消息收发成功率及处理时延、各协议定义的计数器情况、性能指标等)等,这类信息通常是由网管系统进行监控和采集的。
在这些数据中,无论是用户实时业务信息还是网络/设备运行信息,都是从现网实时产生并实时采集到的动态信息。
这一类型的信息,不仅包括了用户使用电信业务及互联网业务的行为特点,而且还能反映出用户使用业务时的网络实时状况,这对运营商提升网络质量以及提升用户使用业务时的感知有着十分重要的作用。
2.网络运营大数据平台架构2.1实时性通信网络每时每刻都在对各种业务进行处理,因此,网络的运行情况也是实时变化的。
电信企业大数据分析、应用及管理发展策略
数据本身 . 而 在 于 企 业 根 据 大 数据 做 出 的更 深 入 、 更 全 面 的 客 户需 求 洞 察 , 并 以此 支 撑 企 业 针 对 性 运 营 管 理 决 策
的及 时 、 科学 、 有效形成, 促 进 企业 运 营管 理 的高 效 准 确运 行 。 本 文 立 足 电 信企 业 , 阐述 了基 于 可 开 展 的 大数 据 分 析需求 。 企业 可拓 展 哪 些 大 数 据 源 , 并 如 何将 大数 据 分 析 应 用 于企 业 的运 营 管 理 工 作 中 , 最 后 展 望 了在 大 数 据 时 代 的企 业 I T运 营管 理 支 撑 的 发展 及 转 型 趋 势 。
j u s t f r o m t h e d a t a i t s e l f ,t h e p o w e r o f b i g d a t a c o me s r f o m i n s i g h t i n t o c u s t o m e r d e m a n d b a s e d o n t h e b i g d a t a .
中国电信大数据技术交流20140421
交易数据和日志数据在这些项目中仍然占主导;
作为大数据技术的补充,很多公司都采用云计算 技术来从大数据中获取收益。
华为保密信息,未经授权禁止扩散
电信运营商大数据应用领域 Top8-Gartner调研
Gartner通过调研识别运营商数据方面目前和今后可能的潜在应用,归纳总结得出TOP 8 类数据应用Case。该报告可以作为CSP未来大数据应用的一个参考建议 1. Top-Level key performance indicators(KPIs):OSS领域的 KPI分析报告 2. Marketing-Customer experience: 从营销角度看客户体验 3. Networks-Customer experience: 从网络状态看客户体验 4. Product/device management: 利用用户使用的设备和服务信 息来加强产品管理 5. Customer services:利用客户数 据增强客服服务能力 6. Marketing:实时营销管理、客 户行为分析等 7. Third-party uses:向第三方开 放数据 8. Vertical uses:在垂直行业(如物 联网)中的数据应用
互联网女皇玛丽·米克说过,人们的生活将变得更好,因为他们将能以非常低的成本获取所有信息,娱乐服务变 得更加便宜,人们能更容易地获得帮助,更容易地趋吉避凶。
华为保密信息,未经授权禁止扩散
Page 4
Gartner 2013年最新问卷调查发现…
2013年 64% 的被调查者已经或计划在大数据领 域进行投资,这个数字相比去年的58%又有所增长;
大数据时代已经来临…
全球全网达到1000PB时间:
2001年是一年, 2004年是一月, 2007年是一周, 2013年是一天, 即一天产生的信息量可刻 满1.88亿张DVD光盘
大数据环境下电信数据服务能力开放研究
2 . S h e n z h e n V i s p r a c t i c e T e c h n o l o g y C o r p o r a t i o n , S h e n z h e n 5 1 8 0 0 0 , C h i n a )
Ab s t r a c t :Da t a r e s o u r c e i s t h e c o r e a s s e t o f t e l e c o m o p e r a t o r s ,u n d e r t h e e n v i r o n me n t o f t h e d a t a s u r g i n g ,O p e n i n g
d a t a s e r v i c e a b i l i t y i s a d v a n t a g e t o t h e o p e r a t o r t o i n c r e a s e t h e v a l u e a n d r e v e n u e o f p i p e l i n e ,b u t i t a l s o n e e d
引用维基百科的定义, “ 大数据是指无法在一定时间内用常
当前,大数据已逐渐渗透到各个行业和业务职能领 域 以利用数据价值为核心的商业服务正在不断涌现, 如
数据资源服务、 数据分析服务、 数据开放平台服务等, 大数
的价值 和收入 . 但 对 其 运 营 能 力 也 提 出 了 更 高 的 要 求 。在 研 究 大 数 据 环 境 下 数 据 服 务 能 力 开 放 业 务 需 求 的基 础上 , 明确 了 数 据 服 务 内 容 , 提 出 了数 据 服 务 能 力 开 放 平 台 的 建 设 思 路 、 体 系架构 和开放机 制 , 对 运 营 商 加 强
大数据安全特征与运营实践
工程与应用大数据安全特征与运营实践刘志勇,何忠江,阮宜龙,单俊峰,张超(中国电信集团有限公司,北京 100032)摘 要:随着数据类型、用户角色和应用需求的不断细化,以及大数据复杂的数据存储和流动场景的出现,大数据安全防护要求越来越高。
以大数据安全特征和运营实践为切入点,分析了大数据安全特征和技术发展趋势,体系化地梳理和总结中国电信以“数据和人”为核心的大数据安全深度防御体系建设和运营实践;并对区块链、联邦学习、人工智能、零信任等新技术在数据安全流通、数据安全风险监测、数据访问控制的引入提出了思考和展望。
分析了大数据安全特征和技术发展的趋势,梳理了中国电信在大数据安全方面的运营实践,对新形势下筑牢大数据安全提出了思考与建议。
关键词:大数据;数据安全;区块链;联邦学习;人工智能;云计算中图分类号:TP311文献标识码:Adoi: 10.11959/j.issn.1000−0801.2021102Big data security features and operation practicesLIU Zhiyong, HE Zhongjiang, RUAN Yilong, SHAN Junfeng, ZHANG ChaoChina Telecom Group Co., Ltd., Beijing 100032, ChinaAbstract: With the continuous refinement of data types, user roles and application requirements, as well as the com-plex data storage and flow scenarios of big data, the requirement of big data security is higher and higher. Starting from the security characteristics and operation practice of big data, the security characteristics and technology devel-opment trend of big data were analyzed, the construction and operation practice of China Telecom’s big data security defense system with “data and people” as the core was systematically summarized. Some thoughts and prospects for the introduction of new technologies were also raised such as blockchain, federated learning, artificial intelligence and zero trust in data security circulation, data security risk monitoring and data access control.Key words: big data, data security, blockchain, federated learning, artificial intelligence, cloud computing1 引言大数据已经逐步应用于产业发展、政府治理、民生改善等领域,大幅度提高了人们的生产效率和生活水平。
中国电信技术的应用知识
中国电信技术的应用知识中国电信技术的应用知识涵盖了广泛的领域,从基础的通信设备到最新的5G网络技术,都是中国电信行业的重要组成部分。
本文将介绍中国电信技术的应用知识,包括通信网络的发展历程、移动通信技术、云计算、大数据等方面的应用。
通信网络的发展历程中国的通信网络发展经历了从固定电话到移动通信,从2G、3G、4G到5G的演进过程。
上世纪80年代,中国开始建设固定电话网络,逐步铺设了遍布全国的通信线路。
随着移动通信技术的发展,中国移动网络的覆盖范围不断扩大,用户数量也不断增加。
而当前,中国正积极推进5G网络建设,以提升通信速度和连接性能。
移动通信技术中国移动通信技术在全球处于领先地位,拥有巨大的用户基础和完善的网络覆盖。
中国的移动通信技术包括2G、3G、4G和5G等多种网络技术,为用户提供了高速、稳定的通信服务。
此外,中国还在不断探索新的通信技术,如物联网、人工智能等,以满足不同应用场景的需求。
云计算云计算是当前信息技术领域的热门技术之一,也是中国电信行业的重要应用领域之一。
中国的电信运营商提供了各种云计算服务,包括基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等多种服务模式。
云计算技术的应用为企业提供了灵活、可扩展的计算资源,推动了中国企业的数字化转型。
大数据大数据技术在中国的电信行业得到了广泛应用,通过对大量数据的采集、处理和分析,中国的电信运营商能够更好地了解用户需求、优化网络性能、提升服务质量。
大数据技术还被广泛应用于精准营销、智能推荐等领域,为用户提供更个性化、便捷的服务体验。
在这一系列的应用实践中,中国电信行业不断探索和创新,推动着技术的发展和应用的普及。
未来,随着5G网络的普及、物联网、人工智能等新技术的应用,中国电信技术的应用知识将继续深化和扩展,为推动数字经济的发展做出更大的贡献。
大数据在无线通信中的应用
大数据在无线通信中的应用提纲:一、大数据在无线通信中的应用介绍二、大数据在无线通信中的优势三、大数据在无线通信中的应用场景四、大数据在无线通信中的挑战与解决方案五、未来大数据在无线通信中的发展前景一、大数据在无线通信中的应用介绍无线通信是指通过无线电波传输信息的通信方式,已成为现代社会中交流信息的重要手段之一。
而大数据作为一种新兴的技术,也在无线通信中得以广泛应用。
大数据应用于无线通信中,主要是通过对海量数据的分析和挖掘,提取有价值的信息,为通信技术的实现和优化提供支持。
二、大数据在无线通信中的优势大数据的应用在无线通信中,有以下优势:1、提高通信质量。
无线通信中会出现信号干扰等问题,通过对海量数据进行分析,可以对通信信号进行实时优化,提高通信质量。
2、提升系统性能。
通过对无线通信网络的数据进行分析,可以及时检测网络中存在的问题,利用大数据分析模型对网络进行优化,提升网络的整体性能。
3、提升管理效率。
大数据技术可以提供通信网络维护管理的数据支持,对数据进行快速处理、分析和定位,提高管理效率,降低维护成本。
4、做出更准确的预测。
通过对大数据的分析,可以预测未来的无线通信趋势和需求,为未来的通信发展提供科学依据。
三、大数据在无线通信中的应用场景大数据在无线通信中的应用场景主要有以下几个方面:1、网络优化。
利用大数据技术对现有的无线通信网络进行实时监测和管理,对信令传输效率进行优化,实现网络优化。
2、信号强化。
利用大数据技术通过对通信信号的各种参数进行分析,优化信号,提高信号强度。
3、定位服务。
借助大数据技术对位置数据进行处理,实现位置定位服务,提高位置服务的精度和准确度。
4、降低网络费用。
通过大数据技术对网络资源的分析,优化网络应用,降低网络使用的费用。
5、预测用户需求。
利用大数据技术对用户需求进行分析和预测,实现对用户需求的全面覆盖,为无线通信企业提供更好的服务。
四、大数据在无线通信中的挑战与解决方案大数据技术在无线通信中的应用,也存在一些挑战。
大数据时代中国电信客户关系管理中的问题及改进
大数据时代中国电信客户关系管理中的问题及改进作者:窦豆来源:《商情》2017年第02期(中国电信股份有限公司昌吉分公司)大数据时代,客户关系和管理水平,对于促进中国电信的可持续健康发展,意义非常重大。
目前,在电信客户关系管理中,还有诸多问题存在,需要有针对性的采取改进措施,树立以客户为中心的经营理念,在压力和机遇并存的情况下,完善电信公司自身的管理,进而提升市场竞争力。
电信客户关系大数据时代问题改进大数据时代促进了企业的管理决策,也改变了企业的运营管理方式。
根据大数据,企业能对客户需求进行更全面、更深入的洞察,并以此促进企业形成更加科学和及时的运营管理决策,构建良好的客户关系,为企业高效运营管理提供保障。
一、大数据时代中国电信当前客户关系管理中存在的问题目前,中国电信发展取得了一定的成绩,经过一系列改革,形成了以客户为中心的企业经营理念,在客户关系管理方面达成了共识。
但在具体的实践过程中,还有很多问题存在,对电信企业市场竞争力形成了一定的制约。
这些问题具体表现在:1、客户服务理念陈旧大数据时代,营造良好的客户关系管理具有重要的意义。
然而一些基层服务人员对客户价值缺乏深刻的认识,有着相对陈旧的服务理念,在业务创新活动中,不能有效贯穿服务意识,无法对客户的个性化需求给予满足,也不能有效解决客户的细分问题,有待于进一步提高客户的整体服务质量。
2、客户关系管理缺乏整体规划在制定相应策略的过程中,各个方案之间相互独立,缺乏有效衔接,并相互抵消营销成果,给客户带来不良印象。
各个部门之间缺乏有效的交流和沟通,和客户接触的方式相互脱离,使客户无法形成对企业的整体印象。
3、客户信息的共享及利用率低中国电信尽管积累了一定的客户资料和信息,但却不能深入挖掘现有的客户资源。
客户信息具有较低的共享与利用率,不能对客户进行差异化分析,无法满足客户的个性化需求。
当前电信一项比较薄弱的环节,就是挖掘现有客户的潜在需求。
同时,也没有深入分析客户流失的原因,没有掌握客户流失的数量结构和方向,更没有采取有效的管理和控制措施。
中国电信云改数转心得体会
中国电信云改数转心得体会"采菊东篱下,悠然见南山"是千百年前诗人们所追寻的浪漫。
而今天,现代科学技术也赋予了生活别样的浪漫,让普通的日常变得甚是有趣。
人与人之间的交流能够演变出万千形态,从诗词歌赋到人生哲学,从鸿雁传书到拇指生活……如今,在数字化的作用下,不仅缩短了人与人的信息传递距离,而且给了物品以"生命",实现了人与物、物与物之间的对话与交流。
物联产生了数据,数据生出了智慧,智慧在社会的每个角落悄然播种,等待着一场盛大的花开——数字经济时代的到来。
数字化转型"持久战"已全面打响什么是数字经济时代?实际上,我们当前就处在数字经济时代的初级阶段。
信号以“1”“0”这种我们所熟悉的二进制来传送就是数字化;数字时代是指一个信息存在方式,正越来越趋向于数字形式,以数字技术为运作规则的时代;而数字经济是指随着信息技术革命发展而产生的新经济形态。
当前,以5G、物联网、大数据、人工智能、工业互联网等为代表的新一代信息基础设施加速发展,数字化浪潮席卷而来,我们离真正的数字经济时代越来越近。
"数字经济"也俨然成为近年热词,多次出现在政府工作报告中。
2021年政府工作报告提出,"加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国"。
这已经是“数字经济”第四次被写入政府工作报告。
从2017年的“促进数字经济快速成长”,到2019年的“促进新兴产业加快发展,壮大数字经济”,到2020年的“全面推进互联网+,打造数字经济新优势”,再到2021年的“协同推进数字产业化转型和产业数字化转型”,数字经济发展肩负的使命越来越重。
十四五年规划和2035年远景目标纲要草案中亦明确提出,“迎接数字时代,激活数据要素潜能,推进网络强国建设,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革。
大数据时代电信运营商的机遇_童晓渝
ీޜခ
ᅎྪࢻۯ
ຕ ీ
JbbT0QbbT
ٷຕ
ሊऺ໙ )ྪஏĂຕዐ႐čč*
图2 基于云计算的数据智能服务
务范围必然向移动互联网应用等非 电信业务、非传统优势领域延伸。 因此,在移动互联网时代,为提升 ICT产业中的话语权,电信运营商 不仅需要实现商业模式创新,更需 要借助开放智能普适服务能力、推 动业务形态转型等方式来应对新的 产业环境挑战、打造新的产业核心 竞争力[8],而实现这一目标需要历 经三个阶段。第一是开放面向大数 据的智能普适服务,即提供云计算 中IaaS层中海量数据存储和处理 能力、PaaS层中海量数据挖掘的 通用支撑能力以及大数据系统中智 能分析、应用开发等面向业务的大 数据服务能力。第二是积极培育大 数据产业生态,首先需要与开源组 织合作,推动低成本、高灵活的开 源软件部署应用,如Hadoop分布 式系统、NoSQL数据库以及R语 言运行环境等;其次是强化平台支 撑,构建面向大数据应用的通用能 力平台并通过标准API接口对外开 放;最后是加强应用培育,即培育 各类大数据分析挖掘应用的开发者 社区,推动应用丰富化。做好上述 两步的基础上可开展第三步,也是 最重要的一步,即推动业务形态转 型。从电信网运营向电信网与互联 网融合形态转型,从以网络资产为 核心的运营模式向以数据资产为核 心的运营模式转型,从参与传统 的 流量经营竞争向推动大数据产品生 态转型。
当前,大数据的应用包含四 个阶段,首先是数据收集与存储, 包含ETL、数据融合与集成等;其 次是信息提取,包含数据统计与查 询、报表生成、数据可视化与服务 化等;第三是知识发现阶段,包含 机器学习与数据挖掘等;最后是智 能应用阶段,包含基于知识的分析 与预测功能等。
同时,大数据应用的目标是 追求数据价值的最大化,要想实现 这一目标,必须具备从海量数据 资源中抽取信息、凝练知识的能 力,即必须能够通过信息交换、数 据整合、知识共享与交叉复用,形 成新知识、创造新价值。为构建 上述能力,本文提出并设计了面 向大数据的智能普适服务模型, 如图1中虚线部分所示,智能普适 服务包含大数据系统(BDS,Big Data System)、业务智能运营模 型(BI,Business Intelligence)以 及网络智能运营模型(NI,Network Intelligence);向下依托全面感知 的数据资源采集系统,向上为智能 监控、智能分析以及敏捷开发等应 用提供能力支撑,进而支持基于大 数据的智慧型管理、智慧型营销以 及智慧型服务等多场景业务。
大数据时代的电信运营商营销变革
74产经评论Business Comment中国电信业CHINA TELECOMMUNICATIONS TRADE移动通信市场竞争越发激烈随着价格战的持续升温、新进入者的加入、替代者的挑战,移动通信市场竞争越发激烈,传统电信运营商面临成长困境。
价格战持续升温,套餐门槛、单价加速下降。
“低门槛、高流量”套卡已成为三家运营商抢夺新增用户的主要手段,不足10元的套卡,每月赠送的流量最高达到5.8GB。
虚拟运营商的加入,使现有游戏规则面临挑战。
苏宁、迪信通等虚拟运营商纷纷推出自有通信品牌和套餐,灵活的资费模式和互联网化的宣传营销方式,让传统电信运营商压力倍增。
OTT 替代效应显著,“管道化”风险持续发酵。
QQ、微信等互联网产物,迫使传统运营商话音及短彩信收入进入下滑阶段,中国移动作为国内最大的通信运营商,2011年短信收入下跌0.9%,2012年扩大至4.8%,2013年更是扩大至6.5%。
大数据可以成为运营商的核心竞争力电信运营商拥有大数据首先,传统电信运营商拥有庞大的用户规模。
截至2014年3月,国内三家传统的通信运营商拥有庞大的用户规模,合计超过10亿用户。
其中,中国移动移动通信用户数合计为7.81亿,中国联通移动通信用户数为2.89亿,中国电信移动通信用户数为1.83亿。
其次,传统电信运营商拥有每个用户多维度数据。
传统电信运营商承担了数据传送者的重要职责,在完成传统业务的同时,还处于数据传递和交换中心的地位,拥有用户多维度数据,例如用户属性数据、上网行为数据、上网内容偏好数据、用户消费数据、用户通信行为数据等。
最后,鉴于传统电信运营商的核心地位,仍有大量可整合和接入的数据。
手机号码作为用户身份的标志,可从外部获取大量的非结构化的数据,例如位置信息数据、关系信息数据、银行信息数据以及通讯录信息数据等,此类数据能迅速扩大传统电信运营商“大数据”池。
大数据可以有效提升传统电信运营商市场竞争力在流量时代,流量用户需求更为多样化、个性化,受资源及营销能力的限制,“大而全”的粗放经营已不再适应市场发展。
中国电信大数据发展分析报告
中国电信大数据发展分析报告一、引言大数据是继信息化、互联网之后的新一轮科技革命的重要驱动力量,对于社会经济的发展、政府治理的改进、企业战略的调整等方面都具有重要意义。
中国电信作为我国最大的电信运营商之一,一直致力于发展和应用大数据技术,以提供更好的产品和服务。
本报告将对中国电信的大数据发展进行分析,探讨其在未来的发展方向。
二、中国电信大数据的现状1.数据积累中国电信作为电信运营商,拥有庞大的用户数据储备。
包括用户通话记录、短信记录、上网数据、位置数据等。
这些数据的积累为中国电信提供了丰富的数据资源,为开展大数据分析提供了基础。
2.数据整合中国电信通过数据整合,将不同业务领域的数据进行整合,建立了统一的数据仓库。
这使得中国电信能够更好地对用户数据进行分析,挖掘出有价值的信息,以提供个性化的服务。
3.数据挖掘与应用中国电信通过数据挖掘等技术,对用户数据进行分析,为用户提供个性化的产品和服务。
例如,根据用户的通话记录和上网偏好,推荐适合的手机套餐或互联网应用。
三、中国电信大数据发展的挑战1.数据安全大数据时代,数据安全成为一个重大挑战。
中国电信需要加强数据的安全防护,避免用户数据泄漏和滥用。
2.数据隐私用户数据隐私保护是一个重要问题。
中国电信需要制定和执行严格的隐私保护政策,保护用户的数据隐私不被滥用。
3.技术人才大数据技术需要高水平的技术人才支持,而这方面的人才供给还不够充足。
中国电信需要加大对大数据技术人才的培养和引进力度,以提高技术人员的能力。
四、中国电信大数据未来的发展方向1.数据驱动决策中国电信可以通过大数据分析,提供更精准的市场判断、业务决策等。
通过深入分析用户行为,帮助企业了解用户需求,并根据需求制定相应的策略。
2.优化用户体验通过大数据分析,中国电信可以实时了解用户的使用习惯、偏好,从而提供更加个性化的服务。
例如,根据用户的上网偏好,为用户推荐相关的应用或产品。
3.开拓新业务五、总结中国电信在大数据领域取得了一定的成就,但仍面临着许多挑战。
大数据技术在中国电信天翼高清质量监测系统中的应用
大数据技术在中国电信天翼高清质量监测系统中的应用刘㊀博中国电信河南公司,河南郑州450000摘要:随着现代网络的发展,大数据技术在网络维护和分析中的作用正在逐步显现㊂介绍了大数据技术在中国电信天翼高清项目中的实际应用,提出了运用大数据技术解决实际工作问题的方法,可以为运营商其他系统的研发提供参考意义㊂关键词:大数据;Hadoop;Spark;质量监测系统中图分类号:TP311.50引言在过去的一年中,三大运营商的电视业务得到了快速的发展,IPTV的燎原之势㊁发展之猛超乎大多数人的意料㊂截至2017年5月,全国IPTV用户已超过1亿,全国近1/4人口通过IPTV观看电视,IPTV也成为越来越受人们欢迎的选择㊂然而,在用户猛增的背后,是运营商都面临着挑战:如何尽快实现IPTV业务发展模式从规模扩张向价值兑现的转变,实现从封闭业务体系到可控开放业务生态的转变㊂因此,从规模到价值的转型,从量变到质变的推进,是今后中国电信IPTV发展策略的重中之重㊂1天翼高清质量监测系统简介中国电信天翼高清质量监测系统,是由中国电信集团运维部主导,上海研究院㊁云公司㊁悦me运营中心及各省公司参与研发的产品,是中国电信电视业务的集团级战略产品之一,也是中国电信试水开发运营一体化战略转型的试点项目㊂系统核心架构基于Spark+Kafka+Hadoop的分布式大数据技术,综合使用了SparkSQL㊁SparkStreaming㊁SparkCore技术㊂依托大数据计算平台,综合分析多方海量数据,对用户障碍可以做到定界㊁定段,并覆盖终端㊁EPG/认证平台㊁节目源㊁CDN㊁承载网等环节㊂系统架构方案主要包含以下四个部分㊂数据采集:各省数据接收至LVS负载分担集群,通过Flume汇总日志,并将收集到的数据输送到Kafka中间件,以供实时或非实时消费计算㊂大数据处理:大数据处理部分包括数据清洗㊁计算与存储㊂数据清洗模块从Kafka取到数据后输送至SparkStreaming进行实时数据清洗,清洗后数据保存至HDFS㊂大数据计算模块从HDFS取出相应时间段数据,进行MAP/REDUCE等操作得到计算结果㊂实时数据和离线数据基于Spark按维度进行计算,实时计算后的数据存储至Redis队列中,供前端界面展示㊂离线计算后的数据存储至HDFS,供前端界面展示㊂数据存储:清洗后的数据入Kafka后,一份输送至SparkStreaming供实时计算,一份存至HBase满足短期深入分析需求,一份存至HDFS用于长期存档㊂大数据计算部分是整个项目的核心部分㊂后台应用:对大数据处理结果进行归并与简单的二次分析,为前端提供可以直接展示的数据㊂前端:负责界面展示㊂2大数据技术在系统中的应用2.1Spark+HDFS完成离线区域归并计算HDFS是HadoopDistributeFileSystem的简95大数据与信息管理㊀㊀㊀㊀㊀㊀㊀㊀作者简介:刘博(1984 ),男,情报学硕士,软件工程师,研究方向为大数据及网络信息安全㊂㊀2019年第01期㊀㊀称,也就是Hadoop的一个分布式文件系统㊂它的主要设计理念包括:(1)存储超大文件;(2)最高效的访问模式是一次写入㊁多次读取(流式数据访问);(3)运行在普通廉价的服务器上㊂Spark是专为大规模数据处理而设计的快速通用的计算引擎,其是对Hadoop的补充,提供了一个集群的分布式内存抽象(RDD),以支持需要工作集的应用㊂RDD(ResilientDistributedDataset)也是Spark中的编程模型㊂Spark提供了RDD上的两类操作 转换和动作㊂转换是用来定义一个新的RDD,包括map,flatmap,filter,union,sample,join,groupByKey,cogroup,reduceByKey,cros,sortByKey,mapValues等,动作是返回一个结果,包括collect,reduce,count,save,lookupKey㊂通过对RDD的操作,我们可以完成对海量分布式数据集的运算㊂在项目的实际应用中,我们的HDFS文件系统采用时间维度的目录结构,方便实现按照时间段批量获取文件㊂如2017年8月5日14点12分的文件,目录结构可定义为/2017/08/05/14/201708051412.txt㊂这样做离线计算时,可以直接取某一目录下的所有文件,提高文件查找效率㊂但是,这样每分钟都生成相应文件的做法,随着时间的推移,会造成小文件过多㊂因为HDFS的存储原理是将文件分布式地存储在DataNode上,读取时并发访问来提升效率,如图1所示㊂这就要求HDFS为每个文件维护一份元数据来记录该文件的存储位置等信息㊂当大量的小文件存储到HDFS中就会产生大量的元数据,因而占用NameNode大量的内存㊂如果对海量小文件进行高并发的访问会使得HDFS的NameNode和DataNode都负载过大㊂图1㊀HDFS存储原理为了解决小文件的问题,引入了周期性文件合并功能㊂将三天前的HDFS文件,按照小时合并为一个大文件,合并后的大小在2G左右,同时调整HDFS分块Block大小为256M,降低元数据消耗,延长磁盘寻道时间㊂在Spark处理方面,因为涉及多维度的计算,为提升运算效率,我们将需要运算的信息首先进行分类整理㊂尽量保证后面的运算能够基于前面的计算结果进行,因为再次读取HDFS文件数据的操作是非常耗时的㊂例如,我们首先将单用户的质量按照MAC地址进行MapToPair操作,生成后续用于归并为区域总计结果的RDD㊂由于已进行了一次归并,后续计算时,原始数据量也减少了很多,RDD的运算越来越快㊂优化后我们单计算SPARK任务计算处理1500万条原始数据的时间为30s左右,完全能满足离线计算的时间需求㊂2.2SparkStreaming+Kafka完成实时区域计算㊀㊀实时区域计算的需求是每分钟分析出前一分钟海量终端上报的话单数据,要按照基础的运算维度,即时地算出结果,不得出现运算超时的情况㊂如果仍旧按照Spark+HDFS的操作模式,仅每次提交任务的初始化时间就要30s以上,无法满足我们实时计算的需求㊂因此,需要用到SparkStreaming技术㊂SparkStreaming是一个对实时数据流进行高通量㊁容错处理的流式处理系统,可以对多种数据源(如Kdfka㊁Flume㊁Twitter㊁Zero和TCP套接字)进行类似Map㊁Reduce和Join等复杂操作,并将结果保存到外部文件系统㊁数据库或应用到实时仪表盘㊂SparkStreaming是将流式计算分解成一系列短小的批处理作业㊂这里的批处理引擎是SparkCore,也就是首先把SparkStreaming的输入数据按照batchsize(如1s)分成一段一段的数据(DiscretizedStream),每一段数据都转换成Spark中的RDD(ResilientDistributedDataset);然后将SparkStreaming中对DStream的Transformation操作变为针对Spark中对RDD的Transformation操作,将RDD经过操作变成中间结果保存在内存中㊂整个流式计算根据业务的需求可以对中间的06㊀㊀㊀㊀㊀㊀㊀㊀大数据与信息管理㊀㊀2019年第01期㊀结果进行叠加或者存储到外部设备㊂图2显示了SparkStreaming的整个流程㊂图2㊀SparkStreaming流程我们从Kafka读取相关Topic的做过数据清洗后的数据clear01(话单数据消息),clear02(统计数据消息),然后分别提取这两个消息的相关字段信息进行Join关联,关联之后运算得到单用户质量数据,然后将单用户质量数据新建一个消息队列回写到Kafka,再由后续关联程序分别取出,写入ElasticSearch系统和HDFS中㊂在这个过程中,有一个问题需要解决,就是两个Topic的数据如何关联的问题,尤其是在实时处理中,可能存在数据流不同步的情况㊂比如终端的丢包重传,就会让一个Topic中有这个终端的数据,而另一个Topic需要等下一个小周期才能收到数据㊂目前,通过Kafka的DirectAPI接口直接读取Kafka的Topic数据,两个Topic的消息在同一个时间间隔被读取并进行关联,即关联的两个Topic的消息是同一批时间间隔中的消息㊂为了解决数据不同步的问题,我们通过引入中间结果RDD进行延迟匹配来解决㊂操作原理如下:我们对两个Topic进行匹配后,会得到匹配成功数据㊂与此同时,我们把未匹配成功的数据保存进中间结果RDD中,等待后续匹配㊂为了避免这个RDD过于庞大,设置了5min的清理时长,每次清理出RDD中超过5min有效期的数据㊂通过如上处理步骤,我们的实时区域计算每15s收取一次SparkStreaming的内容,并能够在5s内完成运算,满足系统需求㊂2.3Netty服务器解决集群进程级故障的即时响应㊀㊀如图3所示,Yarn集群的Yarn⁃Cluster运算模式,是由ClusterManager将程序分发到WorkerNode上,然后在各个WorkerNode上运行的㊂图3㊀Yarn⁃Cluster程序运行流程这样就会带来一个问题,程序在WorkerNode上执行期间,如果遇到运行错误或者计算规则问题,我们是很难了解的㊂这就需要一种能够将WorkerNode运算情况及时掌握的技术来解决㊂为此,我们基于Netty搭建了一个服务分发监测与管理系统,用于提交Yarn⁃Cluster任务㊂Netty是由JBOSS提供的一个开源的Java网络编程框架,主要是对Java的nio包进行了再次封装㊂Netty比Java原生的nio包提供了更加强大㊁稳定的功能和易于使用的API,可以支持超高并发量的Socket访问㊂我们的Netty服务提供了任务定时提交的功能,可以完美替代我们之前用的Crontab提交方式,并可以实时㊁完整地按需记录提交记录和执行记录㊂同时,通过监听Socket端口,如果任何一个WorkerNode内部出现问题或者有需要传递出来的执行信息,都可以Socket消息传递出来,并由Netty服务端接收处理,可以极大地方便类似Yarn⁃Cluster这类分布式执行系统的进程级监控㊂最后,我们还将Netty服务端与短信接口整合,提供了短信告警系统,出现进程级错误可以直接通知到维护人,确保系统问题能够在第一时间被确认和解决㊂2.4优化程序逻辑,规避大规模Shuffle操作对Spark程序来说,Shuffle操作最消耗性能,在Shuffle的过程中会产生大量的磁盘IO㊁网络IO,以及压缩㊁解压缩㊁序列化和反序列化等性能开销㊂在项目代码中要尽量避免Shuffle类操作,以确保大数据处理的性能㊂对于必须进行Shuffle操作的数据,要考虑如何减少源数据量,如可先筛选掉无用数据后再进行Shuffle㊂下文结合项目的实际场景来阐述如何规避对16大数据与信息管理㊀㊀㊀㊀㊀㊀㊀㊀㊀2019年第01期㊀㊀㊀㊀2019年第01期㊀大规模数据的Shuffle操作㊂我们需要处理的海量数据源是机顶盒定期报上来的性能㊁业务数据,每分钟将达到近千万条记录㊂而要做到告警级别,就要在尽量短的时间内处理完这些数据,目标时间是20s内完成大数据分析和告警入库等一系列操作,这就对大数据处理效率提出了很高的要求㊂首先,在未刻意优化的情况下测试系统的处理能力与时长,最终发现未优化情况下完成千万级数据处理需要约5min时间㊂这个处理时长是实际无法接受的,于是就开始了程序优化㊂优化第一步是在处理原始数据时添加了更多filter条件进行过滤,尽量减少最后需要Shuffle的数据量㊂接下来,尽量使用ReduceByKey来替换GroupByKey㊂如图4所示,因为GroupByKey是把分区中所有的键值对都进行移动,然后再进行整体求和,而ReduceByKey会在每一个分区内先归类汇总后,再整个集群做整体合并,所以使用GroupByKey会导致集群节点之间的开销增大,传输效率降低㊂在大数据环境下,使用ReduceByKey优势明显㊂然后,对于能够重复利用的计算结果RDD,我们使用cache操作将其持久化,保存在内存中,提高数据集调用效率㊂这些处理过的RDD已经不是大数据级别的百万条数据了,而很可能是数千级甚至仅是数百级的数据了,并不会消耗太多的内存空间,但对于系统整体性能的提升是非常可观的㊂2.5设置双重KEY,避免数据倾斜数据倾斜是分布式大数据处理中严重影响处理效率的问题,个别任务执行慢,拖慢了整个任务的处理时间㊂造成这种现象的原因是在并行处理的数据集之中,某一Partition的数据显著多于其他部分,从而使得该部分的处理速度成为整个数据集处理的瓶颈㊂天翼高清系统需统计区域+CDN节点维度㊁区域+CDN服务器维度㊁CDN节点维度㊁CDN服务器维度㊁CDN节点所在区域维度各个维度的质量检测数据,其输入数据为单用户质量数据lines(格式为:mac|area|playtype|contentid|bitrate|Time|Rrip|serverip|SERVER_TAG|TAG_NODE|throughput|playtv|Lagtv|mLr|PlayTimes|SlowTimes|FailTimes|isSlow|isFail|isLag|isLoss|isBad|),其输出数据为区域㊁CDN节点标识(或CDN服务器标识)㊁类型㊁播放用户数㊁质差率㊁质差用户数㊁起播慢比率㊁故障影响人数㊁起播失败比率㊁故障影响人数㊁卡顿率㊁故障影响人数㊁丢包率㊁故障影响人数等信息㊂其中的类型分为 0:组播;1:直播单播;2:时移;3:回看;4:点播;6:直播汇总(0+1);7:点播汇总(2+3+4);8:单播汇总(1+2+3+4);9:不区分类型 等㊂由于各个CDN的数据量差别相当大,所以我们遇到的数据倾斜问题也很严重㊂经综合考量,我们最终使用了Spark前缀Key双重聚合方案:Spark对Key值使用加前缀的处理技巧,综合调用reduceByKey㊁groupByKey算子进行计算,对Key值进行二次聚合,如图5所示㊂第一次聚合(局部聚合):对每一个Key值加上一个前缀,执行第一次reduceByKey聚合操作㊂第二次聚合(双重聚合):转换Key值的前缀,执行第二次聚合操作groupByKey,最终得到全局聚合的结果㊂将结果持久化到HDFS系统中㊂2.6关联第三方系统调优天翼高清系统主要使用的第三方系统包括Hadoop集群㊁Kafka㊁Oracle㊁Redis等㊂例如,在Spark与Kafka的交互方面,我们一开图4㊀GroupByKey与ReduceByKey原理26㊀㊀㊀㊀㊀㊀㊀㊀大数据与信息管理㊀2019年第01期㊀㊀图5㊀双重聚合解决数据倾斜问题始用SparkStreaming操作Kafka时是使用createDstream方法的,后来尝试调整为createDirectStream的方式,直接对Kafka进行操作,发现可以明显提升计算性能㊂同样,SparkStreaming连接Redis操作时,我们从redis.lpush方式调整为redis.pipelined方式,使用pipeline管道批量写入redis,也对性能带来了较大的提升㊂SparkStreaming连接Oracle数据库,SQL语句使用like查询比较耗时,在OracleSQL层面进行优化后,也明显提升了整体性能㊂因此,通过对SPARK关联的第三方系统调优,也是可以整体提升Spark系统的处理性能㊂3实施效果中国电信天翼高清质量监测系统在从2017年9月应用以来,极大提升了天翼高清维护工作的运行效率,加强和丰富了运维管理手段㊂(1)实时分析全国天翼高清用户视频业务质量,为视频业务的QoS分析提供了有效的手段㊂(2)大数据流式实时计算,实现群障的实时监控派单,派单准确,直接定位故障段落和影响范围,极大地提高了中国电信视频业务维护效率㊂(3)运用大数据快速检索技术,为全国提供用户视频质量投诉快速响应服务,结合用户光宽业务质量数据,快速精准分析用户质差的原因,快速解决用户问题㊂(4)通过整个电信集团集约运营的方式,降低中国电信集团整体研发开销,提升了系统效益㊂4结语在网络运维工作中,很多地方会涉及海量数据的处理,如故障判断㊁漫游分析㊁各类探针数据等㊂随着SDN在电信网络中的逐步深入应用,我们也将有能力获知网络运行状态的更多细节,而要利用这些更加海量的信息就需要依赖大数据计算的能力㊂本文所述的大数据应用案例作为中国电信集(下转第76页)36大数据与信息管理㊀㊀㊀㊀㊀㊀㊀㊀据发展的法律法规,用于规范信息网络使用安全,给予相关技术保护部门相应的管理权限,同时建立起行业信息使用规范,从法制层面保证网络信息安全和隐私保护㊂5结语随着大数据和数据科学的迅速发展,基于数据共享的应用几乎在所有的社会领域和商业领域开始广泛流行㊂然而,数据共享带来的数据隐私的泄露问题阻碍了数据共享服务的健康发展㊂数据共享主要是由一些大的数据拥有者(如GWAS医疗研究机构㊁Facebook,Twitter等)定期发布一些大的数据集供其他第三方研究机构或者个人进行数据分析使用,但是这些大的数据集里往往包含了用户的一些隐私信息㊂因此,如何保护用户的隐私信息免受恶意侵犯是需要解决的问题㊂本文对面向数据发布和数据分析的隐私保护进行了研究,并深入研究了全基因组关联研究(GWAS)过程中的数据发布隐私保护,并在此基础上设计和实现了一种基于差分隐私的数据采集与分析平台㊂参考文献[1]李超.大数据环境下隐私保护的研究现状分析[J].电脑知识与技术,2016,12(18):29⁃31.[2]陆雪梅,古春生.大数据环境下用户信息隐私泄露成因分析和保护对策[J].现代情报,2016,36(11):66⁃70.[3]牛晨晨,周畅,张昪.大数据背景下的个人隐私保护研究[J].西安航空学院学报,2017,35(1):73⁃76.(上接第63页)团自主研发的一个战略性项目,可以为后期开展其他电信网络相关的数据分析甚至自动化㊁智能化维护提供有价值的参考意义㊂参考文献[1]ZahariaM,XinRS,WendellP,etal.ApacheSpark:Aunifiedengineforbigdataprocessing[J].CommunicationsoftheACM,2016,59(11):56⁃65.[2]龚鹏,曾兴斌.基于Netty框架的数据通讯服务系统的设计[J].无线通信技术,2016,25(1):46⁃49.[3]陈锐忠,魏理豪,梁哲恒,等.基于Hadoop的海量数据处理模型研究和应用[J].电子设计工程,2016,24(14):101⁃103.67㊀㊀㊀㊀㊀㊀㊀㊀大数据与信息管理㊀㊀2019年第01期㊀。
大数据分析在电信行业中的应用实践
大数据分析在电信行业中的应用实践大数据分析作为一种新兴的技术和工具,已经在各个行业中展现出巨大的潜力和影响力。
在电信行业中,大数据分析的应用也蔚然成风,为电信企业提供了更多洞察消费者需求、提高服务质量和效率的机会。
本文将探讨大数据分析在电信行业中的应用实践,以及其带来的优势和挑战。
一、市场和竞争分析电信行业面临着激烈的竞争和不断变化的市场环境。
通过大数据分析,电信企业可以更好地理解市场需求和竞争态势,为企业决策提供有力支持。
通过对大数据的挖掘和分析,电信企业可以获取用户消费行为、偏好和需求的深入了解,从而为产品开发、定价和市场推广提供指引。
二、用户行为分析电信企业积累了大量用户数据,如呼叫记录、短信记录、手机应用使用情况等,这些数据蕴藏着宝贵的信息。
通过大数据分析技术,电信企业可以深入挖掘用户行为模式和趋势,提供个性化的服务和推荐。
例如,通过分析用户的呼叫记录和短信记录,电信企业可以为用户定制更适合的套餐和服务,提高用户满意度。
三、网络优化与故障排除电信网络的性能和可靠性对电信企业来说至关重要。
大数据分析可以帮助电信企业监测网络状态、分析网络负载和预测故障风险,从而及时进行网络优化和故障排除。
通过大数据分析,电信企业可以发现网络拥堵点、对网络资源进行合理调配,提高网络性能和用户体验。
四、精准营销和客户关系管理大数据分析使得电信企业能够深入了解用户需求和消费习惯,并根据用户的个性化需求进行定向营销。
通过分析用户的消费行为、社交媒体信息和其他相关信息,电信企业可以为用户提供更精准的推荐产品和服务。
此外,通过大数据分析,电信企业还可以建立客户画像,提供个性化的客户服务和管理。
总结:大数据分析为电信行业带来了许多机遇,能够提高服务品质、增强竞争力和优化运营效率。
然而,大数据分析的应用也面临着一些挑战,如数据安全、隐私保护和技术实现等。
电信企业需要充分利用大数据分析的优势,并在应用中坚持合规和合理原则,以确保数据的安全和隐私保护。
案例应用年度技术总结(3篇)
第1篇一、引言随着科技的飞速发展,新技术、新应用层出不穷,为各行各业带来了前所未有的变革。
在过去的这一年里,我国在多个领域取得了显著的成果,以下将从几个典型案例出发,对年度技术应用进行总结。
一、5G与5G-A技术1. 中国电信“翼”路创新中国电信在5G和5G-A技术发展方面取得了重要成就。
5G-A作为5G技术的演进方向,正在加速赋能物联网及垂直行业。
中国电信已在多个地区实现了5G-A应用,例如深圳的血液运输智能空港平台、陕西的智慧煤矿场景等。
此外,中国电信在5G网络建设上与联通创新共建共享模式,积极推动数字信息基础设施建设与升级,并在工业、交通物流、医疗等多个行业实现了广泛应用。
2. 5G-A关键技术突破与生态构建工信部提出加速5G-A关键技术突破,构建新生态。
中国电信在模式创新、科技创新和应用创新方面取得显著成效,助力全球5G发展,并获得了2023年度国家科技进步奖一等奖。
在云网一体、天地一体等方面的技术创新和实践案例,以及对新兴工业化、低空经济等领域的影响,都充分体现了中国电信在网络升级方面的示范效应,助力数字经济高质量发展。
二、人工智能与大数据技术1. “业界首个大模型&多智能体应用实现核心网运维降本增效”中国移动集团、中国移动浙江有限公司与华为联合申报的业界首个大模型&多智能体应用实现核心网运维降本增效案例,荣获“ICT中国案例(2024年度)”评选一等奖(卓越案例奖)。
这一案例通过引入大模型和多智能体技术,成功应用于核心网运维,实现了成本的降低和效率的提升,已在浙江、青海和西藏等多个省份部署并取得显著成效。
2. AI辅助软件开发AI辅助测试与调试在软件开发中的应用案例,包括制定测试策略、输出测试计划、生成测试用例、生成接口测试用例和脚本、生成Web端登录界面的自动化测试脚本、解决问题、测试过程中使用的工具以及App自动化测试方法等。
这些案例展示了AI技术在软件测试领域的应用趋势,有助于提高测试效率和测试质量。
大数据在中国电信的应用实践(大数据能力开放)
大数据在中国电信的应用实践(大数据能力开放) 大数据在中国电信的应用实践(大数据能力开放)1.引言1.1 背景1.2 目的1.3 范围2.大数据在中国电信的应用介绍2.1 中国电信的大数据战略2.2 大数据应用的目标和优势2.3 大数据应用的实际情况3.大数据技术架构3.1 数据采集与处理3.2 数据存储与管理3.3 数据分析与挖掘3.4 数据可视化与展示4.大数据在营销领域的应用4.1 用户画像分析4.2 精准营销4.3 市场预测与决策支持5.大数据在网络运维领域的应用5.1 故障预警与主动管理5.2 网络质量优化5.3 智能运维与故障定位6.大数据在风险控制领域的应用6.1 金融风险监测与预警6.2 信用评估与反欺诈6.3 风险控制策略优化7.大数据在智慧城市建设领域的应用 7.1 智慧交通管理7.2 智能能源管理7.3 智慧安防系统8.大数据在客户服务领域的应用8.1 个性化推荐8.2 智能客服与在线支持8.3 客户满意度分析与提升9.大数据能力开放9.1 数据共享与合作9.2 开放平台建设9.3 开放数据集与API10.本文涉及附件附件1、中国电信大数据应用案例合集附件2、大数据技术架构图附件3、大数据应用示例截图11.法律名词及注释- GDPR:《通用数据保护条例》(General Data Protection Regulation),是欧盟制定的关于个人数据保护与隐私的法规。
- CCPA:加州消费者隐私保护法(California Consumer Privacy Act),是加州通过于2018年6月28日的立法,旨在保护个人隐私的法规。
- 个人信息:根据相关法律定义,个人信息是指能够单独或与其他信息结合识别、推断出个人身份的信息,包括但不限于姓名、联系号码、方式号码、电子邮箱等。
附件:附件1:中国电信大数据应用案例合集附件2:大数据技术架构图附件3:大数据应用示例截图法律名词及注释:GDPR:《通用数据保护条例》(General Data Protection Regulation),是欧盟制定的关于个人数据保护与隐私的法规。
中国电信大数据应用实践
对 中国电信运 营商而 言, 三 网总 的活跃 移动 连 接 超过 1 0 亿, 其 中超 六成 终端 为智 能终端 , 每天各类 应用和 业务被使 用 , 持续 产 生大 量 的数 据 流 。 用户通 过 智 能终 端 的
发展 。 根据集 团规 划 , 云计算分公司作为大 数 据运 营 支撑 单位 , 承 担大 数 据产 品集 约 开发、 运营、 销售 、 服务和 经营支撑工作 。
发 展方 向有 较 大 的影 响 ; 从数 据 的有 效 性 看, 在大 量 数 据 中寻 找 关联 信息并 验 证 其 有效 性 , 是 非常巨大 的工作 量; 从 业务 逻辑 看, 对 于 运营 商 来讲 , 将 原 本用 于 经 营 的
数 据产 生机 制用 于大 数 据 领域 , 需 要从 硬
主要研 究方 向为消费 者研究 、 互 联网网民行为分析 和数据挖 掘 、 新媒 体传播 及媒介价值 研究 、 网络
营销效果 评估优化 、 汽车数字营 销。
李名洋 ( 1 9 8 3 一 ) , 男, 中国电信股份有 限公司云 计算分公司数据 分析师 。 主要负责大数 据分析 、
模 型搭建 应用 、 行业大数 据研 究等 作。
・ 数 据 生 产 线 技 术 架 构 设 计 。适 应 电信 大 数 据 两种 业 务 数 据 模 型 , 包 括 批
大数 据 的应 用问题不 仅仅是 一 个企 业 内部 的事情 , 也 是 整 个 行业 乃至 跨 行业 的 事情 。 从 软硬件方 面看 , 大 数 据应用涉及硬 件 设施 、 基础软件 、 应 用 软件 和 信 息服 务 等方面; 从 数 据 生产 流 程 看 , 大 数 据 应 用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2
2
3
1
3 11
1 2
基本思路:
1. 稳定基本资源能力,理清能 力建设头绪
2. 单体示范应用拉动,打通非 自动化、安全可控的对外服 务流程
3. 体系流程系统固化、自动化
积极助力各地政府,根据区域特色及题材选择,推进示范创兴项目
助力政府 准确决策
助力行业 创新服务
助力中小 企业发展
支撑客户:X省经信委,X省卫计委,X省应急办,X省国安局 ……
隔离:按功能分类、数据敏感等级严格划定功能区域,并进行访问控制
限制
脱敏:包含敏感信息的数据,进入用户空间时进行实时脱敏处理,敏感
信息通过系统标识存入单独隔离区
标识:敏感信息读取,只能通过授权后标识识别的方式;通过敏感信息
标识、关联的数据,改为通过系统标识、关联
授权:非敏感数据一次授权访问;敏感信息通过触点二次授权后,通过
“大数据+云”能力组合,专业稳健的服务运营能力
三点体会 – 关于数据开放服务平台实践
• 充分认识数据开放服务复杂性,需要组合式的解决方案应对 • 选择合理的建设模式以及推进步骤,示范应用拉动能力建设非常必要 • 运营是核心中的核心,数据运营需要良好的规划、治理以及生命周期管理
定位于数据汇聚开放平台,首先要面对融合、开放与服务带来的挑战
大数据在中国电信的应用实践
下篇:大数据能力开放
中国电信云计算分公司大数据事业部 2016年5月20日
“互联网+”吹响产业转型创新的号角,也改变了信息生产消费模式
拥抱变化,为“互联网+”整体布局世界领先的基础设施
数据中心直连专网分层汇聚、高速互联全网数据中心
数据中心间流量智能调度,数据中心+网络一体化服务
标识访问
审计:数据进入、离开用户空间,进行内容审计
能力概述:数据生产调度管控能力
平
台
能
力
管 控
E T
L
调
平度
台
网
管
数据作业流水线 数据基础服务开放
子表
子表
母表 基表 文件总线
流表 数据总线
文件接入、流式接入
能力概述:数据标签发布及接口能力
示例
合理规划建设步骤,根据区域特色及热点主题选择示范应用并行
积极助力各地政府,根据区域特色及题材选择,推进示范创兴项目
助力政府 准确决策
助力行业 创新服务
助力中小 企业发展
支撑客户:X省商务部(部试点)
三点体会 – 关于数据开放服务平台实践
• 充分认识数据开放服务复杂性,需要组合式的解决方案应对 • 选择合理的建设模式以及推进步骤,示范应用拉动能力建设非常必要 • 运营是核心中的核心,数据运营需要良好的规划、治理以及生命周期管理
• 数据存储:文件系统级的数 据加密压缩存储;应对冷数 据提供对象存储技术
能力概述:数据安全管理能力
• 刑法第九修正案 • 全国人民代表大会常务委员会关于加强网络信息保护的决定 • 信息安全技术公共及商用服务信息系统个人信息保护指南 • 工信部24号令《电信和互联网用户个人信息保护规定》 • ……
积极助力各地政府,根据区域特色及题材选择,推进示范创兴项目
助力政府 准确决策
助力行业 创新服务
助力中小 企业发展
支撑客户:X省经信委,X省卫计委,X省应急办,X省国安局 ……
积极助力各地政府,根据区域特色及题材选择,推进示范创兴项目
助力政府 准确决策
助力行业 创新服务
助力中小 企业发展
支撑客户:国家旅游局,及若干省旅游局 ……
保障用户到云的访问速度,打造20ms IT生活圈
拥抱变化,为“互联网+”整体布局世界领先的基础设施
数据是中国电信差异化优势能力,积极推进社会大数据开放服务
70% 国内
的通信数据流量及数据计算行为承载于
中国电信的网络及IDC上
48小类,日增量15PB
大数据开放服务取得显著成效,运营模式及能力得到国家社会广泛认可
数据运营体系:基于数据生命周期的能力规划
• 从哪里来 • 组成情况 • 数据规则 • 统计口径 • 更新频率 • 体量特征 • 应用场景
数据运营体系:基于数据生命周期的能力规划
数据运营体系:四维度治理、十因素评估
数据运营体系:数据治理
天翼大数据 数据服务生活
感谢
数据安全管理能力 (脱敏、标识、授权 触点) – 隐元星系统
大数据生产环境构建能力 – 飞龙系统
云处理能力 虚机+OOS+CDN
网络通信能力 DCI
3项基础能力
• 云、网络、数据处理
4项运营级系统能力
• 实时构建、调度管控、安全管理、 服务发布
2项运营级体系能力
• 规划及治理、审计与监控
能力概述:大数据生产环境构建能力
数据产品使用者
业务应用提供商
分析技术提供商 数据能力开 放平台商
基础设施提供商
• 数据开放服务是大趋势,更是社会责任与企业使命 • 成长的关键是产业链中找准定位,参与良好生态的建设
做数据开放平台,三个无法绕过的问题:
互信融合 安全合规
跳出数据归属的思路限制,敢放上来,能灵 活用,控制输出与失效期
围绕五要素“隔离、脱敏、标识、授权、审 计”,严格控制敏感数据,拥有者知情通报 与实时授权,全程监控与审计留痕
普适高效
全程自动化场景适配,多种应用模式适配, 即席查询验证与高复杂度挖掘分析方向适配
数据开发运营基础能力组合视图:“3+4+2”
应用
应用
应用
应用
应用
数据服务审计与监控体系
能力规划及数据治理体系
数据标签发布及接口能力 – 飞梭系统
数据生产调度管控能力 (采集、ETL、稽核、
宽表) – 天狮系统
大数据处理能力 Hadoop
5.整体空间焚毁
1.申请
临时空间 3.输出审计
2.授权后供给
用户空间A
审计 4.成果使用
Hale Waihona Puke 用户空间B临时空间• 基于定制云模板技术的实时 大数据运行环境生成
• 非对称密钥保护的数据授权 交付确保传输安全
• 加工后整体环境彻底字节级 消除
用户空间
• 基于混合云技术,专线或 VPN连接用户私属的独立 大数据运行空间