运维2.0理论体系之三大重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运维2.0之三大重点
一、业务驱动运维
IT的使命是向业务交付价值,为了高效地服务于业务,运维2.0强调以一种新的途径来管理运维,即业务驱动运维。业务驱动运维的本质强调无论服务源自何处,IT 运维总能主动规避、发现或解决问题,向业务提供统一标准地端到端交付,并以确保持续改进的最佳服务级别的目标加以管理。业务驱动运维可以从如下两个层面来解读。
(一)自上而下——业务战略指导IT运维规划
运维规划从企业的业务战略入手,逐步将业务战略转化为运维管理系统与工具的功能目标和系统架构,通过分析业务战略识别运维目标、运维的交付过程和数据,对数据进行分析,自上而下地指导运维规划,并形成一体化运维平台。支撑企业业务战略的实现,满足企业管理层次的要求,引领企业业务创新。业务战略与愿景给IT运维体系和一体化运维平台提供总体架构与演进方向,同时也明确运维体系与相应落地工具组成与开发的先后顺序。
(二)自下而上——智能运维提升业务的敏捷性
业务的发展瞬息万变,移动化、虚拟化和云计算等技术使IT运维环境错综复杂,IT运维要想跨越分散独立的异构IT领域,深入分析业务服务并实现模块化。就需要将业务服
务级别提高到一个全新的智能级别。利用历史数据优化资源的使用情况,并规划未来业务发展。服务智能化旨在将各种IT数据转化为切实可行的知识,引领规划和指导实践。运维2.0工具体系提供能够提前预见IT问题和预判未来业务需求的分析引擎,支持IT部门更智能化地为业务交付价值。自下而上地将存储、监控、分析、展示、管理和规划全面整合在一起,提供全新的一站式和一体化服务,保证业务的敏捷性以及频繁变动时业务决策的科学化和智能化,减少耗时粗犷的手动操作。
运维2.0所提倡的业务驱动运维使得IT运维主动和业务建立强相关,运维愿景与规划来源于业务战略,运维活动反作用于业务创新与规划,IT的任何问题或故障都能量化成业务影响,业务不必了解复杂的IT技术仅需要了解和自身相关的服务。通过规范SLA评估服务质量,从而达到IT运维和部门之间相互依存、互利共赢的目的。
图示:业务驱动运维
二、架构驱动运维
所谓架构驱动运维是指利用架构的优化达到运维管理效率的提升,在应用发生变化或故障发生时,可以触发架构本身可伸缩和可调度能力,做到自我修复,节省对运维成本与能力的依赖。运维2.0的架构规划原则包括:
(一)分层多级且单元化服务——拆分迭代灵活
大系统拆分成多层多级,如应用架构上分服务提供层、接入调度层、中间计算层、数据存储层。层级模块内高内聚,层级模块间低耦合。每一层级划分若干模块,低耦合系统易于扩展,足够小的模块易于复用。在保持功能模型完整的基础上,要保持高性能与高负载,需要不同功能特点的模块再拆分,比如静态与动态部分分离。此外,考虑到服务的性能和成本,核心服务的主服务提供体系可以考虑架构单元化,即服务虽然分层划分,但每个单元自成一体,单元中的上层
节点会访问指定的下层节点。这样不仅保证了更高性能更低成本的目标,在资源隔离,系统灰度发布,对高峰扩容的应对方式上也提供了权宜之策。
图示:服务单元化
(二)服务模块化,兼顾分区容忍性——纵向可伸缩
根据目标客户群、增长模型、访问量模型、峰值分析等来推导和设计服务的架构、规模、资源,每个服务由多模块组成,如接入层主服务器集群、中间层备服务器集群。根据功能模型和用户规模推导出模块数量,每个模块支撑的容量,每个模块的服务器数量,每个服务器支撑的容量以及模块在多IDC、多ISP间的分布。当出现故障时,通过故障梯度服务柔性将故障对服务提供的影响消化掉,借助可伸缩的服务设计不影响服务调用者的体验。根据功能模型的需要,一部分类似一致性的商务需要可以通过其他手段完成。
图示:服务模块化
(三)多ISP、多IDC分布——横向可调度
为防范网络、硬件的故障,规避硬件层、系统层、通过全局负载均衡解析服务的访问,引导服务到最优的ISP、IDC、模块、服务器。当出现故障时,可以通过全局负载均衡将故障对应的ISP、IDC的服务器IP地址从全局负载均衡中摘除,服务访问被解析到其他正常的模块、服务器,从而使故障不影响自服务的提供。架构上多ISP、多IDC的分布和调度策略是重点。
(四)分布式云化部署——海量运维可支持
运维最大的挑战是基础架构环境规模越来越大,服务支持趋于海量,海量导致技术选型取向趋于分布式架构和产品。如分布式文件系统、分布式缓存、分布式存储和分布式数据库、IDC分布式部署。每套服务独占物理环境,交付慢且调整难度大导致运维日益云化,底层架构实现虚拟化资源池、
上层架构实现运维流程服务调用,以达到有效提高资源利用率,全面提升系统运维管理能力的目的。
三、数据驱动运维
在云计算和大数据时代,集群规模和数据爆发式海量增长,给运维带来了巨大的挑战。运维2.0理论提出用数据说话、用数据预见运维活动、借助全量的数据提及评价运维过程,简言之,就是数据驱动运维。运维2.0的数据驱动运维关注两个重点。
(一)构建全量的数据体系
构建全量的数据体系包括构建数据全生命周期管理和数据架构体系,做好数据分类、数据标准、数据质量和数据安全的把控,作为数据驱动体系的基础数据采集与规范平台,发挥数据价值,为运维决策和运维服务的衡量提供科学依据。
数据全生命周期管理包括数据创建、存储、清洗、迁移、归档及销毁数据从产生到灭亡的六个阶段的标准、规范和流程。
数据架构体系则从流程、人员和技术三个层面,对所采集的面向资源的、面向技术指标的、面向服务的、面向用户的以及面向产品的结构化数据和非结构化日志或文件,在数据管控、数据归属、数据架构、数据质量和数据安全方面提出要求。具体落地方式可通过如下方式在实现。
1.建立主数据系统,对主数据进行一致性管理和调用;
2.建立数据质量规范与策略、数据清理标准、数据合规性标
准,并将上述规则嵌入到应用系统与工具中;
3.将数据分类,落实不同类型数据的归属者与责任人,并建
立相应的逻辑数据模型和物理数据模型;
4.建立《数据质量考核办法和实施细则》,定期对数据进行
合规和安全性的审计,确保数据质量的持久可控;
5.完善操作及分析数据的工具与技术,如数据提取、加载与
转换工具、数据同步与整合工具、数据清洗工具、数据建模与分析工具等。
图示:全量数据体系
(二)构建价值驱动体系
在建立全量数据体系,保证数据的准确性和完整性基础