运维规划

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、运维现状问题发现:

二、运维架构设想:

(1)监控管理:提供整套服务器的全面监控,包括机房监控、业务监控、系统监控、资源监测及应用监测。

(2)配置管理:提供统一的CMDB管理,包括配置建模、配置发现、配置维护及数据应用。

(3)自动化管理:提供应用部署管理、操作自动化管理。

(4)流程管理:提供运维服务流程管理,包括服务台、服务目录、事件管理、问题管理、变更管理、知识库及流程引擎等。

(5)运维门户:提供生产服务器统一运维入口,包括平台统一认证、系统管理及级联管理等。

三、运维体系初步实施:

1、搭建zabbix监控平台实时监控所有生产环境服务器、磁盘、网络、负载及业务系统的

运行状态、性能。根据监控和处理结果,及时记录相关信息,定期汇总。

2、通过线上服务器的监控,将线上服务器的CPU、内存、磁盘调制最优值,保证资源最

大化。

3、搭建测试环境,并将生产环境中测试环境回收,使生产环境与测试环境区分开,保证

生产环境稳定运行,

4、搭建跳板机,对线上生产环境实行单点登录,对用户实施限制,以及后期对线上自动

化部署的实现。

5、与开发人员配合沟通,解决运行过程中的相关问题。

四、运维体系工作内容:

1、从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的管理。

●设备基础性能检测;

●设备日志查看;

●测试ping的连通性;

●网络安全策略应运是否正常;

●异常网络数据包流量;

●DOS、DDOS等网络攻击情况监测;

2、对主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护。

进行监控管理的内容包括以下几点:

●CPU性能管理;

●内存使用情况管理;

●硬盘利用情况管理;

●系统进程管理;

●监控备份服务进程、备份情况(起止时间、是否成功、出错告警);

●监控记录磁盘阵列、存储硬件故障提示和告警,并及时解决故障问题;

3、对数据库的监控管理,了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性的进行性能优化。同时,密切注意数据库系统的变化,主动的预防可能发生的问题。

进行监控管理的内容包括以下几点:

●数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。

●表空间使用信息监测;

●数据库文件I/O读写情况,读写是否分离;

●Session链接数量监控;

●查看每日数据备份,数据同步是否正常;

●检测数据库后台进程;

4、负责对终端PC、笔记本以及工作站的操作系统、应运软件和硬件的维护,解决使用人员在应用过程中遇到的问题并简单的培训。

相关文档
最新文档