运维规划
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、运维现状问题发现:
二、运维架构设想:
(1)监控管理:提供整套服务器的全面监控,包括机房监控、业务监控、系统监控、资源监测及应用监测。
(2)配置管理:提供统一的CMDB管理,包括配置建模、配置发现、配置维护及数据应用。
(3)自动化管理:提供应用部署管理、操作自动化管理。
(4)流程管理:提供运维服务流程管理,包括服务台、服务目录、事件管理、问题管理、变更管理、知识库及流程引擎等。
(5)运维门户:提供生产服务器统一运维入口,包括平台统一认证、系统管理及级联管理等。
三、运维体系初步实施:
1、搭建zabbix监控平台实时监控所有生产环境服务器、磁盘、网络、负载及业务系统的
运行状态、性能。根据监控和处理结果,及时记录相关信息,定期汇总。
2、通过线上服务器的监控,将线上服务器的CPU、内存、磁盘调制最优值,保证资源最
大化。
3、搭建测试环境,并将生产环境中测试环境回收,使生产环境与测试环境区分开,保证
生产环境稳定运行,
4、搭建跳板机,对线上生产环境实行单点登录,对用户实施限制,以及后期对线上自动
化部署的实现。
5、与开发人员配合沟通,解决运行过程中的相关问题。
四、运维体系工作内容:
1、从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的管理。
●设备基础性能检测;
●设备日志查看;
●测试ping的连通性;
●网络安全策略应运是否正常;
●异常网络数据包流量;
●DOS、DDOS等网络攻击情况监测;
2、对主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护。
进行监控管理的内容包括以下几点:
●CPU性能管理;
●内存使用情况管理;
●硬盘利用情况管理;
●系统进程管理;
●监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
●监控记录磁盘阵列、存储硬件故障提示和告警,并及时解决故障问题;
3、对数据库的监控管理,了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性的进行性能优化。同时,密切注意数据库系统的变化,主动的预防可能发生的问题。
进行监控管理的内容包括以下几点:
●数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。
●表空间使用信息监测;
●数据库文件I/O读写情况,读写是否分离;
●Session链接数量监控;
●查看每日数据备份,数据同步是否正常;
●检测数据库后台进程;
4、负责对终端PC、笔记本以及工作站的操作系统、应运软件和硬件的维护,解决使用人员在应用过程中遇到的问题并简单的培训。