中间件运维服务
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中间件运维服务
1 中间件的服务内容
1.1 服务目标
行天科技可提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络
信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规
划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数
据库软件、中间件软件等)、业务应用软件等。
行天科技通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的
环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信
息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。
行天科技提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,
创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持
续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
1.2 中间件运维服务
中间件管理是指对BEA Weblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管
理、故障监控、性能监控。
执行线程:监控WebLogic配置执行线程的空闲数量。
JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。
JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。
检查WEBLOG日志文件是否有异常报错。如果有WEBLOG集群配置,需要检查集群的配置是否正常。
2、MQ中间件维护项目
1. 实时监控以下文件系统使用情况:
检查文件系统/var/mqm
MQ应用所在文件系统。
2. 定期报告MQ系统错误,备份清理MQ系统错误记录
在遇到问题时,检查/var/mqm/errors目录下是否有新的FDC文件产生,如果有应当立即报告IBM技术支持部门。另外,要定期检查该目录下MQ错误日志。
3. 监控队列深度
DIS QLOCAL(QName)
该命令的显示结果可以看出队列当前深度
4. 检查死信队列
DIS QLOCAL(DEAD QName)
5. 检查日志个数是否增长
使用命令cd移动到MQ日志所在目录,使用ls –l|wc命令统计,如果有所增长,应立即报告IBM系统支持人员。
6. 检查MQ队列管理器错误日志
当系统运行不正常时首先检查:
/var/mqm/qmgrs/
7. 检查、处理队列管理器pending事务
若队列管理器启动成功后,CICS(配置XAD连接MQ)启动失败,则可以检查是
否有pending事务,若有必须进行处理(可能造成数据的不一致性,必须事先加以确认)。
Websphere维护项目
➢系统安装规范和流程。全新系统从操作系统、数据库、WebSphere 相关组件,按照特定was/ihs版本根据安装手册设立安装规范和流程
(目前已经完成此项文档)。
➢系统维护规范和流程。比如大版本升级\小版本\APAR\fix维护。是否应用某些关键fix的判断原则,是建议打?是可选?对于可选,分
析具体fix用途以及对应用影响,并和开发部配合沟通的流程。
➢应用部署规范。包括初始应用部署和大版本升级。重新部署和测试
➢应用修改流程。Jsp,修改程序时间后让其自动更新。Class,servlet,ejb, 一般重启应用服务器,对于公共模块,重启was等。
➢常用工具说明文档和使用流程。脚本开发和使用,wsadmin脚本,管理控制台,PMI(连接池释放等)等工具。后面又详细描述。
➢应用的发布位置要求规范。系统安装路径规范,应用发布路径,repository位置规范,log, property 文件规范等等。(不当的位置可
能带来严重后果,比如/home/,批量修改的后果)
Websphere 系统优化
➢JVM基本调优
➢Web容器接收请求线程池。Web 容器Servlet引擎线程池的值在合理的范围内
➢JDBC 数据库连接池
数据库连接池的最大值要稍小于Web容器线程池的大小
➢后台数据库本身能接受的客户端连接数目
➢合理设置数据源配置项中的preparedstatement缓存的大小,提高后台数据库访问的效率。
3、对Websphere 进行监控管理和问题诊断
对Websphere 的资源和可用性进行管理
管理员需要对WebSphere 的资源信息,JVM 的CPU、内存、jdbc 连接池、
线程池、EJB 调用情况、GC 的情况、Session 的连接情况等做实时的信息监控,
并且将这些数据收集起来,作为长期性能趋势
对WebSphere 用户请求信息的监控
对用户的请求信息进行实时监控,对关键的请求信息以及持续占用系统资源比
较高的请求进行告警处理。过历史信息收集和分析,分析哪些请求在哪些时间
段是频繁的,哪些业务是用户最多关心和访问的,帮助优化业务过程,提高服
务质量。
对应用问题的深度诊断和分析
在实际的应用开发中,由于对J2EE 组件使用不当,或者是代码编写的不规范,
可能会出现一些很难发现且难以解决的问题,比如线程死锁、内存泄漏、内存
溢出等。
Weblogic 维护
中间件故障诊断总结
一、步骤:
1、准确描述现象:客户说的和自己查看到的:平台、版本、操作、信息等。特别是,
故障前是否有做过什么操作:网络调整、设备调整、主机参数调整、配置文件修改……
反正将这一切都列入排查的对象。
2、使用工具收集数据,收集配置文件、日志、dump文件等等。
3、使用分析数据,根据问题或收集的数据,使用适当的工具分析数据,当然包括了
在网上和在官方支持站点搜索类似的问题的解决办法。
4、尝试解决问题,根据找到的问题点,尝试解决。如修改错的,复原正确的;运行
有问题的,适当调整运行的环境和运行的参数等等。5、给出最佳解决方案,一般就
是继续观察了。6、总结经验并加以重用,知识积累。
小魏16:50:21
[文件: Tuxedo维护文档.pdf]