weblogic中间件通用应急预案教程文件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
w e b l o g i c中间件通用应急预案
Weblogic中间件(含业务应用)通用应急预案一、应急处置原则与工作流程
国网信息系统中间件主要采用weblogic集群方式部署,通过中间件控制台对各应用节点进行统一管理和监控,本次中间件应急预案以“先抢通、后抢修”为处理原则,首先恢复业务应用,保存相关日志,后期再根据日志进行详细分析和故障定位。
weblogic中间件是应用程序的发布平台,相对比较稳定。
业务应用均通过weblogic中间件进行发布,通过weblogic中
间件的JDBC等配置,实现前端应用和后台数据库之间的交
互。
因此不管是程序代码问题、硬件问题、数据库问题均有可能体现在weblogic中间件节点异常;并且由于程序代码效率
低下、参数配置不当,也会导致weblogic中间件节点异常。
这种情况下,重启异常weblogic节点,释放资源,是最快的
恢复业务的应急手段。
具体原因可以通过备份日志,事后进行分析排查。
本应急预案中涉及到的程序包路径,均是根据信通公司weblogic中间件安装规范中指定的路径。
如果未按照规范安装的中间件,请电话咨询对应系统专责协助处理。
二、weblogic中间件故障应急场景
故障应急处理步骤6步:
1、使用IE浏览器访问节点应用确认节点可用性。
2、登陆weblogic控制台确认节点状态。
3、收集故障点日志,备份节点日志。
4、查看节点日志,根据报错信息确定故障原因。
5、根据故障原因,执行应急操作。
6、组织人员进行具体原因分析并整改。
三、故障场景
Weblogic中间件日志文件中常见错误如下:
ddedLDAP.tran (Permission denied)>
9 <Aug 10, 2014 3:15:07 AM CST> <Error
> <JDBC> <BEA-
001112> <Test "SELECT 1 FROM DUAL"
set up for pool "JDBC Data Source-
0" failed with exception: "java.sql.SQLRe
coverableException: No more data to rea
d from socket".>
<Aug 10, 2014 3:15:07 AM CST> <War
ning> <JDBC> <BEA-
001129> <Received exception while cre
ating connection for pool "JDBC Data So
urce-
0": IO Error: The Network Adapter could
not establish the connection.>
数据库单节
点异常,
RAC无法全
部正常对外
提供服务
节点运行过程中13,11,12
10 The JRE was not found in directory /usr/
java/k1.6.0_38. (JAVA_HOME)
Please edit your environment and set th
e JAVA_HOME
variable to point to the root directory of
your Java installation.
Java环境变
量配置不正
确
节点启动过程中14,12
11 <BEA-002621> <Connection rejected,
the server license allows connections
from only 5 unique IP addresses.>
Weblogic9版
本license未
授权
节点运行过程中1,2,3,4,5,15,11,12
12 VM Version 1.5.0_12-b04 from Sun
Microsystems Inc.>
<2014-8-11 下午04时50分58秒 CST>
<Critical> <WebLogicServer> <BEA-
000362> <Server failed. Reason:
There are 1 nested errors:
weblogic.management.ManagementExce
ption: Unable to obtain lock on
/home/weblogic/bea/user_projects/dom
ains/bzcb_domain/servers/AdminServer/
tmp/AdminServer.lok. Server may
already be running
节点未正常
停止
节点启动过程中5,11,12
13 因硬件或者系统故障,应用服务器全部无
法启动
16
四、应急处理步骤
1.使用IE登陆访问对应故障节点应用地址,验证故障现象,防止
误告警出现。
2.登录weblogic控制台,确认故障节点名称。
使用IE浏览器,访问weblogic控制台http://IP:端口,根据异常端口号确认异常节点名称,如下图。
3.使用weblogic用户登陆操作系统。
4.备份对应节点日志。
$ cd /app/logs/hqgl/server1.log ---进入对应日志目录
$ cp –r server1.log 20140808server1.log -----按照日期备份节点日志
5.查看节点进程状态。
$ ps –ef|grep server1 (server1为节点名称)
如果返回值为空,如下,则执行步骤12:
weblogic 59086 2803 0 22:12 pts/1 00:00:00 grep server1
如果返回值不为空,如下,则执行步骤11:
6.增加JDBC连接池上限
1)登陆weilogic控制台,进入JDBC配置页面,修改增加JDBC配置。
主要调
整initial capacity及maximum capacity两个参数,其中initial capacity表示初始建立的连接数,maximum capacity表示最大的连接数,主要调整增大Maximum Capacity参数,再原有基础上增加20。
(具体要根据对应数据库的process上限,要求weblogic节点数*Maximum Capacity 值< 数据库process数的80%)如下图所示:
2)如果无法进入JDBC控制界面,可以按照步骤11,12,通过重启应用节点,
释放数据库连接资源,达到抢通业务的目标。
7.调整操作系统用户打开文件数量上限
使用root用户登录系统
# vi /etc/security/limits.Conf
weblogic - nofile 10240 ----新增该内容,或者调整该值上限。
# su – weblogic ---切换到weblogic用户
$ ulimit –Hn ---验证配置是否生效,如下表示生效
10240
8.修改weblogic后台启动密码问题
使用weblogic用户登录系统,进入节点缓存目录,修改后台启动密码
9.调整JVM参数设置
10.修改文件权限
11.停止异常节点进程
12.启动异常节点
13.修改JDBC连接串
部正常对外提供服务时,修改JDBC连接串,让应用节点连接到可用的数据库地址上。
登陆weilogic控制台,进入JDBC配置页面,根据数据库专责提供的可用连接串,修改JDBC连接串地址为
jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)( HOST=10.1.80.141)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME=test)(INSTA NCE_NAME=test)))
14.JAVA环境变量错误
Weblogic用户登录系统
$ java –version --------查询weblogic用户下jdk信息
java version "1.6.0_37"
Java(TM) SE Runtime Environment (build 1.6.0_37-b06)
Java HotSpot(TM) 64-Bit Server VM (build 20.12-
b01, mixed mode)
$ which java ---查询jdk安装路径
/usr/java/jdk1.6.0_37/bin/java
$ cd
/home/weblogic/Oracle/Middleware/user_projects/domains/test_domain/bi n
$ vi setDomainEnv.sh ---按照上面查询的路径结果修改weblogic脚本中的JDK配置
SUN_JAVA_HOME="/usr/java/jdk1.6.0_37"
export SUN_JAVA_HOME
15.更换weblogic9版本更换license
16.因硬件或者系统故障,节点均无法启动。