分享一种系统事故问题处理反馈方式(COE)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分享⼀种系统事故问题处理反馈⽅式(COE)
标签: ,
【前记】COE(Correction Of Error)是我们在JD研发部时使⽤的⼀种事故&问题处理反馈⽅式。
就是我们常说的“复盘”。
复盘,围棋术语,也称“复局”,指对局结束后,双⽅旗⼿把刚才的对局再复演⼀遍,这样可以有效地加深对这盘对弈的印象,也可以找出双⽅攻守的漏洞,是提⾼⾃⼰⽔平的好⽅法。
联想集团的管理中也引进了复盘这种⽅法,并作为联想的三⼤⽅法论之⼀。
当⼀个⼈精通复盘之后,他对于⾃⼰的⼯作就会有深刻的认识和体悟,具有⼀种惊⼈的直觉。
就可以从纷繁复杂的现象中⼀眼抓住关键所在,找出解决问题的⽅法和路径。
如下为2014/11⽉份的邮件。
丁总,如下为摇钱树标的交易订单号重复事故的发⽣及处理过程。
COE(Correction Of Error)是我们在JD研发部时使⽤的⼀种事故&问题处理反馈⽅式。
事故描述
11⽉6⽇下午业务部门在进⾏回款操作时,反映存在两个⽤户购买的标的,但是单号相同
事故症状
徐夫明查看通过数据库统计订单,发现在有34笔这样的交易,只有17个单号,即每2笔交易共⽤1个单号。
产⽣的影响
连连⽀付在⽀付成功后会回调我们系统,然后我们的系统会根据订单号更新订单为已⽀付。
因此,当某2笔交易共⽤⼀个单号时,当其中⼀笔完成⽀付,会同时更新这2笔交易为已⽀付。
处理过程描述
-11⽉6⽇10:00 业务部门反映存在两个⽤户购买的标的,但是单号相同
-11⽉6⽇11:00 徐夫明查看通过数据库统计订单,发现在10⽉17⽇、18⽇、21⽇、22⽇的交易中,存在34笔这样的订单,只有17个单号,即每2笔交易共⽤1个单号。
单笔交易均为100元。
-11⽉6⽇13:00 徐夫明发现问题,订单表订单号不是主键,同时,当时的订单号⽣成规则是以精确到秒时间格式命名,导致同⼀秒发⽣的交易的订单号重复。
(此⽣成规则在10⽉22⽇已经变更为⽇期+5位随机数的⽅式)
-11⽉6⽇17:00 业务部门对⽤户承诺,会对这34笔交易逐⼀回款。
-11⽉6⽇20:00 张国战更正订单表表结构,撤销⾃增的标识列主键,将订单号设为主键。
-11⽉7⽇10:00 张国战、徐夫明更改影响到的程序,包括PC端和⽆线端的交易、后台订单管理等模块,并做测试。
-11⽉10⽇19:00 准备上线。
后续⼯作
任务名称任务概述负责⼈完成时间完成情况
数据库梳理对现有数据库设计进⾏系统梳
理,对于不合理的设计,给予改
正。
张国战11⽉17⽇在进⾏
加强代码的Review⼯作对于提交的代码进⾏严格的代码
review,确保提交代码的质量以
保证⽣产
张国战、徐夫明、
王栋
以后会陆续执⾏
[结束]。