全台网关键业务流程短信预警平台的实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全台网关键业务流程短信预警平台的实现
摘要
我台的业务生产系统以ESB、EMB业务数据总线为主干,新闻制播网、媒资网、综合制作网通过互联主干实现互联互通;在实际业务生产过程中,因为各种原因,有可能出现媒资上下载、新闻制播等关键生产流程中的任务出错情况。
针对此类情况,结合大洋系统提供的工作流机制以及数据流信息,自主开发了一套节目生产系统关键任务短信预警系统。
该系统不仅造价便宜,部署便捷,而且能实时捕捉生产过程中的出错和异常,第一时间采取相应处置手段,提高业务生产的效率,减轻生产系统运维的整体压力。
关键字
非编媒资互联新闻制播工作流实时监控短信报警
一、前言
苏州广播电视总台是比较有代表性的城市型传媒集团。
依托全台节目生产制播网络的持续建设,苏州台的节目生产流程已经基本实现文件化,生产效率极大提高。
在节目制作网络内部,各板块通过主干平台实现互联互通。
媒资系统通过全台网主干为节目制作系统提供了平均300次/日的素材调用,其中2/3为新闻业务服务,在新闻网内部,每日平均也有150条成片送演播室播出。
依托传统的流程监控软件,可以了解这些关键任务在流程中的运行情况。
但在一般情况下,除非运维部门设置监控中心,派专人监控业务流程,否则由使用部门发现任务出错,再通知运维部门干预,往往需要十几分钟甚至更长时
间,在关键时段这些新闻相关任务的故障,可能会给节目播出造成较大影响,而专门设置由人值守的监控中心则管理使用成本过高,为及时捕捉生产过程中的出错和异常,第一时间采取相应处置手段,提高业务生产的效率,减轻生产系统运维的整体压力。
我台技术团队依靠自身力量开发了关键业务流程短信预警平台。
二、苏州台生产制播网络现状和业务流程分析
1、生产制播网络总体架构
生产制播网络以总线型的分布式结构搭建,集成了包括新闻网在内的多个制作网络、媒资系统、主干互联平台、演播室播出系统。
各业务板块均通过标准的接口与总线连接,通过ESB、EMB双总线,实现了多个业务板块之间开放、规范、松耦合的互联互通,业务生产系统能够实现基于工作流的24小时不间断节目生产。
我台当前的业务生产系统网络拓扑如图1-1所示,采用简单的以太网连接方式,媒资模块、新闻制播模块、综合制作模块连接到业务网核心交换机。
EMB服务器、ESB服务器、业务网核心交换机为互联主干平台的物理基础, ESB、EMB双总线为业务支撑平台。
主干平台是互联互通的核心,为业务生产模块、媒资模块提供接入方式、业务交互方式以及数据交换方式并具有可扩展性;提供了不同业务模块之间的业务整合功能;各个业务模块在主干平台上集成了数据的交换和路由、流程的管理和控制、实现全台业务系统的统一管理和互联互通
图1-1业务生产网络系统拓扑图
2、业务生产模块
新闻制播模块分为新闻制作网和演播室系统,从采集、粗编、精编、配音、审片到播出都在网络中完成,实现了制播一体化。
新闻制作网由文稿子系统、非编子系统和内容管理子系统组成;演播室系统采由主+备播出服务器、视频服务器及信号采集、传输设备。
综合制作模块承担以综艺类节目后期制作、电视剧和广告串编、数字电视等业务,包含数字电视收录制作网、电视剧制作网、广告制作网、综艺节目制作网多个非编子系统。
媒资模块是管理总台媒体资源、节目资料等内容的系统,通过上载、编目、审核、存储、发布、检索、下载等流程将海量资料在数据库中全面存储,为节目生产提供丰富的检索功能。
3、业务生产流程
1)新闻制播流程
图2-1 新闻制播流程
新闻制播流程分为制作和播出两个阶段。
记者根据新闻线索拍摄采访后回到制作机房,用自己的账号登陆编辑工作站,首先在大洋文稿系统中新建一条稿件,然后进入大洋非编系统编辑已关联好的故事版,对故事版进行精剪和上字幕,最后走提交演播室流程。
非编桥设置完故事版的打包路径后,转换桥向打包队列中新增一条打包任务,打包完成后由演播室桥向trans队列中添加一条trans外部任务,非编桥回置完成状态,任务继续由trans服务执行外部迁移和内部迁移,最终将要播出的成片迁移到新闻演播室视频服务器上。
整个制播过程中任务会在以下几个节点出错或停滞不前:打包出错、打包终止、打包不进行、trans出错、trans不进行、审核不通过等,这些出错都会导致节目制作和传输的失败,需要人为干预。
2)媒资上载流程
图2-2 媒资上载流程
提交上载媒资请求后,流程可能会在节目查重、获取目标路径、调用EMB服务、转码、入库、入库回调这些工作流节点出错,导致流程终止。
3)媒资下载流程
图2-3 媒资下载流程
媒资与各制作网通过ESB、EMB双总线互联,用户在制作网提交下载请求后,流程可能会在后续的节目查重、媒资下载、获取目标路径、调用EMB服务、入库、入库回调这些工作流节点出错,导致下载流程终止。
三、关键业务流程监控预警平台的实现
1、平台构成及思路
硬件:1)服务器、2)华为CDMA短信猫、3)电信天翼卡;平台软件:1)基于COM通信的短信报警程序、2)节目生产系统关键任务监控模块,软件结构如图3-1所示;
出错信息队列
关键任务监控模块
短信发送模块D Y E M B
D Y
E S B
D Y R
E N D E R
监控线程1监控线程2监控线程3发送线程
D Y T R A N S
监控线程4
读
读
读
读
写
写
写
写
读
图3-1 软件架构图
工作方式:关键任务监控模块通过收集关键流程的工作流和数据流信息并深度挖掘,筛选出错信息,并以结构化的数据插入发送队列中,短信报警程序按照固定时间间隔将发送队列中的信息发送给当天IT 值班运维人员。
2、监控关键流程对象
新闻制播模块有两套新闻子网,综合制作模块有四个子网,这六个子网都通过互联主干与媒资模块互联互通,关键流程如下: 媒资下载到1套新闻网; 媒资下载到2套新闻网; 媒资下载到广告制作网; 媒资下载到节目制作网; 媒资下载到5套新闻网; 媒资下载到数字电视制作网; 1套新闻网送播流程; 2套新闻网送播流程; EMB 流程;
3、数据库设计
该平台需要本地建立数据库来存放关键任务出错信息、人员管理信息、任务监控信息等;数据库实例命名为smsdb,包括三张表:用户管理表、监控流程信息表、出错任务信息记录表;用户管理表存运维人员的姓名、该用户负责的监管流程、该用户的手机号码;监控流程信息表记录流程对应数据库服务器IP、库名、管理用户及口令等;出错任务信息表记录出错的任务信息,例如任务名称、类型、出错步骤、该任务创建时间、报警状态位等。
4、短信猫接口设计
短信猫接口主要提供三个功能函数,并封装成动态链接库,以便在编码时显式调用。
1)Open函数,连接短信猫,建立COM通信信道;
2)SendMsg函数,发送短信文本;
3)Close函数,断开短信猫,关闭通信信道。
5、任务监控策略
制作网通过主干与媒资模块互联的ESB流程监控通过分析工作流数据库DYESBDB来实现,库中表WF_PROCESSINSTANCE记录了每一条关键任务的实时运行情况,包括任务名称、任务ID、任务类型、任务状态、任务当前活动节点、任务出错的活动节点ID,表WF_ACTIVITY 定义了不同类型的流程的所有活动节点ID以及活动节点名称。
筛选ESB流程的条件:任务类型字段值为mam2edit,任务状态的错误码为非零值,每隔30秒重复做数据分析,确保及时捕获流程的出错信息。
EMB任务的监控主要分析DYEMBDB数据库,库中表DYEMB_MAINTASKINFO、DYEMB_FINISHEDMAINTASKINFO记录了所有正在执行和已经完成的EMB任务。
这两张表的字段定义相同,包括任务名称、任务进度、出错信息、回调信息等;筛选所有EMB出错任务的条件:任务状态码不等于8;筛选EMB不回调任务的条件:任务状态码为8、回调状态码为1;筛选添加EMB失败的任务的条件:同时检索表DYEMB_MAINTASKINFO、DYEMB_FINISHEDMAINTASKINFO,若检索结果为空,则说明该任务在EMB中没有添加成功。
新闻制播流程中的打包任务和迁移任务非常关键,对于打包任务的监控主要通过分析打包数据库DYRender来实现;DYRender库中的表DYRC_TASKINFO记录了相关打包任务的信息,监控提演播室的打包出错任务的条件:任务状态码不等于8,任务发起人为trans_bridge。
对于迁移任务的监控通过分析大洋演播室数据库studio30实现,库中表rendertaskinfo和transtaskinfo对应着trans外部任务和内部任务,rendertaskinfo和transtaskinfo的数据结构一致,记录了任务ID、任务名称、任务进度、任务状态、任务出错原因等信息,监控迁移任务出错的条件:状态码为5,任务发起人为studio_bridge。
6关键任务监控模块
图3-2 用户界面1
关键任务报警模块监控的关键任务:trans,打包,EMB任务,ESB 流程,通过勾选复选框可开启或停止监,能够为每个监控任务设置轮询时间片;每个任务的监控都以单独的后台线程执行,该线程负责记录关键任务出错信息并将线程和数据库操作信息写入日志;各个线程互不影响,确保程序稳定运行。
7短信报警模块
图3-3 用户界面2
如图3-3所示短信报警模块的用户界面,提供软件与短信猫的COM 信道连接与断开功能:COM口默认为COM1,数据波特率默认为115200;提供单独的短信发送测试;提供发送队列的信息检索功能;可设置循环发送短信的时间间隔。
四、项目效果和发展
该短信预警平台在总台生产业务网络中部署并试运行近两个月,效果极佳。
通过与技术值班管理系统关联,各种业务流程出错信息可以短信方式直接发送到当日值班人员的手机上,为安全播出的应急响应提供了充裕的反应时间;同时,在使用部门反馈问题之前,运维团队就已经完成故障处理,极大提高了全台网技术服务水平,保证了使用部门对技术服务的高满意度。
在实际运行中,系统报警的准确率在98%左右,较少出现误报漏报的情况。
目前平台尚有不足,接下来我台技术团队将从功能、可靠性、实用性多方面进行不断完善。