投稿邮箱

digitcw@163.com

您的位置:首页 > 技术研究 >
广播电视台总控系统传输环网故障监测研究
作者:未知   添加时间:2018-11-26
近年来,故障监测在广播电视网络系统中发挥了重要作用。针对某省级广播电视台新台总控系统建设需求,在对总控系统传输环网故障监测问题研究分析基础上,引入预警监测概念,提出一套故障监测流程及其相应的监测功能,为总控传输环网故障监测提供一套科学方案
  1 引言
 
  近年来,信息网络的可靠性和稳定性成为研究热点,如何监测到网络中的故障以及在故障发生时如何实现网络恢复成为可靠通信的关键 [1,2] 。在广播电视网络系统中,传统监测手段主要通过RR(Round Robin)轮询或被动接收获取系统告警信息,其重要价值在于系统一旦发生故障,便产生告警信息并通知值班人员及时进行处理,尽快恢复系统运行和重新提供服务。为提高广播电视总控系统安全性和可靠性,本文在对总控系统传输环网故障监测问题研究基础上,引入预警监测概念 [3,4] ,提出一套故障监测流程,设计出相应的监测功能,在传输网络产生故障前,监测到可能存在性能劣化或故障隐患并产生预警信息,使技术维护人员能够及早发现问题,在故障产生前即排除设备隐患,最大限度减少广播电视播出事故。
 
  2 故障监测流程
 
  在信息网络系统中,光传送网可分为骨干层、汇聚层和接入层,主要包括SDH光传输系统、DWDM光传输系统、基于SDH的ASON光传输系统和OTN光传输系统。相应地,光传输系统故障通常有通信故障、业务中断故障、误码故障、同步故障、公务故障、设备对接故障、网管连接故障等 [2,4] 。
 
  故障监测是通过主动或被动采集网络硬件、软件上的各种事件信息,识别出其中与网络系统故障相关的内容,对其中的关键部分发出报警并保持跟踪,生成网络故障事件记录,为网络系统安全可靠运行提供技术保证。如文献 [2] 引入OTDR并与GIS和GPS技术相结合,形成一套面向特定区域的光缆监测应用方案;文献 [4][5] 综合运用大数据关联分析技术、数据挖掘技术以及状态评估技术,实现信息通信风险态势全面感知、运维数据全面分析、运维风险实时预警;文献 [6] 对不同类型的事故进行布尔离散化,并基于关联规则挖掘提出事故诱因的诱发度计算方法,运用Apriori算法进行深度关联规则挖掘,并根据强关联规则对关键故障诱因进行筛选和分析。总控传输环网作为核心的节目流传输汇聚和分发平台,是广播电视网络系统的重要组成部分,利用在有线网络传输中广泛应用的IP化节目流监测技术 [1,7] ,以此建立针对广播电视总控系统传输环网节目流的信号质量、传输路径、相关处理设备工作状态的实时监测、展示和告警,以弥补依靠人工监看电视墙或通过仪表仪器抽检个别信号监测之不足。
 
  为此,将预警监测概念引入到总控系统传输环网故障监测业务,提出一套总控系统传输环网故障监测流程,具体如图1所示。
 
  
图1 总控系统传输环网故障监测流程
 
  根据上述流程,总控系统传输环网故障监测业务应包括设备监测、信号监测、机房环境监测、统一展现监测四个部分,具体如图2所示。
 
  
图2 总控系统传输环网故障监测业务图
 
  根据图2所示监测业务图,总控系统传输环网故障监测具体内容考虑如下。
 
  (1)信息采集。主要采集各前端设备上传的信号状态、设备状态、设备控制、资源等信息,分别传送至设备监控、信号监测、机房环境监测模块。
 
  (2)设备监测。接收来自信息采集模块相关设备的数据,加以处理、存档,并送至综合分析模块。
 
  (3)信号监测。接收来自信息采集模块相关信号的数据,加以处理、存档,并送至综合分析模块。
 
  (4)机房环境监测。接收来自信息采集模块相关机房环境的数据,加以处理、存档,并送至综合分析模块;与此同时,接收机房视频监测数据,推送至前端展现。
 
  (5)综合分析。对相关监控系统上传送的监控、监测数据进行综合分析,旨在使时间与任务关联、信号与设备关联、信号与系统关联等 [6] ,并将分析结果送至信息发布模块。
 
  (6)统一数据展现。考虑系统服务对象权限以及所关注内容不同,各类信息发布应做到个性化、区别化,这样既能做到重点突出,同时也能有效降低网络压力。
 
  (7)信息显示。根据所收集的各类信息,生成设备监测拓扑展现图、信号路由图、机房环境状态图、系统状态日志等信息,可在大屏幕上显示,也支持远程授权调用。
 
  (8)设备状态日志。将所有采集设备状态数据存入指定数据库,供授权人员以日志方式列表显示,其中各显示图是相互关联的,比如所监控的某个设备出现故障,直播信号流程图也会报警。
 
  (9)信息查询。支持授权人员通过本地或远程方式来对各类监测数据进行查询。
 
  3 故障监测功能
 
  根据上述故障监测流程以及监测业务要求,总控系统传输环网故障监测所涉及到的监测管理故障、性能和配置数据使用统一的主流关系型数据库进行存储,以提高监测数据管理的实效性和故障业务处理的高效性。鉴于此,总控系统传输环网故障监测功能实现可采用B/S结构进行软件设计;维护人员可通过Web方式访问,允许多个运维人员同时进行远程管理数据查看和配置操作;操作界面符合维护人员使用习惯,支持通过统一控制台完成拓扑展示、告警管理、性能管理、配置处理等各项功能和数据的配置、展现、管理和操作;能够满足及时告警与动态预警的功能,当设备、软件出现问题时,能以最快的速度、最直接的方式进行告警通知;告警方式有多种形式,如图标闪烁、背景色强调、声音报警、邮件、短信报警等。鉴于此,总控系统传输环网故障监测功能设计如下。
 
  (1)设备监测。设备监测范围主要是传输环网各类业务设备,如光传输设备、网络设备、存储设备、服务器、动力环境及相关软件等设备。根据业务具体特征与运行要求,可在各个业务系统部署采集客户端或接收由各业务系统提交的软硬件状态参数。
 
  (2)采集管理。系统数据采集是根据预先定义的管理对象和管理指标间的关联关系,提供可选择的采集指标清单。除了采集对象和采集指标外,可以在图形界面中灵活定义采集周期、采集时间段等参数,在完成采集任务的定义后,可以进行采集任务启动、暂停、中止等操作,实现对故障、性能、资源等管理指标数据的采集;通过特定的轮询控制机制,获取被监测对象的故障、性能和配置数据;能够对标准SNMP MIB (Simple Network Management Protocol Management Information Base)和厂商私有SNMP MIB管理数据进行采集,能够接收、解析和翻译,获取事件信息并转换为便于维护人员理解的信息;支持手工录入或批文件导入基础配置数据,支持多种扩展采集手段,如数据库接口等。
 
  (3)拓扑管理。拓扑视图能够以直观、统一、真实的方式展现整个传输环网系统的运行状况,支持手工定制方式增加拓扑设备。对于网络和系统结构复杂、庞大的拓扑能够进行缩放显示,提供分层次的拓扑展示方式;具备拓扑图的编辑功能,如拓扑图重新自动排列、背景和颜色的更改等;通过拓扑节点可以查看该节点相关的配置、性能、告警信息,拓扑图间可互相引用,方便从一个拓扑图直接进入到另一个拓扑图;可根据维护人员给定的条件(如按IP地址、节点名称、厂家等条件)方便地在多个拓扑视图中进行网元的快速查询和定位
 
  。
 
  (4)告警管理。告警管理将技术系统中各种设备或管理系统产生的事件作为原始事件,按照预定义的事件规则,经过过滤、分类、分级、转换等处理环节,形成有效的预警或故障告警信息,按预定的告警策略通知管理人员进行故障处理,对多次生成的告警提供自动升级,系统能够将告警传递到告警视图、拓扑图中。
 
  (5)告警分析。监测系统支持通过对设备性能数据的统计分析,形成性能数据变化报告,分析当前性能数据是否超过动态的阀值,如果超过阀值则产生性能告警;具有可靠、科学的报警策略设置机制,用于对报警条件的设定;支持采取多种方式设置报警阀值,支持设置多种报警级别,根据情况不同设置为低级别、中级别、高级别报警等。
 
  (6)告警展现。提供告警列表、拓扑图、逻辑图、物理位置部署图等多种展现方式,能够对原始事件、标准事件、告警信息分别进行展现;能够对基于内容不同而提供不同的告警信息展现视图,使不同值班人员和维护人员能够看到自己职责范围内的告警信息,并且能够提供按照各种组合条件进行告警查询;在拓扑图中能够通过颜色改变帮助维护人员迅速定位发生告警的组件;能够在拓扑图上查看相应的告警明细信息;能够提供自动刷新的、直观的当前告警列表,以提示值班人员进行处理。
 
  (7)告警通知。提供告警通知功能,将告警信息以声、光、短信等手段,提示维护人员(包括厂家人员、值班人员、维护人员、主管人员);具有各种通知接口,并能维护使用人员各类信息(如手机号码等)。
 
  (8)告警解除。支持手工清除和自动清除两种方式,能够对已经处理完毕的告警信息进行清除操作并标记为清除,告警信息能从当前告警视图中退出并转存到历史告警记录中。
 
  4 结束语
 
  本文结合某省级广播电视台新台建设需求,在对总控系统传输环网故障监测问题研究基础上,将预警监测概念引入系统设计中,旨在系统网络产生故障前,能够监测到可能存在性能劣化或故障隐患并产生预警信息,使技术维护人员能够即时发现并排除故障隐患。所提出的故障监测流程及相应的监测功能,在总控系统传输环网故障监测方案设计中具有一定的推广价值。
 
  参考文献
 
  [1] Ryan Paderna, Duong Quang Thang, Yafei Hou, etal. Low-Complexity Compressed Sensing-Based Channel Estimation With Virtual Oversampling for Digital Terrestrial Television Broadcasting[J]. IEEE Transactions onBroadcasting, 2017, 63(1):82-91.
 
  [2] 彭志荣,薛菲,亢中苗.电力光缆故障监测的研究[J].信息技术,2017(7):71-73.
 
  [3] Chetna Singhal, Swades De. Energy-Efficient and QoE-Aware TV Broadcast in Next-Generation Heterogeneous Networks[J]. IEEE Communications Magazine, 2016. 54(12):142-150.
 
  [4] 王江亭,靳丹,俞俊.基于大数据的电力信息通信预警技术研究[J].电力信息与通信技术,2017(9):68-73.
 
  [5] Rodney Martinez Alonso, David Plets, Margot Deruyck, etal. TV White Space and LTE Network Optimization Toward Energy Efficiency in Suburban and Rural Scenarios[J]. IEEE Transactions on Broadcasting,2018, 64(1):164-171.
 
  [6] 陈碧云,丁晋,陈绍南.基于关联规则挖掘的电力生产安全事故事件关键诱因筛选[J].电力自动化设备,2018(4):74-80.
 
  [7] Peter Bagot, Mark Beach, Andrew Nix, etal. Spatially Adaptive TV Broadcast System: Hardware in the Loop Operational Analysis[J]. IEEE Transactions on Broadcasting, 2018, 64(1):41-51.