带外管理系统及管理方法与相关技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图片简介:
本技术的一种带外管理系统及管理方法,属于互联网技术领域。
包括数据处理模块、远程诊断模块、远程管理模块、数据交互模块和远程监控模块,远程监控模块包括硬件监控单元和存储监控单元,通过硬件监控单元和存储监控单元对机房内的硬件和存储进行实时监控并将信息通过数据交互模块输送给远程管理模块,数据交互模块通过网络连接服务器的管理口实现,当硬件设备出现故障时能及时发现、实时告警。
带外方式通过服务器的管理口实现,不需要在每台服务器上安装代理软件,可以减少对操作系统的影响,并实现与操作系统的无关性,而且可以实现远程的电源管理、虚拟KVM、虚拟媒体功能。
不需要人工巡查机房,节约了人工成本。
技术要求
1.一种带外管理系统,其特征在于:包括数据处理模块(100)、远程诊断模块(200)、远程管理模块(300)、数据交互模块(400)和远程监控模块(500),所述远程监控模块(500)包括硬件监控单元(510)和存储监控单元(530),所述硬件监控单元(510)连接有电源控制单元(520),所述存储监控单元(530)连接有数据备份单元(540),所述硬件监控单元(510)用于对机房内的硬件进行监控并将数据输送给数据交互模块(400),数据交互模块(400)将数据输送给远程管理模块(300),所述数据交互模块(400)用于传输数据,所述远程管理模块(300)将接收到的数据输送给数据处理模块(100),该数据处理模块(100)对数据进行监测和记录并将数据可视化通过数据显示单元(110)进行显示,所述数据处理模块(100)还连接有远程诊断模块(200),该远程诊断模块(200)用于对数据处理模块(100)处理后的数据进行诊断,当出现数据异常时通过远程诊断模块(200)的自动告警单元(210)进行告警。
2.根据权利要求1所述的一种带外管理系统,其特征在于:所述远程监控模块(500)设为若干个监控子模块,若干个监控子模块分别监控一定数量的硬件设备。
3.根据权利要求1所述的一种带外管理系统,其特征在于:所述硬件监控单元(510)收集前置面板的状态、CPU、内存、磁盘阵列卡、物理磁盘、逻辑磁盘、网卡、远程管理卡、电源、风扇、温度、电压和序列号等硬件状态、配置等信息数据。
4.一种带外管理系统的管理方法,其特征在于:采用上述权利要求1~3任一项所述的带外管理系统,所述方法为通过硬件监控单元(510)对机房内的硬件状态进行记录并将数据通过数据交互模块(400)输送给云端的远程管理模块(300),远程管理模块(300)将接收的数据通过数据处理模块(100)进行整合处理。
5.根据权利要求4所述的一种带外管理系统的管理方法,其特征在于:所述存储监控单元(530)对存储进行监控并定时通过数据备份单元(540)进行备份。
6.根据权利要求4所述的一种带外管理系统的管理方法,其特征在于:所述自动告警单元(210)建立告警平台并将数据进行集中,设置有告警阀值,根据告警阀值产生告警通知,同时将告警信息记录日志。
7.根据权利要求4所述的一种带外管理系统的管理方法,其特征在于:所述硬件监控单元(510)和存储监控单元(530)还可以对硬件和存储进行远程开关机或重启操作。
8.根据权利要求4所述的一种带外管理系统的管理方法,其特征在于:所述远程诊断模块(200)控制硬件监控单元(510)和存储监控单元(530)定时对硬件和存储进行巡检并生成巡检报告进行存储。
9.根据权利要求6所述的一种带外管理系统的管理方法,其特征在于:所述自动告警单元(210)的告警平台还以不同颜色表示不同类型的事件及严重程度,在同一窗口显示事件的来源、时间、原因等详细信息。
10.根据权利要求6所述的一种带外管理系统的管理方法,其特征在于:所述自动告警单元(210)通过微信告警、邮件告警、短信告警、弹出页面告警、声音告警等方式进行告警。
技术说明书
一种带外管理系统及管理方法
技术领域
本技术属于互联网技术领域,具体来说是一种带外管理系统及管理方法。
背景技术
随着发展,数据中心硬件设备类型和数量都在增加,在硬件层的监控方面,缺少一套统一的平台来实现跨厂商、跨硬件平台的集中监控和管理。
目前的监控方式只能采用人工到机房定时巡检,这种方法效率低下,而且当设备出现问题时发现问题不及时的办法。
当需要开展设备重启、软件安装、操控配置等工作时,运维人员前往现场处理需要一定的时间成本,而人员进出机房,也给机房管理带来安全隐患。
根据业界的发展趋势,机房的无人值守和自动运维管理技术已经成熟,在金融行业、互联网行业已广泛商用。
因此,有必要开展机房自动化运维工具的建设,帮助提高运维效率,降低运维成本;同时可以缩短故障恢复时长,降低故障发生率。
本次拟建设硬件带外管理系统,对数据中心硬件x86服务器、小型机、存储等设备实现实时高效主动的监控这些硬件设备的工作状态,当硬件设备出现故障时能及时发现、实时告警。
带外方式通过服务器的管理口实现,不需要在每台服务器上安装代理软件,可以减少对操作系统的影响,并实现与操作系统的无关性,而且可以实现远程的电源管理、虚拟KVM、虚拟媒体功能。
远程管理与本地管理一个最大的区别就是一旦服务器出现故障,无论什么问题本地管理人员可以及时到达服务器现场,进行故障处理。
因此建设一套统一硬件监控平台支持对服务器的远程管理是很有必要的,它可以协助管理人员实现对异地服务器管理,包括:远程诊断、ROM升级、配置和系统维护,无需赶到现场。
技术内容
1.技术要解决的技术问题
本技术的目的在于解决现有的机房通过实际人员进行现场管理成本高且管理不够及时的问题。
2.技术方案
为达到上述目的,本技术提供的技术方案为:
本技术的一种带外管理系统,包括数据处理模块、远程诊断模块、远程管理模块、数据交互模块和远程监控模块,所述远程监控模块包括硬件监控单元和存储监控单元,所述硬件监控单元连接有电源控制单元,所述存储监控单元连接有数据备份单元,所述硬件监控单元用于对机房内的硬件进行监控并将数据输送给数据交互模块,数据交互模块将数据输送给远程管理模块,所述数据交互模块用于传输数据,所述远程管理模块将接收到的数据输送给数据处理模块,该数据处理模块对数据进行监测和记录并将数据可视化通过数据显示单元进行显示,所述数据处理模块还连接有远程诊断模块,该远程诊断模块用于对数据处理模块处理后的数据进行诊断,当出现数据异常时通过远程诊断模块的自动告警单元进行告警。
优选的,所述远程监控模块设为若干个监控子模块,若干个监控子模块分别监控一定数量的硬件设备。
优选的,所述硬件监控单元收集前置面板的状态、CPU、内存、磁盘阵列卡、物理磁盘、逻辑磁盘、网卡、远程管理卡、电源、风扇、温度、电压和序列号等硬件状态、配置等信息数据。
一种带外管理系统的管理方法,采用上述所述的带外管理系统,所述方法为通过硬件监控单元对机房内的硬件状态进行记录并将数据通过数据交互模块输送给云端的远程管理模块,远程管理模块将接收的数据通过数据处理模块进行整合处理。
优选的,所述存储监控单元对存储进行监控并定时通过数据备份单元进行备份。
优选的,所述自动告警单元建立告警平台并将数据进行集中,设置有告警阀值,根据告警阀值产生告警通知,同时将告警信息记录日志。
优选的,所述硬件监控单元和存储监控单元还可以对硬件和存储进行远程开关机或重启操作。
优选的,所述远程诊断模块控制硬件监控单元和存储监控单元定时对硬件和存储进行巡检并生成巡检报告进行存储。
优选的,所述自动告警单元的告警平台还以不同颜色表示不同类型的事件及严重程度,在同一窗口显示事件的来源、时间、原因等详细信息。
优选的,所述自动告警单元通过微信告警、邮件告警、短信告警、弹出页面告警、声音告警等方式进行告警。
3.有益效果
采用本技术提供的技术方案,与现有技术相比,具有如下有益效果:
本技术的一种带外管理系统及管理方法,包括数据处理模块、远程诊断模块、远程管理模块、数据交互模块和远程监控模块,远程监控模块包括硬件监控单元和存储监控单元,硬件监控单元连接有电源控制单元,存储监控单元连接有数据备份单元,硬件监控单元用于对机房内的硬件进行监控并将数据输送给数据交互模块,数据交互模块将数据输送给远程管理模块,数据交互模块用于传输数据,远程管理模块将接收到的数据输送给数据处理模块,该数据处理模块对数据进行监测和记录并将数据可视化通过数据显示单元进行显示,数据处理模块还连接有远程诊断模块,该远程诊断模块用于对数据处理模块处理后的数据进行诊断,当出现数据异常时通过远程诊断模块的自动告警单元进行告警。
通过硬件监控单元和存储监控单元对机房内的硬件和存储进行实时监控并将信息通过数据交互模块输送给远程管理模块,数据交互模块通过网络连接服务器的管理口实现,当硬件设备出现故障时能及时发现、实时告警。
带外方式通过服务器的管理口实现,不需要在每台服务器上安装代理软件,可以减少对操作系统的影响,并实现与操作系统的无关性,而且可以实现远程的电源管理、虚拟KVM、虚拟媒体功能。
不需要人工巡查机房,节约了人工成本。
附图说明
图1为本技术的一种带外管理系统的结构示意图。
示意图中的标号说明:
100、数据处理模块;110、数据显示单元;200、远程诊断模块;210、自动告警单元;300、远程管理模块;400、数据交互模块;500、远程监控模块;510、硬件监控单元;520、电源控制单元;530、存储监控单元;540、数据备份单元。
具体实施方式
为了便于理解本技术,下面将参照相关附图对本技术进行更全面的描述,附图中给出了本技术的若干实施例,但是,本技术可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本技术的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
参照附图1,本实施例的一种带外管理系统,包括数据处理模块100、远程诊断模块200、远程管理模块300、数据交互模块400和远程监控模块500,远程监控模块500包括硬件监控单元510和存储监控单元530,硬件监控单元510连接有电源控制单元520,存储监控单元530连接有数据备份单元540,硬件监控单元510用于对机房内的硬件进行监控并将数据输送给数据交互模块400,数据交互模块400将数据输送给远程管理模块300,数据交互模块400用于传输数据,远程管理模块300将接收到的数据输送给数据处理模块100,该数据处理模块100对数据进行监测和记录并将数据可视化通过数据显示单元110进行显示,数据处理模块100还连接有远程诊断模块200,该远程诊断模块200用于对数据处理模块100处理后的数据进行诊断,当出现数据异常时通过远程诊断模块200的自动告警单元210进行告警。
通过硬件监控单元510和存储监控单元530对机房内的硬件和存储进行实时监控并将信息通过数据交互模块400输送给远程管理模块300,数据交互模块400通过网络连接服务器的管理口实现,当硬件设备出现故障时能及时发现、实时告警。
带外方式通过服务器的管理口实现,不需要在每台服务器上安装代理软件,可以减少对操作系统的影响,并实现与操作系统的无关性,而且可以实现远程的电源管理、虚拟KVM、虚拟媒体功能。
不需要人工巡查机房,节约了人工成本。
本实施例的远程监控模块500设为若干个监控子模块,若干个监控子模块分别监控一定数量的硬件设备。
当其中一个监控子模块发生故障时,该故障监控子模块的管理设备自动分配后其余未故障的监控子模块。
硬件监控单元510收集前置面板的状态、CPU、内存、磁盘阵列卡、物理磁盘、逻辑磁盘、网卡、远程管理卡、电源、风扇、温度、电压和序列号等硬件状态、配置等信息数据。
实施例2
一种带外管理系统的管理方法,采用上述的带外管理系统,方法为通过硬件监控单元510对机房内的硬件状态进行记录并将数据通过数据交互模块400输送给云端的远程管理模块300,远程管理模块300将接收的数据通过数据处理模块100进行整合处理。
存储监控单元530对存储进行监控并定时通过数据备份单元540进行备份。
硬件监控单元510和存储监控单元530还可以对硬件和存储进行远程开关机或重启操作。
远程诊断模块200控制硬件监控单元510和存储监控单元530定时对硬件和存储进行巡检并生成巡检报告进行存储。
自动告警单元210建立告警平台并将数据进行集中,设置有告警阀值,根据告警阀值产生告警通知,同时将告警信息记录日志。
自动告警单元210的告警平台还以不同颜色表示不同类型的事件及严重程度,在同一窗口显示事件的来源、时间、原因等详细信息。
自动告警单元210通过微信告警、邮件告警、短信告警、弹出页面告警、声音告警等方式进行告警。
以上所述实施例仅表达了本技术的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围;因此,本技术专利的保护范围应以所附权利要求为准。