发布时间:2018-01-05

快讯:勤智ITBA运维大数据分析平台V3.0最新发布


新年新气象,勤智ITBA3.0产品也来报到啦! 据悉,此次新版本围绕“提前发现故障征兆、更加快速定位根源”这一定位,从采集、传输、存储、计算到展现,历经两个多月架构重组设计和长达半年的功能研发测试,以脱胎换骨姿态全新上线,让我们来快速了解一下V3.0版本能带来哪些传统运维无法企及的改变!

指标异常波动.png


  传统监控工具只有当达到预警阈值或故障频繁爆发时,才能做出响应,而此时已然对网络性能或业务系统造成了一定影响;在故障处理过程中,往往因预警过多或过少、缺乏时间/空间整体观判断等因素而导致无从下手,导致故障处理不及时。


  勤智ITBA3.0运维大数据分析平台则为故障发生前以及故障发生后两个阶段提供了良好的故障解决方案:


故障发生前,ITBA3.0运维大数据分析平台通过对历史各项监控指标运行轨迹分析学习,自动根据不同设备指标运行特征构建健康衡量标准,先于监控工具识别到指标异常波动,提前通知到人员优化校正,避免业务真正受到影响。

故障发生后,ITBA3.0运维大数据分析平台通过对历史各项指标告警关系和规律的分析,自动挖掘指标之间的故障关联性和运行相关性、故障发生的周期性特征和后台日志关联排查,提供多种维度的故障处理排查手段,更好地帮助运维人员快速排查和解决故障根源,尽可能降低业务影响时间。


勤智ITBA V3.0版本从架构到功能焕然一新:


丰富的应用功能导航.png

丰富的应用功能导航

 

1、可结合大数据分布式存储和计算,实现跨工具的运维数据汇聚整合。


分布式集群架构.png

分布式集群架构


2、故障根源挖掘,提供从时间周期性到空间关联性全方位分析手段。


图片1.png

  故障根源分析:指标告警发生时,可以实时分析影响它的相关软硬件或性能指标,以及与其同时告警的具体指标,故障根源一目了然。


图片2.png

  指标相关性分析: 实时分析指标告警发生前后,与它运行趋势相同的强相关指标对比的轨迹变化。


 指标关联组分析:实时分析并展示历史上多次出现同时告警的成组关联指标。


  故障周期分析:实时汇总分析历史上指标告警发生的分钟、小时、每周和每月中隐藏的规律。


3、业务/区域健康评估,脱离阈值告警,依赖指标运行构建标准,挖掘系统潜在问题。


业务监控评估


  4、未来风险预测,先于阈值告警,提前发现征兆规律、快速定位根源



    5、海量日志分析,实现日志秒级监控预警、日志聚合归类和周期规律分析。


日志实时预警:满足Syslog及日志文件的同时监听,支持邮件通知、告警推送等多种方式。


    日志聚类分析:分析并展现历史上相同内容的日志告警时间的分布规律。


    日志周期分析:分析并展现历史上日志告警在分钟、小时、每周和每月的分布规律。


 6、数据共享开放,提供标准化的数据展现API接口,与第三方系统实现无缝对接。


数据共享开放