Menu
您的位置:中国房产新闻网 > 数据研究 > >

日志易:运营商日房产新闻志大数据分析案例

新闻来源:网络整理  2018-03-16 20:55

图1 日志分析平台的演进

CDN,DPI,网络设备日志,信令数据,话单数据往往结构复杂,数据量大,缺乏能快速适配千变万化非结构日志的手段,同时也缺乏在秒级返回几十TB级别甚至几百TB数据量下的关联分析结果的手段

1498703080825094509.png

1498703080837030197.png

日志易提供了完备的智能运维方法集合。

1498703080684076602.png

黄俊毅.jpg

图6 CDN数据实时分析示例

场景四家庭宽带数据关联查询

CDN服务商了解网络状态时,通常需要进行多维度的数据统计,例如响应成功的请求、按照节点统计命中/不命中比例、TS下发速率及带宽峰值等。然而所需分析的数据体量巨大,一天可能达到几十TB,用常规方法很难满足实时统计的需求。使用日志易可以做到海量数据的准实时检索,能在几秒钟内返回结果,同时用户可以指定时间段进行分析,并建立自定义仪表盘方便查看结果。

当业务系统出现问题,导致相关业务办理异常时,运维人员不能及时了解到系统的异常情况,往往在用户投诉后,才知道业务办理出现了问题,比较被动。

2、第1条日志出现关键字A:Invoke setMo()

图3 运维人员视图:自动钻取业务处理各环节日志明细

· 周期性预测

运营商数据中CPU使用率、内存使用率等都是周期性数据,日志易引入指数平滑等算法,通过机器学习,用户只需简单的设置就可以进行周期性预测。

业务系统日志记录分散,并且记录不完整,出现故障排查时,有可能找不到对应的日志,因此有些故障很难定位的原因。

1、缺乏有效监控手段

大部分运营商的日志处理技术仍处于第一、二阶段,其日志平台无法解决当前的日志分析需求,只能满足基础运维。针对运营商日志分析面临的问题,日志易(日志数据实时搜索分析引擎)提供实时灵活的全文检索,解决运营商目前面对的常见问题。

一  业务端到端日志分析

图4 局方视图

当出现某用户无法办理某一业务或办理某一业务失败后,无法还原该笔业务办理路径,不利于解决用户投诉、用户分歧等相关问题。

1498703080738040369.png

4、缺乏及时有效的关联提醒

满足上述四个条件后,才能认为是一个高危事件,从而衍生出一条日志告警规则。

典型场景:用户进行手机话费充值,已扣款成功,却没有显示到账。当前运营商面对的问题是:业务所涉及的完整日志由多台机器产生,并没有存储在一台机器上,工作人员只能依靠人工慢慢查找,效率低下。如果日志能统一存储、做到实时监控,就能快速定位故障原因。

· 多元神经网络预测

注:M>=1;M>N;

1498703080675016485.png

2、缺乏海量非结构数据实时处理手段

(1)快速定位失败环节

日志易技术总监 黄俊毅

4第N条日志出现关键字C:command='commit'

通过运维人员视图,只需要在界面搜索手机号以及流水号,就可以查看到这一笔交易的多达12个环节明细日志信息,快速定位故障原因。

图5呈现的高危告警结果,是通过日志易平台提供的SPL(Search Processing Language)将日志进行串联分析得到的。SPL类似SQL,并支持管道符命令,使多项操作可以顺序执行,实现复杂关联运算,专门用于处理非结构化数据。用户可使用SPL灵活高效地完成告警条件的设置,实时筛选出符合规则的事件并发送告警信息。

运营商日志分析面临的难题

3、第M条日志出现关键字B:关键字(厂家提供)如:“creation”

3、缺乏单笔业务办理回溯

(2)宏观掌控业务状态

运营商为了解决上述难题,其日志平台也不断升级完善,大致分为以下四个阶段:

图5  网维设备监控告警示例

1、网元名称相同;

1498703080872020802.png

1498703080714053742.png

· 异常检测

场景二网维设备监控

图8 多元神经网络预测

图2 客服视图:一键查询充值结果,快速定位故障环节,精确派单

关于智能运维

在运营商场景中,最常用的还是多元神经网络预测,例如对于容量分析——容量不仅与CPU有关系,也可能与业务量、网络带宽IO甚至UPS供电都有关系。通过机器学习算法,将这些元素作为参考因素,并通过自动参数调整,得到多元预测曲线,从而进行容量预测和规划。

运营商业务运维管理系统经过多年建设,在客户感知端到端管理、基于大数据的运营分析、云环境下虚拟资源的管控等方面能力不断加强,对日常运维工作效率及管理水平的提升做出了重要贡献但随着新技术的不断引入、新架构的不断调整、互联网思维的不断冲击,传统的运维思路极大制约着系统的发展,尤其在“大而全”的系统如何平衡“小而精”的快速能力提供方面,与互联网公司还存在着很大的差距。

场景三 CDN数据实时分析

图7 家宽数据关联查询

1498703080794015181.png

系统出现故障时,维护人员对故障发生在哪个环节不清楚,需要手工到各台主机上查看大量的日志,运维成本大,效率低。

一项充值订单要经过十几个模块的处理,通过日志数据采集模块,日志易可以在一分钟内把所有订单链路的数据串联起来。客服通过一个简单的搜索界面,输入手机号,就能在几秒钟内得到结果,清晰的呈现出充值失败的原因,此时客服只需要把手机号及工单信息派送给出现故障的相关厂家即可。

免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

最新资讯

滚动播报

更多