您的位置:首页 > 互联网

从算法到智能,智能运维的实践之路

发布时间:2020-06-05 14:33:48  来源:互联网     背景:

  作者王立新

      随着企业数字化转型的不断深入,利用AI技术改善运维和IT服务水平成为当前运维管理的主要关注方向。在此过程中逐渐产生了不同的发展策略:围绕着AI的平台化智能运维发展模式、场景化智能运维发展模式以及自建智能运维发展模式。

  不同发展策略的智能运维发展方向是一致的,即通过大数据和人工智能技术对运维管理进行赋能:

  ●结合现有监控手段,增强数据分析,进一步提高监控的能力;

  ●通过资源的有效配置节省运维成本;

  ●通过多数据源分析增强排查问题的能力,有效缩短故障恢复时间;

  ●通过预警并结合自动化工具,有效提高运维效率甚至自愈能力。

  目前智能运维尚处在弱人工智能阶段,人机协作的方式将促进智能运维的发展,人教会AI去学习,AI实现对数据的智能分析,提高运维人员的运营能力。

  建设智能运维的算法挑战

  虽然这几年人工智能在人脸识别、智能驾驶等领域得到了大量应用,但是AI仍然面临着计算效能、安全、可解释性等诸多挑战。相比于其他AI落地场景,智能运维所亟需解决的问题具有一定的独特性:

  1、心态的转变:智能运维是运维发展的方向,而且是一个长期的过程——从经验主义到数据驱动,再回归到业务驱动的过程。经验是结合了数据、知识、业务等长时间学习的结果,而AI主要依靠历史指标或者文本数据,对历史数据进行预测,从而对未来趋势做出判断。对于想达到的目标,需要考虑现有的信息是否充足,还需要结合业务场景进行具体模型的不断优化。

  2、工程化算法的欠缺:由于缺乏标准的运维数据集,学术界针对运维的算法还比较少,工程化的算法尤其欠缺。同时算法在不同数据集上的泛化能力也决定了算法能否在真实场景应用的关键。

  3、缺乏有效的标签体系:以异常定义为例,由于不同业务部门对数据需求存在巨大区别,同时对异常的容忍程度也有不同定义,因此现有的泛化模型难以满足用户的实际需求。

  4、数据的多样化和变更频繁:运维场景存在大量变更行为,因此需要考虑Concept-shift(如:促销中的变更)前后对算法结果的影响。

  5、唯一性:很多异常和故障的特征是唯一的,很难通过历史数据的学习得到,因此需要结合业务属性和其它数据进行有效学习。

  6、算法失效带来的灾难:AI的应用需要明确目标和不确定性。工业化算法的准确性在85%以上可以用,但是需要考虑不准确情景的影响。算法很多时候需要考虑准确和召回的集合(F-score),而很多场景对算法的准确性有更高要求,因此对算法结果的评估将有助于进一步完善模型。

  提升智能运维关键能力

  面对上述算法落地挑战,需要对运维场景进行剖析,将学术界的算法和业界的场景有效的融合统一,再通过业界的工程实现能力进行有效的组合。对于每个场景的实现,都不仅仅是一个或多个算法。在智能运维的落地的过程中,一般会构建四个智能分析能力集合:

  ●智能告警能力

  及时有效的告警是运维的基础。智能运维常常利用异常检测来实现智能告警,但是异常检测主要是找出数据的异常,而告警是业务驱动的,因此在设计告警条件时,需要集合异常检测和业务的特性进行告警。

  ●智能诊断能力

  当关键业务指标发生异常时,快速给出问题的根本原因的能力。在运维过程中,根因很可能是唯一的,不能通过历史学习的方式构建,需要一个系统性设计,构建完善的运维分析库,通过有效的学习对故障进行快速定位。

  ●智能预警能力

  通过基于历史数据的有效学习,对未来可能的故障进行有效预测是减少损失的重要手段。故障的类型很多,针对不同类型的预测需要不同的算法模型。当故障发生时,配合资源优化算法,自动化的对任务进行编排,从而有效、及时预测故障的发生。

  ●智能服务管理能力

  智能服务管理能力将利用人工智能技术,与新一代ITSM进行融合。通过知识库的构建,利用文本相似度,对历史上发生的故障工单进行匹配,及时有效的提供故障的解决方案,大大提升了故障的处理效率,结合自动化的工具,快速给出请求回复,减少运维人员的时间浪费。

  注重算法的鲁棒性、自适应性、可解释性、泛化能力等,通过构建专业运维数据库以及智能分析方面的4个关键能力,将为企业智能运维体系化建设提供有力支撑,落地从运维的监控预警、告警、诊断分析、事件管理和知识推荐的全链路智能系统。

  发展与展望

  随着AIOps应用不断的深入,智能运维将会在纵向和横向不断延伸。横向上,智能运维应用场景将会从ITOM向ITOA、ITSM和ITBM发展,覆盖更多的运维领域。纵向上,随着运维数据成熟度以及AI能力的提升,智能运维将从机器学习向深度学习、增强学习甚至向元学习能力延伸。这种纵横能力的覆盖,将实现AI对整个运维场景的可见、可控、可分析、可管理。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
“没有面包的汉堡“上市,肯德基天猫超级品牌日重新定义汉堡
8月11日,肯德基天猫超级品牌日重磅来袭,狂欢盛典燃情盛夏。这是肯德基2016年正式入驻天猫后,连续......
日期:08-13
世界无醛日 零微科技用黑科技捍卫人类呼吸安全
4月26日,世界无醛日。甲醛,相信大家早已不再陌生,这个被世界卫生组织认定的一级致癌物,已经困扰中国......
日期:04-26
贝壳找房2019新居住大会 大咖共议未来社区的新商业图景
4月23日,以“预见新居住 共建新经纪”为主题的2019贝壳新居住大会将在北京国贸大酒店召开......
日期:04-24
5G套餐今天正式启用,华为Mate30系列5G版现已开售!
2019年10月31日,绝对是一个值得载入史册的日子。在2019年中国国际信息通信展览会开幕式上,中国电......
日期:11-01
直播带货、社群营销…… 疫情下国美零售的新进化
“我不想当网红,我不会做直播,我只想把优质、低价的商品带给大家!”...
日期:03-09
大型奥利奥,OPPO Reno 手机后置 7 摄像头专利曝光
2月24日消息 OPPO自2019年4月推出Reno系列智能手机以来,已经推出了多款有趣的型号,手机具有时尚设......
日期:02-24
惠普新款ENVY X360笔记本曝光
(原标题:惠普新款ENVY X360笔记本曝光:搭载R5 4500U,6核6线程)...
日期:02-20
首届“开源软件供应链点亮计划-暑期2020”正式启动!
[中国深圳,2020年5月15日]今日,首届“开源软件供应链点亮计划-暑期2020”正式拉开帷幕......
日期:05-15
“至极之道 至慧未来” 新华三揭秘智慧计算之道
8月22日,由紫光旗下新华三集团主办的“至极之道 至慧未来”智慧计算媒体沟通会成功举办......
日期:08-23
苏宁小家电24期免息积极“救市”
2月24日晚,苏宁侯恩龙化身主播,宣布将于2月27日起推出“购家电享24期分期免息”活动,......
日期:02-26
老茧手也能识别指纹?联想智能门锁A1你必须体验下
大概是因为天气越来越冷的缘故,近来早上起床变得万分艰难,为了不迟到,每天早上出门都紧赶慢赶的......
日期:12-06
5G套餐陆续发布:运营商开启竞争新赛道
2019年是5G商用元年,国内外基础电信运营商纷纷加快5G网络部署,让广大消费者尽快体验到5G带来的便......
日期:07-09
公益峰会T-DAY创益城亮点集锦 看腾讯如何为公益注入新原力
不知道从什么时候开始,逛展渐渐成为都市年轻人日常生活的一部分。经常被朋友笑称为“逛展达人......
日期:05-19
有米科技获省高新技术产品认定及市广告行业一级资质
2019年第一季度刚刚结束,有米云在Q1中获得了良好的市场表现,季度新注册用户保持高速增长。...
日期:04-10
米家驱蚊器智能版今日开卖:3只装 能用一夏天
夏日来临,驱蚊器迎来了热销季,米家驱蚊器智能版今日回归上架,3只装售价149元,能用一夏天。...
日期:05-08
边缘算力爆发!360家庭安全大脑发布,安防行业迎来新拐点
10月28日,“守护升级 智造未来” 360 IoT安防战略升级暨新品发布会在深圳举行。会上,备......
日期:10-28
共享充电大幅涨价:行业规范缺失、标准未定问题待解
近日,多家媒体报道,共享充电宝已告别“一元时代”,租金甚至涨至8元每小时。蓝鲸TMT记......
日期:10-21
萌经济正红,看美的如何携手宝可梦IP,打造动漫联名爆款
“她经济”、“粉丝经济”、“小镇经济”......电商时代的专有名词......
日期:01-01
新款iPhone,越看越好看,等良心价
时间进入下半年之后,很多用户都在期待手机厂商推出新一代的产品,而最令人关注的自然是苹果即将在9......
日期:07-29
春季运动搭档 三星Galaxy Watch Active2直降200元起
四月迎春生机勃勃,但乍暖乍寒的特点,也是对大家抵抗力的一次挑战。适当的运动不仅可以改善新陈代......
日期:04-09