IT运维AIOps自动完成自己的开发任务和业务流程


AIOps实际上是将来自不同IT(和非IT)来源的数据关联到一个庞大的数据存储库,使它们可以相互连接,从而进行分析和趋势判断。

  AIOps系统可处理多种共享的数据结构(如下图所示),而无需额外进行二次开发或改进:

  timestamp:各种事件、日志和测量方法中都包含了时间点的特征,这些数据可以集中在一起,以按时间顺序进行因果分析。

  Properties:一些与日志或测量相关的信息关键值对如“key:value),像Status,Source,Ruby,Triver,等等,可以用来创建不同数据集之间的关系模型。

  历史记录:已过去的数据,可用于预测未来绩效或阈值,例如饱和度(saturation)和退化(degradation)。

  效果:一天、一周、一个月等时间序列数据显示的趋势或规律,可以用来关联多个数据集,或者预测对可伸缩性的资源要求。

  ApplicationServices和BusinessModels:如果您能够定期进行发现和配置管理实践,那么可以使用它们来向AIOps平台中不同资产的分组、关联、依赖以及数据去重。

  总而言之,AIOps通过建立良好的时间序列数据,可以运用各种业务监测和管理工具进行关联、分析和预测各种时间数据,然后实现:

  把IT和非IT类的数据集中起来,如:用户的数量+绩效表现,延时时间+转化率;

  并且可以增加数据的“粒度”,例如:从频率为5分钟到1分钟;

  对数据流进行应用级分析,例如:实现“实时”或对一个特定历史时期的查询。

  人为捕捉的事件通常是非结构化的;而大部分设备所获得的IT事件blob(翻译:binarylargeobject,二进制大对象)也只能达到半结构化。

  其特征是:格式不一致、不够完整、大量重复。所以,AIOps应该提供关于这些IT事件属性的模式转换,以便进行更深入的分析。

  当前的工作流程分析。

  到目前为止,我认为您的AIOps方案分析工作已经就绪。这里的分析并不是来自IT工具,而是您经常或者不定期地进行,它旨在改善过程、降低成本、改善性能。

  通过手工分析AIOps方案,您可以以一种持续迭代的方式解决自动化过程中出现的问题,从而减少花费在分析方面的人工工作量,增加分析的频率和范围。

  很明显,AIOps的目标是:减少你花在手工上的时间和精力,通过提高速度与频率来自动地对数据集进行实时分析。

  着手实现自动化。

  的确,每个人都知道自动化的价值,但对自动化的认识却各不相同。伴随着DevOps带来的持续集成和交付(CI/CD),IT运营的自动化之路也随之产生。

  ITOps:重点关注任务自动实现并协调各个步骤。这些措施包括:实现服务台工作自动化,服务器自动打补丁,通过监视工具自动纠正系统错误。各工种的难点在于各工种之间的协作和相互联系。

  DevOps:关注于自动完成自己的开发任务和业务流程,从而避免了瀑布式开发中的阶段审查过程、独立测试、行为遵从性,以及运营和上线连接等造成的瓶颈和滞后。

  很明显,DevOps的应用团队的目标是加速集成和交付的速度和频率,这是通过创新服务(比如云应用)实现的。

  对IT运营团队来说,需要“全自动化”,他们不仅要协调CI/CD,还要配合整个“链条”。

  若用户不知道服务何时从测试转移到生产环境,也不知道谁拥有源代码将对产生环境有什么影响,也不知道如何衡量业务开发人员积压的工作,那么就无法真正有效地管理自己的自动化环境。

  所以,IT操作需要跟上DevOps团队的速度和灵活性,综合使用各种工具来发现信息,分享信息,并且通过与DevOps进行交流,“刷出自己的存在”。

  云呐统一运维管理平台,通过对网络设备管理、服务器管理、存储设备管理、业务应用管理、无线管理、日志分析、办公设备/联网设备、动环系统等本地和异地网络的实时监控、自动巡检,精准采集、分析故障信息,判断重要数据性能指标,实现大规模数据中心的集中统一管理。