Pagerduty徽标

自动诊断解决方案

故障排除不应该是那么多麻烦。

你知道吗典型事件持续时间的85%用于诊断,涉及至少4位工程师?事件响应的基本目标是找出出了什么问题,谁需要尽快解决问题。加快问题的诊断可以使您进入解析器和分辨率更快。

许多公司面临的挑战在于,进行准确诊断所需的更深层次的数据被锁定在生产环境中,并要求专家由于知识,技能和访问权限而提取。

回答“出了什么问题?”的问题。和“谁可以解决?”第一响应者必须平均至少召集其他3位工程师,以提取只有适当访问的信息。

最重要的是太多的时间了,太多的人花了很多时间来反复收集诊断数据。自动化此重复将使MTTR至少加快15分钟的速度,并将成本和中断降低至少50%。

响应者

让响应者进行故障排除,而不是您的开发人员。

这是一个更好的操作模式:自动为您的Pagerduty中的响应者自动化您最常见的故障排除程序,并停止使用Pagerduty的自动诊断解决方案来破坏专家工程师的日常工作。

自动诊断通过允许响应者有效地分类问题,只能升级到可以解决该问题的工程师,从而节省了时间和中断。解析器具有他们需要的数据,并且在事件响应记录中捕获了此故障排除数据以供将来回顾。

响应者

解决速度更快

更快地诊断和解决事件 - 同时还减少了错误预算消耗。

提高效率

解决更多的事件,每次事件的升级减少40%,响应者较少。

不断改进

随着您的发展,自动化更多,将MTTR提高25分钟,并在加强工程能力的同时减少辛劳。

停止升级并开始解决

Pagerduty Automated Diagnostics可以帮助响应者使用Pagerduty事件响应对迅速分类事件的响应,该响应是使用来自服务的内省数据,以前只能通过升级为域专家来升级。响应者可以利用这种扩展的意识来分类并排除依赖关系之间的其他可能性,并检查是否有误报。这使响应者可以快速有效地升级为正确的解析器,以减轻问题并解决事件。

Image7-22

改善MTTR并减少干扰

打电话给骑兵会压力很大且耗时。借助预先构建的工作模板和插件集成,您可以使用专业知识来修改和添加新的自动化,以授万博pc版下载权您的第一响应者,以前只有主题专家以前只能做到这一点。

Screen-Shot-2022-09-26-AT-3-01-57-PM

自动化解决方法以降低严重性

自动诊断允许客户组成自动化缓解过程,例如触发故障和灾难恢复以及补救过程,例如服务重新启动。客户可以在半天的时间内部署此类解决方法,以减少中断的严重性,直到可以实施更永久的修复。

Image3-80

通过活动编排主动触发诊断

当连接到Pagerduty事件智能时,即使在通知响应者通知之前,也可以主动运行诊断作业,因此他们在确认事件时就拥有了所需的信息。对于众所周知的案例,甚至有可能触发自动化的解决方法,如果自动补救解决事件,则无需召唤响应者。

Image2-106

AWS的自动诊断

Pagerduty中AWS的自动化诊断提供了常用的诊断作业,用于常用服务,包括Amazon CloudWatch,Amazon Lambda,Amazon Lambda,Amazon EC2,Amazon ECS,Amazon ECS,Amazon ELB,Amazon RDS和Amazon VPC。客户可以轻松地配置这些模板作业以在其特定环境中工作,并在作业定义中扩展诊断步骤,以帮助他们立即开始。

AWS自动诊断

这个怎么运作

当Pagerduty生成事件时,响应者可以自动自动或单击按钮来调用基础架构,监视工具,云传播器以及更加自动的诊断。

然后,这些信息以pagerduty的形式提交,该格式是通过第一响应者消耗的,以便他们可以就如何开始对事件进行故障排除或向谁提取帮助做出更明智的决定。

自动诊断解决方案包

Pagerduty自动诊断解决方案捆绑包包括以下内容:

  • Pagerduty自动化动作。Pagerduty事件响应的附加组件,可以通过远程执行的自动化将Pagerduty最终用户安全地连接起来。
  • Pagerduty Runbook自动化。SaaS提供通过自动动作与Pagerduty无缝连接的SaaS。
  • 插件集成与35万博pc版下载个常见组件和服务,使其API迅速并牢固地纳入自动化工作流中。
  • 预先定义的诊断工作为操作系统和基础架构工具和服务提供常见的诊断
  • 自动诊断实施和自定义快速启动服务
联系我们
Baidu