Pagerduty徽标

Pagerduty博客

更好的事件验尸

尽管正在进行一个重大事件,但您所有的重点都是恢复服务:观察烟雾,弄清楚火势在哪里,然后将其放出。但是,在恢复了服务后,事件已经解决,肾上腺素已经消耗,这是和平的时间 - 是时候从发生的事情中学习,然后利用这些学习来更好地解决,回应和预防未来事件。实现这一改进周期的核心最佳实践是验尸过程,Pagerduty很高兴介绍对邮政事故的综合支持在我们的全部生命周期事件管理平台呢再加上其他几个Pagerduty功能,例如系统和运营效率分析以及操作命令控制台,我们现在提供您需要学习和主动提高基础架构的弹性和解决过程所需的一切。

Pagerduty改善了验尸过程的所有部分,从一路构建时间表到跟踪验尸状态。在几分钟而不是数小时内构建具有相关PAGERDUTY和聊天活动的时间表,然后使用详细的分解来有效研究根本原因,评估响应效果并确定最重要的后续行动。我们已经从进行有效的验尸中消除了摩擦,因此,更多的验尸时间可以集中在学习和减少手动工作上。您的邮政事故有多容易?让我们来看看!

现在,您可以单击一次事件开始验尸过程:

调查

随着验尸报告的创建,是时候卷起我们的袖子并开始研究实际发生的事情了。我们想从已经开始的活动现有的沟通来源和事件响应:聊天和Pagerduty。我们的pagerduty事件信息自动与我们的新验尸有关,因此让我们添加相关的聊天渠道:

现在,我们可以查看事件和这些聊天室可用的合并活动,并将其包括在验​​尸时间表中,完全与了解事件的播放方式最相关。我们希望涵盖事件的几个方面:涉及的技术系统,我们的响应效率和解决步骤。

验尸时间表

在验尸时间轴中包括一个项目也只需单击即可 - 没有切割和粘贴,在应用程序之间没有切换,没有容易出错的和手动的时间区域数学。可以包括一系列Pagerduty活动:事件状态变更,注释,升级,通知,当要求其他响应者,何时将状态更新派遣到利益相关者等等。一旦活动进入时间表,您也可以注释以描述其与事件的相关性,如下所示:

分析

随着时间表的构建,我们可以继续进入分析阶段。这包括总结发生的事情,识别根本的根本原因,呼唤解决方案等等。此步骤是关键,因为它使团队能够内省效果很好以及我们可以做得更好的地方,然后确定最重要的进步作为行动项目。所有这些都很容易在验尸编辑器中捕获,该编辑器还提供了接近这些部分的说明:

那就像那样简单!

流线邮政管理

不仅单独的验尸结构更容易,更有效,总体过程也被显着简化。所有验尸都在目录中可用。

这使您可以轻松地找到验尸,确定有影响力的长期发生事件,并查看哪些邮政事故仍在进行中或已经完成。邮政事态也可以作为PDF导出,以进行分发或归档,并且可以对作者的报告模板和每节指令进行自定义以满足您组织的需求。一起,所有这些工具提供了完整的端到端验尸过程,既易于使用又易于管理。

这套功能套件可帮助您从验尸中获得最大收益:

  • 时间轴构建更快,痛苦较小,并且可以实现更广泛的见解。
  • 使用简化的工具链管理验尸过程要容易得多。
  • 您的团队可以通过获得更多更好的学习,同时花费更少的时间来加速持续改进。

我们希望这种能力使您的团队尽可能轻松地促进共享学习的文化。如果您有兴趣了解更多信息,请下载我们的免费验尸手册有关进行有效验尸的最佳实践。

Pagerduty Postmortems均适用于我们的标准和企业计划的所有客户。要开始,请查看支持文章在这里

Baidu