在这里,我们将回答呼叫网络研讨会的问题
问题1:您对衡量围绕事件响应质量的指标有任何想法,例如利益相关者的知情程度如何?
答案1:我们建议定期审查该过程作为验尸的一部分。您还想查看人们是否将其订阅为利益相关者 - 您还可以主动订阅组织中的利益相关者。查看此信息以获取更多详细信息:
问题2:我们试图限制谁写了对生产资源的书面访问。您如何处理通话团队的权限?呼叫团队成员是否一直都有权限,还是使用像LastPass这样的工具来添加换班并在结束时将其删除时添加访问?
答案2:您可以执行一些瞬态权限,但是您也可以使用Pagerduty Rundeck之类的工具为常见的任务和控件提供更永久的解决方案。对于诸如记录,监视和可观察性之类的集中服务,整个团队都应一直访问。
暂时的权限是具有挑战性的,因为如果主要响应者需要升级为另一个团队成员,则该人可能没有他们需要的所有访问权限。因此,如果最大程度地减少解决方案是您目标的一部分,则找到一种永久性的提供特权的方法将更好地工作。
问题3:SRE团队或NOC应该是响应者还是第一响应者?或者,响应者应该是开发人员还是更熟悉该服务的人?
答案3:这实际上取决于组织的设置方式。在Pagerduty,我们建议提供全方位服务的所有权模型,其中负责服务或申请的人们是最有知识的人,因为他们是第一名。查看所有权.pagerduty.com了解更多信息
问题4:睡眠时间警报…这是Pagerduty还是一个过程中的功能?
A3:是的。对于您的应用程序代码的错误和警报,应用程序开发人员将对首次诊断最有用。如果他们发现问题与平台或其他服务有关,请不要犹豫升级。但是,应用程序开发人员将最了解哪些错误确实适用于应用程序及其运行时。诸如垃圾收集,依赖量的超时,对数据存储的数据处理数据可能需要跨团队响应者,但是应用团队将最了解问题与SRE或NOC团队相比。
答案4:您可以在“分析”选项卡中使用智能仪表板来测量各种事情,包括中断,下班时间和睡眠时间中断量。查看此知识库文章以查看分析的所有选项:https://support.pagerduty.com/docs/intelligent-dashboards
我收到了一封电子邮件,该电子邮件据说具有网络研讨会录制的链接。但是,每次我单击电子邮件中的链接时,由此产生的Pagerduty网站只是说
请参阅屏幕截图。
20210416-083019 | 690x228
我有同样的问题