Pagerduty高级CSV导出是一种强大的新工具,使经理和分析师能够深入了解其运营绩效。具有高级分析的帐户将能够使用我们的高级CSV出口来回答诸如
让我们开始吧
开始,
- 创建我们的副本Google电子表格模板和
- 下载事件的CSV文件。
我们不提供Excel版本,因为Excel的Pivot表无法很好地处理大量的源数据更改,无法用作模板。
下载事件的CSV文件的最简单方法是访问事件报告,然后单击下载CSV在任何日期的权利:
您可以通过这种方式下载多达一个月的数据。如果您需要更多数据,请单击在线查看,然后更改右上角的日期范围。然后下载CSV。
这将以我们的新CSV格式下载多达10,000起事件。您还可以从我们的系统和事件报告中下载相同的CSV格式。
点击这里查看此导出中将包含哪些字段。
接下来,按照我们的说明Google电子表格模板。完成后,您应该根据导出的CSV数据有许多新的Pivot表报告。
让我们利用这一点,回答一些常见的报告问题。
查看“最常见的事件”选项卡。这向您展示了最常见的事件,该事件是总数总数的降序。您还可以看到每个事件如何解决。
更多想法:添加报告“过滤”以将其限制在特定的时间范围,用户,升级策略或服务。您甚至可以选择非工作时间来查看哪些事件正在唤醒您。
查看“按小时/天的事件计数”选项卡。这显示了您的事件计数,按一周的小时和一天。考虑将其复制并粘贴到Excel并应用条件格式以获取热图。
更多想法:添加报告“过滤”以将其限制在特定的时间范围,用户,升级策略或服务。您还可以添加一个“通过”过滤器,以查看“ API”解决的事件计数,表明事件很可能是通过拍打监控服务自动解决的。
查看“一天中断”选项卡。这将向您展示每天解决的总时间,使您了解开放事件的时间。
更多想法:尝试通过升级策略或用户过滤此内容。您也可以过滤通过超时解决的事件。
查看“如何解决的事件”选项卡。这将向您显示API解决的每项服务的事件数量,表明最有可能通过拍打监控服务自动解决的事件。
查看“用户解决的事件数量”选项卡。
转到“输入”选项卡,然后从z – A(降序)中对“ auto_escalation_count”进行排序。最重要的是,您会发现自动估算最大的事件。想看看发生了什么吗?请访问https:// [subdomain] .pagerduty.com/Inventents/[id],其中[子域]是您的pagerduty子域,[id]是列的alpha-numeric ID。
更多想法:尝试按Seconds_to_first_ack或seconds_to_resolve进行排序,以查看事件花费了很长时间才能确认和解决。您可能还需要过滤掉auto_resolved = 1,以排除超时解决的事件。
查看“ TTA和TTR SLA记分卡”标签。这显示了通过升级政策和服务符合5-m TTA和60分钟TTR SLA的事件的百分比。
更多想法:
- 过滤枢轴表以排除自动解决事件。
- 您可以通过编辑“输入”选项卡上的各个列来调整SLA。只是寻找”遇到了5M TTA SLA?“ 和 ”遇到了60m TTR SLA?”。SLA在几秒钟内输入。也考虑更改列标题。
- 您也可以为每种服务或升级策略指定不同的TTA和TTR SLA。为此,首先创建一个新选项卡,然后在A列中列出您的服务或升级策略名称。然后,在B列中列出您的TTA SLA(以秒为单位),在C列中列出TTR SLA(以秒为单位)。最后,使用VLOOKUP function in conjunction with the existing IF function to compare the incident’s TTA and TTR against the respective TTA and TTR in this sheet.
查看“ TTA直方图”选项卡。这将向您显示TTA在几分钟内违反的事件的计数。样本图的水平轴为对数刻度。
在输入表上,添加另一列带有功能
= Regexreplace(C2,“ [0-9]+”,“”)
接下来,使用此列而不是列C创建一个类似于我们的“最常见事件”表的枢轴表,这将从事件描述中删除所有数字,从而更容易查看哪些类事件引起了麻烦。编辑正则表达式,如您所见,以删除其他常见术语。例如,您可以删除各种主机名,以关注所有主机都在创建哪些类型的事件。
也可以在Excel中执行以上操作,但是这更具挑战性,因为Excel没有提供开箱即用的正则表达功能。因此,即使是简单的数字删除也将需要十个嵌套替换语句。
您也可以使用正则表达式。
在输入表上,添加一个带有正则和嵌套的IF语句的列,例如:
=(regexMatch(c2,“ db”),“ db”,if(regexMatch(c2,www'),“ www”,if(regexmatch(c2,“ load”),“ load”,“ load”,“ load”,“其他”)))
这是一个基于我们客户之一的分类规则的更复杂的示例:
= if(regexMatch(c2,“ monkey exceptions”),“异常”,if(regexMatch(regexMatch(c2,'staging''),“ staging”,if(regexMatch(c2,“ nfs”),“ nfs”),“ nfs”,if(regexMatch)(c2,“ ftp”),“ ftp”,if(regexMatch(c2,“ db1 | db2 | db0 [1-9] \。mp“),“ db”,if(regexmatch(c2,dj”),,“ dj”),“ dj”,if(regexMatch(c2,“ splunk”),“ splunk”,if(regexMatch(c2,“ phoenix”),“凤凰”,if(regexmatch(c2,reporting db”),“ reporting-db”),“报告db”“,if(regexMatch(C2,“弹性| es-util | es0 | en-util | search-index | search-master”),“弹性搜索”,if(regexmatch(c2,“ web”),“ web”,“ web”,如果(regexMatch(c2,“ cron”),“ cron”,“”)))))))))))))))))))))))))))))
笔记:如果您想利用此示例,请从上方删除线路断裂。
因此,诸如“ [Critical] DB04.MP下降”之类的事件描述将简单地返回“ DB”,从而简单地看到团队面临的DB相关问题总数。
编辑正则表达式和标签,如您所见,然后使用此列创建一个枢轴表。您可能会更轻松地编辑嵌套IF文本编辑器中的语句。这将使您通过将各种匹配与事件描述进行分类,从而构建一个简单的分类模型。您甚至可以构建一个枢轴表图,该图表会向您展示随着时间的推移的各种类别事件的发病率。