• 大小:331名员工
  • 工业:资讯科技及服务
  • 地点:博尔德有限公司
  • 客户自:2016
  • 产品:平台
客户→SendGrid

SendGrid是一个经过验证的基于云的客户通信平台,每个月成功地为互联网和移动客户发送超过250亿封电子邮件。该公司总部位于科罗拉多州,拥有300多名员工,其中23人在运营团队,约84人在开发团队。工程运营经理Mary Moore-Simmons负责管理SendGrid的基础设施,包括服务器和数据中心、背后的网络、虚拟化栈和后端系统。由于从SendGrid发送电子邮件的频率很高,每天都会生成大量的事件警报。寻找一个可伸缩的企业级解决方案来帮助简化手动事件警报流程是该公司的首要计划。

取代以前的警报工具并克服可伸缩性挑战

SendGrid在典型的一天内接收多达2000个事件警报,在技术事故或中断期间每分钟接收数万个警报。由于数量如此之多,对于公司来说,快速有效地处理警报是非常重要的。在转移到PagerDuty之前,SendGrid使用了不同的供应商进行警报,但意识到他们需要一个全面的事件管理解决方案来支持他们的大量事件。“当你有一个工具在适当的地方,你希望它能工作,尤其是在发生故障的时候;这就是你期望它能起作用的时候,”摩尔-西蒙斯说。面对可伸缩性方面的挑战,SendGrid决定转向可靠的、可伸缩的事件管理解决方案。

“PagerDuty帮助我们更快地响应我们收到的警报。我们能够更快地诊断故障,从而改善客户的体验,减少停机时间以及任何相关成本。”

——玛丽Moore-SimmonsSendgrid工程运营经理

通过切换到新的事故管理平台,加速MTTA和MTTR

SendGrid实现了PagerDuty作为新的事件管理解决方案,并使用该平台进行协作、调度、升级和报告。在调用时,用户能够确认一个事件警报,在需要时升级警报,或解决手头的问题,允许他们直接移动到下一个事件,没有任何延迟。报告所有事件的主仪表板是SendGrid的另一个关键优点。PagerDuty的事件管理仪表盘的UI设计方式允许你看到发生了什么,以及你收到了什么样的警告。这对我们非常有帮助——不再有一个警报列表一直在移动,并失去对它们的关注,”摩尔-西蒙斯说。

Moore-Simmons发现PagerDuty的报告功能是她的角色最重要的资产。报告指标使她能够收集每天、每周、每月和每年的警报数量。“我们估计今年发生了78000次警报,公司的目标是与2015年相比减少50%的警报。到目前为止,多亏了PagerDuty的支持,我们正朝着这个指标前进。”她还能够计算出团队的平均平均修复时间(MTTR)是19分钟,而平均平均应答时间(MTTA)只有2分钟。收集这类信息有助于摩尔-西蒙斯和其他工程经理识别哪些是有效的,哪些是无效的,以及如何解决问题。

SendGrid的最大好处是,他们的操作和开发团队现在可以快速解决中断,并防止它们再次发生,这要归功于可靠和快速的事件通知。中断发生的每一分钟都会给公司带来数千美元的成本,并导致糟糕的客户体验和客户流失,而中断越少,客户流失就越少。此外,在切换到PagerDuty后,团队现在更加满意和高效。

“我们对PagerDuty有信心,不再需要担心不必要的长时间停电和收入损失。”

——玛丽Moore-SimmonsSendgrid工程运营经理

提高员工生产力和提高可伸缩性

SendGrid可以依靠PagerDuty作为一个值得信赖的解决方案来支持他们的用例、关键警报和调度。“我们对PagerDuty有信心,不再需要担心不必要的长时间中断和收入损失。SendGrid的每个随叫随到的人都使用PagerDuty,并知道作为一个已建立的提供商的解决方案,”Moore-Simmons说。员工是快乐的和富有成效的,这对企业很重要。总的来说,切换到PagerDuty后,公司已经看到了许多优势,包括更快的故障解决时间,提高员工的生产率和幸福感,以及令人印象深刻的底线指标,证明了公司的运营效率。

Baidu