Pagerduty徽标
  • 尺寸:101-500名员工
  • 行业:金融服务
  • 地点:伊利诺伊州芝加哥
  • 客户以来:2014
  • 关键集成万博pc版下载:
    • 吉拉
    • 松弛
    • Splunk
    • AWS
顾客→芝加哥贸易公司

芝加哥贸易公司(CTC)成立于1995年,是一家衍生品贸易公司,专门从事各种产品,服务和策略的市场交易。CTC积极以广泛的资产类别进行交易,包括股票,利率和商品。它的交易台每周六天每天开放20个小时,该公司被公认为是全球众多股票和衍生品交流的流动性和定价的领先提供商。

由于市场会随着微秒的发展而波动,因此CTC的关键应用程序和服务需要始终在线,并在一刻的通知中为用户提供,以每次提供一致的客户体验。“随着我们的服务直接与公开市场有关,停机时间不是一个选择,” SRE和CTC的可观察性经理Luke Rotta解释说。“如果我们不在市场上,我们就不会参加这个机会,这是一个错过的机会。”Rotta负责管理CTC的可观察性,并监督支持,自动化和改善预生产和生产环境的正常运行时间的SRE团队。

在Pagerduty之前

在实施Pagerduty之前,Rotta的团队遇到了一些挑战,包括:

  • 响应延迟是由带有过时的时间表和旋转的手册内通用目录的延迟
  • 在非企业时期与呼叫响应者进行沟通困难
  • 缺乏嵌入到响应过程中的自动化,这为呼叫响应者提供了更多的手动工作
  • 一个遗留仪表板,充满了无与伦比的事件和警报,在事件确认和解决方案中造成延迟
  • 警报风暴降低了团队理解构成和有效反应事件的能力

随着最近迈向远程工作的推动,CTC被迫将操作迅速转移到数字优先模型上。此外,市场波动的提高意味着其客户还增加了交易的频率,这比以往任何时候都更重要的是,CTC交易平台始终保持启动和运行。

为了帮助实现这一目标,CTC需要重新考虑其事件管理流程,同时继续维护和提供一致的客户体验。这意味着罗塔(Rotta)的团队需要将他们的努力重新集中在日常运营中,而不是长期的项目,而不是在新的,遥远的环境中。Rotta分享道:“我们的团队专注于确保系统能够处理增加的容量并向市场提供流动性,以使我们的客户满意。”

优先交流和协作

在远程前进之前,大多数信息是在办公室中口头传达的。现在,随着整个公司远程工作,跨团队有效沟通和协作的能力比以往任何时候都更为重要。Pagerduty帮助CTC将其事件通信渠道转变为完全数字化。“ Pagerduty确实教会了我们远程旋转事件,并使我们能够将事件管理过程集中到将团队迅速组装到一个渠道中,并直接从那里做出决定。”

CTC还利用了懈怠,Pagerduty的一部分超过600多个集成的生态系统万博pc版下载,以改善团队之间的事件沟通和协作以及进行验尸。与松弛整合,团队可以直接在Slack界面内创建,响应和解决Pagerduty事件,从而减轻了多个通信渠道的压力,并允许所有必要的团队一起完成事件。“由于所有团队现在都很遥远,因此我们只是直接在Slack中创建事件。剧本告诉所有人都可以跳入什么,然后我们离开。”

提高操作可见性

在数字优先的环境中,利益相关者必须实时对关键系统和服务的健康状况的全部知名度至关重要,这样他们就可以在发生事件时迅速协调适当的响应。

在Pagerduty之前,CTC使用了传统的仪表板,该仪表板会提醒团队有关服务中断和事件的信息。Rotta解释说:“我们会得到所谓的“红色墙”,这实际上是一个充满了数百个警报的屏幕,没有对我们的环境中的影响或正在发生的事情的感觉。”

为了解决这个问题,CTC实施了Pagerduty事件智能自动将警报组合在一起,并减少所有关键任务服务和应用程序的噪音。“在Pagerduty之前,我们有时会立即出现50-200个警报。有了事件智能,该数字现在降至5-10。” Rotta解释说。

借助活动智能,CTC的响应团队还具有他们在广泛影响客户影响之前快速解决问题的上下文。Rotta说:“减少噪音并清除平台中的警报的能力确实可以使我们的SRE团队中的人们专注于更高影响的任务。”

像今天的许多公司一样,CTC需要继续扩展,以跟上客户需求和新的创新。尽管速度是CTC等贸易公司的桌子赌注,但AWS内的非延迟敏感工作负载仍使CTC能够更快地扩展并减少投放想法的时间。部署到AWS的许多新服务都遵循您建立的,您拥有的方法和Pagerduty提供了一种单一的方法来升级,跟踪和衡量整个公司的事件,无论谁拥有或支持该服务。

Pagerduty的好处

自实施Pagerduty以来,CTC已经看到了几个好处,包括:

  • 警报疲劳减少了,并改善了事件响应Pagerduty事件智能
  • 在所有关键系统和服务中,更快的平均时间到acknowledge/平均时间到恢复(MTTA/MTTR)
  • 改进的日常事件管理以及自动化事件从转移到轮班的交接的能力
  • 与地板上的高级交易者的开放式沟通线,在需要时跨时区向呼叫经理升级事件
  • 在AWS上运行的24×7应用程序的无缝事件管理经验

Pagerduty还帮助CTC的业务连续性策略。“在这个新的,偏远的环境中,员工可能会与正在发生的事情脱节,我们正在尝试用Pagerduty解决这一问题。Rotta分享道。

未来

CTC计划继续在整个组织中扩大对Pagerduty的使用。例如,该公司已决定更多地关注指标以告知未来的行动,因此Rotta的团队正在研究运营评论,以及狗万 ,为了帮助更好地了解团队健康和事件的业务影响,衡量SLA,并获得与执行领导的无缝共享指标的能力。Rotta解释说:“这可能有助于推动我们需要投资的应用程序的决策。”

此外,尽管CTC已经在状态仪表板上设有所有主要的业务服务,但该公司希望通过提供高管领导力改善对事件或服务状态的可见性来扩展整个公司的使用。随着Pagerduty平台随CTC的增长,Rotta和他的团队期待将平台的功能扩展到其基础架构的其他部分。“我喜欢这很简单。我不必管理任何事情,因为它只是完成了工作,”他分享道。

要了解Pagerduty如何帮助您的团队使事情变得简单,并在数字优先世界中转变运营,请与您的客户经理联系或尝试尝试14天免费试用今天。

Baidu