Pagerduty徽标

Pagerduty博客

新的!AWS用户的常见自动诊断

当今以AWS为中心的现代云体系结构通常是由250多个SaaS服务,房屋开发服务和旧系统实施的〜250个AWS服务和工作流程的组合。当这些环境中发生事件(无论是否建立了集中式的云平台)时,通常是必要的。由于这种扩展的复杂性,急救人员发现自己必须升级为几个不同的服务所有者或专家工程师,以收集诊断,然后才能确定谁应该是问题的最终解析器。

在事件响应方面,至关重要的是,这些新的云环境将与组织现有的关键应用程序和服务无缝集成 - 包括新旧的。鉴于提高服务质量并使响应者更容易跨越该专业知识,我们很高兴宣布立即提供新的AWS插件集成万博pc版下载自动诊断

新的AWS插件,用于自动诊断

我们用于自动诊断的新的AWS插件有助于为AWS的用户提供更深入的覆盖范围,使其更容易更容易使用自动诊断启动并运行在他们的AWS环境中。

用于自动诊断的新的AWS插件包括:

  • CloudWatch日志插件。该插件从AWS基础架构和应用程序中检索诊断数据。现在,用户可以更轻松地在多个帐户和产品上为AWS运行自动诊断。
  • 系统管理器插件。该插件允许更快地执行和准确性,例如配置管理,修补和部署监视和安全工具代理。现在,用户能够将自动化应用于上述任务,以更快地执行。
  • ECS远程命令插件。该插件提供了一种在容器上执行命令的机制。这使开发人员和运营商能够在重新部署服务之前实时从其运行应用程序中检索诊断数据。
  • lambda自定义代码工作流插件。创建,执行并选择地删除新的lambda函数,其中用作业步骤中提供的自定义代码作为其输入。执行自定义脚本作为作业的步骤,而无需安装任何软件。

听起来很复杂?不用担心,我们想到了一切:)。

AWS用户的新自动诊断工作模板

我们也发布了AWS的新的预制模板,因此您可以立即开始为特定环境增强事件细节。这些是专门建造的,可用于最小配置。现在,用户没有从头开始,而是拥有一个精心策划的,现成的作业定义库,可以在响应期间检索数据,用于调查,调试和分类事件。

新用户可以更快地开始为AWS自动化诊断,现有用户可以轻松地将AWS诊断添加到其现有的Pagerduty Process自动化项目中。

一些示例作业模板包括:

AWS - EC2 实例状态和关联的IAM角色 检索EC2实例状态和关联的IAM角色 远程命令(或SSM
AWS - ECS 停止ECS任务错误 检查停止ECS任务的错误,并提供有关错误原因的详细信息。 停止ECS任务
AWS - Elb 检索ELB目标健康状况 检索负载平衡器相关目标组中不健康目标的列表。 ELB实例状态
AWS - RDS 检查数据库存储状态 检查RDS数据库中的实例状态。 RDS实例状态
AWS - VPC 使用UDP传输协议的IP地址 查询CloudWatch日志以使用UDP传输协议识别任何主机。 CloudWatch日志
AWS - VPC 通过子网上的吞吐量前10个主机 查询CloudWatch日志以通过给定子网上的吞吐量来识别前10个主机。 CloudWatch日志
AWS - VPC 最高拒绝请求的十大源IP地址 查询CloudWatch日志,以标识具有最高拒绝要求的前10个源IP地址。 CloudWatch日志
AWS - VPC 公共IP的十大网络服务器请求者 查询CloudWatch日志,以确定我们网络服务器的前10个公共IP请求者(例如NGINX)。 CloudWatch日志

这只是冰山一角!我们将继续开发和建立我们现有的插件,以确保使用AWS的客户能够在需要的任何地方调用自动化,包括提供一些互动指南。

想了解有关常见诊断的更多信息吗?注册我们的网络研讨会事件,“常见组件的常见诊断”,9月14日。请求演示要查看具有Pagerduty Process自动化的自动诊断。

已经使用PageDuty过程自动化了吗?查看自动诊断解决方案指南查看实现完整解决方案的端到端过程。

Baidu