适用于 AWS 云实例的 AWS 监控工具
通过统一的仪表板获取适用于您的 AWS 实例的可操作见解
SolarWinds® Server & Application Monitor (SAM) 包括 AWS 云监视工具,旨在从一个单一窗格中提供对 Amazon Elastic Compute Cloud (EC2) 实例的可见性。SAM 中的 AWS 监视工具包括直观图表和非侵入式架构,并带有 Web 界面,以帮助支持直接的云集成。CloudWatch API 可以收集并显示 Orion® Platform 中的指标,如果您计划轮询其他指标,则可以将 AWS 云作为一个节点进行监控。您还可以终止、停止或重启作为节点进行监控的任意 AWS 实例。
用于全面 AWS 监视的自动发现实例
自动发现并查看您的 AWS 帐户中部署的所有实例。SAM 中的 AWS 云监视工具用于发现云架构中的所有 EC2 云实例和 Amazon Elastic Block Store (EBS) 卷,立即开始监视,并向您发出新实例的警报。SAM 通过轮询服务 API 的性能和状态指标以及汇总 AWS 监视数据为 AWS 提供多云监视,来帮助您监视、管理问题并排除故障。SAM 整合了一系列监视数据,帮助消除对多个 AWS 监视工具的需求。
监视相关性能指标并配置警报以解决云问题
SAM 中的 AWS 监视工具可提供有关云服务和应用程序如何影响整体性能的全面视图。AWS 应用程序性能监视功能还允许您针对诸如 AWS 节流、AWS 超出限制、轮询问题、运行状况和其他阈值之类的问题自动将警报发送给合适的利益相关者。尽管默认设置可以提供关键阈值和警告阈值的可见性和通知,但 SAM 还允许您自定义监视和警报以适应 IT 环境的需求。
通过针对 AWS 的多云监控来支持混合环境
SAM 旨在帮助无缝集成 AWS 应用程序性能监视,并可以提供有关本地和云服务器指标的持续洞察力,以便更好地映射完整的混合 IT 环境。SAM 将基于云的 AWS 监视中的数据与从本地和虚拟服务收集的信息合并在一起,在同一仪表板上创建资源、应用程序和服务的统一视图。这样您可以更轻松地比较和关联指标和性能问题。
利用 AWS 应用程序监视工具更高效地排除云性能故障
SAM 中的 AWS 云监视工具提供了一种简化的方法,来监视云运行状况指标并关联跨托管应用程序的历史性能数据。借助性能分析仪表板功能(或称 PerfStack™),您可以将来自其他 Orion Platform 管理的节点中的其他数据合并到图表中,以提供可视化概述以及云指标。这可以提供云性能问题的关键概述,允许您将相关性能数据拖拽到可调整时间线上,更好地理解问题是如何发生的,以及问题何时发生。
详细了解 AWS 监视
什么是 AWS 监控?
AWS 是常用的云服务提供程序,提供一系列架构、平台和软件作为服务解决方案。AWS 监控包括维护、故障排除和调整 AWS 云实例的性能。
旨在持续监视系统、应用程序和其他基于云的环境的 AWS 监视工具可帮您快速响应问题,跨云实例优化性能。
什么是 AWS 混合云监视?
混合计算环境基于融合了本地和基于云的组件的 IT 架构。通过启用动态工作负载,此架构模型可以潜在地为组织运营和服务提供广泛的支持。
适用于开发运营的 AWS 监视的优势是什么?
AWS 系统和服务可能是高度复杂的架构和环境中的重要组件,因此对于您而言,确保其稳定性、可靠性和正常运行时间至关重要。借助专业的监视工具,您可以通过跟踪能够指示新问题或恶化问题的关键指标和活动来提高 AWS 流程的效率。通过主动监视在这些问题严重影响性能之前识别出问题,您可以更有效地进行故障排除和解决。
此外,您的 AWS 监视策略应包括一种全面的整体方法,以从各种各样的源和节点收集数据。这有助于在整个环境中提供更高的可见性,这在尝试对多点故障进行故障排除时特别有用。
但是,适当地集成、管理和监视混合架构通常会增加复杂性。成功 AWS 监视混合计算环境应包括能够为各种架构类型提供灵活、可扩展解决方案的工具和软件。由于混合环境可以包括基于公共云或私有云的服务,因此确保 API 兼容性、网络连接性以及提供商之间的无缝集成至关重要。例如,管理不同的服务提供商可能很棘手,因为您需要能够管理与各种服务级别协议 (SLA) 相关的问题,同时确保最终用户可以访问应用程序、服务和其他资源。
AWS 监视工具可以提供从 AWS 云到本地设备的完整 IT 环境的可见性,从而帮助您更有效地跟踪和解决问题。
您还可以通过在发生特定事件时建立明确的团队职责,尽可能将自动化合并到监视流程中并确保监视 Amazon Elastic Compute Cloud (EC2) 实例日志文件来改善 AWS 监视。选择合适的 AWS 监视工具可以简化很多重要任务。
AWS 服务可监视哪些内容?
理想情况下,AWS 应用程序监视工具应通过从多个来源收集数据来跟踪 AWS 实例的性能和状态。AWS 监视软件可以从性能指标、事件日志、流量日志、网络架构和其他数据流中收集和合成信息,以生成整个 AWS 部署的合并图。
许多 AWS 监视解决方案均包含可提高 AWS 实例监视效率并帮助您从这些监视解决方案中获取见解的功能。例如,数据可视化和图表可以将原始的 AWS 监控数据转换为一目了然的可理解信息,让您掌握基于云的服务和应用程序的运行状况和性能。
AWS 的监视工具还应包括可配置的智能警报功能,使您可以设置触发通知和其他自动响应的关键性能指标的阈值。这可以帮助您在问题被发现后立即收到通知,从而大大缩短响应时间和解决时间。
AWS 中的指标是什么?
AWS 包含各种服务,您可以通过优先考虑特定的绩效指标来实现最有效的监视。
为了监视特定的 AWS 服务,SolarWinds® Server & Application Monitor (SAM) 允许您使用API轮询器创建自定义监视器,以便从 Amazon EC2 环境(例如 Elastic Block Store (EBS)、Elastic Load Balancing (ELB)、Relational Database Service (RDS) 和 ElastiCache)中收集数据。
Amazon EC2 实例是能够扩展的虚拟服务器,确保公司和组织可以访问足够的资源和容量来运行业务关键应用程序。由于 EC2 实例的性能可能表明存在更深层的架构问题,因此通常需要持续监视。
针对 EC2 要监视的主要指标包括以下几项:
- CPU 使用率:可以跟踪每个 EC2 实例正在使用的已分配计算单元的比例,帮助确定资源瓶颈或是否为您的环境工作负载优化了实例和资源的配置。
- DiskReadBytes 和 DiskWriteBytes:可以跟踪从 EC2 实例读取和写入的数据字节,该指标可用于查明应用程序级别的问题。
- StatusCheck Failed:此指标对于监视 EC2 实例的运行状况很重要,可以提供相关信息来佐证有关问题是由特定实例还是其支持架构造成的。
Amazon EBS 为 EC2 实例提供长期存储,这样随着架构的扩展,可以有效地复制和传输副本。针对 EBS 要监视的指标包括以下几项:
- VolumeReadBytes 和 VolumeWriteBytes:可以追踪特定时间段内复制到或从 EBS 复制的数据字节,这对确定您的整体 EBS 负载很有用。
- VolumeTotalReadTime 和 VolumeTotalWriteTime:可以跟踪指定时间段内的读取和写入操作的持续时间,当与吞吐量指标相关联时,这对于故障排除延迟问题特别有用。
- VolumeQueueLength:可以跟踪队列的数量,还有助于了解总体的 EBS 工作负荷。随着时间的推移,高容量队列长度可导致增加延迟。
- VolumeIdleTime:可测量 EBS 容量不活动的持续时间,可以利用该持续时间来防止成本高昂且效率低下的过度配置。
- VolumeStatus:此指标有助于监视 EBS 卷的运行状况,如果运行不佳,则会发送警告状态。
Amazon ELB 通过多个 EC2 实例路由应用程序流量防止过载。这样的好处在于通过自动将性能不佳的实例中的请求分配出去,提高应用程序的运行状况和容错能力。监视 ELB 运行状况和性能指标对于优化最终用户体验至关重要。要监视的 ELB 指标如下:
- RequestCount:此指标跟踪指定时间段内分发的总请求。突然出现峰值或下降通常是 AWS 或 DNS 问题的初步迹象。
- SurgeQueueLength:此指标跟踪 ELB 尚未分发的队列请求。与卷队列长度一样,该指标在较长时间内的较高值可能导致更大的延迟和更差的性能。这对于监视也很重要,因为一旦队列容量达到上限,所有传入的请求都将丢失。
- 延迟:该指标不是跟踪负载平衡器的延迟,而是跟踪后端实例响应 ELB 分发的请求所花费的时间。
- HealthyHostCount 和 UnHealthyHostCount:这些运行状况检查可帮助 ELB 评估哪些实例可以响应请求以及哪些实例需要注意。
利用 Amazon RDS 可以轻松配置和操作基于云的数据库系统。要实现最佳效果,AWS 监视策略应跟踪以下 RDS 指标:
- FreeStorageSpace:此指标跟踪各数据库实例的可用分配存储空间。确保实例有充足的存储空间是防止数据丢失以及其他应用程序问题的关键。
- DatabaseConnections:此指标对指定时间段内打开的数据库连接进行计数,可用于避免达到每个数据库引擎和实例的最大连接限制。
- ReadLatency 和 WriteLatency:这些指标跟踪磁盘输入/输出请求所花费的平均时间,可用来突出显示配置不足的资源。
- DiskQueueDepth:此指标跟踪列队输入/输出请求的数量。当监视延迟相关内容时,该指标可洞悉存储层中的潜在瓶颈。
Amazon ElastiCache 是一种内存缓存服务,使应用程序可以从缓存访问文件和资源,而无需查询后端实例。这样的另一个好处是增加吞吐量,减少读取密集型负载的延迟。您应该考虑监视的 ElastiCache 的 AWS CloudWatch 性能指标包括:
- 当前连接:此指标跟踪客户端和缓存之间的总连接数量。此指标发生意外的急剧变化可能是潜在架构出现问题的迹象。
- 处理的 Set/Get 命令数量:这些指标是吞吐量和缓存使用情况的指标,对于延迟相关问题的故障排除很有用。
- 缓存命中和缓存未命中:这些指标可以互相参照,以确定成功的缓存查找的比率。如果命中率很低,这可能表明需要配置额外的缓存资源。
- 逐出:此计数是指从缓存中删除以允许写入新文件的项目。命中率低且逐出次数总是很高,这表明需要增加缓存大小。
- 交换使用:此指标计算实际应存储在内存中的缓存数据的磁盘使用情况。内存中缓存的全部好处是基于较低的交换使用量预测,因此该指标对于监视至关重要。
AWS 监视在 SAM 中如何工作?
SolarWinds Server & Application Monitor 包括 AWS 监视工具,该工具旨在直接与您的云服务帐户集成,以轮询 API 获得重要性能指标和状态更新。解决方案旨在为您提供整个云环境的深入可见性。SAM AWS 监视可以使您更有效地管理分布式服务和数据,并且最终可以帮助您以更高的效率对 AWS 性能问题进行故障排除。
SAM 还提供内置监视模板,并能够自定义工具跟踪和关联的指标。该工具旨在使用历史云性能问题为 AWS 实例提供上下文多云监视。此外,您可以使用 SAM 可视化应用程序和服务器的依赖性,以使用 PerfStack™ 获取网络通信见解。借助此信息,您可以更轻松地配置独特且有用的警报,以满足您的 AWS 性能监视需求。
什么是 AWS 监控?
AWS 是常用的云服务提供程序,提供一系列架构、平台和软件作为服务解决方案。AWS 监控包括维护、故障排除和调整 AWS 云实例的性能。
旨在持续监视系统、应用程序和其他基于云的环境的 AWS 监视工具可帮您快速响应问题,跨云实例优化性能。
使用必要的洞察力和工具实现精简的 AWS 监视
Server & Application Monitor
- 通过 AWS 云监控获取 AWS 实例的完整可见性。
- 将性能指标和资源使用与 AWS 监控软件相关联。
- 利用故障排除建议来实现最佳的 AWS 监控。
起始价格 $1,813
SAM 是一个 Orion 模块,建立在 SolarWinds Platform 之上