用于队列和服务器性能监控的 Redis 监控工具
借助 Redis 监控工具监控和优化 Redis 查询
使用 SolarWinds® Database Performance Monitor (DPM) 将查明 Redis 性能问题所需的数据可视化。DPM 旨在测量每个以微秒为单位执行的单个查询的吞吐量。
“热门查询”等各种内置功能旨在跨应用程序中所有服务器显示一个主要详情视图,并可按每秒逐层展开查询样本以及与其他指标相互关联。您可以对查询进行逐层展开和截片处理,并快速地在不同时间段之间进行比较,以进行变更前后的分析。
收集各种 Redis 指标
SolarWinds Database Performance Monitor 可以测量有关您的系统的大量指标,并且可以每秒从系统上的每台服务器收集多达 10,000 个指标。除了 Redis 公开的每个指标之外(包括与内存、性能和持久性相关的关键指标),DPM 还监控和分类其他系统组件上的多维数据。只要出现问题,即便只持续一两秒,您也能收到诊断所需的数据并快速将问题解决。
使用简单、高效的 Redis 监控工具获得基于云的监控
由于 DPM 是一个软件即服务 (Software as a Service, SaaS) 解决方案,因此没有任何需要配置、购买或维护的部分。DPM 会不断更新和升级,因此您可以自动获得新功能。DPM 针对 Redis 监控的代理程序是完全现成可用的,使用诸如网络流量捕获和系统视图检查等技术。它们非常安全,可以在传输过程中和静止时提供数据加密,而且无需入站网络访问。这些代理旨在提高效率和节约资源,仅使用不到 1% 的 CPU。
探索适用于 Redis 性能监控的自适应故障检测和大数据分析
适用于 Redis 性能监控的 DPM 大数据分析平台使用诸如回归分析和排队理论等先进技术,提供无以伦比的洞察,包括对微小服务器停机的零配置检测以及查询和 CPU 或 I/O 等之间的关系。DPM 自适应故障检测技术可帮助您在故障演变为停机之前查找并解决故障。这样就能减少性能中断现象并实现更好的用户体验。
充分利用跨职能团队来监控 Redis
DPM 专为跨职能团队而设计。它通过协同工具,帮助应用程序开发者、开发运营人员和 DBA 一道合作解决问题。轻松集成聊天、深层链接、快速分享和其它功能,使团队成员见您所见。在开发和准备阶段使用 DPM,在问题进入生产环节前就将其发现。
详细了解 Redis 监控工具
什么是 Redis 数据库?
Redis 可以替代传统的基于磁盘的数据库。它以速度快、易于上手、灵活的数据结构和总体性能质量而著称。
Redis 与标准数据库之间的区别在于 Redis 将数据存储为包含字符串、列表、哈希集和排序集的键值对的方式。因此,Redis 被定义为键值存储,而不是直接的数据库。除了充当数据库之外,Redis 还可以充当缓存或消息中介程序。
Redis 使用内存中数据集来实现其出色性能,特别是高速度。它可以运行原子操作,例如查找和检索列表中的成员、追加字符串、计算集合交集、并集与差集、增加哈希值等等。
Redis 还支持主副本体系结构,提供快速无阻塞的首次同步、异步复制,并在网络断裂时实现包含部分重新同步的自动重新连接。它采用 ANSI C 编写,但是也支持大部分编程语言。
使 Redis 数据库脱颖而出的关键功能之一是 Redis Cluster。Redis Cluster 可让您运行一个 Redis 安装程序,其中数据将自动在多个 Redis 节点之间共享。即使某些节点当前无法通信或完全故障,它也让您能够继续操作。您的操作不会因为少量的问题节点而停滞不前。
与标准数据库相比,Redis 具有一些优势和不同之处。因此,它需要持续的 Redis 性能监控,尤其是 Redis Cluster 监控,以便保持性能并在对最终用户产生重大影响之前找出问题所在。
如何监控 Redis 数据库性能
Redis 性能监控(包括 Redis 群集监控、Redis 队列监控等)是一个涉及跟踪关键指标和查询以防止瓶颈或其他性能中断的过程。它可以帮助您发现两个关键领域中的问题:Redis 本身的资源问题以及架构中会影响 Redis 性能的其他方面的问题。
任何数据库监控计划的第一步都是明确需要监控的内容。对于 Redis 性能监控,您想要确保自己了解以下方面:
- 基础架构的运行状况
- 数据源及其所有进程的运行状况
- 正在执行的查询的成功和性能
- 问题发生时通常会出现故障的情况,因此您知道对何处进行干预
使用 Redis,监控数据库性能涉及收集和分析与内存、持久性、错误和基本活动等各种内容相关的关键指标。由于 Redis 数据库管理系统的数据存储依赖于主内存,因此内存指标特别重要。这些指标包括已用内存、缓存命中率、内存碎片率、阻止的客户端等统计信息以及被逐出的关键统计信息。
对于 Redis 队列监视,网络流量是另一个重要指标。流量发生无法解释的变化可能表明应用程序和数据源之间的连接断开。如果无法快速解决该问题,则可能会导致性能下降。
由于要跟踪的内容如此之多,再加上如果问题变成漏网之鱼会造成的风险如此严重,因此将 Redis 用作数据库的任何人都必须使用 Redis 监控工具。这个工具可以按秒监控您的关键 Redis 指标,并跟踪您的查询,测量每个执行查询的吞吐量。
How to monitor Redis on cloud?
Monitoring Redis on cloud requires keeping a close eye on a variety of metrics, so you can more easily identify potential bottlenecks and pinpoint issues with Redis on cloud and in the supporting infrastructure.
However, maintaining key metrics like quick response times often depends both on consistently monitoring and understanding how Redis on cloud performance may be affecting your entire infrastructure. Using a tool designed to track Redis on cloud performance and to combine these insights with advanced techniques such as regression analysis and queueing theory to deliver unmatched visibility into your database types and servers in a unified view can help you better understand your system health.
When it comes to what key metrics to monitor, a general best practice for any database—not just Redis cloud service—is to develop a database monitoring plan that can offer insight into the following key areas:
- The health of the data source and its processes
- The performance and success of queries being executed against the data source
- The conditions typically at fault when things take a turn for the worse
Since Redis on cloud is built to use main memory for data storage, many of the most important metrics to monitor are those related to memory. These include memory fragmentation ratio, used memory, cache hit ratio, blocked clients, and evicted key stats.
However, memory metrics aren’t the only ones worth monitoring when it comes to Redis. There are five other key metrics and categories you should also consider monitoring for the most comprehensive view into Redis on cloud database health:
- Performance metrics like latency. Latency is a measure of the time that passes between a client request and the server’s response. Because of the structure of Redis, outliers in your latency distribution can cause major bottlenecks. Long response time for a single request will increase the latency for all subsequent requests.
- Memory metrics like used_memory. If your used_memory exceeds the total available system memory, the operating system will start swapping old or unused sections of memory. Each of these swapped sections is written to disk, which is 100,000x slower than reading or writing from memory.
- Basic activity metrics like connected_clients. Since Redis is typically mediated by an application, there is an upper and lower limit for the number of connected clients. If this number leaves the normal range, it could indicate a problem, either with upstream connections getting lost or with the server’s ability to handle requests getting overwhelmed.
- Persistence metrics like rdb_last_save_time and rdb_changes_since_last_save. These metrics can help you keep track of the volatility of your dataset, while persistence helps keep you from having the replicas copy empty datasets when the primary restarts. These metrics also give you a good sense of how much data you stand to lose should a failure occur.
- Error metrics like ejected_connections. If your client connections exceed your preset maximum, they will be ejected. This metric helps you keep track of your connections and make sure you aren’t exceeding your limits.
Redis 关键指标是什么?
作为 Redis 性能监控的一部分,需要跟踪大量不同指标。由于指标太多,因此无法在此一一列举,但 Redis 性能的核心有五大主要指标类别。这些类别分别是:
- 性能指标,比如延迟。延迟反映了客户端请求与服务器响应请求之间的时间。Redis 的构造方式使得即使是延迟分布中的一个离群值也会造成严重瓶颈。实际上,单个请求的响应时间过长将增加所有后续请求的延迟,这表示在 Redis 中发生延迟时立即将其捕获至关重要。监控与性能相关的数据库指标,以尽早捕获延迟。
- 内存指标,比如 used_memory。确保您的已用内存小于系统总内存,这点对于维持 Redis 众所周知的高速度而言至关重要。如果使用的内存超过系统内存,则操作系统将开始交换内存区块,然后再将其写入磁盘。这个过程比从内存中读取或写入要慢约 100,000 倍。由于数据是通过主内存存储在 Redis 中的,因此这些指标在 Redis 数据库中比平时更为重要。Redis 监控工具可以帮助您跟踪所需的所有内存指标,包括缓存命中率、阻止的客户端、内存碎片率和被逐出的关键统计信息。
- 基本活动指标,比如 connected_clients。Redis 的已连接客户端数具有上限和下限。检查此指标可帮助您查看客户端数量是否超出正常范围,这可以作为 Redis 系统内问题的早期指标。客户端太多或太少可能意味着服务器处理请求的能力已不堪重负或上游连接已丢失。
- 持久性指标,比如 rdb_last_save_time 和 rdb_changes_since_last_save。持久性在 Redis 中很重要,因为它让您不必在主数据库每次重启时都让副本复制空的数据集。监控这些指标可帮助您跟踪数据集的波动性。它们还可以使您对发生故障时可能丢失的数据量有一个很好的了解。
- 错误指标,例如 ejected_connections。当您的客户端连接超出预设的最大数量时,它们将被弹出。错误指标(例如弹出的连接)可帮助您确保自己并未超出限制,并帮助您根据需要调整限制。每当需要您关注这些指标时,Redis 监控工具都会向您发出警报。
Redis 监控在 DPM 中如何运行?
SolarWinds Database Performance Monitor (DPM) 是一种用户友好的 Redis 监控工具,旨在帮助您享受数据库监控的诸多好处,而不会耗费过多资金。DPM 提供全天候监控和性能分析,以帮助您识别和解决出现的问题,避免对用户体验产生严重影响。
与任何 Redis 监控工具一样,DPM 的最重要元素是其监控关键指标的能力。Database Performance Monitor 旨在每秒钟从该工具正在监控的每个系统捕获 10,000 多个指标。这一级别的粒度数据收集让您可以更轻松地快速排除故障并解决问题。
管理查询是 Redis 性能监控的另一个关键要素。DPM 的“热门查询”视图提供了系统上所有服务器的主要详情视图,并可让您按秒逐层展开与 I/O、CPU、查询样本和 EXPLAIN 计划等其他关键指标的相互关联。DPM 旨在帮助您在几秒钟内从全局视图逐层展开到单个查询,从而让您可以深入了解潜在问题。
DPM 的自适应故障检测技术可在故障有机会发展成为严重的停机之前检测到错误,从而帮助您快速解决问题。检测最小的故障意味着更少的中断和更好的整体性能。
除了作为一个 Redis Cluster 监控工具使数据库平稳运行之外,DPM 还包括旨在帮助您优化 Redis 数据库性能的功能。它可以帮助您调整数据库表,检查汇总中的查询并确定数据库是否以预期的性能水平运行。
什么是 Redis 数据库?
Redis 可以替代传统的基于磁盘的数据库。它以速度快、易于上手、灵活的数据结构和总体性能质量而著称。
Redis 与标准数据库之间的区别在于 Redis 将数据存储为包含字符串、列表、哈希集和排序集的键值对的方式。因此,Redis 被定义为键值存储,而不是直接的数据库。除了充当数据库之外,Redis 还可以充当缓存或消息中介程序。
Redis 使用内存中数据集来实现其出色性能,特别是高速度。它可以运行原子操作,例如查找和检索列表中的成员、追加字符串、计算集合交集、并集与差集、增加哈希值等等。
Redis 还支持主副本体系结构,提供快速无阻塞的首次同步、异步复制,并在网络断裂时实现包含部分重新同步的自动重新连接。它采用 ANSI C 编写,但是也支持大部分编程语言。
使 Redis 数据库脱颖而出的关键功能之一是 Redis Cluster。Redis Cluster 可让您运行一个 Redis 安装程序,其中数据将自动在多个 Redis 节点之间共享。即使某些节点当前无法通信或完全故障,它也让您能够继续操作。您的操作不会因为少量的问题节点而停滞不前。
与标准数据库相比,Redis 具有一些优势和不同之处。因此,它需要持续的 Redis 性能监控,尤其是 Redis Cluster 监控,以便保持性能并在对最终用户产生重大影响之前找出问题所在。
Database Performance Monitor
- 选择一个具有基于 Web 的直观用户界面的 SaaS 平台。
- 监控 Redis 数据库,不论是云、本地还是混合环境。
- 使用自适应故障检测功能,在故障演变为停机之前找出故障。