Prometheus 指标 v2 预览

自Redis企业软件版本7.8.2起,Prometheus可用的V2指标。

您可以将Redis企业软件与Prometheus和Grafana集成,以创建重要指标的仪表板。

以下表格中的v2指标自Redis Enterprise Software版本7.8.0起可用。如需从v1指标过渡到v2 PromQL的帮助,请参阅Prometheus v1指标及等效的v2 PromQL

数据库指标

指标 类型 描述
endpoint_client_connections counter 客户端连接建立事件的数量
endpoint_client_disconnections counter 客户端发起的客户端断开连接次数
endpoint_client_connection_expired counter 客户端连接TTL(生存时间)过期的总数
endpoint_client_establishment_failures counter 未能正确建立的客户端连接数量
endpoint_client_expiration_refresh counter 客户端过期时间变更的次数
endpoint_client_tracking_off_requests counter CLIENT TRACKING OFF 请求的总数
endpoint_client_tracking_on_requests counter CLIENT TRACKING ON 请求的总数
endpoint_disconnected_cba_client counter 基于证书的客户端断开连接的数量
endpoint_disconnected_ldap_client counter 断开的LDAP客户端数量
endpoint_disconnected_user_password_client counter 断开连接的用户和密码客户端数量
endpoint_disposed_commands_after_client_caching counter 由于误用而被处理的客户端缓存命令的总数
endpoint_egress counter 出口字节数
endpoint_egress_pending counter 发送待处理的字节数
endpoint_egress_pending_discarded counter 由于断开连接而被丢弃的待发送字节数
endpoint_failed_cba_authentication counter 基于证书认证失败的客户端数量
endpoint_failed_ldap_authentication counter LDAP认证失败的客户端数量
endpoint_failed_user_password_authentication counter 用户密码认证失败的客户端数量
endpoint_ingress counter 入口字节数
endpoint_longest_pipeline_histogram counter 具有最长管道长度的客户端连接
endpoint_other_requests counter 其他请求的数量
endpoint_other_requests_latency_histogram histogram 其他命令的延迟(以微秒为单位)直方图
endpoint_other_requests_latency_histogram_bucket histogram 用于表示除读或写命令之外的其他命令的延迟直方图。可用于表示不同的延迟百分位数。
p99.9 示例:
histogram_quantile(0.999, sum(rate(endpoint_other_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db))
endpoint_other_responses counter 其他响应的数量
endpoint_proxy_disconnections counter 由代理发起的客户端断开连接的数量
endpoint_read_requests counter 读取请求的数量
endpoint_read_requests_latency_histogram histogram 读取命令的延迟(以微秒为单位)直方图
endpoint_read_requests_latency_histogram_bucket histogram 读取命令的延迟直方图。可用于表示不同的延迟百分位数。
p99.9 示例:
histogram_quantile(0.999, sum(rate(endpoint_read_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db))
endpoint_read_responses counter 读取响应的数量
endpoint_successful_cba_authentication counter 成功使用基于证书认证的客户端数量
endpoint_successful_ldap_authentication counter 成功通过LDAP认证的客户端数量
endpoint_successful_user_password_authentication counter 成功使用用户名和密码进行身份验证的客户端数量
endpoint_write_requests counter 写入请求的数量
endpoint_write_requests_latency_histogram histogram 写入命令的延迟(以微秒为单位)直方图
endpoint_write_requests_latency_histogram_bucket histogram 写入命令的延迟直方图。可用于表示不同的延迟百分位数。
p99.9 示例:
histogram_quantile(0.999, sum(rate(endpoint_write_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db))
endpoint_write_responses counter 写入响应的数量

节点指标

指标 类型 描述
node_available_flash_bytes gauge 节点中可用的闪存(字节)
node_available_flash_no_overbooking_bytes gauge 节点中可用的闪存(字节),不考虑超额预订
node_available_memory_bytes gauge 节点上可用于数据库配置的可用内存量(字节)
node_available_memory_no_overbooking_bytes gauge 节点中可用的RAM(字节),不考虑超额预订
node_bigstore_free_bytes gauge 所有集群节点上后端闪存(由闪存数据库的[BigRedis]使用)的可用空间总和(字节);仅在启用BigRedis时返回
node_cert_expires_in_seconds gauge 每个给定节点的证书过期时间(以秒为单位);了解更多关于Redis Enterprise中的证书监控证书
node_ephemeral_storage_avail_bytes gauge 配置的临时磁盘上可供RLEC进程使用的磁盘空间(字节)
node_ephemeral_storage_free_bytes gauge 配置的临时磁盘上的可用磁盘空间(字节)
node_memory_MemFree_bytes gauge 节点中的空闲内存(字节)
node_persistent_storage_avail_bytes gauge 配置的持久磁盘上可供RLEC进程使用的磁盘空间(字节)
node_persistent_storage_free_bytes gauge 配置的持久磁盘上的可用磁盘空间(字节)
node_provisional_flash_bytes gauge 此节点上可用于新分片的闪存数量,考虑了超额预订、最大Redis服务器数量、保留闪存以及配置和迁移阈值(字节)
node_provisional_flash_no_overbooking_bytes gauge 此节点上可用于新分片的闪存数量,不考虑超额预订、最大Redis服务器、保留闪存以及配置和迁移阈值(字节)
node_provisional_memory_bytes gauge 可用于分配给数据库的RAM量,占分配给数据库的总RAM的比例
node_provisional_memory_no_overbooking_bytes gauge 可用于分配给数据库的RAM量,不考虑超额预订,从分配给数据库的总RAM中计算
node_metrics_up gauge 节点是集群的一部分并且已连接

集群指标

指标 类型 描述
generation{cluster_wd=} gauge 特定cluster_wd的生成编号
has_qourum{cluster_wd=, has_witness_disk=BOOL} gauge Has_qourum = 1
没有法定人数 = 0
is_primary{cluster_wd=} gauge 主节点 = 1
次节点 = 0
license_shards_limit 按分片类型(ram / flash)的许可证总分片限制
total_live_nodes_count{cluster_wd=} gauge 活跃节点数量
total_node_count{cluster_wd=} gauge 节点数量
total_primary_selection_ended{cluster_wd=} counter 每个结束的选择过程的单调计数器
total_primary_selections{cluster_wd=} counter 每个启动的选择过程的单调计数器

复制指标

指标 描述
database_syncer_config 用作配置标签的占位符
database_syncer_current_status 流量同步器状态;0 = 同步中,2 = 不同步
database_syncer_dst_connectivity_state 目标连接状态
database_syncer_dst_connectivity_state_ms 目标连接状态持续时间
database_syncer_dst_lag 同步器与目标之间的延迟(以毫秒为单位)
database_syncer_dst_repl_offset 最后确认命令的偏移量
database_syncer_flush_counter 目标刷新次数
database_syncer_ingress_bytes 从源分片读取的字节数
database_syncer_ingress_bytes_decompressed 从源分片读取的字节数
database_syncer_internal_state 同步器的内部状态
database_syncer_lag_ms 源和目标之间的流量延迟时间,以毫秒为单位
database_syncer_rdb_size 同步阶段需要传输的源RDB大小(以字节为单位)
database_syncer_rdb_transferred 在同步阶段从源的RDB传输的字节数
database_syncer_src_connectivity_state 源连接状态
database_syncer_src_connectivity_state_ms 源连接状态持续时间
database_syncer_src_repl_offset 最后已知的源偏移量
database_syncer_state 分片同步器的内部状态
database_syncer_syncer_repl_offset 同步器处理的最后一个命令的偏移量
database_syncer_total_requests 目标写入次数
database_syncer_total_responses 目标写入确认的数量

分片指标

指标 描述
redis_server_active_defrag_running 自动内存碎片整理当前激进程度(% CPU)
redis_server_allocator_active 总使用内存,包括外部碎片
redis_server_allocator_allocated 总分配内存
redis_server_allocator_resident 总驻留内存 (RSS)
redis_server_aof_last_cow_size 最后一次AOFR,CopyOnWrite内存
redis_server_aof_rewrite_in_progress 正在进行的AOF重写数量
redis_server_aof_rewrites 此进程执行的AOF重写次数
redis_server_aof_delayed_fsync AOF fsync 导致主 Redis 线程延迟的次数(导致延迟);这可能表明磁盘速度慢或过载
redis_server_blocked_clients 计算等待阻塞调用的客户端数量
redis_server_connected_clients 连接到特定分片的客户端连接数
redis_server_connected_slaves 已连接的副本数量
redis_server_db0_avg_ttl 所有易失性键的平均TTL
redis_server_expired_keys 易失性键的总数
redis_server_db0_keys 总键数
redis_server_evicted_keys 到目前为止(自重启以来)被驱逐的键
redis_server_expire_cycle_cpu_milliseconds 在活动过期周期中花费的累计时间
redis_server_expired_keys 到目前为止(自重启以来)过期的键
redis_server_forwarding_state 分片转发状态(开启或关闭)
redis_server_keys_trimmed 在当前或最后一次重新分片过程中被修剪的键的数量
redis_server_keyspace_read_hits 访问现有键空间的读取操作次数
redis_server_keyspace_read_misses 访问不存在的键空间的读取操作次数
redis_server_keyspace_write_hits 访问现有键空间的写操作数量
redis_server_keyspace_write_misses 访问不存在的键空间的写操作数量
redis_server_master_link_status 指示副本是否连接到其主服务器
redis_server_master_repl_offset 发送到副本的分片字节数;通过比较不同时间的值来计算一段时间内的吞吐量
redis_server_master_sync_in_progress 主分片正在同步中(1 表示真)
redis_server_max_process_mem 当前内存限制由redis_mgr根据节点空闲内存配置
redis_server_maxmemory 当前内存限制由redis_mgr根据数据库内存限制配置
redis_server_mem_aof_buffer AOF缓冲区的当前大小
redis_server_mem_clients_normal 当前用于非副本客户端的输入和输出缓冲区的内存
redis_server_mem_clients_slaves 当前用于副本客户端输入和输出缓冲区的内存
redis_server_mem_fragmentation_ratio 内存碎片比率(1.3 表示 30% 的开销)
redis_server_mem_not_counted_for_evict 用于驱逐和OOM错误时不计算在内的used_memory部分(以字节为单位)
redis_server_mem_replication_backlog 复制积压缓冲区的大小
redis_server_module_fork_in_progress 一个二进制值,指示是否有由模块生成的活动fork(1)或没有(0)
namedprocess_namegroup_cpu_seconds_total 分片进程CPU使用百分比
namedprocess_namegroup_thread_cpu_seconds_total 分片主线程CPU时间(以秒为单位)
namedprocess_namegroup_open_filedesc 打开文件描述符的分片编号
namedprocess_namegroup_memory_bytes 共享内存大小(字节)
namedprocess_namegroup_oldest_start_time_seconds 进程自Unix纪元以来的分片启动时间(以秒为单位)
redis_server_rdb_bgsave_in_progress 指示当前是否正在进行bgsave
redis_server_rdb_last_cow_size 上次bgsave(或SYNC fork)使用的CopyOnWrite内存
redis_server_rdb_saves 自进程重启以来bgsaves的总计数(包括副本全同步和持久化)
redis_server_repl_touch_bytes 由于处理的READ命令,分片发送给副本的TOUCH命令的字节数;通过比较不同时间的值来计算一段时间内的吞吐量
redis_server_total_commands_processed 分片处理的命令数量;通过比较不同时间点的值来计算一段时间内的命令数量
redis_server_total_connections_received 分片接收的连接数;通过比较不同时间的值来计算一段时间内的连接数
redis_server_total_net_input_bytes 分片接收的字节数;通过比较不同时间的值来计算一段时间内的吞吐量
redis_server_total_net_output_bytes 分片发送的字节数;通过比较不同时间的值来计算一段时间内的吞吐量
redis_server_up 分片已启动并运行
redis_server_used_memory 分片使用的内存(在BigRedis中包括闪存)(字节)
RATE THIS PAGE
Back to top ↑