监控行业

首页 » 常识 » 诊断 » 块存储监控与服务压测调优利器EBSLe
TUhjnbcbe - 2025/6/27 9:12:00

EBS监控现状

块存储是阿里云为云服务器ECS提供的块设备产品,具有高性能和低时延的特点。临近双十一,在大促的时候,磁盘IO往往是运维的重点,如果磁盘被打爆了,那么关键的业务可能会停滞甚至崩溃。EBS监控目前存在几个问题

1.块存储提供的原生监控仅限制在单实例级别,只能查看单个云盘的性能监控,缺少对全局云盘状态的监控,如果云盘数量很多,那么云盘状态的监控就非常麻烦

2.通过SLSLogtail,Telegraf或者云监控agent等,可以实现对单个ECS实例所有云盘的状态的监控。但是这些监控方式都是侵入式的,agent的安装、监控大盘的维护、云盘实例监控精细化控制、以及跨ECS实例的监控,对于用户来说,都有很大的学习成本和代价

3.分析维度单一,以上场景下,对云盘的监控和分析还是基于云盘id的,而云盘资产本身的属性也包含很多信息。比如用户想看到一个自己所有云盘资产的大图、各个地域的云盘分布、各个云盘类型的比例等信息,都是很难做到的。

正是考虑到用户对EBS监控的使用有如上的痛点,SLS团队联合EBS团队发布了EBSLens(Lens,透镜的意思,取名为Lens意味着洞察云产品细微的变化),针对块存储提供数据分析、资源监控的功能,可以帮助用户获取云上块存储资源信息与性能监控数据、提升云上块存储资源的管理效率、高效分析业务波动与资源性能消耗情况。

EBSLens产品特点

自动化数据采集

EBSLens开启后,SLS会自动从用户的EBS资产中拉取云盘列表。进入APP后首先展示的就是接入管理页面,在这个页面,可以看到EBS云盘全局的一个管理视图,包含以下信息:

展示当前接入的云盘总量、数据采集的云盘数量、云盘的地域和目标存储库的数量。展示EBS实例信息。例如,实例ID、标签、云盘种类、云盘类型、可用区信息、采集状态、采集操作等信息。如果用户在开启EBSLens之后,对EBS云盘有新建、更新和删除操作的话,SLS会自动更新这里的云盘列表

采集配置

EBS云盘资产同步过来之后,需要用户开启云盘资产的监控数据采集。在这里,我们提供两种采集方式,一种是供用户进行精细化管理的手动采集,还有一种是在EBS云盘数量过多的情况下,方便用户全局管理的自动化采集。

手动采集

支持对单个实例的采集状态进行管理考虑到EBS实例数量会比较多,这里支持在单个分页下面进行批量开启/批量关闭操作

自动化采集

当用户云盘有几百甚至上千个的时候,手动采集的管理方式显然不能满足需求,因此我们还提供了一个自动化采集的功能。自动化采集提供了图形化的配置界面:

可以使用地域、实例ID、付费类型、磁盘类型、标签等属性设置采集条件。标准模式下各个条件之间为且关系。高级模式下,您可以灵活组合与嵌套条件。

配置保存之后,自动化采集立刻开启。所有满足条件的云盘,都会自动打开日志采集,从而省去了手动操作的步骤,另外当实例有所增减的时候,自动化采集也能够感知实例的变化,进行相应的调整。

存储库信息展示

开启云盘监控数据采集之后,SLS会从EBS云盘上拉取监控数据,然后投递到用户配置的目标存储库里,以时序数据的形式进行存储,在目标存储库这个tab里,支持的功能有:

支持查看存储目标库的地域、数据保存时间支持数据保存时间的调整

点击目标库,可以进入SLS的project页面,查看原始监控数据

EBS云盘资产同步、日志采集开启之后,EBSLens就有了EBS云盘资产和云盘的监控数据了,基于这两个数据,EBSLens做了两个监控大盘,资源概览和性能分析页面。

多维度数据聚合与丰富的数据指标类型

资源概览页面,提供一个全局的资产大盘,默认按照用户维度,提供用户账号下所有云盘的统计信息,包括:

云盘总数量云盘总容量云盘实例所属地域个数云盘实例所属可用区个数启用快照云盘占比加密云盘占比Top10容量的区域Top10容量的可用区云盘类型容量分布付费类型容量分布

除了账号的维度外,还支持对地域、付费类型、磁盘类型进行筛选,充分满足用户的各种统计需求

高精度的数据监控粒度

性能分析页面提供了一个全局的云盘监控大盘,默认会统计用户账号下所有磁盘关键指标的监控,包括

吞吐量

总的吞吐量变化曲线读/写吞吐存储Top的实例,以及吞吐变化曲线

IOPS

总的IOPS变化曲线读写IOPSTop的实例,以及IOPS变化曲线

性能分析页面还支持对地域、付费类型、云盘类型、云盘id进行筛选,满足用户精细化监控的需求云盘监控粒度为10s,监控延迟为10s内,对于抖动类场景可以有效进行监控

使用场景

EBSLens有这么便捷的管理方式以及丰富、多维度的监控指标,下面我们列举了几个常用的场景,来详细说明下EBSLens的功能:

监控场景

下面我们模拟日常常见的磁盘IO异常的场景,展示下EBSLens的在监控场景下的应用。

环境准备

首先我们创建一个云盘,或者使用已有的云盘,挂载到ECS实例上。挂载云盘的操作参见:

1
查看完整版本: 块存储监控与服务压测调优利器EBSLe