随着企业的不断发展壮大,在线服务器的数量也越来越多,因此,企业软硬件发生故障的概率也会愈发增高。在上述情况下,当企业主机或应用发生异常时,如果企业没有一个比较完善且功能强大的监控系统,则会造成企业的业务的中断,而这种损失对于企业来讲则是巨大的。
作者:*阳(EdwardLi)云智慧开发工程师。具有多年运维与Dvops从业经验,致力于云原生方向领域的研究及落地。
监控的简介
随着微服务的出现,监控系统变得尤为重要。当开发者自己写一个规模比较小的程序时,会选择写一个脚本或一个小程序去做监控;而当一个企业自身服务应用规模比较大时,则会采用适合自己企业业务系统的商业监控方案。云智慧作为国内领先的全栈智能业务运维解决方案服务商,产品包括监控宝、透视宝等其他商业软件。此外,部分企业则会选择一些开源监控方案,如Zabbix、Promthus等。本篇文章,我们将围绕如何在云原生时代选择合适的监控方案这一话题展开讲解。
监控的目的
建立完善的监控体系可达到以下目的:
告警:当系统出现或者即将出现故障时,监控系统需要迅速反应并通知管理员,从而能够对问题进行快速的处理或者提前预防问题的发生,避免出现对业务的影响;长期趋势分析:通过对监控样本数据的持续收集和统计,对监控指标进行长期趋势分析;对照分析:两个版本的系统运行资源使用情况的差异如何?在不同容量情况下系统的并发和负载变化如何?通过监控能够方便地对系统进行跟踪和比较;故障分析与定位:当问题发生后,需要对问题进行调查和处理。通过对不同监控以及历史数据的分析,能够找到并解决根源问题;数据可视化:通过可视化仪表盘能够直接获取系统的运行状态、资源使用情况、以及服务器运行状态等直观的信息。
监控的维度
监控的维度主要包含以下方面:
网络层:包括对网络协议(