轻松玩转全链路监控 (developer.aliyun.com)

【简介】

好的产品总是能给予用户最轻松的使用体验,并在实际生产中发挥出巨大的业务价值。我们不妨从现在开始,就将所有微服务应用通过无侵入的方式接入ARMS,构建一体化的全链路监控体系,而不是等到真正遇到生产故障的那一天,为了定位问题而费尽周折。

点击查看原文 >>

@可耐芊小仙女 2020-11-25 14:08 / 0个评论
要不要再学学下面的文章?
基于 Docker 搭建开发环境(三):链路追踪 (www.diguage.com)
本文介绍了通过 Docker 配置 OpenTelemetry 和 Jaeger,实现分布式链路追踪。详细讲解了如何使用 OpenTelemetry Agent 和 Collector 配置尾部采样策略,识别慢请求和错误。结合 Prometheus 和 Grafana,构建全面的监控和追踪系统。提供了具体的 `docker-compose.yml` 配置文件示例,适合需要全链路可观测性的分布式应用开发环境。
by @技术头条 2024-11-02 16:34 查看详情
基于 Docker 搭建开发环境(一):数据库+监控 (www.diguage.com)
本文介绍了使用 Docker 构建开发环境的步骤,涵盖 MySQL 数据库配置、Nacos 服务发现与配置管理、Prometheus 监控及 Grafana 可视化。通过 Docker Compose 结构化配置,实现了多组件集成。文章提供了详细的 `docker-compose.yml` 文件示例,并探讨了自动接入监控、应用打包等优化方向,适用于需要集中管理多项开发工具的场景。
by @技术头条 2024-11-02 16:33 查看详情
如何监控 Nginx (crossoverjie.top)
如何高效监控 Nginx?本文介绍了通过 nginx-prometheus-exporter 和 Cprobe 实现 Nginx 监控的详细步骤,并提供了数据采集和 Prometheus 集成的最佳实践。如果你想提升服务器监控能力,快来阅读这篇实用指南!
by @技术头条 2024-09-09 23:43 查看详情
从 Prometheus 到 OpenTelemetry:指标监控的演进与实践 (crossoverjie.top)
本文总结了OpenTelemetry中指标的概念与使用。作者介绍了OpenTelemetry如何收集和处理应用程序的性能指标,包括计数器、仪表和直方图等核心概念。文章还讨论了如何在应用中实现这些指标的监控,并通过代码示例展示如何使用OpenTelemetry SDK进行集成。此外,作者分享了将指标数据导出到Prometheus和Grafana进行可视化的步骤。
by @技术头条 2024-08-06 08:07 查看详情
实操 OpenTelemetry:通过 Demo 掌握微服务监控的艺术 (crossoverjie.top)
本文演示了如何使用OpenTelemetry进行应用程序监控。作者通过一个具体的示例展示了如何在应用中集成OpenTelemetry,包括如何配置和使用OpenTelemetry SDK来收集和发送数据。文章还介绍了如何在本地运行OTel Collector,以及如何将收集到的数据发送到Grafana等可视化工具中进行展示。此实践指南为开发者提供了一个全面的入门教程。
by @技术头条 2024-08-06 08:06 查看详情
Kubernetes中的事件收集以及监控告警 (jokerbai.com)
随着微服务以及云原生的发展,越来越多的企业都将业务部署运行到Kubernetes中,主要是想依托Kubernetes的可扩展、可伸缩、自动化以及高稳定性来保障业务的稳定性。
然而,Kubernetes本身是一个复杂的管理系统,它既然是作为企业业务的基础设施,其本身以及运行在集群内部的业务系统对于企业来说都变得非常重要。
by @技术头条 2024-05-05 23:22 查看详情
Linux上文件监控的踩坑分享 (www.cnxct.com)
在Linux主机安全产品HIDS中,文件监控是特别常见的需求,在实现方案上,Linux内核层提供了文件变动的通知机制fsnotify,然而,在高磁盘IO的主机上、不同版本的内核上以及海量监控目标中,将会面临哪些问题呢?业务性能与安全性如何做更好地取舍均衡?今天,我的小伙伴阿松给大家分享以下文件监控系统的建设历程。
by @技术头条 2024-01-17 23:09 查看详情
如何让监控告警更准确? (ixyzero.com)
对于7*24小时不间断运行的后台服务,监控告警是稳定性运行的基石。很多开发者都有过这样的经历,对服务的每一个指标都做了严格的监控和告警,唯恐漏掉告警导致问题无法发现,导致每天接收到大量的无效告警,告警的泛滥逐渐麻痹了警惕性,结果真实的问题初漏端倪时却被忽略,最终导致了严重的故障。

如何提升告警的有效性,准确识别问题,同时又不至于淹没在大量的无效告警中,正是本文所探讨的内容。
by @技术头条 2023-10-30 22:58 查看详情
如何利用链路追踪快速定位问题 (insights.thoughtworks.cn)
随着微服务应用数量的增加,服务与服务之间的调用关系变得复杂,导致系统问题定位困难。链路追踪可通过唯一ID标记请求的整个调用链路,记录每个节点,快速定位问题。
by @Thoughtworks 2023-08-25 11:32 查看详情
浅议分布式链路追踪与日志的整合 (blog.yuanpei.me)
最近拜读了 Artech 大佬的新文章 《几个Caller-特性的妙用》,可以说是受益匪浅。不过,对我而言,最大的收获当属这篇文章里的第二主角,即 ActivitySource 和 Activity,这组 API 可以认为是微软针对 OpenTelemetry 规范的一种实现,即:每一个 Activity 都对应着一个 Span 。经过数日的探索,我有了一点小小的收获。因此,今天这篇博客我想和大家分享的是,分布式链路追踪系统如何和日志系统进行整合。
by @技术头条 2023-07-30 17:42 查看详情