10 人,2 个月 | 虾米音乐的监控体系升级之路 (yq.aliyun.com)

【简介】

监控一直是服务端掌握应用运行状态的重要手段,经过近几年的发展,阿里虾米服务端目前已经有 100 多个 Java 应用,承担核心业务的应用也有将近 50 个,对于应用的监控配置也是因人而异。有的人配置的监控比较细,有的应用在经历了多人开发阶段以后,监控就逐渐疏于管理,有些应用的监控项最后修改时间只停留到 2 年以前,早已不适应业务的发展。

点击查看原文 >>

@可耐芊小仙女 2019-08-28 15:44 / 0个评论
要不要再学学下面的文章?
基于 Docker 搭建开发环境(一):数据库+监控 (www.diguage.com)
本文介绍了使用 Docker 构建开发环境的步骤,涵盖 MySQL 数据库配置、Nacos 服务发现与配置管理、Prometheus 监控及 Grafana 可视化。通过 Docker Compose 结构化配置,实现了多组件集成。文章提供了详细的 `docker-compose.yml` 文件示例,并探讨了自动接入监控、应用打包等优化方向,适用于需要集中管理多项开发工具的场景。
by @技术头条 2024-11-02 16:33 查看详情
如何监控 Nginx (crossoverjie.top)
如何高效监控 Nginx?本文介绍了通过 nginx-prometheus-exporter 和 Cprobe 实现 Nginx 监控的详细步骤,并提供了数据采集和 Prometheus 集成的最佳实践。如果你想提升服务器监控能力,快来阅读这篇实用指南!
by @技术头条 2024-09-09 23:43 查看详情
从 Prometheus 到 OpenTelemetry:指标监控的演进与实践 (crossoverjie.top)
本文总结了OpenTelemetry中指标的概念与使用。作者介绍了OpenTelemetry如何收集和处理应用程序的性能指标,包括计数器、仪表和直方图等核心概念。文章还讨论了如何在应用中实现这些指标的监控,并通过代码示例展示如何使用OpenTelemetry SDK进行集成。此外,作者分享了将指标数据导出到Prometheus和Grafana进行可视化的步骤。
by @技术头条 2024-08-06 08:07 查看详情
实操 OpenTelemetry:通过 Demo 掌握微服务监控的艺术 (crossoverjie.top)
本文演示了如何使用OpenTelemetry进行应用程序监控。作者通过一个具体的示例展示了如何在应用中集成OpenTelemetry,包括如何配置和使用OpenTelemetry SDK来收集和发送数据。文章还介绍了如何在本地运行OTel Collector,以及如何将收集到的数据发送到Grafana等可视化工具中进行展示。此实践指南为开发者提供了一个全面的入门教程。
by @技术头条 2024-08-06 08:06 查看详情
Kubernetes中的事件收集以及监控告警 (jokerbai.com)
随着微服务以及云原生的发展,越来越多的企业都将业务部署运行到Kubernetes中,主要是想依托Kubernetes的可扩展、可伸缩、自动化以及高稳定性来保障业务的稳定性。
然而,Kubernetes本身是一个复杂的管理系统,它既然是作为企业业务的基础设施,其本身以及运行在集群内部的业务系统对于企业来说都变得非常重要。
by @技术头条 2024-05-05 23:22 查看详情
Linux上文件监控的踩坑分享 (www.cnxct.com)
在Linux主机安全产品HIDS中,文件监控是特别常见的需求,在实现方案上,Linux内核层提供了文件变动的通知机制fsnotify,然而,在高磁盘IO的主机上、不同版本的内核上以及海量监控目标中,将会面临哪些问题呢?业务性能与安全性如何做更好地取舍均衡?今天,我的小伙伴阿松给大家分享以下文件监控系统的建设历程。
by @技术头条 2024-01-17 23:09 查看详情
[体验向]使用Deepin深度系统制作音乐 (lado.me)
本文是分享使用Deepin来搭建Linux的音乐制作环境的体验。

Deepin自带ALSA、Pulseaudio和FFmpeg,基于Debian能直接使用几乎所有软件。唯一有点小麻烦的地方是在wine官方源安装高版本wine需要另外安装依赖。
by @技术头条 2023-11-30 23:36 查看详情
升级到 Pulsar3.0 后深入了解 JWT 鉴权 (crossoverjie.top)
最近在测试将 Pulsar 2.11.2 升级到 3.0.1的过程中碰到一个鉴权问题,正好借着这个问题充分了解下 Pulsar 的鉴权机制是如何运转的。

Pulsar 支持 Namespace/Topic 级别的鉴权,在生产环境中往往会使用 topic 级别的鉴权,从而防止消息泄露或者其他因为权限管控不严格而导致的问题。
by @技术头条 2023-11-29 23:45 查看详情
如何让监控告警更准确? (ixyzero.com)
对于7*24小时不间断运行的后台服务,监控告警是稳定性运行的基石。很多开发者都有过这样的经历,对服务的每一个指标都做了严格的监控和告警,唯恐漏掉告警导致问题无法发现,导致每天接收到大量的无效告警,告警的泛滥逐渐麻痹了警惕性,结果真实的问题初漏端倪时却被忽略,最终导致了严重的故障。

如何提升告警的有效性,准确识别问题,同时又不至于淹没在大量的无效告警中,正是本文所探讨的内容。
by @技术头条 2023-10-30 22:58 查看详情
廉价的家用工作站方案:ThinkPad 存储升级及数据迁移 (soulteary.com)
最近,给当台式服务器一样使用了两年的 ThinkPad 做了存储升级和数据迁移,对硬盘也做了额外的散热处理。本篇文章里,我们分享下相关的经验和思考,希望能够帮助到有同样诉求的你。
by @技术头条 2023-09-10 23:14 查看详情