Kubernetes中的事件收集以及监控告警 (jokerbai.com)

【简介】

随着微服务以及云原生的发展,越来越多的企业都将业务部署运行到Kubernetes中,主要是想依托Kubernetes的可扩展、可伸缩、自动化以及高稳定性来保障业务的稳定性。
然而,Kubernetes本身是一个复杂的管理系统,它既然是作为企业业务的基础设施,其本身以及运行在集群内部的业务系统对于企业来说都变得非常重要。

点击查看原文 >>

@技术头条 2024-05-05 23:22 / 0个评论
赞过的人: @IT技术博客大学习
要不要再学学下面的文章?
基于 Docker 搭建开发环境(一):数据库+监控 (www.diguage.com)
本文介绍了使用 Docker 构建开发环境的步骤,涵盖 MySQL 数据库配置、Nacos 服务发现与配置管理、Prometheus 监控及 Grafana 可视化。通过 Docker Compose 结构化配置,实现了多组件集成。文章提供了详细的 `docker-compose.yml` 文件示例,并探讨了自动接入监控、应用打包等优化方向,适用于需要集中管理多项开发工具的场景。
by @技术头条 2024-11-02 16:33 查看详情
如何监控 Nginx (crossoverjie.top)
如何高效监控 Nginx?本文介绍了通过 nginx-prometheus-exporter 和 Cprobe 实现 Nginx 监控的详细步骤,并提供了数据采集和 Prometheus 集成的最佳实践。如果你想提升服务器监控能力,快来阅读这篇实用指南!
by @技术头条 2024-09-09 23:43 查看详情
2024年CrowdStrike导致的Windows系统大规模蓝屏事件整理 (ixyzero.com)
本文整理了2024年7月19日因CrowdStrike导致的大规模Windows系统蓝屏事件。由于CrowdStrike更新其Falcon安全产品的配置文件,许多Windows系统出现蓝屏崩溃,影响全球多国的重要业务系统。此事件引发了对安全软件稳定性和供应链风险的反思。作者分析了事件的时间轴、技术原因及对安全产品设计的启示。
by @技术头条 2024-08-06 08:18 查看详情
从 Prometheus 到 OpenTelemetry:指标监控的演进与实践 (crossoverjie.top)
本文总结了OpenTelemetry中指标的概念与使用。作者介绍了OpenTelemetry如何收集和处理应用程序的性能指标,包括计数器、仪表和直方图等核心概念。文章还讨论了如何在应用中实现这些指标的监控,并通过代码示例展示如何使用OpenTelemetry SDK进行集成。此外,作者分享了将指标数据导出到Prometheus和Grafana进行可视化的步骤。
by @技术头条 2024-08-06 08:07 查看详情
实操 OpenTelemetry:通过 Demo 掌握微服务监控的艺术 (crossoverjie.top)
本文演示了如何使用OpenTelemetry进行应用程序监控。作者通过一个具体的示例展示了如何在应用中集成OpenTelemetry,包括如何配置和使用OpenTelemetry SDK来收集和发送数据。文章还介绍了如何在本地运行OTel Collector,以及如何将收集到的数据发送到Grafana等可视化工具中进行展示。此实践指南为开发者提供了一个全面的入门教程。
by @技术头条 2024-08-06 08:06 查看详情
在 kubernetes 环境下如何优雅扩缩容 Pulsar (crossoverjie.top)
在整个大环境的降本增效的熏陶下,我们也不得不做好应对方案。

根据对线上流量、存储以及系统资源的占用,发现我们的 Pulsar 集群有许多的冗余,所以考虑进行缩容从而减少资源浪费,最终也能省一些费用。

不过在缩容之前很有必要先聊聊扩容,Pulsar 一开始就是存算分离的架构(更多关于 Pulsar 架构的内容本文不做过多介绍,感兴趣的可以自行搜索),天然就非常适合 kubernetes 环境,也可以利用 kubernetes 的能力进行快速扩容。
by @技术头条 2024-03-31 21:12 查看详情
竞业协议的相关文章收集 (ixyzero.com)
在国内互联网行业,竞业协议已经有点被滥用了——因为依据《劳动合同法》只有高级管理人员、高级技术人员和其他负有保密义务的人员才可被列于竞业限制的对象;但是现在,全员竞业,入职时就要求签署,不签没法入职。

为了给自己一点保障,多学习一点知识,所以简单整理一下竞业协议的简单内容,方便查阅和参考。
by @技术头条 2024-03-12 22:58 查看详情
Linux上文件监控的踩坑分享 (www.cnxct.com)
在Linux主机安全产品HIDS中,文件监控是特别常见的需求,在实现方案上,Linux内核层提供了文件变动的通知机制fsnotify,然而,在高磁盘IO的主机上、不同版本的内核上以及海量监控目标中,将会面临哪些问题呢?业务性能与安全性如何做更好地取舍均衡?今天,我的小伙伴阿松给大家分享以下文件监控系统的建设历程。
by @技术头条 2024-01-17 23:09 查看详情
chatGPT提示词(prompt)收集 (ixyzero.com)
关于ChatGPT,很多人用的时候发现问问题得到的答案并不如意,很大程度上是因为——问题的质量直接决定了答案的质量,没有Prompt的ChatGPT也只是比较聪明的人工智能而已!毕竟简单问问题的话,ChatGPT的回答也很容易出现空洞、绕圈子、答非所问等情况。因此,出现了Prompt,用GPT能听懂的语言告诉它要做什么!
by @技术头条 2023-12-26 22:19 查看详情
AIOps在美团的探索与实践——事件管理篇 (tech.meituan.com)
美团服务运维团队从事前防御、事中处理、事后运营多个阶段探索AIOps在事件管理领域的应用。本文介绍了在各个运维领域中AIOps的赋能场景,详细阐述了每一个运维场景的业务价值以及算法的具体的落地效果。
by @技术头条 2023-12-26 22:00 查看详情