B 站监控体系 (zhuanlan.zhihu.com)

【简介】

由于早期B站高速发展,巨石架构基于CMS系统搭建,导致代码紊乱。

从研发角度切入,来分析监控系统。

1. 业务层:监控系统需要关注业务指标,如携程网的酒店下单量,大众点评、唯品会的商品购买指标、实时业务,B站的注册成功率等……

点击查看全文 >>

@Jerry轩5211 2018-03-21 11:10分享 / 0个评论
赞过的人: 技术头条 Jerry轩5211
要不要再学学下面的文章?
14 张思维导图构建 Python 核心知识体系 (mp.weixin.qq.com)
本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库)。
按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组,字典,集合),条件&循环,文件对象,错误&异常,函数,模块,面向对象编程;
by @code小生 2019-09-22 16:57 分享 查看详情
阿里巴巴飞天大数据架构体系与Hadoop生态系统 (yq.aliyun.com)
Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算,充分利用集群的威力进行高速运算和存储。Hadoop的核心有两大板块:HDFS和MapReduce。
by @可耐芊小仙女 2019-09-12 17:56 分享 查看详情
从求生存到修体系,我在阿里找到了技术人的成长模式 (yq.aliyun.com)
成长即意味着改变,而改变本身是一件很痛苦的事情。改变会有连锁反应,一次改变之后,你的心态和认知可能会和以前大有不同。平凡的人总是相似,不凡的人各有各的不凡,技术人的成长道路依然很长!本文由阿里巴巴前端技术专家悟寻将他在阿里的成长思考进行分享,希望能够给正在业务中深耕细作的你带来一些思考和方向。
by @可耐芊小仙女 2019-08-30 16:09 分享 查看详情
10 人,2 个月 | 虾米音乐的监控体系升级之路 (yq.aliyun.com)
监控一直是服务端掌握应用运行状态的重要手段,经过近几年的发展,阿里虾米服务端目前已经有 100 多个 Java 应用,承担核心业务的应用也有将近 50 个,对于应用的监控配置也是因人而异。有的人配置的监控比较细,有的应用在经历了多人开发阶段以后,监控就逐渐疏于管理,有些应用的监控项最后修改时间只停留到 2 年以前,早已不适应业务的发展。
by @可耐芊小仙女 2019-08-28 15:44 分享 查看详情
全景还原报错现场 | 应用实时监控 ARMS 上线用户行为回溯功能 (yq.aliyun.com)
随着前端技术日新月异迅猛发展,为了实现更好的前端性能,最大程度提高用户体验,支持单页应用的框架逐渐占领市场,如众所周知的React,Vue等等。但是在单页应用的趋势下,快速定位并解决JS错误却成为一大难题。在当下的互联网行业,对前端性能要求越来越高,前端性能监控的产品层出不穷,javascript错误诊断更是其中举足轻重的一个环节。帮助开发者排查线上bug,实现快速定位问题,高效解决问题,是我们努力的方向。
by @可耐芊小仙女 2019-08-20 16:05 分享 查看详情
告别诊断烦恼 | 应用实时监控 ARMS 上线智能和实时诊断功能 (yq.aliyun.com)
当您需要密切监控一小段时间内的应用性能时,例如发布应用时,或者应用出现问题时,您可以使用 ARMS 应用监控的实时诊断功能。开启实时诊断后,ARMS 应用监控会持续监控应用 5 分钟,并在此期间通过来一条上报一条的方式(延时在秒级),实时全量的上报调用链数据。接下来,您就能以出现性能问题的调用链路为抓手,通过方法栈瀑布图和线程剖析等功能定位问题原因。
by @可耐芊小仙女 2019-08-20 15:28 分享 查看详情
TSQL:让监控分析更简单更高效 (yq.aliyun.com)
SQL作为一个诞生于上世纪70年代的编程语言已经存在几十年了。这是一个相对而言较“古老”的编程语言,但又是一个有着广泛用户基础的语言。在跟踪主要编程语言的流行程度的TIOBE index[1]中,SQL在2019年4月份的排名是第8。而如果把排名列在11-20之间的SQL的两个“兄弟”PL/SQL, Transact-SQL也合并进来的话,SQL的流行度应该更高。
by @可耐芊小仙女 2019-08-09 15:21 分享 查看详情
重磅!容器集群监控利器 阿里云Prometheus 正式免费公测 (yq.aliyun.com)
Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,并于 2015 年正式发布。2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。7月3日,阿里云Promtheus云托管实例正式开始免费公测。针对容器集群监控场景,提供了完整的采集、存储、监控、告警、图表展现的数据监控服务。通过与 Kubernetes 平台运维解耦合,使得 Prometheus 监控服务不受被监控平台的性能、稳定性、可靠性等诸多因素的影响。
by @可耐芊小仙女 2019-07-19 15:21 分享 查看详情
阿里云容器Kubernetes监控(九) - Kubernetes事件离线工具kube-eventer正式开源 (yq.aliyun.com)
监控是保障系统稳定性的重要组成部分,在Kubernetes开源生态中,资源类的监控工具与组件百花齐放。除了社区自己孵化的metrics-server,还有从CNCF毕业的Prometheus等等,开发者可选的方案有很多。但是,只有资源类的监控是远远不够的,因为资源监控存在如下两个主要的缺欠:
by @可耐芊小仙女 2019-07-17 14:55 分享 查看详情
实践:轻松可视化实现设备监控大屏效果 (developer.aliyun.com)
前期团队一直在搭建与云端服务器对接的事情,近期终于落地,数据采集中心实现了服务端与可视化编辑器的融合,整个案例中脚本就两百行左右,基本通过可视化平台配置完成,体现我们平台的高效性。今天通过本案例讲解下服务端接口搭建、服务端与可视化编辑器是如何配合使用的。
by @可耐芊小仙女 2019-07-10 16:38 分享 查看详情