您现在的位置:首页
--> Xupeng
得知下厨房的数据被误删了,正在紧张恢复中。作为犯过很多次严重错误的人,我最想说的是,善待当事人吧,此刻他在承受着巨大的压力,比其他任何人都要心焦,他会很感激你的善言和善意。
这几年犯过很多次严重影响线上服务的错误,像重启了错误的节点这样的事情应该算作能够对线上造成影响的最微不足道的错误,就只简单说几件现在都还让我心有余悸的事吧。
停用线上 memcached 集群
在调整 memcached 客户端配置的使用和部署方式之前,尽管经过了多次测试,比如在部分节点先上线,确认没有问题之后上线所有的应用服务器,但还是使用了错误的配置,导致线上所有应用禁用了 memcached,巨大的访问压力瞬间拖垮了数据库,从发现问题到完全恢复持续了将近二十分钟。
软件 bug 导致线上 memcached 集群被污染
上线的代码在特定条件下会禁掉对 memcached 的使用,导致在本应清除 c
用了三年多 Wordpress,由于实在很懒,没有写过多少东西,但跑在 Linode VPS 上的 Wordpress 却一直占用了很多资源,几个 PHP-FPM 进程加上 MySQL 就用掉了将近 400MB 内存,却没有什么访问量,觉得很不划算,再加上 Wrodpress 越来越臃肿,就想把它换成一个静态内容发布系统。
[ 共2篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [743] WEB系统需要关注的一些点
- [21] 移动音乐产品梳理
- [18] 豆瓣是啥?
- [17] 哪本书是对程序员最有影响、每个程序员都该阅读
- [16] Chrome开发者工具的小技巧
- [14] 内存的惰性初始化
- [12] 这些反人类设计,你肯定也碰到过
- [12] sns视觉设计分享
- [12] 一张图帮你看懂 iPhone 的屏幕分辨率
- [11] Spark性能优化——和shuffle搏斗
赞助商广告