IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:Scribe

共 4 篇相关文章

IT 累计浏览 2,541

scribe的生产实践总结

作者结合两年生产实践,分享了对Facebook开源日志系统Scribe的应用总结。Scribe以精简稳定著称,作者团队在线上运行超过两年,未曾遭遇其自身进程崩溃。 文章核心聚焦于生产环境中Scribe的关键运维实践。针对Master节点宕机,标准配置是Primary接Secondary文件,故障时日志本地缓存,恢复后自动补发,并可通过一行脚本监控积压。为防止Scribe进程意外阻塞业务,建议采用异步线程写日志。而最棘手的情况是网络拥塞导致日志追送困难,作者提到一项压缩传输的改造尝试。文章最后将Scribe与LinkedIn开源的Kafka进行对比:Scribe如同“激流勇进”的冲锋舟,简单可靠;Kafka则似“航空母舰”,以集群和去中心化设计,对单点故障的容忍度更高。作者认为,对于中心化的日志收集场景,两者各有适用之处。

IT 累计浏览 1,907

浅析App Engine

这篇讲的是谷歌App Engine这个PaaS平台,作者从实际选型的角度出发,深入剖析了它的核心设计思路与典型应用场景。 文章没有泛泛而谈,而是紧扣App Engine作为“无服务器”先驱的特点展开。重点解释了它的沙箱隔离机制、自动扩缩容策略,以及背后对开发者“只需专注代码”的承诺是如何通过底层架构实现的。文中还将它与Heroku、AWS Elastic Beanstalk等主流PaaS进行了横向对比,指出了关键差异:例如App Engine与Google Cloud数据服务的深度集成、特定语言运行时的限制,以及在不同计费模型下的成本考量。 最终,文章给出的结论很明确:App Engine特别适合那些希望快速迭代、流量波动明显且技术栈与之匹配的应用。对于追求完全控制或需要深度定制基础设施的团队,它可能并非首选。整篇分析立足于技术细节,为读者的选型决策提供了扎实的参考依据。

IT 累计浏览 5,075

用hadoop hive协同scribe log用户行为分析方案

这篇讲的是如何用Facebook开源的分布式日志系统Scribe,与Hadoop生态中的数据仓库工具Hive搭建一套高效的用户行为分析方案。Scribe在官方示例中能支撑每秒高达200万条日志的高并发采集,而Hive则能将结构化日志文件映射为表,并通过熟悉的SQL查询转换为MapReduce任务执行,非常适合对海量日志进行灵活分析。 作者54chen在文中分享了自己实践Scribe和Hive的经验手记,核心在于解决如何让两者协同工作。具体步骤上,文章从创建与Scribe日志格式相匹配的Hive表开始,引导读者逐步搭建起从日志收集到分析查询的完整流程。这套方案的价值在于,它让企业可以充分利用Scribe在高吞吐日志采集上的优势,并结合Hive强大的数据仓库查询能力,从而低成本、高效率地完成用户行为等大规模日志数据的分析工作。

IT 累计浏览 8,980

分布式日志系统scribe使用手记

这篇讲的是如何用Facebook开源的Scribe搭建分布式日志系统。作者从实际需求出发,介绍了Scribe的核心优势:它通过thrift协议传输日志,能轻松整合不同语言的项目,实现从本地到远程的统一日志收集。在性能上,Scribe示例配置的并发量可达每秒200万条消息,对于绝大多数应用来说,即便是最基础的配置也能保证远程日志收集的可靠性。如果遇到更高压力,还可以通过主从架构自动同步日志到本地,进一步提升稳定性。文章接下来会具体演示Scribe的安装与配置过程。