IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

Linux内核代码中的脏话统计

外刊IT评论 2013-09-23 12:27:57 累计浏览 3,436 次
本机暂存

按脏话数/版本号统计

graph

按脏话密度/版本号统计

relgraph

上图显示的是对Linux内核里的c,h和S源代码里的脏话统计结果,我会每月更新一次这些数据,当有新版本发布时也会更新一次。我是受the linux kernel fuck count的启发,但遗憾的是它里面的数据已经过期了。

从图中可以很明显的看出,自从2.4版开始,脏话的数量有大量的增加。然而,总的代码量也增加了很多,所以,总的来看,平均每行的诅咒密度是减少的。

介绍一下统计方法:不论任何地方出现的脏话词汇都会计入总数——出现在另一个词内也算。本来可以做的更合理些,但结果发现FreeBSD的正则表达式引擎有严重的内存泄漏问题,我也就没有再改进了。一行里对一个脏词可能会统计出多次,因为有时候一个程序员会遇到非常非常懊恼的一天。

你可以在找到这个脚本,但它写的实在是太乱了,不推荐。

:)

同分类推荐文章

  1. How to Set Up Homebrew Tap for Private CLI Tools: A Complete Guide (2026-05-27 02:13:03)
  2. WARNING: detected duplicate paths to the same disk导致crs无法正常启动故障解决 (2026-05-24 22:24:49)
  3. Terraform 极简入门:从 AWS-CLI 到基础设施即代码(IaC) (2026-05-20 08:00:00)

查看更多 DevOps 文章 →

建议继续学习

  1. Git常用命令备忘 (累计阅读 54,626)
  2. Git log diff config高级进阶 (累计阅读 24,793)
  3. Git subtree 要不要使用 –squash 参数 (累计阅读 23,355)
  4. 我的git笔记 (累计阅读 20,185)
  5. Linux如何统计进程的CPU利用率 (累计阅读 16,226)
  6. 我的 RHCA 之路 (累计阅读 13,944)
  7. Linux内存点滴 用户进程内存空间 (累计阅读 13,084)
  8. 给程序员新手的一些建议 (累计阅读 13,039)
  9. Linux 性能监控、测试、优化工具 (累计阅读 12,964)
  10. 关于linux内存free的一些事情 (累计阅读 12,780)