Linux 找出大文件汇总
Q. 如何在目录中找出所有大文件? A. 1) 句法 for RedHat / CentOS / Fedora Linux find {/path/to/directory/} -type f -size +{size-in-kb}k -exec ls -lh {} \; | awk ‘{ print $9 “: ” $5 }’
精选技术长文、实践记录与系统化阅读
低噪声、高可扫读;标题、摘要、来源、标签一目了然。
采集自各技术站点的近期文章。
Q. 如何在目录中找出所有大文件? A. 1) 句法 for RedHat / CentOS / Fedora Linux find {/path/to/directory/} -type f -size +{size-in-kb}k -exec ls -lh {} \; | awk ‘{ print $9 “: ” $5 }’
bmp图片的格式我是了如指掌的,是不是ps以某种方式记录了它的更改操作呢?我比较了下ps前和ps后的图片的大小,结果发现ps后图片大小大了两个字节。用UltraEdit打开看了下十六进制的数据,发现原来是ps后的图片末尾被ps添加了两个字节的零。这两个字节的零不会对亮度和对比度起任何作用,那么到底什么改变了亮度和对比度呢?
可以吃吗 豆瓣酱可以吃。本文讨论的是豆瓣网(douban.com),我们通过它找到美味;而且,不仅包括美食。 定位: 豆瓣网为用户提供一种服务,这种服务不针对特定对象。它根据用户的口味,帮助用户找到符合口味的东西。 1 :东西包括书影音,以及最新上线的东西和周边生活。公允地讲,豆瓣网的用户也是「东西」,这群人构成的圈子(小组、小站、部落、阿尔法城),以及圈子里蕴含的氛围、话题、活动、内容,都是东西 粗略来看,兴趣和东西可以是一回事。比如羽毛球。若细分,则兴趣不仅包含东西,还指人与东西之间的关联,比如对羽毛球的情感、讨论以及延伸。兴趣们加在一起,反映并影响着用户的口味 每个人的口味不尽相同,豆瓣尊重个体,最大化用户价值。 2: 通过「区隔」力图去中心化,让用户始终关注自己最喜欢的,而不让兴趣串台。 3: 很多豆瓣用户也因此骄傲 4 :豆瓣网里的成员,通过兴趣,把东西(广义上,包括东西与成员)串在了一起。这三个元素,组成了豆瓣社区。
Travis CI,是一个专门为开源项目打造的持续集成环境。如果你有一个放在github上的开源项目,Travis CI简直就是一个完美的CI选择。下面以Moco为例,说明如何在自己的项目里添加Travis CI支持。实际上,只要采用的是“标准工具”,支持Travis CI就简单得一塌糊涂。
Chromium 采用 Chrome:// 协议开头的形式, 规定了一系列的内部协议, 有的用来显示数据, 有的用来实现一些功能, 但对普通用户进行了屏蔽。在Chrome浏览器地址栏直接访问就好了!
最近我们团队开展了一系列的15分钟linux培训计划,今天给大家分享了下find命令的使用,不过内容有点少了。这里把能用到的命令都列一下,也方便以后查找使用。
写硬盘:为了持久化, 必须写硬盘。 Log 文件:为了快速写入硬盘, 必须采用追加方式顺序写到 log 文件. 这导致 log 文件中的数据是无序的。 sst 文件:为了快速从硬盘中读取数据, 基于查找算法和局部性原理考虑, 必须将数据排序组织到 sst 文件中。 多个 sst 文件而不是单个:为了快速的插入数据到 sst 文件中, 必须使用多个 sst 文件, 每个 sst 文件只保存一定范围的数据. 堆。 Levels:为了减少 log 文件合并所影响的 sst 文件个数, 将 sst 按层次组织, 层次越深, 文件数量越多. 最坏的情况, 每一次合并都会修改该层次所有的 sst 文件. 而层次越深, 合并发生的概率越小. 树。 Bloom Filter:由于 LevelDB 在某一层查找不存在的数据时, 会继续在下一层进行查找, 所以对于不存在的数据的查找会速度非常慢. 所以, 需要结合 Bloom Filter, 利用 Bloom Filter 能快速地判定”不存在”的特点.
Paul Graham不仅是Y Combinator天使投资公司的创始人,而且还是一名关系编程界的程序员,最近他的一位朋友Kevin Kelleher向他建议了一个比较各种编程语言的有趣方法:看看它们各自都是来解决什么问题的。可问题是,像这样去描述,你可以罗列出无数的语言,而且你可以使用各种的角度来描述。
1.scala的数组与java相比是可变的数据结构。 2.for(i <- 0 to 2) 这里的向左箭头是指i的范围,两头是闭区间。 3.list是不可变的,不需要new,list与list之间用:::(三个冒号)可以做连接,::(两个冒号)会产生新的维度的list。 4.var可变,val不可变。崇尚val,不可变对象和没有副作用的方法。 5.Unit类似java的void。 6.object是特殊的class,是单例。 7.maven也可以搞定scala,但是更好用的是sbt。
这几天无意中发现一款开源的 3d engine ,名为 pixel light 。文档 虽然不多,但写的很漂亮。从源码仓库 clone 了一份,读了几天,感觉设计上有许多可圈可点的地方,颇为有趣。今天简略写一篇 blog 和大家分享。
很早以前,江湖上就有利用在hosts文件屏蔽优酷广告服务器IP地址的方式来达到屏蔽其广告的秘笈。可惜秘笈没有使用多久,就被优酷用黑屏广告给攻击了。于是,江湖人事继续苦练内功后,又推出了目前能完整屏蔽优酷广告的秘笈。此秘笈如下。。。。
起因 对 Ubuntu 频繁的版本升级有点厌倦了,6 个月的更新周期有些短。 不升级吧经不住诱惑, 升级吧往往需要花专门的时间处理,解决或大或小这样那样的问题, (最近几次好多了,出现问题很少,但还是不放心)。 Rpm 系的不喜欢,不考虑。 Debian 吧嫌它有点旧,sid 嫌不稳定。 希望尝试滚动升级的发行版,目前的选择看来看去也就是 Gentoo 和 Arch 了。 Gentoo 需要编译不考虑,Arch 看来不错,但它的追新特性让我比较担心。 我希望即使几个月或者几年不更新,也能够比较顺利的更新到最新版。 除了 Arch,看起来也没有别的更加合适的发行版了, 于是就做了很多功课,发现 Arch 也不是像瓷瓶那样脆弱, 一般只要不是以年为间隔进行升级应该不致命, 实在弄坏了就重装吧,多重装几次就当是复习了。 另外还可以琢磨一些办法快速安装软件,以及有效保存、管理自己的 配置文件 。
这是陈吉平以前在ITPUB论坛上写下的职业生涯总结,随着时间推移,他早已经从技术岗位转向了管理,现在带领团队承担着淘宝无线的开发工作(现在淘宝拆分了,但是据说他的团队再次扩大),我将这篇文章转载在这里,供后来的同学们参考。
Sheepdog的块设备驱动写好有一段时间了,陆续修改了几个版本之后,近期进行压测的时候遇到一个死锁的问题,头痛了一个多星期,今天请教了一下淘宝内核组的@伯瑜同学,在他的热情帮助下分析出来了死锁出现的原因,解决的办法暂未找到,或者说这问题无解,待我细细说来。
在今天的这篇文章中,我们将继续推荐给大家一组我们精挑细选的web开发设计必备的在线工具应用。相信会在web开发和设计的过程中给你带来方便和快捷!
每年一到要找工作的时候,我就能收到很多人给我发来的邮件,总是问我怎么选择他们的offer,去腾讯还是去豆瓣,去外企还是去国内的企业,去创业还是去考研,来北京还是回老家,该不该去创新工场?该不该去thoughtworks?……等等,等等。今年从7月份到现在,我收到并回复了60多封这样的邮件。我更多帮他们整理思路,帮他们明白自己最想要的是什么。
在分析各个网站的CSS时,我们经常可以看到一些网站有很多的元素共享了一张背景图片,而这张背景图片包含了所有这些元素需要的背景,这种技术就叫做CSS Sprites。这样做有什么好处呢? 显而易见,浏览器在载入每一张图片的时候都会发起一个HTTP请求。 如果使用CSS Sprites技术,将所有的图片合成一张图片,那么,这样多个HTTP请求会被合成一个HTTP请求。 这样就既能大大降低后台服务器的开销,又能加快网页载入速度。 CSS Sprites原理: CSS Sprites是通过背景图片外加背景图片定位来实现的。
什么是BFC? BFC(Block Formatting Context),简单讲,它是提供了一个独立布局的环境,每个BFC都遵守同一套布局规则。例如,在同一个BFC内,盒子会一个挨着一个的排,相邻盒子的间距是由margin决定且垂直方向的margin会重叠。而float和clear float也只对同一个BFC内的元素有效。
为了规避内存碎片问题,Memcached采用了名为SlabAllocator的内存分配机制。内存以Page为单位来分配,每个Page分给一个特定长度的Slab来使用,每个Slab包含若干个特定长度的Chunk。实际保存数据时,会根据数据的大小选择一个最贴切的Slab,并把数据保存在对应的Chunk中。如果某个Slab没有剩余的Chunk了,系统便会给这个Slab分配一个新的Page以供使用,如果没有Page可用,系统就会触发LRU机制,通过删除冷数据来为新数据腾出空间,这里有一点需要注意的是:LRU不是全局的,而是针对Slab而言的。
项目中常常有同学遇到这样的问题,现象是给元素设置了overflow:hidden,但超出容器的部分并没有被隐藏,难道是设置的hidden失效了吗? 其实看似不合理的现象背后都会有其合理的解释。