IT技术博客大学习 共学习 共进步

技术文章

精选技术长文、实践记录与系统化阅读

技术文章精选

低噪声、高可扫读;标题、摘要、来源、标签一目了然。

最新文章

采集自各技术站点的近期文章。

IT 算法/ 2010-11-29 21:04:30 / 累计浏览 3,189

Pthreads并行编程之spin lock与mutex性能对比分析

POSIX threads(简称Pthreads)是在多核平台上进行并行编程的一套常用的API。线程同步(Thread Synchronization)是并行编程中非常重要的通讯手段,其中最典型的应用就是用Pthreads提供的锁机制(lock)来对多个线程之间共 享的临界区(Critical Section)进行保护(另一种常用的同步机制是barrier)。

IT 其他/ 2010-11-29 20:55:12 / 累计浏览 2,185

网页分析处理的极品模块Web::Scraper

我们在做各种自动化处理时,常常会希望能更加智能的得到网页中自己想要的元素,最好是象 css 和 div 中的信息来取得,就会更加方便,这个 Web::Scraper 是我用过的几个模块中最方便的。在使用 Web::Scraper 的时候,我们需要先有 Xpath 的路程,这个是网页结构解析出来的结构的路径。如果对 XPath 不了解,看我以前的文章 : XPath 的简单语法介绍. 这个中有 XPath 的简单语法介绍.

IT 视觉设计/ 2010-11-29 20:53:08 / 累计浏览 1,887

为扫描而设计

当我们设计一个页面或者一个banner的时候,往往挖空心思去想创意,或者把效果做得很炫,却忽略了一些用户习惯。我这里所说的只是一些大家都知道,却往往容易忽略的――为扫描而设计. 用户善于扫描,且勤于扫描。WHY? 1.忙碌――大部分用户会花极少的时间来阅读极多的页面,为了提高效率,他们对于大部分的页面会采取扫描的方式,匆匆掠过。他们不可能也没有时间去阅读互联网带给他们的所有信息。 2.目标明确――大部分用户在某一...

IT 其他/ 2010-11-28 19:08:04 / 累计浏览 2,950

关于DRBD与Heartbeat的一些思考

DRBD和Heartbeat这两个用于实现高可用的组合,折腾了有一周了,从开始的新鲜到配置成功的兴奋再到遇到问题的苦闷最后还是在其中一点点的被纠结着,似懂非懂中迷茫着,似乎从小到大没有一件事能做得明白的,稀里糊涂得就奔着三十去了。下面就把这一周里遇到的疑惑,抖露抖露,大家也给点力,说说你们的理解。DRBD是个什么东西――Distributed Replicated Block Device,这4个英文单词说的很明白,BD说明要实现这个功能首先要是块设备...

IT 系统运维/ 2010-11-28 19:05:13 / 累计浏览 3,327

好软件推荐 gnuplot 来做可视化数据

先给大家看个图。。。做得不好。。。这个是我学习 RHCA 中的调优课的一个工具,相当相当好。介绍给大家。ps 我发现所有调优都能数字化,bc 和 gnuplot 是最好的帮助了。

IT 奋斗/ 2010-11-28 18:59:36 / 累计浏览 1,527

周会经验一小枚

忽然兴起,讲一讲我组织周会的经验。我在相册每周主持两次例会,周三的策划例会,以及周五的策划运营例会。周三例会的主要议题是策划方案的通报讨论,每位策划人员各自负责一些模块,每个模块在接近完成的时候,都拿到例会上讨论,大家提意见,经过这么一个流程再定稿。不仅集思广益,也帮助策划组内部互相了解,共享经验。除此之外,每位策划都分配了若干个观测竞品。每个月初的第一次周三例会,大家分头讲自己跟踪的竞品,上个月...

IT Apache/ 2010-11-28 18:58:18 / 累计浏览 3,971

Nginx进程管理之master进程

Nginx分为Single和Master两种进程模型,Single模型即为单进程方式工作,具有较差的容错能力,不适合生产之用。Master模型即为一个master进程+N个worker进程的工作方式。生产环境都是用master-worker模型来工作。本文着重分析Nginx的master进程做了哪些事情,它是如何管理好各个worker进程的。在具体分析代码之前,先附上一张master进程的全貌图: 我们知道在main函数中完成了Nginx启动初始化过程,启动初始化过程中的一个重要环节...

IT 系统运维/ 2010-11-28 18:57:18 / 累计浏览 3,170

windows下完全手动配置绿色版ROR

ruby是前一阵子比较火的动态语言之一,很是灵活ROR则是基于ruby语言的开发框架。本文讲述如何windows里面自己手动配置安装绿色的ROR环境。

IT 算法/ 2010-11-28 18:56:00 / 累计浏览 4,132

Oracle hash join

hash join是oracle里面一个非常强悍的功能,当做hash join时,oracle会选择一个表作为驱动表,先根据过滤条件排除不必要的数据,然后将结果集做成hash表,放入进程的hash area,接着扫描第二张表,将行的键值做hash运算,到内存的hash表里面去探测,如果探测成功,就返回数据,否则这行就丢弃掉这个是最基本的解释,实际情况中,考虑到单个进程PGA的大小,oracle不会让进程任意的消耗OS内存,hash area是有一定限制的,所以在oracl...

IT 互联网/ 2010-11-28 18:55:04 / 累计浏览 2,706

评论《博客的精神》

  千鸟写了一篇日志《博客的精神》,我想还是在自己的博客里用TB的方式作为评论吧。先看一下百度百科对于Blog(博客)的定义: Blog 全名Weblog,中文意思是“网络日志”,后来缩写为Blog。它是继Email、BBS、IM之后出现的第四种网络交流方式,是网络时代的个人“读者文摘”,是以超级链接为武器的网络日记,是代表着新的生活方式和新的工作方式,更代表着新的学习方式。简言之,Blog 就是以网络作为载体,简易迅速便捷地发布自...

IT 互联网/ 2010-11-28 18:54:17 / 累计浏览 2,776

关于微博的四个商业观点

首先要说的是“微博元年”这件事。很多人都知道,在门户微博之前,早就有饭否叽歪嘀咕之类的所谓独立微博站点。但要说火爆,的确是门户切入这个市场之后,于今年火爆起来的。这里面的因素可能很多,但有一条是核心的:只有门户有这个财力去推动,独立微博其实没那个力量。既然是今年火爆起来的,故而把2010年称为微博元年没什么错,这个道理就像有人把去年或今年称为“电商元年”那样,事实上,电商这个东西,1997年12月就有了中国化工网。

IT CSS/HTML/ 2010-11-24 23:10:19 / 累计浏览 3,010

模拟宽度自适应的输入框

很早以前就看过ytzong的《宽度自适应的输入框》这篇文章,感觉很不错,非常详实,YUI的栅格决定宽度,内容决定高度确实很实用。 前段时间在一个项目中真好用到,同事啄米鸟模拟了一个宽度自适应的输入框,原理和ytzong的大致相同,但是解决了以上两个麻烦点。当然也有不足的地方。

IT 视觉设计/ 2010-11-24 23:06:24 / 累计浏览 1,792

版式设计心得

掌握必要的方法 设计的时候,如果设计者随意地进行处理而不考虑当中的原则方法及对象规律的话,那么很多时候都会出现一些不太好的结果。虽然感性是一种相当重要的因素,设计中一定要带有情感,但并不代表简单地依靠情感就能做出好的设计。相反,如果设计的时候能够考虑到各方面的因素并运用恰当的方法的话,那么作品将更加得体和出色。在网页设计中,版式设计占的比重非常大,可以说版式的好坏直接决定页面的成败,也可以说...

IT 算法/ 2010-11-24 23:03:42 / 累计浏览 2,149

namenode 内部关键数据结构简介

本文档目的在于对namenode中各种关键的数据结构进行剖析和解释,以方便更好的对namenode的各种处理逻辑和代码结构进行理解。其中包 括对namenode中Namenode和FSNameSystem的程序代码结构,FSDirectory,BlocksMap, CorruptReplicationMap,excessReplicateMap, UnderReplicatedBlocks,PendingReplictiondBlocks等数据结构的介绍。

IT 其他/ 2010-11-24 23:01:46 / 累计浏览 3,811

Hadoop现有测试框架探幽

背景 从使用hadoop的第一天开始,就一直没有离开过对Hadoop自身功能的开发以及hadoop本身bug的修复的相关开发。这样的开发模式已经持续了好几年,但是可以从中发现的一个现象:对于我们修复的bug或者开发的功能,一直都没有一种很规范,很统一,高效,好管理,并且一目了然的测试的方式。常常的现象是:开发了一个功能或修复了一个bug后,就针对该修改进行一些人为手动的环境模拟和测试,然后测试确认没有问题以后,就合入基线版本...

IT 系统架构/ 2010-11-24 21:14:57 / 累计浏览 16,060

分布式缓存系统 Memcached 入门

维基百科上对 Memcached 的介绍是一个分布式的缓存系统, 但是 Memcachd 到底是什么意思,有什么作用呢?缓存一般用来保存一些经常被存取的数据和资源(例如:浏览器会将访问过的网页会话缓存起来),因为通过缓存来存取数据要比从磁盘存取同样的数据要快得多。所以 Memcached 顾名思义,意味着 “内存缓存”,所有缓存的内容都在服务器的内存中。内存中的这些缓存数据可以通过 API 的方式被存取。数据是以 key/value 的配对方式...

IT 互联网/ 2010-11-24 21:14:09 / 累计浏览 3,954

背水一战的新浪

把微博说成是新浪的救命稻草,其实一点也不过分。相对于新浪而言,另外三家收入对门户广告依赖得并不多,事实上,这三家更像一个游戏公司。网易87%、搜狐52%的收入都是来自于游戏,而至于腾讯,这个卖虚拟物品卖到连摩根斯坦利都得把它当成一种商业创新,对广告的依赖就更小了――只有区区7个百分点的收入贡献。网络从业者都知道,其实做游戏的毛利率高得惊人,一款已经为大众所接受的游戏,毛利率超过100%不是什么神话。但网络广告不是。即便是象google这种主要靠技术搭建的自助式管理平台,它的毛利也不过在60%-70%之间。至于门户广告,当我们看到新浪每股净收益只有0.4美元的时候,就该明白,这不是一个什么朝阳产业。

IT PHP/ 2010-11-24 21:12:47 / 累计浏览 2,928

PHP 中对变量unset,可以销毁变量中的资源

在变量被重新赋值时,变量所标示的连接立即关闭;在变量被unset时,变量所标示的连接立即关闭;不要写这么含蓄的代码。如果你是一个连接变量,重新赋值前最好close一下;如果你是一个对象,在析构函数中关闭你的连接;当然如果你使用的是长连接,就不必这么做了。

IT 互联网/ 2010-11-24 00:12:49 / 累计浏览 3,634

国内的开放平台就是一个玩笑

晚上煮了点面条,手艺越来越差,难以下咽,于是就在微博写写骂骂的,还不过瘾,就瞎写一番.此文有辱斯文,品德高尚者走开. 国内的开放平台就是一个玩笑国外的几个平台。

IT 设计思想/ 2010-11-24 00:11:55 / 累计浏览 3,913

设计师:值得长期关注的网站

在积攒了很多截图和案例之后,我才猛然发现,其实关注太多很容易分散精力,经典往往永远走在最前边,只需要关注他们就够了。如下列表个人认为也许不一定完全代表当今Web Design 的巅峰水准,但长期不懈的努力的确创造了很多难忘瞬间。