IT技术博客大学习 共学习 共进步

技术文章

精选技术长文、实践记录与系统化阅读

技术文章精选

低噪声、高可扫读;标题、摘要、来源、标签一目了然。

最新文章

采集自各技术站点的近期文章。

IT Linux/ 2011-01-06 22:38:48 / 累计浏览 2,208

Linux下pstack的实现

Linux下pstack的实现 Linux下有时候我们需要知道一个进程在做什么,比如说程序不正常的时候,他到底在干吗?最直接的方法就是打印出他所有线程的调用栈,这样我们从栈再配合程序代码就知道程序在干吗了。 Linux下这个工具叫做pstack. 使用方法是 # pstack Usage: pstack 当然这个被调查的程序需要有符号信息。 比较雷人的是 这个程序竟然是个sh...

IT Linux/ 2011-01-06 22:34:16 / 累计浏览 3,513

完美使用 WINE 来运行 RTX

研究 RTX 在 Ubuntu 下使用 Wine 来跑,就我研究的最多最多了,最开始的使用方法和帖子 使用Wine来运行RTX的方法 还有 ubuntu 论坛上 使用 Wine 来完美运行 RTX. 二年多前,大量使用 RTX 时,很烦人,...

IT 系统架构/ 2011-01-06 22:32:56 / 累计浏览 5,453

定向抓取漫谈

网络爬虫(web crawler)又称为网络蜘蛛(web spider)是一段计算机程序,它从互联网上按照一定的逻辑和算法抓取和下载互联网的网页,是搜索引擎的一个重要组成部分。一般的爬虫从一部分start url开始,按照一定的策略开始爬取,爬取到的新的url在放入到爬取队列之中,然后进行新一轮的爬取,直到抓取完毕为止。 我们看一下crawler一般会遇到什么样的问题吧: 抓取的网页量很大 网页更新量也很大,一般的网站,比如新闻,电子商务网...

IT 系统架构/ 2011-01-06 22:30:19 / 累计浏览 3,669

梦幻西游服务器的优化

在历史工程上修补是件麻烦的事情。前两天说起梦幻西游服务器的优化。这几天我到广州住下来,打算专门花一周时间搞定这件事。由于以前都是网上聊天,只有坐到一起才能真正理解问题。目前,梦幻西游,只使用单台机器,最高配置 8 个 CPU ,配置 8G 内存。就算最热闹的服务器,也用不完这些资源(大约只用满了 3 个 CPU ,一半的内存)。核心程序差不多就是 10 年前写的,从大话西游延续至今。这两年一直在享受免费的午餐,随着硬件配...

IT Oracle/ 2011-01-06 22:29:16 / 累计浏览 2,366

EXPDP 过程中的 SYS_XMLGEN 性能影响

在EXPDP执行数据导出时,其中一个过程要调用SYS_XMLGEN执行XML文件生成,这个过程可能会产生性能问题,所以需要关注相应时段的AWR报告相关信息。 在一个客户的性能诊断中,发现类似如下的SQL,手工在SQL*Plus中执行该类SQL可以评估其性能,如果其性能存在较大问题,则需要介入研究起原因。

IT 系统运维/ 2011-01-06 22:24:52 / 累计浏览 2,647

Tsung用于压测MySQL服务器的脚本

Tsung用于压测MySQL服务器的脚本 这个MySQL服务器压测的需求是 : 环境: Linux RHEL 5U4 X86-64, 24G内存, 16核. MySQL服务器在10.232.36.100上。 压力由最多32个客户端发起,每个客户端分别做update, insert, delete操作,概率分别是50%, 30%, 20%, 每种操作循环999999 × 100次,每100次操作后休息1-3秒。 这样的压力最多持续2个小时。 我们用的是著名的tsung压...

IT 用户研究/ 2011-01-06 22:19:21 / 累计浏览 3,009

与文科生对话程序员

最近部门里新进了不少即将毕业的大四学生,未来可能做编辑也可能是产品和运营。为了让这群菜鸟(基本上是文科生)以后可以和技术人员能有一个较好的交流基础,我列了10个题目来作培训,预计每个题目发展成一个2小时的课程:计算机基础网络基础和HTTP协议网络运维项目管理软件测试以及SVN/JIRA使用互联网存储WEB前端技术发展开放平台和API人工智能和个性推荐无线互联网头两个题目是我自己来准备的,今天讲第一节课。围绕着两个核心概...

IT Apache/ 2011-01-06 22:17:27 / 累计浏览 4,249

如何在nginx的access log中记录post请求的参数

移动互联网行业开发过程中,服务端经常会需要检查是否收到请求,收到什么样的请求,最简单的办法就是看nginx的access log,常见的nginx配置中access log一般都只有GET请求的参数,而POST请求的参数却不行。 http://wiki.nginx.org/NginxHttpCoreModule#.24request_body $request_body This variable(0.7.58+) contains the body of the request. The significance of this variable appears in locati...

IT 用户研究/ 2011-01-05 22:49:00 / 累计浏览 1,574

用户分层研究方法――以集市卖家为例

写在前面:本文是笔者以往研究的经验总结,由于涉及敏感数据,故作了虚化和符号化处理,读起来会有些费劲,但数字呈现不是主旨,本文侧重用户分层研究的方法,希望能给大家提供一套做用户分层的研究思路和操作流程。 本文讨论的是用户分层,有别于常规的用户细分,最大的区别在于分层是定序的概念,即各层之间有递进关系;而常规细分是定类的概念,即各类之间相对独立。广义上而言,细分包括分层。 现以集市卖家分层为例,介绍整...

IT 系统架构/ 2011-01-05 22:45:41 / 累计浏览 2,942

大型网站用户定位技术

其实这个文章叫大型网站用户定位技术,其实今天要讲的不是智能 DNS ,今天是要讲的智能 DNS 的问题,和一些网站对这个的处理,下面要讲的这个技术主要是针对比较大的文件,比如下...

IT Apache/ 2011-01-05 22:44:49 / 累计浏览 3,774

使用fastcgi_cache加速你的Nginx网站

很久以前在TW上挖了个坑,说nginx的fastcgi_cache是被大家忽视的一大金矿,今天把这个坑填上,顺祝大家新年快乐。 对于变化不太频繁的数据,大家都比较喜欢存Memcached以减少数据库的读取,但还是会有语言解析运行上的消耗(比如运行PHP,Python等),当然这个时间很短,记得OP上有个同学说P字头的语言,效率都不高,如果能省去,当然最好。(已经用上Squid等的可以忽略本文)。 还有一个问题就是很多时候一个页面由多个数据片断组...

IT Oracle/ 2011-01-05 22:42:05 / 累计浏览 2,331

cursor_sharing参数对于expdp的性能影响

客户的数据库使用了cursor_sharing=similar参数,经过测试,发现这一参数极大影响了expdp的性能。其本质原因是SQL的执行计划发生了改变。 在正常情况下28分钟完成的EXPDP操作,在similar模式下用了整整1个小时

IT 算法/ 2011-01-05 22:34:58 / 累计浏览 14,652

天朝第二代身份证号码的验证机制

今天,在盛大某网站注册的时候,身份证必填,但我又不想填真实身份证号码,于是随便编了串自认为合法的身份证号码,但是却马上被提示号码错误,由于响应速度极快,可以肯定不是联机校验正确性的,那也就是说第二代身份证除了大家都知道的几位表示生日和性别的规则以外,还有另外的自我校验规则。于是翻开页面源码查看,发现这段js没有被压缩,所以规则也很好懂。 就在这里给大家科普下,不知道是不是火星了,呵呵。 以下代码来自这...

IT 算法/ 2011-01-05 22:26:37 / 累计浏览 2,369

从狄仁杰的测字占卜到一淘网的Query分析之大结局

《从狄仁杰的测字占卜到一淘网的Query分析之大结局》一文在淘宝搜索技术博客发表已经快一个月了,很多看客看了后给我反馈。当然大部分看客看完后会给一个看似褒奖实则中性的评论:屁股上挂暖壶----有一定(腚)的水平。部分看客看完很不爽,说刚看到“美女说不够深入,不能满足欲望”之处便戛然而止,怎么没有帅哥英雄救美,满足所有想法的预期场景出现。我以前的一个同事更是直接抨击:《狄仁杰》一文就是一篇典型的太监文-----下...

IT 其他/ 2011-01-05 22:16:26 / 累计浏览 4,411

公共场所英文译写规范

随着国际化程度的加深,国内越来越多的公共场所开始提供英文标识。但是,中国人的英语水平普遍不高,导致大量的翻译错误。比如,下面四个真实的例子,你能看出错在哪里吗?(答案稍后公布)  * 停车场:Park  * 加油站:Oil Station  * 汽车租赁店:Car Rent  * 请勿拍照:No Photograph这种"中式英语"有一个专门的单词,叫做Chinglish。很多老外把它们当做笑话看。去年,上海召开世博会,为了维护国际大都市的形象,市政...

IT 编程语言/ 2011-01-05 22:15:28 / 累计浏览 2,795

巧用宏定义来简写C,C++代码

今天在工作上遇到一个问题,觉得很有代表性,特抽象如下: 通过设计模式的角度来说,就是模板方法,已经有一个基类,需要定义很多子类来实现其方法。 但是类名都只有一部分不同,且构...

IT 视觉设计/ 2011-01-05 22:11:18 / 累计浏览 2,713

网易首页2011新版随想

元旦期间,突然发现网易首页(www.163.com)再次改版,当然第一次看到有些不习惯,我随便看了下评论里有好些人在骂这次改版,这也很正常,我记得09年10月份的时候,网易首页也改版了,骂声一片,那次好些改动比较大,大家一时接受不了,我当初一开始也很不习惯,后来也适应了也觉得改得也挺成功的,至少对广告的拉动效果还不小。 之前有一次在公司做分享,就把网易历次改版的页面拿出来,抛砖引玉让大家讨论,当时小K等人也说...

IT 系统架构/ 2011-01-05 22:10:34 / 累计浏览 5,454

Redis新的存储模式diskstore

Redis作者antirez是一个非常勤奋的开发者,在Redis性能已经非常惊人的情况下持续不断开发新的特性,比如从新的cluster源代码看到,作者已经把Dynamo及Paxos一些核心的思想考虑进去并进行了一些简洁的实现。相比其它产品如Memcached则几年没什么大变化,在Web 2.0时代,Memcached已经非常不够用,技术人员需要考虑做很多额外工作才能让Memcached适应新的变化和需求。 antirez在1月5日Google Groups发表了一篇Redis diskstore文章,...

IT 设计思想/ 2011-01-05 22:09:09 / 累计浏览 2,753

匮乏的中文互联网词汇

人们进行沟通,总是依赖一套相对稳定的词汇系统。这套系统里的词汇,有粗有细,能深能浅。根据不同的对象和不同的需要,或抽象,或专业,以达到精确交流的目的。但互联网方面,英语国家相对领先,虽然我们在翻译术语上做了很多努力,在抽象方面都可以见文知意,可是在专业性上,还是有待完善。 优秀的方面,翻译较为精细,考虑周道。比如: Business process reengineering,译为“企业过程再工程”。清华大学薛华成教授解释说,这...

IT 奋斗/ 2011-01-05 03:33:20 / 累计浏览 2,194

我的2010,2011

2010.12.31 22:59:50 在万象城,和现场的很多朋友一起,数完大屏幕数上最后10个数,我们终于迎来了2011。 新的一年来了,充满了欣喜,充满了期待。回顾逝去的2010,那么的快,有点不敢相信。 2010年,是挣扎的一年。 时而失落,时而摇晃,我的物质财富为零,我放弃了几个貌似诱人的绣球。我不知道这些是不是浮云,是不是仅是眼前的得失?很多时候我的心智辨别不清,所以我索性简单不一点,不用去比较。也不知道很多人到底是好还是...