IT技术博客大学习 共学习 共进步
首页 / 五四陈科学院
IT 2010-10-12 08:36:57 / 累计浏览 2,280

说说中国互联网公司的地域差异

直到五年十年之后,北上广的技术人才要结婚生子养家的时候,全国各地省会城市,才会出现一个又一个坚如磐石的技术团队,他们呆在家人身边,快乐生活,努力工作,而那时的中国互联网,才是真正的欣欣向荣。

IT 2010-10-11 23:38:51 / 累计浏览 2,480

大型网站登录项目的重要性

中国互联网最不缺少的就是复制,为什么美国一个行业的网站都是一家独大?有人说是因为他们上网的人少,先入为主的效果比较大,后面进入市场的网站基本都存活不久。 而在国内,大家都在把皮毛抄来抄去,真正的核心却是抄不去的,比如说登录。 登录,垃圾广告的第一关 网站大了,自然被一堆的spam盯上,少量的spam不会怎么样,但是到处是牛皮

IT 2010-09-06 08:46:04 / 累计浏览 3,360

用搜索的倒排轻松搞定“好友的文章”类相关推荐功能

在SNS网站中,“好友的相册”、“好友的日志”、“好友常去的小组”,这样的功能到处都是,如果处理不当,对整个系统的压力都会非同小可。 这里介绍一种利用sphinx的搜索天性,倒排索引群中的人,然后把好友的XX功能化解为或关系的搜索,下面是是一些记录。

IT 2010-08-23 22:07:30 / 累计浏览 4,080

简单好用的土办法抗击洋鬼子对wordpress系统的广告灌入

自升级wordpress3.0以后,一切风调雨顺,自上周起,被洋鬼子的广告肉机盯上了,平均每三五分钟一条广告,评论内容大致相同,评论ip来自五湖四海,各不相同。 虽然说akismet是wordpress中antispam无二的选择,但是akismet那个验证码让人很纠结,于是只能自己山寨一把了。 土办法步骤一 转发默认评论地址 常见的洋鬼子的广告肉机,都是利用了wordpress公开的post地址来做到脚本灌入的,其默认地址是wp-c...

IT 2010-08-04 22:56:56 / 累计浏览 3,200

使用maven的profiles自动设置log4j线上环境和测试环境区别

前言 Maven是基于项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的软件项目管理工具.   如果你已经有十次输入同样的Ant targets来编译你的代码、jar或者war、生成javadocs,你一定会自问,是否有一个重复性更少却能同样完成该工作的方法。Maven便提 供了这样一种选择,将你的注意力从作业层转移到项目管理层。Maven项目已经能够知道如何构建和捆绑代码,运行测试,生成文档并宿主项目网页. 项目的主页...

IT 2010-07-26 23:36:04 / 累计浏览 3,560

人人网Feed系统架构分析

我今天跟大家分享这个内容是人人网系统架构,里面我们会讲到跟新鲜事相关的一些技术和开源一些项目,希望对大家今后工 作有一些帮助。首先我要讲我们新鲜事系统在SNS的主要功能。我要在人人网发一个日志,可以很及时高效迅速的在我朋友圈、粉丝圈子里面可以看到,我朋友可 以很快回复跟我进行一个很快的交互。我必须保证系统高效运转,同时要稳定。对于我们这样一个SNS网站来说,包括SNS还有微博这样一些系统,很重要一点 是当发生特殊事件时会有一个爆发效应。前两天世界杯,我不是一个足球迷,那天晚上我就睡了。两点我手机不停的响,我说怎么回事,我以为同事更新服务,想了 想可能今天晚上是什么比赛比较火,第二天早上说是德国队进球了。系统遇到这种事情会有一个脉冲式的爆发,去年春节晚会赵本山小品刚开始,整个系统会非常爆 炸式的报警,所以对于我们系统来说我们需要解决很多的突发事件给我们带来的压力,保证我们系统有足够的稳定性。

IT 2010-07-19 19:53:15 / 累计浏览 1,500

由php的call_user_func传reference引发的思考

 引用其实类似linux里的文件硬链接一样,但和C语言中的指针是不相同的,在parser阶段php会根据上下文环境自行判断是传引用还是值。而本文所提到的call_user_function并不会自行判断传的是引用还是值。所以前面的例子call_user_function在传值的时候不管用,而在传引用的时候得出了正确结果(但其实还有一个废除警告)。

IT 2010-07-14 09:53:06 / 累计浏览 3,760

用sphinx轻松搞定方便管理的多节点过亿级数据搜索

来自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级),实测千万级数据在0.0X秒和0.00X秒占大多数。 Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,实测30W线上复杂的blog数据需要5分钟,创建1000万条记录的索引可以在50分钟内完成,实测时间比这个更长得多,而只包含最新10万条记录的增量索引,重建一次只需几十秒,实测十万条在一分钟不到的时间。 Sphinx 是一个基于 GPL 2 协议颁发的免费开源的全文搜索引擎.它是专门为更好的整合脚本语言和SQL数据库而设计的.当前内置的数据源支持直接从连接到的 MySQL 或 PostgreSQL 获取数据, 或者你可以使用 XML 通道结构(XML pipe mechanism , 一种基于 Sphinx 可识别的特殊xml格式的索引通道) 。

IT 2010-07-06 23:26:30 / 累计浏览 3,180

一条SQL引发的对order by的思考

在实际工作中遇到下面一个问题:有一个表,存有2000万数据。主键为ID bigint(20) NOT NULL auto_increment 另有一字段time timestamp NOT NULL default CURRENT_TIMESTAMP 故事从这两个字段说起: sql1需要从这个表...

IT 2010-06-24 09:51:10 / 累计浏览 4,760

54chen解读NoSQL技术代表之作Dynamo

NoSQL其实并不是什么妖魔鬼怪,相反的,NoSQL的真谛其实应该是Not Only SQL,其产生是在数据量和访问量的增大下,人为地去添加机器、切分数据到不同的机器,变得越来越困难,人力成本越来越高,于是便开始有了这样的项目,本意是提高数据存储的自动化程度,减少人为干预的时间,让负载更加均匀。在国际上,真正的代表之作有来自Google的 BigTable 和Amazon 的Dynamo,他们分别使用了不同的基本原理。

IT 2010-06-23 12:59:33 / 累计浏览 5,560

用Sphinx快速搭建站内搜索功能

出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

IT 2010-04-22 22:56:07 / 累计浏览 3,360

PHP上传进度条深度解析

随着互联网的发展,越来越多的技术开始注重用户体验,以人为本才是长久之道,于是在上传的时候,大家都不再满足一个单一的“浏览”按钮,纷纷推出了带上传进度条的功能。而作为解释型语言的PHP,如何做到对上传文件的检测,如何实现上传进度条以其背后的原理,54chen将在本文中一步步展开。

IT 2010-03-28 15:12:40 / 累计浏览 4,200

闲谈分布式key-value存储服务nuclear及其他

现在很多国内公司都纷纷开始了key-value的nosql存储方式,然而,从什么时候开始key-value会变得这么流行呢?是风靡一时,还是顺应时代的潮流?前后数一数,有豆瓣网的beandb、有新浪的SDD、小道...

IT 2010-03-08 23:08:30 / 累计浏览 3,720

如何让squid 2.6.STABLE21输出Content-Encoding: gzip

一个WEB服务器,跑nginx 0.6。前端一squid 2.6代理。用户访问先经过squid。现需要squid服务器输出gzip压缩。问题解决方案:原来的nginx已经支持gzip,修改或者增加nginx.conf中内容

IT 2010-03-05 08:57:38 / 累计浏览 3,240

五四陈透过PHP看JAVA系列:strtotime

以下内容由[五四陈科学院]提供本系列主要总结PHP与JAVA之间的一些异同,给从PHP学JAVA或者是从JAVA学PHP的同学一点启发,五四陈科学院出品。第一部分,先看PHP的Date/Tme函数