技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 算法
    Nagle算法的立意是良好的,避免网络中充塞小封包,提高网络的利用率。但是当Nagle算法遇到delayed ACK悲剧就发生了。Delayed ACK的本意也是为了提高TCP性能,跟应答数据捎带上ACK,同时避免糊涂窗口综合症,也可以一个ack确认多个段来节省开销。 悲剧发生在这种情况,假设一端发送数据并等待另一端应答,协议上分为头部和数据,发送的时候不幸地选择了write-write,然后再read,也就是先发送头部,再发送数据,最后等待应答。发送...
    TTURLRequest是three20开发框架提供的一个url请求类,它是NSURLRequest类的扩展,有如下优点: post数据方便,只需要构建一个参数的dictionary就可以了,像get方法一样简单支持磁盘缓存,而NSURLRequest仅支持内存缓存
    上回说到了用经纬度范围实现附近地点搜索。一些小型应用中这样做没问题,但在大型应用中它有个显著的缺点:速度慢。慢的原因有两个,第一是范围比较的索引利用率并不高,第二是SQL语句极其不稳定(不同的当前位置会产生完全不同的SQL查询),很难缓存。可以考虑使用geohash算法。 geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串。比如,北海公园的编码是wx4g0ec1。 geohash有以下几个特点:首先,geohash用一个...
        记得第一次了解中文分词算法是在 Google 黑板报 上看到的,当初看到那个算法时我彻底被震撼住了,想不到一个看似不可能完成的任务竟然有如此神奇巧妙的算法。最近在詹卫东老师的《中文信息处理导论》课上再次学到中文分词算法,才知道这并不是中文分词算法研究的全部,前前后后还有很多故事可讲。在没有建立统计语言模型时,人们还在语言学的角度对自动分词进行研究,期间诞生了很多有意思的理论。  ...
    看看下面的代码,你觉得输出是什么呢?  var a = [30,2,1,9,15]; a.sort(); alert(a); 如果你觉得输出是1,2,9,15,30,那就错了,真正的结果是1,15,2,30,9。不过,在没真正搞清楚javascript的数组排序之前还是先别放弃这个强大的语言。 那么这是怎么回事呢?当排序的方法没有参数的时候,所有的值都会被转化成为字符串,然后根据字典顺序排序。所以15会排在2前面,10和19999也一样。 为了解决这个问题...
    排序算法好像是程序员学习编程最多的算法,也可能是算法研究者们最喜欢研究的算法了。排序有很多很多的算法,比如,冒泡,插入,选择,堆,快速,归并等等(你可以看看本站以前的那些文章:可视化的排序,排序算法比较,显示排序过程的python)这里向大家介绍一个“巨NB”的排序算法――Sleep Sort。
        因为忙,不少计划写下来的东西都一直搁置着。其中一个拖了很久都没写的就是 UyHiP 一月的题目 了。这是一道看上去非常困难的算法题目,当时我没能解答出来;看到答案后才恍然大悟,拍案叫绝。这是一道非常少见的算法好题,在这里记下来。     一个国家里有 N 个公民,这些公民从 1 到 N 依次编号。这是一个民主国家,国家做出的每个决定都需要全体公民投票,每个人必须且只能投一票。...
        某公司有 n 间办公室。每间办公室都有一盏灯,拉动它的开关即可改变电灯的状态。某些办公室之间存在“业务相关”的关系(这是一个对称的关系)。一个办公室可以和 0 到任意多个办公室相关。愚人节那天,有人在大家上班之前偷偷对办公室的电灯开关做了手脚:拉动任何一个办公室的电灯开关,都会同时改变该办公室以及所有相关办公室的电灯状态。初始时,所有灯都是关着的。证明:等到大家来上班后,总能用有...
        一个公司里有 n 个员工,其中某些员工之间有“好友”的关系(这是一个对称的关系)。每天早晨来到公司,员工们都会从茶和咖啡中选择一样作为早饮。此时,每个员工都会观察自己的朋友们都在喝啥:如果超过一半的人都在喝茶,第二天他自己也会跟着喝茶;如果超过一半的人都在喝咖啡,第二天他自己就会跟着喝咖啡;如果喝茶喝咖啡的人数各占一半(仅当他有偶数个朋友时才会发生这种情况),则第二天他的决策...
        这个 Blog 几乎一直在讲数学趣题,却很少提到物理趣题。其实,我个人觉得,物理也是相当好玩的(我是化学不好才选的文科)。隐约记得初中搞物理竞赛时,曾见过大量让人大呼过瘾的好题。前几天看到了一个绝好的网站,里面有相当多的物理题目,让我激动了好一阵子。我搜集整理了里面的一些好题,加上了我自己的一些补充,在这里和大家分享。不过,由于我的物理实在不怎么样,如果出现什么错误,请大家及时纠...
    搜索引擎每天处理着数以亿计的查询请求,每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候,通过查询返回的网页结果,这些需求被满足了,我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言,页面的价值是指什么,我们为什么要研究页面价值,技术上怎样判断页面的价值呢?本文将逐一回答这些问题。
    在信息高速增长的时代,生活变得越来越简单。随便百度一下,都会有很多的结果。现在让我们困惑的不再是没有选择,而是在浩瀚的信息世界里茫然不知所措。如何能更准确更迅速的找到想要的答案,已经变得非常的重要和急迫。这个时候,如果有一个好的分类和统计信息摆在面前,相信很多人都会笑的乐开怀。因此,这里介绍一个简单的分类系统。
    框计算垂直搜索的索引的设计考虑因素与相应构建流程
    本文介绍一种生成新闻事件脉络的方法,该方法已经应用于百度新闻的新闻事件专题页中。对于一些延续时间较长的新闻事件,我们希望通过机器挖掘的手段,抽取出事件发展的重要阶段,称为事件的脉络信息;使得用户能够通过脉络信息,直观的了解该事件发展的过程。比如:在中国协助智利解救被困矿工一事的专题页中,展现如下的事件回顾信息,能够帮助用户迅速的领略该事件的来龙去脉。
    分布式哈希和一致性哈希是分布式存储和p2p网络中说的比较多的两个概念了。介绍的论文很多,这里做一个入门性质的介绍。
    端午和上个周末做的微博应用送大礼中设计到ajax返回json的数据格式中,我没有完全使用PHP默认的json_encode来编码,因为这样编码出来的是unicode编码的,也就是\\\\u的编码,虽然unicode编码可以在不同的页面中编码不会出现乱码问题。但是一个汉字编码成unicode会变成\\\\u+4个字符,这样在字符长度上要比汉字多。因为我的php文件和html声明中都是使用的UTF-8,不会出现编码乱码问题,所以就放弃了直接使用json_encode的方法,而...
    附近地点搜索,顾名思义,就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及,附近地点搜索也变得炙手可热。不过在网上却很少有这方面的讨论。本文的方法并不算最好,但足以应付一般的应用了。本文中,数据库采用MySQL,语言采用python。理论上别的数据库和语言也没问题,但我们要在经纬度上设置两个索引,所以如果你的数据库不支持索引,或者不支持在一个查询中使用两个索引,那就只能想别的办法了。球面...
        某大公司有这么一个规定:只要有一个员工过生日,当天所有员工全部放假一天。但在其余时候,所有员工都没有假期,必须正常上班。这个公司需要雇用多少员工,才能让公司一年内所有员工的总工作时间期望值最大?     假设一年有 365 天,每个员工的生日都概率均等地分布在这 365 天里。     你的第一感觉或许是,公司应该雇用 100 多人,或者 200 多人吧。答案或...
    HS4J Kit是HS4J的贡献项目, 它的灵感来自ORM(对象关系映射), 通过使用Annotation(注解)对领域对象进行声明, 即可实现对HS4J的调用, 省去编写和维护较为底层的模板式代码.
    周末看到资深电商人士微博,提到网络营销过程中数据挖掘与分析的妙处。某员工通过技术手段对广告与访客监测,通过对收集数据的分析,判断新产品未来的销量,从而影响公司的营销策略与商品运营。 这些年来,我一直在网络营销领域与工具及数据打交道,这样的案例比比皆是。广告主,通过对历史营销数据的分析,定位自己的目标受众;媒体代理公司,通过对媒体广告效果的数据分析,有效优化媒介预算配置,实现ROI提升;搜索引擎公司,通...
[ 共606篇文章 ][ 第22页/共31页 ][ |< ][ 18 ][ 19 ][ 20 ][ 21 ][ 22 ][ 23 ][ 24 ][ 25 ][ 26 ][ 27 ][ >| ]
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1