技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 查看专题: 搜索引擎
    把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索: “javar高性能程序开发”
    这篇文章是我对一些资料的归纳汇总,简单介绍了PageRank的背景、作用、计算方法、变种、Spam及反作弊等内容。为了突出重点我简化了搜索引擎的模型,当然在实际中搜索引擎远没有这么简单,真实算法也一定非常复杂。不过目前几乎所有现代搜索引擎页面权重的计算方法都基于PageRank及其变种。因为我没做过搜索引擎相关的开发,因此本文内容主要是基于现有文献的客观总结,稍加一点我的理解。
    长期以来,站长们选择使用JavaScript来实现网页的动态行为,这样做的原因是多种多样的,如加快页面的响应速度、降低网站流量、隐藏链接或者嵌入广告等。由于早期的搜索引擎没有相应的处理能力,导致在索引这类网页上往往出现问题,可能无法收录有价值的资源,也可能出现作弊。引入JavaScript解析的目的,正是为了解决上述两方面的问题,其结果也就是使搜索引擎可以更为清晰的了解用户实际打开该网页时看到的效果。比如有些网站会将用户评论、评分等信息从网页HTML中抽离,利用JavaScript甚至AJAX等方法在页面被打开的时候动态显示出来,早期的搜索引擎此时能处理到的页面内容就是缺失的,由此会进一步影响对该页面索引价值的判断。要引入JavaScript解析,需要考虑本身的设计与实现、解析速度和对系统其它方面影响等因素,本文通过一些典型的案例来分析如何设计并实现一套网页JavaScript解析系统
    下周组内分享要讨论“工具”,介绍几个搜索引擎的特殊用法,凑凑数: 双引号: 完全匹配搜索。用来更准确的定位竞争对手。 “崔凯” 减号: 代表搜索不包含减号后面的词。用来查询其他竞争的网址。 崔凯 -博客 星号: 通配符,这么搜可以得到“...
    我们可以根据直觉和经验,通过试错的办法,把这两个因素结合起来。但更好的办法是我们能找到一个明确的依据,最好能跟数学这样坚实的学科联系起来。说起来,依据朴素的经验,人类在古代就能建造出高楼;但要建造出高达数百米的 摩天大厦,如果没有建筑力学、材料力学这样坚实的学科作为后盾,则是非常非常困难的。同理,依据朴素的经验构建的搜索引擎算法,用来处理上万的网页集合应该是没问题的;但要检索上亿的网页,则需要更为牢固的理论基础。
    现如今,搜索引擎在互联网生活中占很大份量,人们上网时几乎离不开搜索引擎的帮助。无论你想要得到什么信息,搜索引擎都可以帮你找到。由于习惯的不同,人们可能从朋友推荐得知搜索引擎,或者无意间点击进入,然后从此爱上这个家伙:) 目前在中国,百度搜索引擎占了相当大的市场份额,但是继Google和百度之后,微软推出了Bing搜索引擎,成为搜索引擎的一个后起之秀,赢得了很多人的好评,同样腾讯的搜搜也有大量的用户。...
[ 共6篇文章 ][ 第1页/共1页 ][ 1 ]
赞助商广告
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1