您现在的位置:首页 --> 查看专题: 智能算法
互联网的迅速发展,海量Web数据的扑面而来,给搜索引擎技术带来了严峻的挑战,但同时也带来了新的机遇。从网页抓取的角度来看,同一站点往往包含质量相似的资源,对一个优质网站进行爬取,往往可以找到更多的优质资源。因此,我们希望对网站的质量进行评级,来反映资源的质量水平,从而影响spider的调度和收录。在以往的实践中,大体思路是根据人工调研出的经验构造出规则和阈值。发现问题后逐个打补丁、调阈值,来适应变化。...
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
-
[1162] WordPress插件开发 -- 在插件使用 -
[65] 解决 nginx 反向代理网页首尾出现神秘字 -
[48] Java开发岗位面试题归类汇总 -
[44] web开发设计人员不可不用的在线web工具和 -
[33] Rax 系列教程(长列表) -
[32] 一句话crontab实现防ssh暴力破解 -
[32] 手机产品设计方向 -
[30] 如何建立合适的索引? -
[29] 程序员疫苗:代码注入 -
[28] oracle技术方面的路线
赞助商广告