您现在的位置:首页 --> 查看专题: 智能算法
互联网的迅速发展,海量Web数据的扑面而来,给搜索引擎技术带来了严峻的挑战,但同时也带来了新的机遇。从网页抓取的角度来看,同一站点往往包含质量相似的资源,对一个优质网站进行爬取,往往可以找到更多的优质资源。因此,我们希望对网站的质量进行评级,来反映资源的质量水平,从而影响spider的调度和收录。在以往的实践中,大体思路是根据人工调研出的经验构造出规则和阈值。发现问题后逐个打补丁、调阈值,来适应变化。...
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [13] 手机客户端交互适配设计之我见
- [11] PDC 2010:C#与Visual Bas
- [10] Python连接 MySQL 数据库的超时问
- [10] 谈谈Facebook的聊天系统架构
- [10] 韩国实名制的破产
- [10] 长假,回忆小时候的家庭教育点滴
- [10] 一句话crontab实现防ssh暴力破解
- [10] Oracle bbed工具的编译
- [9] 浅析韩国团购网站
- [9] 四年前的今天,我开始找工作
赞助商广告