BR 技术头条 技术链接、资讯与社区分享流
bl blog.thankbabe.com / 2017-12-06 09:43 / by @SFL_YQ

大话爬虫的基本套

网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。

赞过的人

@技术头条@SFL_YQ

发表评论