技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 查看专题: Simple
    用php解析html/xml文件,PHP内置了几个类,但是要不就是目前处理能力过于简单,用户编码太多,要不就是对文档的要求很严格。刚好今天要用php抓取大量网页的特定内容,在sf.net 上找到了这个类。单个文件,目前36k。官方给出的特性和要求是: 相当简单的方式操作HTML 要求PHP 5 以上支持无效的HTML 类似jQuery的选择器来查找元素单行代码就可以从HTML页面抓取内容。 支持无效的HTML很重要,网络上能严格通过w3c验证的网站太少...
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1