专题：Simple -- IT技术博客大学习 -- 共学习共进步！

IT 浏览 6,940

PHP Simple HTML DOM Parser 是一个不错的html/xml分析类

用php解析html/xml文件，PHP内置了几个类，但是要不就是目前处理能力过于简单，用户编码太多，要不就是对文档的要求很严格。刚好今天要用php抓取大量网页的特定内容，在sf.net 上找到了这个类。单个文件，目前36k。官方给出的特性和要求是：相当简单的方式操作HTML 要求PHP 5 以上支持无效的HTML 类似jQuery的选择器来查找元素单行代码就可以从HTML页面抓取内容。支持无效的HTML很重要，网络上能严格通过w3c验证的网站太少...

标签：Simple

PHP Simple HTML DOM Parser 是一个不错的html/xml分析类