PHP Simple HTML DOM Parser 是一个不错的html/xml分析类
用php解析html/xml文件,PHP内置了几个类,但是要不就是目前处理能力过于简单,用户编码太多,要不就是对文档的要求很严格。刚好今天要用php抓取大量网页的特定内容,在sf.net 上找到了这个类。单个文件,目前36k。官方给出的特性和要求是: 相当简单的方式操作HTML 要求PHP 5 以上支持无效的HTML 类似jQuery的选择器来查找元素单行代码就可以从HTML页面抓取内容。 支持无效的HTML很重要,网络上能严格通过w3c验证的网站太少...