当前位置:首页 > PHP教程 > php应用 > 列表

PHP用DOM方式处理HTML之Simple HTML DOM

发布:smiling 来源: PHP粉丝网  添加日期:2014-08-20 13:25:46 浏览: 评论:0 

近经常需要采集一些网上的数据,发现一个PHP处理HTML的利器 simple html dom,看了一下文档,使用非常方便,关键是能够用CSS选择器来访问DOM树,和jquery相似,实在是难得的利器.

入门级

simple_html_dom插件

用dom处理html文件的利器

使用:加载simple_html_dom.php文件

require_once 'simple_html_dom.php'

new simple_html_dom对象

$dom = new simple_html_dom()

加载html:

$dom->load($html);

find()方法

$dom->find('div.lookLeftname', 0)->plaintext

class=‘lookLeftname'的div中的纯文本

$dom->find('div.lookLeftname', 0)->innertext

class='lookLeftname'的div中的内部文本

完整测试实例,代码如下:

  1. <?php 
  2. require_once("simple_html_dom.php"); 
  3. ini_set('memory_limit','1000M'); 
  4. ini_set("max_execution_time",6000000); 
  5.  
  6. for($i=1;$i<=21;$i++){ 
  7.  $html = file_get_html(http://www.111cn.net); 
  8.  $as = $html->find('.shopname a'); 
  9.  $sum = 0; 
  10.  foreach($as as $a) { 
  11.   if($a->plaintext != "分店"){ 
  12.    $a->href = "http://www.xx.com".$a->href; 
  13.    echo $a->outertext."------".$a->href."-------<br>"
  14.    $sum++; 
  15.   }//开源代码phpfensi.com 
  16.  } 
  17.  echo "<br><br>第 {$i} 页结束 ,数目:{$sum}<hr>"
  18. ?> 

Tags: DOM方式处理 Simple HTML DOM

分享到: