当前位置:首页 > PHP教程 > php应用 > 列表

PHP curl模拟登录带验证码的网站

发布:smiling 来源: PHP粉丝网  添加日期:2021-06-27 16:17:17 浏览: 评论:0 

最近接了个项目,其中有需求是要登录带验证码的网站,获取数据,但是我们不可能人为的一直去记录数据,想通过自动采集的方式进行,下面小编给大家带来的相关代码,对php curl 模拟登录带验证码的网站感兴趣的朋友一起学习吧。

需求是这样的,需要登录带验证码的网站,获取数据,但是不可能人为一直去记录数据,想通过自动采集的方式进行,如下是试验出来的结果代码!有需要的可以参考下!

  1. <?php 
  2. namespace Home\Controller; 
  3. use Think\Controller; 
  4. class LoginController extends Controller 
  5.   protected $cookieName = array('cookie_verify''cookie_verify'); 
  6.   protected $cookiePath = '/cookie/'
  7.   protected $cookiePathFile = array(); 
  8.   public function index() 
  9.   { 
  10.     $this->display(); 
  11.   } 
  12.   public function _initialize(){ 
  13.     foreach($this->cookieName as $key => $name
  14.     { 
  15.       $this->cookiePathFile[] = ROOT_PATH . $this->cookiePath . $this->cookieName[$key] . '_xxx.txt'
  16.     } 
  17.   } 
  18.   /** 
  19.    * 登录xxx 
  20.    */ 
  21.   public function xxxLogin() 
  22.   { 
  23.     $username = I('username'); 
  24.     $password = I('password'); 
  25.     $verifyCode = I('verify'); 
  26.     $loginData = array
  27.       '__VIEWSTATE' => '/wEPDwUKMTU0MzAzOTU4NmQYAQUeX19Db250cm9sc1JlcXVpcmVQb3N0QmFja0tleV9fFgEFDExvZ2luX1N1Ym1pdL/yae69NsY163G3yuP0lxjz8oXu',              //不把参数补全可能会不被响应哦 
  28.       '__VIEWSTATEGENERATOR' => 'DC42DE27'
  29.       'txt_UserName' => $username
  30.       'txt_PWD' => $password
  31.       'txt_VerifyCode' => $verifyCode
  32.       'SMONEY' => 'ABC'
  33.       'Login_Submit.x' => '52'
  34.       'Login_Submit.y' => '19'
  35.     ); 
  36.     $getBack = $this->_cookieRequest('http://xxx.com/noLogin.aspx'$loginData); 
  37.     if(preg_match('/<div[^\<div]*?id\s*=\s*[\'\"]{1}div_msg[\'\"]{1}.*?>(.*?)<\/div>/s'$getBack$match)){ 
  38.       echo 'matched\r\n'
  39.       print_r($match); 
  40.     }else
  41.       echo $getBack'<br />'
  42.       $paramsFull = parse_url($getBack); 
  43.       parse_str($paramsFull['query'], $paramsFull['parsedQuery']); 
  44.       if(!emptyempty($paramsFull['parsedQuery']['Warn'])) { 
  45.         $msg = "您好,欢迎来P,请先登录。"
  46.         switch ($paramsFull['parsedQuery']['Warn']) 
  47.         { 
  48.           case '2'
  49.             $msg = '您输入的验证码错误,请重试'
  50.             break
  51.           case '3'
  52.             $msg = '该帐号不存在,还没帐号?'
  53.             break
  54.           case '5'
  55.             $msg = '账户已注销'
  56.             break
  57.           case '6'
  58.             $msg = '密码错误,如果连续错误3次半小时内不能登录!'
  59.             break
  60.           case '20'
  61.             $msg = '今日密码错误3次及以上,请于半小时后再来登录!'
  62.             break
  63.           case '21'
  64.             $msg = '今日您所在IP的所有帐号密码错误9次以上,请于半小时后再来登录!'
  65.             break
  66.           case '22'
  67.             $msg = '登录失败,您所在IP今日登录的帐号过多!'
  68.             break
  69.           case '23'
  70.             $msg = '登录失败,验证码失效!'
  71.             break
  72.           case '32'
  73.             $msg = '该帐号已经绑定其他xx帐号!'
  74.             break
  75.           case '33'
  76.             $msg = '一台电脑一天只能注册一个帐号!'
  77.             break
  78.         } 
  79.         $this->error($msg'', 5); 
  80.       }else
  81.         $_SESSION['user_id'] = '123456';      //登录设置session 
  82.         $this->success('登录P网站成功', U('Index/index'), 5); 
  83.       } 
  84.     } 
  85.   } 
  86.   /** 
  87.    * 获取验证码 
  88.    */ 
  89.   public function getVerifyCode() 
  90.   { 
  91.     $img = $this->_cookieRequest('http://xxx.com/VerifyCode_Login.aspx?id=' . rand(10000,999999), null, true, 1); 
  92.     echo $img
  93.   } 
  94.   /** 
  95.    * 删除cookie 
  96.    */ 
  97.   public function clearCookie() 
  98.   { 
  99.     for($i = 0; $i <count($this->cookieName); $i++) 
  100.     { 
  101.       setcookie($this->cookieName[$i], '', time() - 3600); 
  102.     } 
  103. //    unlink($this->cookiePathFile); 
  104.     $this->success('清除cookie成功!'); 
  105.   } 
  106.   /** 
  107.    * 带COOKIE的访问curl 
  108.    * @param $url 访问地址 
  109.    * @param bool|array $data 传递的数据 
  110.    * @param bool $redirect 是否获取重定向的地址 
  111.    * @return mixed 地址或者返回内容 
  112.    */ 
  113.   public function _cookieRequest($url$data = null, $redirect = false, $cookieNum = 0) 
  114.   { 
  115.     $ch = curl_init(); 
  116.     $params[CURLOPT_URL] = $url;             //请求url地址 
  117.     $params[CURLOPT_HEADER] = false;           //是否返回响应头信息 
  118.     $params[CURLOPT_RETURNTRANSFER] = true;       //是否将结果返回 
  119.     $params[CURLOPT_FOLLOWLOCATION] = true;       //是否重定向 
  120.     $params[CURLOPT_USERAGENT] = 'Mozilla/5.0 (Windows NT 5.1; rv:9.0.1) Gecko/20100101 Firefox/9.0.1'
  121.     if($data
  122.     { 
  123.       $params[CURLOPT_POST] = true; 
  124.       $params[CURLOPT_POSTFIELDS] = http_build_query($data); 
  125.     } 
  126.     //判断是否有cookie,有的话直接使用 
  127.     if (!emptyempty($_COOKIE[$this->cookieName[$cookieNum]]) && is_file($this->cookiePathFile[$cookieNum])) 
  128.     { 
  129.       $params[CURLOPT_COOKIEFILE] = $this->cookiePathFile[$cookieNum];   //这里判断cookie 
  130.     } 
  131.     else 
  132.     { 
  133. //      $cookie_jar = tempnam($cookie_path, 'cookie');            //产生一个cookie文件 
  134.       $params[CURLOPT_COOKIEJAR] = $this->cookiePathFile[$cookieNum];    //写入cookie信息 
  135.       setcookie($this->cookieName[$cookieNum], $this->cookiePathFile[$cookieNum], time() + 120);   //保存cookie路径 
  136.     } 
  137.     curl_setopt_array($ch$params);                      //传入curl参数 
  138.     $content = curl_exec($ch); 
  139.     $headers = curl_getinfo($ch); 
  140. //    echo $content; 
  141.     curl_close($ch); 
  142.     if ($url != $headers["url"] && $redirect == false) 
  143.      { 
  144.       return $headers["url"]; 
  145.      } 
  146.       return $content
  147.      } 
  148.   } 

登录以后,就可以使用带cookie的访问其他页面了!

ps:php curl 登录淘宝

提交上去后显示为填写验证码,登录不上去

填写验证码提交:

  1. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"
  2. <html xmlns="http://www.w3.org/1999/xhtml"
  3.   <head>     
  4.    <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> 
  5.    <title></title> 
  6.   </head> 
  7.   <body> 
  8.   <iframe id='img' src="b.php" width="950" height="300" scrolling="No" frameborder="0"></iframe> 
  9.   <form action="tb.php" method="POST"
  10.   <textarea name="vv" cols="50" rows="10">umto=&action=Authenticator&event_submit_do_login=anything&from=tb&fc=default&style=default&css_style=&tid=XOR_1_000000000000000000000000000000_635045544 
  11. 70A7C717F750278&support=000001&CtrlVersion=1,0,0,7&loginType=3&minititle=&minipara=&pstrong=&llnick=&sign=&need_sign=&isIgnore=&full_redirect=&popid=&callback=&guf=&not_duplite_str=&need_user_id=&poy=XOR_1_000000000000000000000000000000_625A424 
  12. A45137C6F7A7F0B786D08&gvfdcname=&gvfdcre=&from_encoding=&TPL_redirect_url=http:www.taobao.com&TPL_username=xxx&TPL_password=xxxx&need_check_code=&&TPL_checkcode=</textarea> 
  13.   <input type="submit" /> 
  14.   </form> 
  15.    
  16.   </body> 
  17. </html> 
  18. <?php 
  19. session_start(); 
  20. if(emptyempty($_SESSION['cookie_jar'])) exit(); 
  21. $cookie_jar=$_SESSION['cookie_jar']; 
  22. $post_fields=$_POST["vv"]; 
  23. $ch = curl_init('https://login.taobao.com/member/login.jhtml');  
  24. curl_setopt($ch, CURLOPT_HEADER, 0);  
  25. curl_setopt($ch, CURLOPT_USERAGENT,  
  26. "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; QQWubi 133; Embedded Web Browser from: http://bsalsa.com/; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Tablet PC 2.0; .NET4.0C; .NET4.0E; InfoPath.3; Media Center PC 6.0)");  
  27. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);  
  28. curl_setopt($ch, CURLOPT_POST, 1);  
  29. curl_setopt($ch, CURLOPT_POSTFIELDS, $post_fields);  
  30. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);  
  31. curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1);  
  32. curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);  
  33. $data = curl_exec($ch);  
  34. curl_close($ch); 
  35. echo $data;exit
  36. $ch = curl_init('http://www.taobao.com');  
  37. curl_setopt($ch, CURLOPT_USERAGENT,  
  38. "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; QQWubi 133; Embedded Web Browser from: http://bsalsa.com/; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Tablet PC 2.0; .NET4.0C; .NET4.0E; InfoPath.3; Media Center PC 6.0)");  
  39. curl_setopt($ch, CURLOPT_HEADER, 0);  
  40. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);  
  41. curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_jar);  
  42. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, TRUE);  
  43. curl_exec($ch);  
  44. curl_close($ch);  
  45. ?> 

提取验证码:

  1. <?php 
  2. session_start(); 
  3. $cookie_jar=tempnam("./temp/","cookie"); 
  4. $_SESSION['cookie_jar']=$cookie_jar
  5. $post_fields = "action=Authenticator&event_submit_do_login=anything&from=tb&fc=default&style=default&css_style=&tid=XOR_1_000000000000000000000000000000_635045544 
  6. 70A7C717F750278&support=000001&CtrlVersion=1,0,0,7&loginType=3&minititle=&minipara=&pstrong=&llnick=&sign=&need_sign=&isIgnore=&full_redirect=&popid=&callback=&guf=&not_duplite_str=&need_user_id=&poy=XOR_1_000000000000000000000000000000_625A424A45137C6F7A7F0B786D08&gvfdcname=&gvfdcre=&from_encoding=&TPL_redirect_url=http:www.taobao.com&TPL_username=xxx&TPL_password=xxx";  
  7. $ch = curl_init('https://login.taobao.com/member/login.jhtml');  
  8. curl_setopt($ch, CURLOPT_USERAGENT,  
  9. "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; QQWubi 133; Embedded Web Browser from: http://bsalsa.com/; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Tablet PC 2.0; .NET4.0C; .NET4.0E; InfoPath.3; Media Center PC 6.0)");  
  10. curl_setopt($ch, CURLOPT_HEADER, 0);  
  11. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);  
  12. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);  
  13. curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2);  
  14. $data = curl_exec($ch);  
  15. curl_close($ch);  
  16. preg_match("/id=\"um_to\" name=\"umto\" value=\"(.*?)\"\/>/"$data$arr);  
  17. $post_fields = "umto=" . $arr[1] . "&" . $post_fields."&TPL_checkcode=";  
  18. echo "<textarea cols=50 rows=10>" . $post_fields . "</textarea><br/>" ;  
  19. $ch = curl_init('https://login.taobao.com/member/login.jhtml');  
  20. curl_setopt($ch, CURLOPT_HEADER, 0);  
  21. curl_setopt($ch, CURLOPT_USERAGENT,  
  22. "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; QQWubi 133; Embedded Web Browser from: http://bsalsa.com/; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Tablet PC 2.0; .NET4.0C; .NET4.0E; InfoPath.3; Media Center PC 6.0)");  
  23. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);  
  24. curl_setopt($ch, CURLOPT_POST, 1);  
  25. curl_setopt($ch, CURLOPT_POSTFIELDS, $post_fields);  
  26. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);  
  27. curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2);  
  28. curl_setopt($ch,CURLOPT_COOKIEJAR,$cookie_jar); 
  29. curl_setopt($ch,CURLOPT_COOKIEFILE,$cookie_jar);  
  30. $data = curl_exec($ch);  
  31. curl_close($ch); 
  32. preg_match("/img id=\"J_StandardCode_m\" src=\"(.*?)\" data-src=/"$data$arr1);  
  33. echo "<img src=".$arr1[1]." />"
  34. exit
  35. ?>

Tags: curl模拟登录 PHP验证码

分享到: