当前位置:首页 > PHP教程 > php函数 > 列表

PHP实现的带超时功能get_headers函数

发布:smiling 来源: PHP粉丝网  添加日期:2021-05-11 10:17:46 浏览: 评论:0 

这篇文章主要介绍了PHP实现的带超时功能的get_headers函数,本文直接给出实现代码,需要的朋友可以参考下

代码比较多,但是比较简单,一眼就看穿的,so,文字尽量少写了。

因为众所周知的网络原因,gavatar也开始越来越慢,写了一个小东西来解决这个问题,过程中遇到了get_headers这个函数,甚是忧伤,记录下来,以免后来人踩坑。

更新记录,函数稍微改了一下,返回值基本和之前序列化后的结果一致,暂时没考虑支持子项也支持数组等(考虑细节性能,还想把没用的http头砍掉….)

需求很简单:获取图片的head信息。

调试程序的时候发现这个函数的调用很缓慢,即使绑定ip,有时候都能蹦到20多秒。

寻思这个事情还是该加个超时吧,但是看官方文档,给出的导出函数接口如下:

array get_headers(string$url[,int$format=0])

你没有看错,这个东西没有超时接口…

上github翻看源码,期望可以用他的底层实现来重新实现一套:

地址 https://github.com/php/php-src/blob/88ca46d92bc1c426e7c7f7313f0fd2b7dcc33cf6/ext/standard/url.c#L710

代码如下:

  1. /* {{{ proto array get_headers(string url[, int format]) 
  2.    fetches all the headers sent by the server in response to a HTTP request */ 
  3. PHP_FUNCTION(get_headers) 
  4. char*url; 
  5. size_t url_len; 
  6. php_stream_context*context; 
  7. php_stream*stream; 
  8. zval*prev_val,*hdr=NULL,*h; 
  9. HashTable*hashT; 
  10. zend_long format=0; 
  11.                 
  12. if(zend_parse_parameters(ZEND_NUM_ARGS()TSRMLS_CC,"s|l",&url,&url_len,&format)==FAILURE){ 
  13. return
  14.  
  15. /** 省略其他一堆... **/ 
  16. /* }}} */ 

但是很不幸的是,zend_parse_parameters 和 ZEND_NUM_ARGS也都没有PHP版的导出函数。

于是造轮子开始:

  1. functionget_url_headers($url,$timeout=10) 
  2.     $ch=curl_init(); 
  3.  
  4.     curl_setopt($ch,CURLOPT_URL,$url); 
  5.     curl_setopt($ch,CURLOPT_HEADER,true); 
  6.     curl_setopt($ch,CURLOPT_NOBODY,true); 
  7.     curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); 
  8.     curl_setopt($ch,CURLOPT_TIMEOUT,$timeout); 
  9.  
  10.     $data=curl_exec($ch); 
  11.     $data=preg_split('/\n/',$data); 
  12.  
  13.     $data=array_filter(array_map(function($data){ 
  14.         $data=trim($data); 
  15.         if($data){ 
  16.             $data=preg_split('/:\s/',trim($data),2); 
  17.             $length=count($data); 
  18.             switch($length){ 
  19.                 case2: 
  20.                     returnarray($data[0]=>$data[1]); 
  21.                     break
  22.                 case1: 
  23.                     return$data
  24.                     break
  25.                 default
  26.                     break
  27.             } 
  28.         } 
  29.     },$data)); 
  30.  
  31.     sort($data); 
  32.  
  33.     foreach($dataas$key=>$value){ 
  34.         $itemKey=array_keys($value)[0]; 
  35.         if(is_int($itemKey)){ 
  36.             $data[$key]=$value[$itemKey]; 
  37.         }elseif(is_string($itemKey)){ 
  38.             $data[$itemKey]=$value[$itemKey]; 
  39.             unset($data[$key]); 
  40.         } 
  41.     } 
  42.  
  43.     return$data

对比最后结果:

原版又是蛮长的等待,不知道校验啥去了(没继续追代码了,有兴趣的童鞋可以去跟下玩):

  1. Array 
  2.     [0]=>HTTP/1.0302Found 
  3.     [Accept-Ranges]=>bytes 
  4.     [Cache-Control]=>max-age=300 
  5.     [Content-Type]=>Array 
  6.         ( 
  7.             [0]=>text/html;charset=utf-8 
  8.             [1]=>text/html;charset=utf-8 
  9.         ) 
  10.  
  11.     [Date]=>Array 
  12.         ( 
  13.             [0]=>Fri,12Dec201415:35:40GMT 
  14.             [1]=>Fri,12Dec201415:35:43GMT 
  15.         ) 
  16.  
  17.     [Expires]=>Fri,12Dec201415:40:40GMT 
  18.     [Last-Modified]=>Wed,11Jan198408:00:00GMT 
  19.     [Link]=><http://www.gravatar.com/avatar/[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical" 
  20.     [Location]=>http://i2.wp.com/[省略...] 
  21.     [Server]=>Array 
  22.         ( 
  23.             [0]=>ECS(oxr/838B) 
  24.             [1]=>nginx 
  25.         ) 
  26.  
  27.     [Source-Age]=>85 
  28.     [Via]=>1.1varnish 
  29.     [X-Cache]=>302-HIT 
  30.     [X-Varnish]=>14702550881470006304 
  31.     [Content-Length]=>0 
  32.     [Connection]=>Array 
  33.         ( 
  34.             [0]=>close 
  35.             [1]=>close 
  36.         ) 
  37.  
  38.     [1]=>HTTP/1.1504Gateway Timeout 

轮子版返回(瞬间返回,两者内容略有不同,你仔细看就能发现一些有趣的地方了):

  1. Array 
  2.     [0]=>HTTP/1.1302Found 
  3.     [Accept-Ranges]=>bytes 
  4.     [Via]=>1.1varnish 
  5.     [Cache-Control]=>max-age=300 
  6.     [Server]=>ECS(oxr/838B) 
  7.     [Content-Type]=>text/html;charset=utf-8 
  8.     [X-Varnish]=>14702550881470006304 
  9.     [Date]=>Fri,12Dec201420:31:02GMT 
  10.     [Location]=>http://i2.wp.com/[省略...] 
  11.     [Expires]=>Fri,12Dec201420:36:02GMT 
  12.     [Source-Age]=>85 
  13.     [Last-Modified]=>Wed,11Jan198408:00:00GMT 
  14.     [X-Cache]=>302-HIT 
  15.     [Link]=><http://www.gravatar.com/avatar/[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical" 
  16.     [Content-Length]=>0 
  17. )

Tags: get_headers

分享到: