当前位置:首页 > CMS教程 > 其它CMS > 列表

CodeIgniter 完美解决URL含有中文字符串

发布:smiling 来源: PHP粉丝网  添加日期:2021-08-04 10:16:06 浏览: 评论:0 

codeIgniter默认的配置下是不允许URL中包含非ASCII字符的,如果URL中含非ASCII字符,那么CI会毫不客气的抛出错误。本文章向码农介绍CodeIgniter 如何解决URL含有中文字符串。

你可能会说,那我把这个URL使用函数urlencode一下呢?不行,因为Web Server会在接收到一个被urlencode的URL后自动将其decode,然后在PHP里得到的这些字符串转换成他原来所代表的含义,并使用 Web Server自己的URL编码字符集(IIS6 中文版是GBK,Apache 2.2是UTF-8)传送给应用程序,这就使得CI得到的URL已经是一个解码过的,无论你有没有对URL进行urlencode,浏览器在发出请求时会 自动检测,若没有,则会自动进行编码。所以,手动的进行urlencode并不能解决问题。那么我们应该怎么做来解决这个问题呢?

对于CI这种框架,用到现在,我的观点是尽量不要去修改它,而是去扩展他,CI提供了很好的扩展机制,我们只需要在application/core/下(2.0版本以前的为application/libraries/)增加一个文件MY_URI.php,其内容为:

  1. <?php if ( ! defined('BASEPATH')) exit('No direct script access allowed');  
  2.    
  3. class MY_URI extends CI_URI {  
  4.    
  5.  /**  
  6.   * 自定义的url过滤函数  
  7.   *  
  8.   * @access private  
  9.   * @param string  
  10.   * @return string  
  11.   */ 
  12.  function _filter_uri($str)  
  13.  {  
  14.   if ($str != '' AND $this->config->item('permitted_uri_chars') != '')  
  15.   {  
  16.    $str = urlencode($str);  
  17.    if ( ! preg_match("|^[".preg_quote($this->config->item('permitted_uri_chars'))."]+$|i"$str))  
  18.    {  
  19.     exit('The URI you submitted has disallowed characters.');  
  20.    }  
  21.    $str = urldecode($str);  
  22.   }  
  23.   return $str;  
  24.  }   

我覆盖了原来CI_URI中的_filter_uri方法,这样就可以使得中文的URL通过检测,但是,如果URL里有空格, 也不行了,怎么办呢?原来,urlencode会将空格转换成+,而CI的默认配置中是不允许+出现在URL里的,OK,把

$config ['permitted_uri_chars'] = 'a-z 0-9~%.:_\-';

改成

$config['permitted_uri_chars'] = 'a-z 0-9~%.:_\+\-';

就可以了。

或者

第一步把config.php 中的

$config['permitted_uri_chars'] = 'a-z 0-9~%.:_\-';

替换成

$config['permitted_uri_chars'] ='a-z 0-9~%.:_-u4e00-u9fa5';

里面所有的操作我们都做完了,但是接下来你可能又遇到了新的问题,那就是url中得到的中文信息是乱码,不知道在你的服务器上会不会遇到该问题,但是我遇到了(IIS)。但是在本地是正常的,本地用的是apache。

好,我在程序中,把$_SERVER['REQUEST_URI']打印出来,发现它就是乱码的,苦思冥想,这是怎么回事?这就说明在我得到uri中的参数之前,就已经被编码了,好,我们使用iconv解码:

iconv("gb2312","UTF-8",$uri);

现在打印出来看看,好了,原来的中文参数打印出来了,是正确的。

这个问题解决了,但是还是有一个疑问,url为什么是gb2312编码的呢,如果在我的程序中使用(我采用的是utf-8编码),还需要转换为utf-8编码,是不是和web服务器是有关系的呢,希望大家能够帮忙解答。

Tags: CodeIgniter中文字符串

分享到: