当前位置:首页 > PHP教程 > php应用 > 列表

PHP读取文件,解决中文乱码UTF-8的方法分析

发布:smiling 来源: PHP粉丝网  添加日期:2022-02-06 09:48:13 浏览: 评论:0 

本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法,分享给大家供大家参考,具体如下:

  1. $opts = array
  2.   'file' => array
  3.     'encoding' => "utf-8" 
  4.   ) 
  5. ); 
  6. $opts = array('http' => array('encoding' => 'utf-8')); 
  7. $ctxt = stream_context_create($opts); 
  8. $content = file_get_contents($filePath, FILE_TEXT, $ctxt); 

最简单的就是将GF2312→UTF-8

$str = iconv("gb2312", "utf-8", $str);

不管用的

$content = mb_convert_encoding($content, "UTF-8", "auto");

******************************************丑陋的分割线来告诉大家上面的不好的:下面的才是正确的方法···哈哈···**********************************************************

  1. define('UTF32_BIG_ENDIAN_BOM'chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF)); 
  2. define('UTF32_LITTLE_ENDIAN_BOM'chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00)); 
  3. define('UTF16_BIG_ENDIAN_BOM'chr(0xFE) . chr(0xFF)); 
  4. define('UTF16_LITTLE_ENDIAN_BOM'chr(0xFF) . chr(0xFE)); 
  5. define('UTF8_BOM'chr(0xEF) . chr(0xBB) . chr(0xBF)); 
  6.  
  7. $text = file_get_contents($newPath); 
  8. $first2 = substr($text, 0, 2); 
  9. $first3 = substr($text, 0, 3); 
  10. $first4 = substr($text, 0, 3); 
  11. $encodType = ""
  12. if ($first3 == UTF8_BOM) 
  13.   $encodType = 'UTF-8 BOM'
  14. else if ($first4 == UTF32_BIG_ENDIAN_BOM) 
  15.   $encodType = 'UTF-32BE'
  16. else if ($first4 == UTF32_LITTLE_ENDIAN_BOM) 
  17.   $encodType = 'UTF-32LE'
  18. else if ($first2 == UTF16_BIG_ENDIAN_BOM) 
  19.   $encodType = 'UTF-16BE'
  20. else if ($first2 == UTF16_LITTLE_ENDIAN_BOM) 
  21.   $encodType = 'UTF-16LE'
  22.  
  23. $content = file_get_contents($newPath); 
  24.  
  25. $content = iconv($encodType"utf-8"$content); 

终极版·····

  1. $text = file_get_contents($filePath); 
  2. //$encodType = mb_detect_encoding($text); 
  3. define('UTF32_BIG_ENDIAN_BOM'chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF)); 
  4. define('UTF32_LITTLE_ENDIAN_BOM'chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00)); 
  5. define('UTF16_BIG_ENDIAN_BOM'chr(0xFE) . chr(0xFF)); 
  6. define('UTF16_LITTLE_ENDIAN_BOM'chr(0xFF) . chr(0xFE)); 
  7. define('UTF8_BOM'chr(0xEF) . chr(0xBB) . chr(0xBF)); 
  8. $first2 = substr($text, 0, 2); 
  9. $first3 = substr($text, 0, 3); 
  10. $first4 = substr($text, 0, 3); 
  11. $encodType = ""
  12. if ($first3 == UTF8_BOM) 
  13.   $encodType = 'UTF-8 BOM'
  14. else if ($first4 == UTF32_BIG_ENDIAN_BOM) 
  15.   $encodType = 'UTF-32BE'
  16. else if ($first4 == UTF32_LITTLE_ENDIAN_BOM) 
  17.   $encodType = 'UTF-32LE'
  18. else if ($first2 == UTF16_BIG_ENDIAN_BOM) 
  19.   $encodType = 'UTF-16BE'
  20. else if ($first2 == UTF16_LITTLE_ENDIAN_BOM) 
  21.   $encodType = 'UTF-16LE'
  22. //下面的判断主要还是判断ANSI编码的· 
  23. if ($encodType == '') {//即默认创建的txt文本-ANSI编码的 
  24.   $content = iconv("GBK""UTF-8"$text); 
  25. else if ($encodType == 'UTF-8 BOM') {//本来就是UTF-8不用转换 
  26.   $content = $text
  27. else {//其他的格式都转化为UTF-8就可以了 
  28.   $content = iconv($encodType"UTF-8"$text); 

以上的终极版·可以适应中文操作windows系统建立的ANSI``````````````UTF-8`````````Unicode`````的txt文本。

Tags: PHP读取文件 PHP中文乱码

分享到: