PHP正确解析UTF-8字符串
发布:smiling 来源: PHP粉丝网 添加日期:2013-12-03 20:46:15 浏览: 评论:0
- $str = '今天非常Happy,所有决定去KFC吃可乐鸡翅!!!';
 - /*
 - $str 是待截取的字符串
 - $len 是截取的字符数
 - */
 - function utf8sub($str,$len) {
 - if($len <= 0){
 - return '';
 - }
 - $offset = 0; // 截取高位字节时的偏移量
 - $chars = 0; // 截取到的字符数
 - $res = ''; // 存放截取的结果字符串
 - while($chars < $len){
 - // 先取字符串的第一个字节
 - // 将它转为十进制
 - // 再转为二进制
 - $high = ord(substr($str,$offset,1));
 - // echo '$high='. $high .'<br />';
 - if($high == null ){ // 如果取出高位为null,证明已经取到末尾,直接break
 - break;
 - }
 - if(($high>>2) === 0x3F){ // 将高位右移2位,和二进制111111比较,相同则取6个字节
 - // 截取2个字节
 - $count = 6;
 - }else if(($high>>3) === 0x1F){ // 将高位右移2位,和二进制11111比较,相同则取5个字节
 - // 截取3个字节
 - $count = 5;
 - }else if(($high>>4) === 0xF){ // 将高位右移2位,和二进制1111比较,相同则取4个字节
 - // 截取4个字节
 - $count = 4;
 - }else if(($high>>5) === 0x7){ // 将高位右移2位,和二进制111比较,相同则取3个字节
 - // 截取5个字节
 - $count = 3;
 - }else if(($high>>6) === 0x3){ // 将高位右移2位,和二进制11比较,相同则取2个字节
 - // 截取6个字节
 - $count = 2;
 - }else if(($high>>7) === 0x0){ // 将高位右移2位,和二进制0比较,相同则取1个字节
 - $count = 1;
 - }
 - // echo '$count='.$count.'<br />';
 - $res .= substr($str,$offset,$count); // 取出一个字符与$res字符串连接
 - $chars += 1; // 截取到的字符数+1
 - $offset += $count; // 截取高位偏移量向后移$count字节
 - }
 - return $res;
 - }
 - echo utf8sub($str,100);
 
Tags: 正确 解析 UTF-8
相关文章
- ·php解析mht文件转换成html的实例(2018-08-08)
 - ·php 检测是否为utf-8还是gb2312编码(2014-07-10)
 - ·php字符串截取函数,支持中文 utf-8截取(2014-09-19)
 - ·完美的2个php检测字符串是否是utf-8编码函数分享(2021-03-25)
 - ·php实现utf-8转unicode函数分享(2021-05-05)
 
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
 - PHP新手上路(一)(7)
 - 惹恼程序员的十件事(5)
 - PHP邮件发送例子,已测试成功(5)
 - 致初学者:PHP比ASP优秀的七个理由(4)
 - PHP会被淘汰吗?(4)
 - PHP新手上路(四)(4)
 - 如何去学习PHP?(2)
 - 简单入门级php分页代码(2)
 - php中邮箱email 电话等格式的验证(2)
 
