登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Perfect-World

以無法為有法,以無限為有限!

 
 
 

日志

 
 

PHP 截取字符串  

2008-11-12 17:04:55|  分类: PHP |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

1. 截取GB2312中文字符串

<?php
< ?
php
//截取中文字符串
function mysubstr($str, $start, $len) {
    
$tmpstr = "";
    
$strlen = $start + $len;
    
for($i = 0; $i < $strlen; $i++) {
        
if(ord(substr($str, $i, 1)) > 0xa0) {
            
$tmpstr .= substr($str, $i, 2);
            
$i++;
        
} else
            
$tmpstr .= substr($str, $i, 1);
    
}
    
return $tmpstr;
}
?>

2. 截取utf8编码的多字节字符串

<?php
< ?
php
//截取utf8字符串
function utf8Substr($str, $from, $len)
{
    
return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'.
                      
'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s',
                      
'$1',$str);
}
?>

3. UTF-8、GB2312都支持的汉字截取函数

<?php
< ?
php
/*
Utf-8、gb2312都支持的汉字截取函数
cut_str(字符串, 截取长度, 开始长度, 编码);
编码默认为 utf-8
开始长度默认为 0
*/

 
function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')
{
    
if($code == 'UTF-8')
    
{
        
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
        
preg_match_all($pa, $string, $t_string);
 
        
if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."...";
        
return join('', array_slice($t_string[0], $start, $sublen));
    
}
    
else
    
{
        
$start = $start*2;
        
$sublen = $sublen*2;
        
$strlen = strlen($string);
        
$tmpstr = '';
 
        
for($i=0; $i< $strlen; $i++)
        
{
            
if($i>=$start && $i< ($start+$sublen))
            
{
                
if(ord(substr($string, $i, 1))>129)
                
{
                    
$tmpstr.= substr($string, $i, 2);
                
}
                
else
                
{
                    
$tmpstr.= substr($string, $i, 1);
                
}
            
}
            
if(ord(substr($string, $i, 1))>129) $i++;
        
}
        
if(strlen($tmpstr)< $strlen ) $tmpstr.= "...";
        
return $tmpstr;
    
}
}
 
$str = "abcd需要截取的字符串";
echo cut_str($str, 8, 0, 'gb2312');
?>

4. BugFree 的字符截取函数

<?php
< ?
php
/**
 *
@package     BugFree
 *
@version     $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $
 *
 *
 * Return part of a string(Enhance the function substr())
 *
 *
@author                  UUMiss UUMiss@qq.com 
 *
@param string  $String  the string to cut.
 *
@param int     $Length  the length of returned string.
 *
@param booble  $Append  whether append "...": false|true
 *
@return string           the cutted string.
 */

function sysSubStr($String,$Length,$Append = false)
{
    
if (strlen($String) < = $Length )
    
{
        
return $String;
    
}
    
else
    
{
        
$I = 0;
        
while ($I < $Length)
        
{
            
$StringTMP = substr($String,$I,1);
            
if ( ord($StringTMP) >=224 )
            
{
                
$StringTMP = substr($String,$I,3);
                
$I = $I + 3;
            
}
            
elseif( ord($StringTMP) >=192 )
            
{
                
$StringTMP = substr($String,$I,2);
                
$I = $I + 2;
            
}
            
else
            
{
                
$I = $I + 1;
            
}
            
$StringLast[] = $StringTMP;
        
}
        
$StringLast = implode("",$StringLast);
        
if($Append)
        
{
            
$StringLast .= "...";
        
}
        
return $StringLast;
    
}
}
 
$String = "CodeBit.cn -- 简单、精彩、通用";
$Length = "18";
$Append = false;
echo sysSubStr($String,$Length,$Append);
?>
 
以下代码试用于gb2312编码,截取中文字符串是php中一个头疼的问题,解决方法是根据值是否大于等于128来判断是否是双字节字符,以避免出现乱码的情况。但中英文混合、特殊符号等问题总是存在,现在写一个比较全面的,仅供参考:

程序说明:

1. len 参数以中文字符为标准,1len等于2个英文字符,为了形式上好看些

2. 如果将magic参数设为false,则中文和英文同等看待,取绝对的字符数

3. 特别适用于用htmlspecialchars()进行过编码的字符串

4. 能正确处理gb2312中实体字符模式(氰)

程序代码:
function fsubstr($title,$start,$len="",$magic=true)   {  /**    *  powered by smartpig    *  mailto:d.einstein@263.net    */      $length = 0;  if($len == "") $len = strlen($title);    //判断起始为不正确位置  if($start > 0)  {    $cnum = 0;    for($i=0;$i<$start;$i++)    {     if(ord(substr($title,$i,1)) >= 128) $cnum ++;    }    if($cnum%2 != 0) $start--;        unset($cnum);  }    if(strlen($title)<=$len) return substr($title,$start,$len);    $alen   = 0;  $blen = 0;    $realnum = 0;    for($i=$start;$i<strlen($title);$i++)  {    $ctype = 0;    $cstep = 0;    $cur = substr($title,$i,1);    if($cur == "&")    {     if(substr($title,$i,4) == "&lt;")     {      $cstep = 4;      $length += 4;      $i += 3;      $realnum ++;      if($magic)      {       $alen ++;      }     }     else if(substr($title,$i,4) == "&gt;")     {      $cstep = 4;      $length += 4;      $i += 3;      $realnum ++;      if($magic)      {       $alen ++;      }     }     else if(substr($title,$i,5) == "&amp;")     {      $cstep = 5;      $length += 5;      $i += 4;      $realnum ++;      if($magic)      {       $alen ++;      }     }     else if(substr($title,$i,6) == "&quot;")     {      $cstep = 6;      $length += 6;      $i += 5;      $realnum ++;      if($magic)      {       $alen ++;      }     }     else if(substr($title,$i,6) == "&#039;")     {      $cstep = 6;      $length += 6;      $i += 5;      $realnum ++;      if($magic)      {       $alen ++;      }     }     else if(preg_match("/&#(\d+);/i",substr($title,$i,8),$match))     {      $cstep = strlen($match[0]);      $length += strlen($match[0]);      $i += strlen($match[0])-1;      $realnum ++;      if($magic)      {       $blen ++;       $ctype = 1;      }     }    }else{     if(ord($cur)>=128)     {      $cstep = 2;      $length += 2;      $i += 1;      $realnum ++;      if($magic)      {       $blen ++;       $ctype = 1;      }     }else{      $cstep = 1;      $length +=1;      $realnum ++;      if($magic)      {       $alen++;      }     }    }        if($magic)    {     if(($blen*2+$alen) == ($len*2)) break;     if(($blen*2+$alen) == ($len*2+1))     {      if($ctype == 1)      {       $length -= $cstep;       break;      }else{       break;      }     }    }else{     if($realnum == $len) break;    }  }    unset($cur);  unset($alen);  unset($blen);  unset($realnum);  unset($ctype);  unset($cstep);    return substr($title,$start,$length);  }
  评论这张
 
阅读(867)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018