PHP 截取中文字符串的问题解析
内容摘要
这篇文章主要为大家详细介绍了PHP 截取中文字符串的问题解析,具有一定的参考价值,可以用来参考一下。
对PHP截取中文字符串的问题对此感兴趣的朋友,看看idc笔记做的技术笔记!
对PHP截取中文字符串的问题对此感兴趣的朋友,看看idc笔记做的技术笔记!
文章正文
这篇文章主要为大家详细介绍了PHP 截取中文字符串的问题解析,具有一定的参考价值,可以用来参考一下。
对PHP截取中文字符串的问题对此感兴趣的朋友,看看idc笔记做的技术笔记!以下代码试用于GB2312编码,截取中文字符串是PHP中一个头疼的问题,解决方法是根据值是否大于等于128来判断是否是双字节字符,以避免出现乱码的情况。但中英文混合、特殊符号等问题总是存在,现在写一个比较全面的,仅供参考:
程序说明:
1. len 参数以中文字符为标准,1len等于2个英文字符,为了形式上好看些
2. 如果将magic参数设为false,则中文和英文同等看待,取绝对的字符数
3. 特别适用于用htmlspecialchars()进行过编码的字符串
4. 能正确处理GB2312中实体字符模式
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 | <code class = "php" > /** * 截取中文字符串 * * @param * @arrange (www.idcnote.com) **/ <?php function FSubstr( $title , $start , $len = "" , $magic =true) { $length = 0; if ( $len == "" ) $len = strlen ( $title ); //判断起始为不正确位置 if ( $start > 0) { $cnum = 0; for ( $i =0; $i < $start ; $i ++) { if (ord( substr ( $title , $i ,1)) >= 128) $cnum ++; } if ( $cnum %2 != 0) $start --; unset( $cnum ); } if ( strlen ( $title )<= $len ) return substr ( $title , $start , $len ); $alen = 0; $blen = 0; $realnum = 0; for ( $i = $start ; $i < strlen ( $title ); $i ++) { $ctype = 0; $cstep = 0; $cur = substr ( $title , $i ,1); if ( $cur == "&" ) { if ( substr ( $title , $i ,4) == "<" ) { $cstep = 4; $length += 4; $i += 3; $realnum ++; if ( $magic ) { $alen ++; } } else if ( substr ( $title , $i ,4) == ">" ) { $cstep = 4; $length += 4; $i += 3; $realnum ++; if ( $magic ) { $alen ++; } } else if ( substr ( $title , $i ,5) == "&" ) { $cstep = 5; $length += 5; $i += 4; $realnum ++; if ( $magic ) { $alen ++; } } else if ( substr ( $title , $i ,6) == "" ") { $cstep = 6; $length += 6; $i += 5; $realnum ++; if ( $magic ) { $alen ++; } } else if ( substr ( $title , $i ,6) == "'" ) { $cstep = 6; $length += 6; $i += 5; $realnum ++; if ( $magic ) { $alen ++; } } else if (preg_match( "/&#(\d+);/i" , substr ( $title , $i ,8), $match )) { $cstep = strlen ( $match [0]); $length += strlen ( $match [0]); $i += strlen ( $match [0])-1; $realnum ++; if ( $magic ) { $blen ++; $ctype = 1; } } } else { if (ord( $cur )>=128) { $cstep = 2; $length += 2; $i += 1; $realnum ++; if ( $magic ) { $blen ++; $ctype = 1; } } else { $cstep = 1; $length +=1; $realnum ++; if ( $magic ) { $alen ++; } } } if ( $magic ) { if (( $blen *2+ $alen ) == ( $len *2)) break ; if (( $blen *2+ $alen ) == ( $len *2+1)) { if ( $ctype == 1) { $length -= $cstep ; break ; } else { break ; } } } else { if ( $realnum == $len ) break ; } } unset( $cur ); unset( $alen ); unset( $blen ); unset( $realnum ); unset( $ctype ); unset( $cstep ); return substr ( $title , $start , $length ); } ?></code> |
注:关于PHP 截取中文字符串的问题解析的内容就先介绍到这里,更多相关文章的可以留意
代码注释