标签归档:正则

php 过滤非中文,数字,字母的特殊字符

搜索引擎吃进数据的时候,是不需要那些奇怪的字符的 $str = "?><?》”\"《喂喂喂,555?,12312。 3》《|“:L}{P+_)In thsdff0?><M<>\"s~!@#$%^&*()+_)(*&dsdffsde~!@#¥%……&*5545445()+——)(*&……%¥#@!~ 电影_后天 230809-peopl.e die我d.(*&^%$#@!!~"; echo match_chinese($str);   function match_chinese($chars,$encoding=’utf8′) { $pattern =($encoding==’utf8′)?’/[\x{4e00}-\x{9fa5}a-zA-Z0-9,,。 ]/u’:'/[\x80-\xFF]/’; preg_match_all($pattern,$chars,$result); $temp =join(”,$result[0]); return $temp; }

发表在 PHP | 标签为 , , | 留下评论

PHP删除所有中文字符

采用php的正则删除中文 /*转换为UTF8 再处理*/ $a = mb_convert_encoding($a, ‘UTF-8′, ‘GB2312′); $a = preg_replace("/[\x{4e00}-\x{9fff}]/u", "", $a);   /*再转回来* $a = mb_convert_encoding($a, ‘GB2312′, ‘UTF-8′); 简单说明下 \x{4e00}-\x{9fff} 这个是中文区间(各种文字都有unicode码区间) /u 表示采用unicode码 进行正则判断 [] 正则标准括号,表示范围[0-3]表示 0,1,2,3, 0到3的意思

发表在 PHP | 标签为 , | 留下评论

php半小时正则快读

想必很多人都对正则表达式都头疼.今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式.来和大家分享学习经验. 正则其实在php,js,java里的用法基本一样。基础学好了。就整明白了。等用熟悉了。发现不少地方直接用正则写,编码效率明显提高 及其简单的例子 preg_match("/^\\d+$/",$s); 判断变量$s是否为数字 开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明 “^The”: 开头一定要有”The”字符串; “of despair$”: 结尾一定要有”of despair” 的字符串; 那么, “^abc$”: 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配 “notice”: 匹配包含notice的字符串 你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边 接着,说说 ‘*’, ‘+’,和 ‘?’, 他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示: “zero or more”相当于{0,}, “one or more”相当于{1,}, “zero or one.”相当于{0,1}, … 继续阅读

发表在 PHP | 标签为 | 2 条评论