注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Perfect-World

以無法為有法,以無限為有限!

 
 
 

日志

 
 

PHP、Python 相关正则函数一点实例  

2013-08-06 19:47:53|  分类: PHP |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

当我们在做字符串处理时,如果字符串处理函数不能实现我们想要的时,我们就借助正则来帮助我们实现了。

一般使用正则的情况有:匹配、查找、分割、查找并替换,下面我们就将这几种情况分别用PHPPython语言来实现,并做一下对比。

PHP正则采用:PCRE风格。


#1
匹配Math(并获取出结果)(注意这里是要获取出匹配结果的,与不获取结果有所不同)

#coding:utf-8 import re strs = '我爱Python哈哈fe' patt = re.compile(r'^.*?(\w+).*?$',re.I)print patt.match(strs).group(1) #输出 P

PHP

<?php $strs = '我爱Python哈哈fe'; preg_match('/^.*?(\w+).*?$/i',$strs,$m);var_dump($m[1]);

#输出:string 'P' (length=1)

 

说明:preg_match()python中的match一样,在第一次匹配后 将会停止搜索。而preg_match_all()不同于此, 它会一直搜索subject 直到到达结尾。

实际上,在PHP中正则表达式还可以这样:

preg_match('/(\w+)/',$strs,$m);

#2 搜索查找Search

   

Python

patt = re.compile(r'(\w+)',re.I) print patt.search(strs).group(1) #输出 P

说明search方法一样,若查找到了就立即返回,否则一直搜索到字符串末尾,在PHP中可以使用preg_match(_all) 来实现。

   

PHP

同上

   

#3 匹配分割

   

Python

patt = re.compile(r'\w+',re.I) for i in patt.split(strs): #注意这里要使用unicode对象输出 print unicode(i,'utf-8') #以上输出 ''' 我爱      哈哈 '''

PHP中可以使用preg_split()来实现

   

PHP

<?php $strs = '我爱Python哈哈fe'; $m = preg_split('/\w+/i',$strs); var_dump($m);

/**输出:

 

array

0 => string '我爱' (length=6)

1 => string '' (length=3)

2 => string '' (length=3)

3 => string '' (length=3)

4 => string '' (length=3)

5 => string '' (length=3)

6 => string '哈哈' (length=6)

7 => string '' (length=3)

**/

#4 搜索查找所有结果(ALL)

Python

print patt.findall(strs) #输出 ['P', 'y', 't', 'h', 'o', 'n', 'fe']

PHP中可使用preg_match_all() 来实现

PHP

<?php $strs = '我爱Python哈哈fe'; preg_match_all('/(\w+)/i',$strs,$m); var_dump($m);

 

/**

   

   

   

   

array

0 =>

array

0 => string 'P' (length=1)

1 => string 'y' (length=1)

2 => string 't' (length=1)

3 => string 'h' (length=1)

4 => string 'o' (length=1)

5 => string 'n' (length=1)

6 => string 'fe' (length=2)

1 =>

array

0 => string 'P' (length=1)

1 => string 'y' (length=1)

2 => string 't' (length=1)

3 => string 'h' (length=1)

4 => string 'o' (length=1)

5 => string 'n' (length=1)

6 => string 'fe' (length=2)

**/

   

#5 查找替换

 实际上finditer()方法在python中不是查找替换,它仅是返回一个顺序访问每一个匹配结果(Match对象)的迭代器

python:

for i in patt.finditer(strs): print i.group() #以上输出 ''' P y t h o n fe '''

这和PHP中的preg_filter()有所不同,preg_filter()preg_replace()都是执行一个正则表达式的搜索和替换。在python中正则方法中,用于查找替换的是:sub()subn()

需要注意的是sub()返回的一个新字符串,不是作用在原对象上。

subn()返回的是一个以"新字符串和替换的次数"组成的元组,也没有作用到原对象上。 #替换三次 print patt.sub('99',strs,3) #输出 '我爱999999hon哈哈fe' print patt.subn('99',strs) #输出:是一个元组('我爱999999999999哈哈99',7) 替换与引用

#这里批量替换文章中的图片的路径(old_c 是文章的内容)

img_dir = 'test'

img_patt = re.compile('src=".*?/(\w+\.\w+)"')

new_c = img_patt.sub(r'src="./%s/\1"'%img_dir,old_c) PHP

#这里批量替换文章中的图片的路径(old_c 是文章的内容)

img_dir = 'test' img_patt = re.compile('src=".*?/(\w+\.\w+)"') new_c =img_patt.sub(r'src="./%s/\1"'%img_dir,old_c) #输出:

string '我爱999999999999999999哈哈999' (length=51)

另注   1 对于正则的基础知识可以GOOGLE一下,Python正则的基础知识也可以GOOGLE一下。

          2 对于更多关于PHP PCRE风格的正则基础,可以参看:http://cn2.php.net/manual/zh/regexp.introduction.php

          3 另外有一点需要注意的是:对于处理字符串能用字符串函数处理的就用函数处理,千万别用正则。

   

  评论这张
 
阅读(1705)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016