2012年10月14日日曜日

python - 正規表現


re モジュールを使う
re.MULTILINE フラグを使わないと、行頭 ^ と行末 $ が、それぞれ改行の直後、改行の直前に引っかからないので注意。(文字列の先頭と終端のみに引っかかる)

  • re.search(pattern, text) : 一番最初のマッチを取ってくる
  • re.findall(pattern, text) :  全てのマッチを取ってくる
  • re.sub(pattern, sub, text) : pattern にマッチしたものを sub で置き換える

参考 : Python reモジュールで使える正規表現演算子

import re

filetext = open('list_inserter.hpp').read()
pattern = re.compile('#include\s+<.*$', re.MULTILINE)
print re.findall(pattern, filetext)

0 件のコメント:

コメントを投稿