split でパターンによる文字列の分解
文字列をあるパターンを元に、バラバラに区切りたいとき、split関数が使えます。
たとえば、メールアドレスを @ の前後で区切るとしたら、次のように split を使えます。
import re
match = re.split(r'@', 'dadosan@keicode.com')
for m in match:
print m
実行結果は次の通りです。確かに @ 前後でバラけた文字がとれてます。
dadosan keicode.com
上の例では、split の使い方という意味ではよいのですが、正規表現のパターンという感じではなかったので、もう一つ例を。
次の例では数字 (\d とか [0-9] とか) が一つ以上 (つまり +) でマッチさせ、そこで文字列を区切ります。
import re
match = re.split(r'[0-9]+', 'xxxx1aaaa2cc3ssss')
for m in match:
print m
この実行結果は次の通りです。
xxxx aaaa cc ssss
確かにスプリットできてますね。