Python 入門

ホーム > 正規表現 > split でパターンによる文字列の分解

split でパターンによる文字列の分解

文字列をあるパターンを元に、バラバラに区切りたいとき、split関数が使えます。

たとえば、メールアドレスを @ の前後で区切るとしたら、次のように split を使えます。

import re

match = re.split(r'@', 'dadosan@keicode.com')

for m in match:
	print m

実行結果は次の通りです。確かに @ 前後でバラけた文字がとれてます。

dadosan
keicode.com

上の例では、split の使い方という意味ではよいのですが、正規表現のパターンという感じではなかったので、もう一つ例を。

次の例では数字 (\d とか [0-9] とか) が一つ以上 (つまり +) でマッチさせ、そこで文字列を区切ります。

import re

match = re.split(r'[0-9]+', 'xxxx1aaaa2cc3ssss')

for m in match:
	print m

この実行結果は次の通りです。

xxxx
aaaa
cc
ssss

確かにスプリットできてますね。

ホーム > 正規表現 > split でパターンによる文字列の分解