【Python】文字列から数字を取り出す方法(re.findallと正規表現を使う)

Pythonで文字列から数字を取り出す方法についてまとめました。

文字列から数字を取り出す(re.findallと正規表現)

Pythonのreモジュールと正規表現を使うことで、文字列から数字を簡単に抽出できます。
例えば、以下のように日付の文字列「2024年4月1日」から、年(2024)、月(4)、日(1)の数字だけを取り出すことができます。


re.findallメソッドは、指定した検索パターンと一致する全ての部分文字列をリストで返します。

re.findall(検索パターン, 文字列)

検索パターンの「r”\d”」は数字、「+」は直前のパターンを1回以上繰り返すということを意味します。
つまり、数字が1回以上繰り返す場合、その数字を全て抽出することになります。

なお、re.subメソッドでも文字列から数字を取り出すことができますが、複数の数字が文字列内にあるとき、複数の数字を1つの文字列として返すため注意が必要です。

関連ページ

Pythonの基礎から応用例については以下ページにまとめています。

【Python超入門】使い方とサンプル集
Pythonの使い方について、基礎文法から応用例まで入門者向けに解説します。

コメント