Pythonで文字列から数字を取り出す方法についてまとめました。
文字列から数字を取り出す(re.findallと正規表現)
Pythonのreモジュールと正規表現を使うことで、文字列から数字を簡単に抽出できます。
例えば、以下のように日付の文字列「2024年4月1日」から、年(2024)、月(4)、日(1)の数字だけを取り出すことができます。
re.findallメソッドは、指定した検索パターンと一致する全ての部分文字列をリストで返します。
re.findall(検索パターン, 文字列)
検索パターンの「r”\d”」は数字、「+」は直前のパターンを1回以上繰り返すということを意味します。
つまり、数字が1回以上繰り返す場合、その数字を全て抽出することになります。
なお、re.subメソッドでも文字列から数字を取り出すことができますが、複数の数字が文字列内にあるとき、複数の数字を1つの文字列として返すため注意が必要です。
関連ページ
Pythonの基礎から応用例については以下ページにまとめています。
【Python超入門】使い方とサンプル集
Pythonの使い方について、基礎文法から応用例まで入門者向けに解説します。
コメント