Pythonで文字列から数字を取り出す方法についてまとめました。
文字列から数字を取り出す(re.findallと正規表現)
Pythonのreモジュールと正規表現を使うことで、文字列から数字を簡単に抽出できます。
例えば、以下のように日付の文字列「2024年4月1日」から、年(2024)、月(4)、日(1)の数字だけを取り出すことができます。
re.findallメソッドは、指定した検索パターンと一致する全ての部分文字列をリストで返します。
re.findall(検索パターン, 文字列)
検索パターンの「r”\d”」は数字、「+」は直前のパターンを1回以上繰り返すということを意味します。
つまり、数字が1回以上繰り返す場合、その数字を全て抽出することになります。
なお、re.subメソッドでも文字列から数字を取り出すことができますが、複数の数字が文字列内にあるとき、複数の数字を1つの文字列として返すため注意が必要です。
関連ページ
Pythonの基礎から応用例については以下ページにまとめています。
【Python超入門】使い方とサンプル集
Pythonとは、統計処理や機械学習、ディープラーニングといった数値計算分野を中心に幅広い用途で利用されている人気なプログラミング言語です。 主な特徴として「効率のよい、短くて読みやすいコードを書きやすい」、「ライブラリが豊富なのでサクッと...
コメント