【Python/pydub】mp3、wavのデータをNumPy配列に変換

Pythonモジュール「pydub」でmp3、wavファイルのデータをNumPy配列に変換する方法についてソースコード付きでまとめました。

音声データをNumPy配列に変換

Pythonモジュール「pydub」で読み込んだ音声データをNumPy配列に変換します。

サンプルコード

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
from pydub import AudioSegment
import numpy as np
import matplotlib.pyplot as plt

# 音楽データの読み込み
sound = AudioSegment.from_file("input.mp3", "mp3")

# NumPy配列に返還
data = np.array(sound.get_array_of_samples())

# ステレオ音声から片方を抽出
x = data[::sound.channels]

# グラフ化
plt.plot(x[::10])
plt.grid()
plt.show()

関連記事
1 【Python/pydub】音声ファイル処理Python入門 基本文法
この記事を書いた人
西住技研

プログラミング言語「Python」を研究、仕事、趣味でデータ分析や作業自動化などに活用してきたノウハウを情報発信しています。
筆者の詳しいプロフィールやお問合せはこちらのページまで。
YoutubeX(旧Twitter)でも情報発信中です!

西住技研をフォローする
音声処理

コメント

  1. 匿名 より:

    Numpy配列を音声に戻すことはできますか?