Wizard Notes

Python, JavaScript を使った音楽信号分析の技術録、作曲活動に関する雑記

音響音楽信号処理

Pythonでボーカル・ドラム・ベース・伴奏を抽出できる楽器分離ライブラリ Spleeter の使い方・デモ

音楽プログラミング音響音楽信号処理歌声信号処理機械学習・深層学習 Python

https://github.com/deezer/spleeter より楽曲のメロディ・和音・リズムといった音楽的分析を行うには、個々の構成楽器ごとの分析が重要です。楽譜・MIDIファイルは情報が各トラックごとに分かれているためメロディ・和音・リズムといった音楽的要素・文…

#Python #音声信号処理

LibROSAの音響特徴量を使って楽曲のサビを自動で検出する (librosa.feature.rms, librosa.feature.spectral_centroid)

LibROSA Python 音楽プログラミング音響音楽信号処理

ポピュラー音楽では、楽曲の聞かせどころであるサビは楽曲の最も盛り上がる部分であり、その楽曲の印象に深くかかわります。サビ検出には様々な手法がありますが、今回は実装が簡単な手法として音響特徴量を使ったサビ検出手法を実装・検証してみました。 …

#Python #音声信号処理

scipy.signal.oaconvolve：FIRフィルタの畳み込み演算を効率的に行うオーバーラップ加算法の使い方と計算速度について

Python ディジタルフィルタ音楽プログラミング音響音楽信号処理

はじめに音信号処理では音を加工する1つの方法としてFIRフィルタがよく使われます。具体的な計算としては、元の信号とFIRフィルタ信号の畳み込み演算を行います。この畳み込み演算を時間領域で素直に行うと、元の信号長×FIRフィルタ長の計算が必要です。 …

#Python #音声信号処理

歌声／楽曲分析・音源分離に使えるステムファイルのデータセット MUSDB18

楽曲解析音響音楽信号処理歌声信号処理機械学習・深層学習

https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems より以前の記事では、様々な音楽ジャンルのステムデータ付き楽曲データセット DSD100 を紹介しました。 www.wizard-notes.com DSD100 は全100曲とそれなりの楽曲数がありますが、大…

#音声信号処理

歌声／楽曲分析・音源分離に使えるステムファイルのデータセット DSD100

音響音楽信号処理歌声信号処理機械学習・深層学習楽曲解析

https://sigsep.github.io/datasets/dsd100.html より楽曲分析や音源分離のアルゴリズムを開発・動作検証する際には、何らかの楽曲データセットが必要になります。市販の楽曲データを利用する手もありますが、2Mix・マスタリングされた音源だけでは動作検…

#音声信号処理

高次のバターワースフィルタ（ハイパス）の不安定性について scipy.signal.butterworth

Python ディジタルフィルタ音響音楽信号処理音楽プログラミング

マルチバンド処理用のフィルタバンク実装でバターワースフィルタによるハイパスフィルタを使おうとすると，7次くらいから周波数応答が不安定になりました．ハイパスフィルタ周波数応答をプロットしてみると，scipy.signal.butterworthのハイパスフィルタ…

#Python #音声信号処理

Python：マルチバンド処理用フィルタバンクのクラス設計・実装・動作検証

ディジタルフィルタ音響音楽信号処理音楽プログラミング Python

以前の記事では，木構造のような信号処理フローのマルチバンド処理を紹介しました．この記事では、実装・利用しやすさに着目して信号処理フローを再設計・実装します。設計以前の記事では木構造の処理フローでしたが，今回は低域のカットオフ周波数から徐…

#Python #音声信号処理

オーディオクロスオーバー向け補完フィルタ（バターワース）でのオールパスフィルタのフィルタ係数算出と検証

音響音楽信号処理ディジタルフィルタ Python

以前の記事で，低域・高域を別々に処理するようなマルチバンド処理（オーディオクロスオーバー）の実装方法を紹介しました． www.wizard-notes.com www.wizard-notes.com 上記の記事では，補完フィルタのローパス・ハイパスフィルタの並列接続したことで生成…

#Python #音声信号処理

複数の2帯域分割（補完）フィルタを使ったマルチバンド処理のPython実装（3バンド以上）

Programming Python 音楽プログラミング音響音楽信号処理ディジタルフィルタ

以前の記事では，低域・高域を別々に処理するようなマルチバンド処理（オーディオクロスオーバー）を実現するフィルタバンクの例として、2バンドの場合の実装方法を紹介しました． www.wizard-notes.com ただ，より実用的なプラグイン／ソフトウェアを作るこ…

#Python #音声信号処理

Python：FIR/IIRフィルタの直列/並列接続の周波数応答（伝達関数）プロット (scipy.signal.freqz)

ディジタルフィルタ音響音楽信号処理音楽プログラミング Python

複雑な信号処理プラグインを開発する場合、複数のFIR/IIRフィルタを組み合わせることがよくあります。そこで，FIR/IIRフィルタの直列/並列接続時の周波数応答をプロットするサンプルコードを作成しました。回路全体の伝達関数を確認するだけでなく、フィル…

#Python #音声信号処理

Pythonでゲーム音楽（チップチューン）の基本波形を生成（サイン波，矩形波，のこぎり波，三角波，白色雑音）

音楽プログラミング音響音楽信号処理 Python

シンセサイザ（オシレータ）の基本波形として一般的なサイン波，矩形波，のこぎり波，三角波，白色雑音は，ファミコンのBGMのようなゲーム音楽（チップチューン）の作成や音信号処理のテストでよく利用されます．サイン波は基本周波数（音高）をとすると， …

#音声信号処理 #Python

マルチバンド（オーディオクロスオーバー）処理を実現するフィルタ（Butterworth, Linkwitz-Riley）のPython実装（2バンド）

音響音楽信号処理音楽プログラミングディジタルフィルタ Programming Python

低域・高域のような周波数帯域別に信号処理する場合、いい感じに帯域を分割するフィルタが必要になります。ソフトウェア／プラグインの具体例としてはマルチバンドコンプレッサが挙げられます。このような回路の特性としては、音質に影響を与えるような振…

#Python #音声信号処理

Pythonでゼロ位相フィルタリング (scipy.filter.filtfilt)

Python 音響音楽信号処理音楽プログラミング

はじめにゼロ位相フィルタリングの実装方法 scipy.signal.filtfiltを使ったゼロ位相フィルタ lfilter x 2 でのゼロ位相フィルタリング参考Webサイトはじめに双2次フィルタ (SOS) やバターワース／チェビシェフフィルタなどといったIIRフィルタは，FIRフ…

#Python #音声信号処理

Python：半音ごとに音高を抽出するIIRフィルタバンクの作成と使い方 (librosa.filters.semitone_filterbank)

LibROSA Programming Python 音響音楽信号処理音楽プログラミング

はじめに音の高さの分析は，メロディや和音の推定に使われる重要な前処理です．本ブログではこれまで，音の高さの分析手法として一般的である，定Q変換やフーリエ変換を使う手法を紹介してきました． www.wizard-notes.com これらの手法は周波数領域で信号…

#Python #音声信号処理

Python: 高品質フェーズボコーダ pyrubberband でタイムストレッチ・ピッチシフト

Programming Python 歌声信号処理音響音楽信号処理音楽プログラミング

オーディオ信号の再生速度・音高の変更はよく利用される処理です。そのアルゴリズムはいくつかありますが、リアルタイム処理向けの手法としてはフェーズボコーダという手法があります。 Pythonでは、音楽信号分析ライブラリLibROSAにおいてフェーズボコーダ…

#Python #音声信号処理

Python-sounddevice で音声や歌声をリアルタイム収音・再生・録音

Programming NumPy Python 音楽プログラミング音響音楽信号処理歌声信号処理

Pythonで音声や歌声、楽器音などの収音・再生・録音を行うためのライブラリとしてはPyAudioが知られていますが、低遅延であるASIO規格が利用できない Python 3.7 以上には非対応というデメリットがあります*1。 Python 3.7 以上でASIO対応デバイスを利用可…

#Python #音声信号処理

Python用 Spotify Web API "spotipy" の楽曲・アーティストを検索（インストール方法，サンプルコード，API仕様）

Programming 音楽プログラミング音響音楽信号処理機械学習・深層学習楽曲解析 Spotify

楽曲の検索やメタ情報に関する Web API を提供しているサブスクリプション型音楽サービスはいくつかあります。中でも Spotify Web API は様々な機能が提供されています。手軽に使えますし楽曲数も多いため、オススメの API です。 github.com 今回は、Spoti…

#Python #音声信号処理 #Spotify

Python：audioread で mp3, aac, m4a 形式のオーディオファイルをNumPy配列として読み込む

LibROSA Python Programming 音楽プログラミング音響音楽信号処理

以下の記事にありますように、Python ではオーディオファイルの読み込むライブラリが複数あります。しかし，.mp3, .aac, .m4a といった圧縮コーデックを読み込むものは多くありません。 www.wizard-notes.com 今回紹介する audioread では ffmpeg のような…

#Python #音声信号処理

LibROSA：音楽のBPM・テンポ分析に便利なテンポグラムを数行で実装

BPM Programming Python LibROSA 音楽プログラミング音響音楽信号処理楽曲解析

音楽の分析方法としてBPM・テンポの分析は非常に重要です。 BPM・テンポの分析を行うことで、楽曲の雰囲気、ノリ、音楽ジャンルといった全体的な特徴を捉えることができます。 BPM・テンポの分析方法としては、テンポグラムという便利な手法があります。テ…

#Python #音声信号処理 #BPM

定Q変換のPython 実装：バッチ処理向けの実装方法の紹介と計算速度の比較

Programming Python LibROSA 音楽プログラミング音響音楽信号処理歌声信号処理楽曲解析

前回の記事では，音楽信号の音高分析に便利な定Q変換 (CQT)のアルゴリズムや実装方法による計算速度の比較を行いました。 www.wizard-notes.com 結果として，再帰的ダウンサンプリング法による定Q変換がリアルタイム処理で実用的な計算速度であることが分か…

#Python #音声信号処理

定Q変換のPython 実装のアルゴリズム／実装方法による計算速度の比較

LibROSA Programming Python 楽曲解析歌声信号処理音楽プログラミング音響音楽信号処理

音楽信号の音高分析に便利な定Q変換 (CQT)。これまでにいくつか計算アルゴリズムや実装方法の種類を紹介してきました。おそらく再帰的ダウンサンプリング法が速いと思っていたのですが、条件によっては疎行列計算と変わらないことがあったりと、実環境での…

#音声信号処理 #Python

再帰的ダウンサンプリング法による定Q変換 (CQT) のPython 実装とアルゴリズム解説

LibROSA Programming Python ディジタルフィルタ歌声信号処理音楽プログラミング音響音楽信号処理

定Q変換 (CQT)は歌声・音楽の音高／メロディ／和音を分析するのに便利な周波数分析方法です。例えば，CQTスペクトログラムを算出すれば各音高（ドレミファ…）がどのくらいの強さで鳴っているかを時系列で観察することができます。以下の記事では、定Q変換…

Python LibROSA で音楽・歌声をタイムストレッチ（時間伸縮） librosa.effects.time_stretch()

Programming LibROSA 歌声信号処理音楽プログラミング音響音楽信号処理

YouTubeやニコニコ動画のような動画サービスで0.5倍・2倍速再生が使えるのが一般的になっています。また、サンプリングされた波形素材の時間伸縮がDAWの基本機能として搭載されていて、曲のタイミングやテンポに上手く合わせて波形素材をいい感じの長さで鳴…

#Python #音声信号処理

LibROSA：音高分析のための定Q変換（CQT）と、逆定Q変換の性能評価

LibROSA 歌声信号処理音響音楽信号処理音楽プログラミング Programming

はじめに音信号を分析する時間周波数分析手法としてはSTFT（短時間フーリエ変換）が良く使われますが，特に音楽を対象にして音高、コード、メロディなどを分析する場合は定Q変換（CQT）という手法が便利です。 www.wizard-notes.com www.wizard-notes.com …

定Q変換のリアルタイム向けPython実装の解説（音高・コード・メロディの分析向け）

Programming Python 歌声信号処理音楽プログラミング音響音楽信号処理

定Q変換は音楽信号の音高・コード・メロディ分析に相性の良い周波数分析手法です．この記事では，前回の定Q変換 (CQT: Constant-Q Transform) の解説の内容をPythonで実装する方法を解説します． Pythonの実装ですが，C++やJavascriptなど，様々な言語で…

定Q変換 (CQT: Constant-Q Transform) の解説（音高・コード・メロディの分析向け）

LibROSA Python 音響音楽信号処理歌声信号処理楽曲解析ディジタルフィルタ

はじめに音信号の時間周波数分析にはFFT (高速フーリエ変換) ／STFT（短時間フーリエ変換）がよく使われます．しかし，FFTの性質上，音高に関わる分析をしようとすると実装や分析精度の向上に手間がかかります。そこで，この記事では音楽信号の分析によく…

Python：信号長に近い2の累乗（2**n）のFFTフレームサイズを求める

音楽プログラミング音響音楽信号処理 Python

FFTを使う時，なるべく高速に計算するためにフレームサイズを2の累乗に設定するのが一般的ですが、入力する信号の長さが2の累乗でない時があります。そういう時は，フレームサイズが２の累乗になるように、ゼロパディング or カットします。その際には、信…

音声・オーディオ版MNIST "FSDD (Free Spoken Digit Dataset)" の紹介と，メルスペクトログラム算出

音響音楽信号処理歌声信号処理音楽プログラミング LibROSA Programming Python 機械学習・深層学習

7万枚の手書き数字の画像＋ラベルのデータセットである MNIST は，今では機械学習・深層学習のHello Worldとして非常に多くの人に利用されていて有名です． MNISTの1つのデータは白黒画像・28x28ピクセル，全体でも7万件なので大規模データですがデータセッ…

Pythonで12音平均律の各音高をカラフルにライブプロット

Programming PyQt Python pyqtgraph 音楽プログラミング音響音楽信号処理歌声信号処理

PyQtGraphの複数の線グラフプロットを利用して，12音平均律で音高ごとに色を変えてライブプロットしたら綺麗＆役立つかなと思い作ってみました．もう少しブラッシュアップしようと思ったのですが，後述の理由でお蔵入りになったので，供養としてソースコー…

Python：音の広がりや位相を見るフェーズスコープをPyQtGraphとPyAudioで実装

DTM Programming PyQt Python pyqtgraph 音響音楽信号処理音楽プログラミング

Pythonにおけるリアルタイム音楽信号処理アプリのデモ／教材として，音の広がりや位相を見るフェーズスコープをPyQtGraphとPyAudioで実装してみました．起動すると，PC上で音楽を再生しながらフェーズスコープを描画することができます．全ソースコードは…

#Python #音声信号処理