LibROSAの音響特徴量を使って楽曲のサビを自動で検出する (librosa.feature.rms, librosa.feature.spectral_centroid)

LibROSA Python 音楽プログラミング音響音楽信号処理

ポピュラー音楽では、楽曲の聞かせどころであるサビは楽曲の最も盛り上がる部分であり、その楽曲の印象に深くかかわります。サビ検出には様々な手法がありますが、今回は実装が簡単な手法として音響特徴量を使ったサビ検出手法を実装・検証してみました。 …

#Python #音声信号処理

2022-03-06

LibROSA付属の音声・オーディオデータ一覧と使い方 (librosa.ex, librosa.example) [v0.9.1]

LibROSA 音楽プログラミング

https://librosa.org/doc/latest/recordings.html より Pythonの音楽分析用モジュール LibROSA には、いくつかのサンプルデータが付属しています。そのため、オーディオデータを自分で用意しなくても音楽データ分析をすぐに試すことができます。そこで、こ…

#Python #音声信号処理

2021-09-22

Python：半音ごとに音高を抽出するIIRフィルタバンクの作成と使い方 (librosa.filters.semitone_filterbank)

LibROSA Programming Python 音響音楽信号処理音楽プログラミング

はじめに音の高さの分析は，メロディや和音の推定に使われる重要な前処理です．本ブログではこれまで，音の高さの分析手法として一般的である，定Q変換やフーリエ変換を使う手法を紹介してきました． www.wizard-notes.com これらの手法は周波数領域で信号…

#Python #音声信号処理

2021-07-21

Python：audioread で mp3, aac, m4a 形式のオーディオファイルをNumPy配列として読み込む

LibROSA Python Programming 音楽プログラミング音響音楽信号処理

以下の記事にありますように、Python ではオーディオファイルの読み込むライブラリが複数あります。しかし，.mp3, .aac, .m4a といった圧縮コーデックを読み込むものは多くありません。 www.wizard-notes.com 今回紹介する audioread では ffmpeg のような…

#Python #音声信号処理

2021-07-19

LibROSA：音楽のBPM・テンポ分析に便利なテンポグラムを数行で実装

BPM Programming Python LibROSA 音楽プログラミング音響音楽信号処理楽曲解析

音楽の分析方法としてBPM・テンポの分析は非常に重要です。 BPM・テンポの分析を行うことで、楽曲の雰囲気、ノリ、音楽ジャンルといった全体的な特徴を捉えることができます。 BPM・テンポの分析方法としては、テンポグラムという便利な手法があります。テ…

#Python #音声信号処理 #BPM

2021-07-18

Python：様々な拡張子＆複数の楽曲ファイルを読み込んでNumPy配列として格納（wav, flac, mp3, aac, m4a, alac, etc.）

Programming Python 楽曲解析 LibROSA

表題のとおり，様々な拡張子に対応し，複数の楽曲ファイルを一括でNumpy配列に変換する関数です。大量の音楽ファイルを分析する場合にオススメです。ファイルの読み込みは librosa.load() を使っています。 librosa.load()は引数にサンプリング周波数を与…

#Python #音声信号処理

2021-07-17

定Q変換のPython 実装：バッチ処理向けの実装方法の紹介と計算速度の比較

Programming Python LibROSA 音楽プログラミング音響音楽信号処理歌声信号処理楽曲解析

前回の記事では，音楽信号の音高分析に便利な定Q変換 (CQT)のアルゴリズムや実装方法による計算速度の比較を行いました。 www.wizard-notes.com 結果として，再帰的ダウンサンプリング法による定Q変換がリアルタイム処理で実用的な計算速度であることが分か…

#Python #音声信号処理

2021-07-16

定Q変換のPython 実装のアルゴリズム／実装方法による計算速度の比較

LibROSA Programming Python 楽曲解析歌声信号処理音楽プログラミング音響音楽信号処理

音楽信号の音高分析に便利な定Q変換 (CQT)。これまでにいくつか計算アルゴリズムや実装方法の種類を紹介してきました。おそらく再帰的ダウンサンプリング法が速いと思っていたのですが、条件によっては疎行列計算と変わらないことがあったりと、実環境での…

#音声信号処理 #Python

2021-07-14

再帰的ダウンサンプリング法による定Q変換 (CQT) のPython 実装とアルゴリズム解説

LibROSA Programming Python ディジタルフィルタ歌声信号処理音楽プログラミング音響音楽信号処理

定Q変換 (CQT)は歌声・音楽の音高／メロディ／和音を分析するのに便利な周波数分析方法です。例えば，CQTスペクトログラムを算出すれば各音高（ドレミファ…）がどのくらいの強さで鳴っているかを時系列で観察することができます。以下の記事では、定Q変換…

2021-07-12

Python LibROSA で音楽・歌声をタイムストレッチ（時間伸縮） librosa.effects.time_stretch()

Programming LibROSA 歌声信号処理音楽プログラミング音響音楽信号処理

YouTubeやニコニコ動画のような動画サービスで0.5倍・2倍速再生が使えるのが一般的になっています。また、サンプリングされた波形素材の時間伸縮がDAWの基本機能として搭載されていて、曲のタイミングやテンポに上手く合わせて波形素材をいい感じの長さで鳴…

#Python #音声信号処理

2021-07-11

LibROSA：音高分析のための定Q変換（CQT）と、逆定Q変換の性能評価

LibROSA 歌声信号処理音響音楽信号処理音楽プログラミング Programming

はじめに音信号を分析する時間周波数分析手法としてはSTFT（短時間フーリエ変換）が良く使われますが，特に音楽を対象にして音高、コード、メロディなどを分析する場合は定Q変換（CQT）という手法が便利です。 www.wizard-notes.com www.wizard-notes.com …

2021-07-10

定Q変換 (CQT: Constant-Q Transform) の解説（音高・コード・メロディの分析向け）

LibROSA Python 音響音楽信号処理歌声信号処理楽曲解析ディジタルフィルタ

はじめに音信号の時間周波数分析にはFFT (高速フーリエ変換) ／STFT（短時間フーリエ変換）がよく使われます．しかし，FFTの性質上，音高に関わる分析をしようとすると実装や分析精度の向上に手間がかかります。そこで，この記事では音楽信号の分析によく…

2021-06-30

音声・オーディオ版MNIST "FSDD (Free Spoken Digit Dataset)" の紹介と，メルスペクトログラム算出

音響音楽信号処理歌声信号処理音楽プログラミング LibROSA Programming Python 機械学習・深層学習

7万枚の手書き数字の画像＋ラベルのデータセットである MNIST は，今では機械学習・深層学習のHello Worldとして非常に多くの人に利用されていて有名です． MNISTの1つのデータは白黒画像・28x28ピクセル，全体でも7万件なので大規模データですがデータセッ…

2021-06-26

Python：PyQtGraphでメルスペクトログラムをリアルタイム描画

Programming PyQt Python pyqtgraph 音楽プログラミング LibROSA

音楽再生ソフトやプラグインでよく見かける，スペクトログラムのリアルタイムプロット．どの周波数帯域で音が鳴っているのかをリアルタイムで可視化できるので非常に便利です． Pythonでスペクトログラムのリアルタイムプロットをやろうとすると，やはりリ…

#Python #音声信号処理

2021-02-03

PythonでSSM（自己類似度行列）を使って楽曲構成（Aメロ，サビなど）を分析

LibROSA Python 音響音楽信号処理楽曲解析音楽プログラミング

計算機を使った音楽分析技術の一つとして、楽曲構成（Aメロ、Bメロ、サビ）を分析する方法があります。しかし、日本語で技術の具体的な実現方法や実装について説明のある文献はあまり多くありません。また、Pythonの音楽分析ライブラリ LibROSA にはまだ実…

2021-01-24

Python:LibROSAのLPC (線形予測分析)を使って音声・歌声分析

LibROSA Python 音響音楽信号処理歌声信号処理音楽プログラミング

Pythonの音楽分析モジュールLibROSAには、v.0.7から線形予測分析(https://ja.wikipedia.org/wiki/%E7%B7%9A%E5%BD%A2%E4%BA%88%E6%B8%AC%E6%B3%95)を行う関数librosa.lpcが追加されました。線形予測分析は音声の音素や声色を分析するのによく利用されていま…

#Python #音声信号処理

2020-12-20

メロディ分析／抽出のための、librosa.salience() によるSalience (顕著性) スペクトログラムの算出

LibROSA Python 音響音楽信号処理歌声信号処理音楽プログラミング

はじめに Python の音楽信号分析モジュールである LibROSAには、楽曲の音高／メロディ／和音情報をより精度よく抽出するためのツールとして、Salience （顕著性）スペクトログラムを抽出する関数 librosa.salience が実装されています。今回は、librosa.sal…

2020-12-20

LibROSAにおける Salience （顕著性）スペクトログラムの算出方法の解説

LibROSA Python 楽曲解析歌声信号処理音響音楽信号処理

はじめにこの記事では、以下の記事で紹介 LibROSAのSalience スペクトログラムの算出方法を解説します。 www.wizard-notes.com 実際の計算方法、プログラムはlibrosa.salience() をご参照ください。 Salience スペクトログラムとは Salience スペクトログ…

2020-10-07

Python：LibROSA のフェーズボコーダで時間伸縮・ピッチシフト librosa.phase_vocoder

LibROSA Python 歌声信号処理音響音楽信号処理

まえがき使い方関数の仕様サンプルコードとプロット librosa.phase_vocoderの中身について重要な中間変数を抜粋メイン処理補足：フェーズボコーダを使ったピッチシフトの実現方法 librosa.phase_vocoderの音質について参考文献まえがきオーディオ編…

2020-10-02

Python LibROSA で音楽・歌声（ボーカル）をピッチシフト librosa.effects.pitch_shift()

Python 音響音楽信号処理歌声信号処理 LibROSA 音楽プログラミング Programming

まえがき librosa.effects.pitch_shift() の使い方引数について半音単位のピッチシフト周波数を指定するピッチシフト使い方のサンプルプロットコード注意補足：ピッチシフトはタイムストレッチ？まえがきボーカルや楽器の録音データに対して、「…

#Python #音声信号処理

2020-09-01

LibROSA ver. 0.8.0 で基本周波数推定（YIN, pYIN）

LibROSA Python

Python の楽曲解析モジュール LibROSA が 2020年7月22日に ver. 0.8.0 に更新されていました。 Changelog — librosa 0.10.0 documentation インストール方法 python -m pip install librosa=0.8.0 気になる変更点として、基本周波数推定アルゴリズムとして有…

#Python #音声信号処理

2020-09-01

librosaにおける16-bitでのWAV書き出し (librosa.output.write_wav)

LibROSA Python 楽曲解析音響音楽信号処理

問題最近のバージョンの librosa では、信号を保存する時、16-bit 整数（int）型のWAVファイルで書き出そうとすると、以下のようなエラーが出てしまい、ファイル出力できません。 >>> import numpy as np >>> import librosa >>> y = np.sin(2.0*np.pi*440*…

#Python #音声信号処理

2019-11-17

librosa.core.magphaseで振幅スペクトルと位相スペクトルを複素信号から抽出

LibROSA Python 音響音楽信号処理

LibROSAの便利な関数として、librosa.core.magphaseがあります。この関数を使うことで、短時間フーリエ変換librosa.stftや定Q変換librosa.cqtで出力される複素信号から、振幅スペクトルと位相スペクトルを抽出することができます。それでは、librosa.core.…

2019-11-08

Python + LibROSAでクロマ特徴（クロマグラム）を使って和音推定：(1) テンプレートマッチング

Python 楽曲解析音響音楽信号処理 LibROSA

音楽の三大要素、メロディ・ハーモニー・リズムの内、ハーモニーの根幹を担っているのが和音です。そのため、計算機を使った楽曲分析でも和音分析は非常に重要な処理です。ただ、楽譜データ*1は簡単ですが、オーディオファイルのような楽曲データからの和…

2019-11-03

LibROSA：Pythonで手軽に始める音楽信号・データ分析 [2022年20月更新]

LibROSA Python 楽曲解析音響音楽信号処理

LibROSA とは？出典：https://librosa.github.io/ 「自分の好きな音楽をパソコンで分析したい！」「音楽データで機械学習・ディープラーニングをやってみたい！」「でも、音データの信号処理やデータの扱い方がよく分からない…」と悩んでいるエンジニア…

#Python #音声信号処理 #LibROSA

2019-11-02

LibROSA で MFCC（メル周波数ケプストラム係数）を算出して楽器の音色を分析

LibROSA Python 楽曲解析音響音楽信号処理

MFCC 算出の流れこの記事では、音に関するデータ分析や機械学習・深層学習で良く使われている MFCC*1 （メル周波数ケプストラム係数）という特徴量を使って、楽器の音色を分析できるかどうかを検証します。 MFCC とは？ LibROSAを使ったMFCCの算出方法 1. …

#Python #音声信号処理

2019-10-25

Perfume The Best "P Cubed" の全52曲をテンポ特徴でクラスタ分析

Python LibROSA 楽曲解析音響音楽信号処理

事始め Perfume のベストアルバム Perfume The Best “P Cubed” を購入しました。これまで（～2018年）の楽曲の中から全50曲 + 新曲2曲が収録されています。全52曲。なかなかのデータ数です。そういえば、最近のPerfumeの楽曲ってFuture BassやDub系が増え…

2019-10-24