メルフィルタバンク

音声生成に関する用語

AI用語解説:メル周波数ケプストラム係数

メル周波数ケプストラム係数(MFCC)とは、音響信号を特徴付けて分類するために使用される音声の特徴量です。人間の音の知覚を模倣しており、人間の聴覚における周波数に対する感度を表現します。音声の短時間フレームから計算され、時間軸に沿った音のスペクトル変化を捉えます。MFCC は、音声認識、音声合成、音楽情報検索などの音声処理のさまざまなタスクで使用されています。