音声生成に関する用語 AI用語解説:メル周波数ケプストラム係数 メル周波数ケプストラム係数(MFCC)とは、音響信号を特徴付けて分類するために使用される音声の特徴量です。人間の音の知覚を模倣しており、人間の聴覚における周波数に対する感度を表現します。音声の短時間フレームから計算され、時間軸に沿った音のスペクトル変化を捉えます。MFCC は、音声認識、音声合成、音楽情報検索などの音声処理のさまざまなタスクで使用されています。 2024.04.19 音声生成に関する用語
音声生成に関する用語 音を彩るスペクトル包絡―音の違いを識別する スペクトル包絡とは、ある音の周波数スペクトルの時間変化を記述するものです。スペクトルとは、音の含まれる周波数成分の分布を表しており、包絡とはその周波数成分の強度の時間変化を意味します。したがって、スペクトル包絡は、時間軸に沿った音の周波数成分の変化を捉えたものであり、音の質感を決定する重要な要素となっています。 2024.04.20 音声生成に関する用語