階層クラスター分析

機械学習に関する用語

AI用語「クラスター分析」の仕組み

-クラスター分析とは- クラスター分析は、データの集合を、類似性の高いデータを持つグループ(クラスター)に分割する手法です。データセット内のデータポイント間の類似性を定量化し、類似性に基づいてポイントをグループ化します。クラスター分析は、データパターンの発見、市場セグメンテーション、異常値の検出など、さまざまな用途があります。
機械学習に関する用語

AI用語 解説『ウォード法』

-ウォード法とは?- ウォード法は、階層的クラスタリング手法の一つです。クラスタリングとは、データを類似性の高いグループに分けることで、データの構造や傾向を明らかにする手法です。ウォード法では、類似性の尺度としてワード距離を使用します。 ウォード距離は、2つのクラスタ間の誤差平方和に基づいています。誤差平方和とは、各クラスタのデータ点がクラスタの重心にどれほど近いかを表す値です。ウォード法では、誤差平方和が最小になるようにクラスタを結合していきます。つまり、最も類似性の高い2つのクラスタをまず結合し、次に誤差平方和が最小になる2つのクラスタを結合していくという手順を繰り返します。 これにより、階層的な木構造が形成されます。この木構造はデンドログラムと呼ばれ、データ内のクラスタ間の関係性を視覚的に表します。ウォード法は、データの構造を調査したり、類似性の高いグループを特定したりするために使用される一般的なクラスタリング手法です。