N-gram

自然言語処理に関する用語

n-gramとは?AIの基本用語解説

n-gramの概要 n-gramとは、連続するn個の要素からなるシーケンスのことです。自然言語処理では、単語、文字、または音節などのテキストデータで利用されます。たとえば、3-gram(トリグラム)は、3つの連続した単語からなるシーケンスです。n-gramは、テキストデータの統計的分析に使用され、言語モデルの構築、機械翻訳、予測テキストなどのタスクで活用されています。