SESエンジニアの自己研鑽ブログ

自由気ままにアウトプットします。

ベイジアンフィルタリング

ベイジアンフィルタリングとは?

迷惑メールフィルターの仕組みであり、機械学習アルゴリズム

ベイジアンフィルタの基本的な考え方は、「手がかり」を洗い出すというもの。ベイジアンフィルタは計算処理を通して、自然言語の文章を構成する多数の言葉の中から「手がかり」となる言葉を選び抜く。

言葉を洗い出したら、「分類辞書」に記録する。

手がかりとなる単語を見つけたら、「分類辞書」と照らし合わせて「判定用スコア」を加算する。

最終的に「判定用スコア」が一定値を超えていたら迷惑メールと判断する。