bsfilter

以前にも書いたと思うんだけど、メールのスパム判定に bsfilter (http://bsfilter.org/) もう長いこと愛用している。
最初にスパムメールとそうじゃないメール(クリーンなメール)を教える必要があるんだけど、それさえ教えておけば、あとは結構高い精度でスパムを判定してくれるので、物凄く便利。 これのおかげで一日に 4,50はあるスパムメールで自分が十差に目にするのは1つか2つという位にはなってる。 それでいて誤判定はほぼ0。 間違えるのは英語で某所から来るアナウンスメールが時々と、メルマがで必ず引っ掛かってしまうの1つ。 メルマガの方はなんどクリーンだと学習させても引っ掛かるのが謎。 まぁ気が向いたときにスパムで弾かれたメールのフォルダをざっとチェックすれば見つかるので、さほど問題はないんだけど。

このbsfilter便利なんだけど、長いこと使ってると時々データベースが壊れるのか、スパムの判定をしてくれなくなる。 最近もなんかえらい目にするスパム増えたな〜と思ってたら案の定 bsfilter のデータベースが壊れていたみたいで、データベース削除して一からスパムとクリーンなメールを学習しなおさせたらなおった。

なんでデータベースが壊れるのかも謎なんだけど。 過学習とかそんなやつなんだろうか? データベース壊れたら作り直したらいいだけと言えばいいだけなんだけど、そのためにスパムメールを棄てることができないのはそれはそれでなんか嫌な気分。