Re: Re: Spamassassin, SpamCatcher

От: Dmitry E Kiselyov <CGatePro_at_mx_ru>
Дата: Thu 15 Apr 2004 - 14:10:41 MSD

  (Maxim Polyakov) wrote:
> То есть, изначально, после установки SA, он русский спам так хорошо не

> определяет как нерусскоязычный? Нужно создавать особые настройки,
> новые правила, проводить тренировки? Вобщем, поделитесь опытом, так
> сказать, как продвинутый пользователь :)

  Изначально в SA байесовский классификатор и, соответственно, спам-тест на его основе не работают. Для их включения нужно "скормить" обучающей утилите как минимум 200 писем со спамом и 200 нормальных писем, а для эффективной работы - как минимум 1000 того и другого. Тренировки нужно производить регулярно, чтобы фильтр адаптировался к изменениям спаммерской тактики и стратегии. Регулярность тренировок и размер базы, в которой хранятся лексемы, надо подстраивать в зависимости от разнообразия и количества поступающего спама. Надо лишь помнить, что чем больше база, тем больше ресурсов сервера "съест" SA. Можно также поиграть с автообучением, но на свой страх и риск. :-) Другие рекомендации по работе с байесовским фильтом в SA можно найти тут: http://eu.spamassassin.org/doc/sa-learn.html и тут http://eu.spamassassin.org/doc/Mail_SpamAssassin_Conf.html (секция LEARNING OPTIONS)
  Кроме того, в SA имеется набор других спам-тестов, вылавливащих спам по некоторым характерным его признакам, коих иногда бывает достаточно и без байеса. Пока байесовский классификатор не обучен SA полагается только на эти спам-тесты. Русский и нерусский спам в этом случае ловятся примерно одинаково, русский даже лучше. :-)

-- 
Dmitry E Kiselyov
Получено Thu Apr 15 10:11:28 2004

Этот архив был сгенерирован hypermail 2.1.8 : Tue 21 Feb 2006 - 03:14:57 MSK