(Maxim Polyakov) wrote:
> То есть, изначально, после установки SA, он русский спам так хорошо не
> определяет как нерусскоязычный? Нужно создавать особые настройки, > новые правила, проводить тренировки? Вобщем, поделитесь опытом, так > сказать, как продвинутый пользователь :)
Изначально в SA байесовский классификатор и, соответственно, спам-тест
на его основе не работают. Для их включения нужно "скормить" обучающей
утилите как минимум 200 писем со спамом и 200 нормальных писем, а для
эффективной работы - как минимум 1000 того и другого. Тренировки нужно
производить регулярно, чтобы фильтр адаптировался к изменениям
спаммерской тактики и стратегии. Регулярность тренировок и размер базы,
в которой хранятся лексемы, надо подстраивать в зависимости от
разнообразия и количества поступающего спама. Надо лишь помнить, что чем
больше база, тем больше ресурсов сервера "съест" SA. Можно также
поиграть с автообучением, но на свой страх и риск. :-) Другие
рекомендации по работе с байесовским фильтом в SA можно найти тут:
http://eu.spamassassin.org/doc/sa-learn.html и тут
http://eu.spamassassin.org/doc/Mail_SpamAssassin_Conf.html (секция
LEARNING OPTIONS)
Кроме того, в SA имеется набор других спам-тестов, вылавливащих спам
по некоторым характерным его признакам, коих иногда бывает достаточно и
без байеса. Пока байесовский классификатор не обучен SA полагается
только на эти спам-тесты. Русский и нерусский спам в этом случае ловятся
примерно одинаково, русский даже лучше. :-)
-- Dmitry E KiselyovПолучено Thu Apr 15 10:11:28 2004
Этот архив был сгенерирован hypermail 2.1.8 : Tue 21 Feb 2006 - 03:14:57 MSK