Re: dspam

От: Andrew V.Statsenko <CGatePro_at_mx_ru>
Дата: Tue 24 Feb 2009 - 14:06:22 MSK

В Втр, 24/02/2009 в 14:50 +0600, Victor Sudakov пишет:
> Andrew V.Statsenko wrote:
>
> > Очень аккуратно и сбалансированно
> > подходите к обучению dspam (подробности в документации),
>
> Обязательно ли участие пользователей в обучении dspam? Можно ли
> избавить их от необходимости лазить в веб-интерфейс и т.п.?

Сложно ответить просто ;-)

При планируемой инсталляции у вас будет:

 - одна база токенов на всех
 - или несколько баз на разные группы/домены
 - или персональная bayes база на каждого пользователя, плюc подключение
общей/доменной базы, если в персональной не хватает токенов ?

Масштаб бедствия (~ количество пользователей) также хотелось бы понять.

Вообще нет, не обязательно. Если есть требование _минимального_ участия в процессе, то у вас есть задачи:

- перевод libsdpam в режим DSM_CLASSIFY, чтобы начальная база не изменялась во времени (при этом отпилите maintenance скрипты из крона)

Подобное статическое решение может неплохо работать, ну и иногда Train-on-Error - ручками переучивать при ошибках.

Хотя лучше все же оставить для персональной базы пользователя DSM_PROCESS и завести в домене адреса spam@domain.tld & ham@domain.tld куда расстроеные ошибками классификации пользователи могли бы пересылать свои false neg/pos и "доучивать" свои персональные базы. Вынос старых токенов из персональной базы, думаю, что лучше в этом случае все же делать - шума меньше будет.

---
С уважением,
Андрей Стаценко
Получено Tue Feb 24 11:06:33 2009

Этот архив был сгенерирован hypermail 2.1.8 : Tue 24 Feb 2009 - 16:15:51 MSK