В Втр, 24/02/2009 в 14:50 +0600, Victor Sudakov пишет:
> Andrew V.Statsenko wrote:
>
> > Очень аккуратно и сбалансированно
> > подходите к обучению dspam (подробности в документации),
>
> Обязательно ли участие пользователей в обучении dspam? Можно ли
> избавить их от необходимости лазить в веб-интерфейс и т.п.?
Сложно ответить просто ;-)
При планируемой инсталляции у вас будет:
- одна база токенов на всех - или несколько баз на разные группы/домены - или персональная bayes база на каждого пользователя, плюc подключениеобщей/доменной базы, если в персональной не хватает токенов ?
Масштаб бедствия (~ количество пользователей) также хотелось бы понять.
Вообще нет, не обязательно. Если есть требование _минимального_ участия в процессе, то у вас есть задачи:
- перевод libsdpam в режим DSM_CLASSIFY, чтобы начальная база не изменялась во времени (при этом отпилите maintenance скрипты из крона)
Подобное статическое решение может неплохо работать, ну и иногда Train-on-Error - ручками переучивать при ошибках.
Хотя лучше все же оставить для персональной базы пользователя DSM_PROCESS и завести в домене адреса spam@domain.tld & ham@domain.tld куда расстроеные ошибками классификации пользователи могли бы пересылать свои false neg/pos и "доучивать" свои персональные базы. Вынос старых токенов из персональной базы, думаю, что лучше в этом случае все же делать - шума меньше будет.
--- С уважением, Андрей СтаценкоПолучено Tue Feb 24 11:06:33 2009
Этот архив был сгенерирован hypermail 2.1.8 : Tue 24 Feb 2009 - 16:15:51 MSK