Re: фильтрация спама в промышленных масштабах и наших измышлениях.

От: Michael Kulakov <CGatePro_at_mx_ru>
Дата: Fri 05 Oct 2007 - 12:20:10 MSD

Здравствуйте!

On Fri, Oct 05, 2007 at 08:06:04AM +0400, Roman Prokhorov wrote:

> >Традиционно среднестатистические SMTP системы строятся по приблизительно
> >следующей схеме: [приём письма]-->[постановка в очередь к
> >антиспам-фильтру & антивирусу]-->[фильтрация]-->[постановка в очередь

> >доставки на backend]-->[доставка в ящик пользователю]. (до приема письма
> >может существовать в очень разных формах RBL/PTR подрезка сессий) Схема
> >классическая, проверенная временем и инсталляциями.  Плюсы: она успешно
> >работает. Минусы: такая схема имеет _радикально_ низкую
> >производительность и в случае операторского сегмента требуется закупать
> >_весьма_ дорогое и мощное оборудование и эксплуатировать его понимая, что
> >бОльшая часть ресурсов уходит на паразитную нагрузку в виде спам-трафика.
> 
> Категорически не согласен - производительность у такой системы не хуже,
> чем у описанной вами ниже.

:) то есть запись на диск уже ничего не стоит ?

> Вот всё это ничто не мешает реализовать в "классической" 
> системе в одной программе. Т.е. если письмо с проблемного IP - его 
> незачем проверять Байесом и т.п.

нет проверки байесом проблемного ip. оно или будет обработано на предыдущих уровнях или это уже "не проблемый ip", а скорее достаточно валидное письмо. но на cgp сейчас так удобно делать не получается.

> сотни писем одновременно, ведь SMTP сессий одновременно может 
> быть много. При разговорах о многочасовых очередях на SpamAssassin в 
> это как-то не верится.

имено сотни сессий одновременно. Андрей скажет более точную статистику.

> Кстати, вставлю свою рекламу :-)
> Cloudmark плагин <http://www.stalker.com/CGPCloudmark/> - очень быстрый
> Из отчёта на Celeron 2.8 ГГц:
> --------------------------
>        1061 messages rated
> Scanning time:
> Min:   0.002 sec.
> Avg:   0.008 sec.
> Max:   0.649 sec.
> 
> Resource usage:
> User:    11.601 sec.    0.962%
> System:   1.408 sec.    0.116%
> --------------------------
> Основан на анализе сигнатур как в Layer #3. И достаточно точный. 
> Так что рекомендую.

то есть все начальные dynamics layers - пропущены ? с ними - быстрее, чем без них :)

С уважением,
  Михаил Кулаков Получено Fri Oct 05 08:22:49 2007

Этот архив был сгенерирован hypermail 2.1.8 : Fri 05 Oct 2007 - 16:14:53 MSD