Re: Re: поиск СПАМ фильтра с авторизацией отправителей

От: Vladimir A. Butenko <CGatePro_at_mx_ru>
Дата: Fri 10 Jun 2005 - 16:58:54 MSD

On Fri, 10 Jun 2005 16:16:54 +0400
  "Andrey N. Oktyabrski" <CGatePro@mx.ru> wrote:

>> статистику по доменам в текущей реализации - для этого мне всего лишь 
>> надо сгруппировать мой серый список по доменам.
> Эффекта уменьшения количества записей в сером списке практически не 
>наблюдается:

> # ./greylist_export.pl db/greylist.db | wc -l
> 764

> # ./greylist_export.pl db/greylist.db | perl -pe
> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l
>      731
> 
> А вот в белом списке - есть немного, в полтора раза (но, к сожалению, не 
>на порядок):

> # ./greylist_export.pl db/whitelist.db | wc -l
> 4663

> # ./greylist_export.pl db/whitelist.db | perl -pe
> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l
>     3013
> 
> Это при TTL записи в белом списке 30 суток. Если меньше - эффект будет ещё 
>меньше.

Видите ли. Если у Вас есть M шариков, каждый из которых определенного цвета из набора в N цветов, то при M << N у Вас в вашем наборе будет около M разных цветов. А вот при M > N эффект будет другим: сколько бы M вы ни брали, у Вас все равно будет не более N разных цветов.

Следующий вопрос, ессейсно, - как велико это число N (то есть число разных доменов). Попутно - можно попробовать хранить не просто доменную часть, а лишь доменную часть до второго уровня. Понятно, что при этом какой-нибудь bigcompany.com поимеет 30 адресов - для своих разных майлхостов. Но - 30, а доменов второго уровня в .com - cколько? По-моему, 50mln...

>
>

Sincerely,
Vladimir Получено Fri Jun 10 12:58:12 2005

Этот архив был сгенерирован hypermail 2.1.8 : Fri 24 Apr 2015 - 16:13:53 MSK