Re: Re: поиск СПАМ фильтра с авторизацией отправителей

От: Andrey N. Oktyabrski <CGatePro_at_mx_ru>
Дата: Sun 12 Jun 2005 - 12:55:22 MSD

Vladimir A. Butenko wrote:
> On Fri, 10 Jun 2005 16:16:54 +0400
> "Andrey N. Oktyabrski" <CGatePro@mx.ru> wrote:
>

>>> статистику по доменам в текущей реализации - для этого мне всего лишь 
>>> надо сгруппировать мой серый список по доменам.
>>
>> Эффекта уменьшения количества записей в сером списке практически не 
>> наблюдается:
>> # ./greylist_export.pl db/greylist.db | wc -l      764
>> # ./greylist_export.pl db/greylist.db | perl -pe 
>> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l
>>      731
>>
>> А вот в белом списке - есть немного, в полтора раза (но, к сожалению, 
>> не на порядок):
>> # ./greylist_export.pl db/whitelist.db | wc -l     4663
>> # ./greylist_export.pl db/whitelist.db | perl -pe 
>> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l
>>     3013
>>
>> Это при TTL записи в белом списке 30 суток. Если меньше - эффект будет 
>> ещё меньше.

>
>
> Видите ли. Если у Вас есть M шариков, каждый из которых определенного
> цвета из набора в N цветов, то при M << N у Вас в вашем наборе будет
> около M разных цветов. А вот при M > N эффект будет другим: сколько бы M
> вы ни брали, у Вас все равно будет не более N разных цветов.
>
> Следующий вопрос, ессейсно, - как велико это число N (то есть число
> разных доменов). Попутно - можно попробовать хранить не просто доменную
> часть, а лишь доменную часть до второго уровня. Понятно, что при этом
> какой-нибудь bigcompany.com поимеет 30 адресов - для своих разных
> майлхостов. Но - 30, а доменов второго уровня в .com - cколько?
> По-моему, 50mln...
Я, кажется, понял, где тут подводные грабли лежат - одному ip-адресу может соответствовать очень много разных доменов (например, с smtpN.masterhost.ru идёт почта от самых разных доменов, включая почему-то yahoo.com). Получено Sun Jun 12 08:53:10 2005

Этот архив был сгенерирован hypermail 2.1.8 : Tue 21 Feb 2006 - 03:16:30 MSK