On Fri, 10 Jun 2005 16:16:54 +0400
"Andrey N. Oktyabrski" <CGatePro@mx.ru> wrote:
>> статистику по доменам в текущей реализации - для этого мне всего лишь >> надо сгруппировать мой серый список по доменам. > Эффекта уменьшения количества записей в сером списке практически не >наблюдается:
> # ./greylist_export.pl db/greylist.db | wc -l
> 764
> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l > 731 > > А вот в белом списке - есть немного, в полтора раза (но, к сожалению, не >на порядок):
> # ./greylist_export.pl db/whitelist.db | wc -l
> 4663
> 's,^(\d+\.\d+\.\d+\.\d+)/.+\@(.+):.*$,$1/$2,' | sort | uniq | wc -l > 3013 > > Это при TTL записи в белом списке 30 суток. Если меньше - эффект будет ещё >меньше.
Видите ли. Если у Вас есть M шариков, каждый из которых определенного цвета из набора в N цветов, то при M << N у Вас в вашем наборе будет около M разных цветов. А вот при M > N эффект будет другим: сколько бы M вы ни брали, у Вас все равно будет не более N разных цветов.
Следующий вопрос, ессейсно, - как велико это число N (то есть число разных доменов). Попутно - можно попробовать хранить не просто доменную часть, а лишь доменную часть до второго уровня. Понятно, что при этом какой-нибудь bigcompany.com поимеет 30 адресов - для своих разных майлхостов. Но - 30, а доменов второго уровня в .com - cколько? По-моему, 50mln...
>
>
Sincerely,
Vladimir
Получено Fri Jun 10 12:58:12 2005
Этот архив был сгенерирован hypermail 2.1.8 : Fri 24 Apr 2015 - 16:13:53 MSK