Vladimir A. Butenko wrote:
>
>>
>> Он вернул 550 и бросил конекшен
>
>
> То есть он даже не упал. Он вернул ошибку и решил, что разговаривать с 
> Вами не хочет. Имеет полное право.
Он не хочет разговаривать со мной про это письмо!
>>
>> Да, это все понятно
>> Только может кто нибудь предложить достойный алогитм как на основании 
>> проблем с доставкой пары писем, оценить что не надо пробовать 
>> доставалять еще пару тысяч писем?
>
>
> Это политика не Ваша и не наша, а политика того самого хоста. Он 
> решил, что говорить в Вами ему не хочется. А Вы хотите быть как та 
> соседка - "нет, ну почему ты не хочешь со мной разговаривать сейчас? 
> Нет, ну почему я должна через час перезванивать - у меня знаешь 
> сколько всего есть тебе рассказать!".
>
> Не хочет. Он. Другой конец. Если для Вас это проблема - то решайте это 
> с владельцем того хоста, чтобы он не посылал Ваш сервер далеко, а 
> просто возвращал ошибки на конкретные письма, которые ему не нравятся.
Вот вроде на одном языке разговариваем, а понять друг друга не можем (или сознательно не хотим, во что верить бы не хотелось)
Еще раз по порядку:
1. в SMTP не предусмотренно возможности сказать удаленному хосту  - 
"отстань от меня со всеми сообщениями на часик, у меня голова болит,  я 
устала"
2. Поэтому делать такие выводы, основываясь на проблеме доставки пары 
сообщений - это Ваша политика и ничего более
>
>> Мне кажется никто, т.к. это головная боль, и тут проще keep it simple 
>> и не заниматся догатками
>
>
> Хм.
>
см выше п.2
>> Может мне в очередь попало письмо, которое вызывает core dump 
>> форконутого процесса, который меня обслуживал? Да еще миллион 
>> вариантов, например вчерашний пример из жизни с антиспам системой (не 
>> самопальная далеко)
>
>
> Какой пример, какой дамп? Кстати, если дамп - то тем более не стоит 
> долбиться. Правда, CGatePro письмо, на котором другой хост упал, 
> немножко передвинет в очереди - но это так, в порядке гуманитарной 
> помощи владельцам падающих хостов.
Пример был вчера, когда антиспам (Symantec Mail Security for MExchange) давал 550 в процессе приема сообщения (в процессе передачи DATA) и это воспринимается CGPro как broken. Сегодня глянув документацию к антиспаму (ftp://ftp.symantec.com/public/english_us_canada/products/sym_mail_security/5.0_mse/manuals/sms_imp_guide.pdf) у меня есть сомнения что там был разрыв tcp. Как только убрали Reject вся почта на хост ушла.
>
>>> В обоих случаях - это проблемы именно хоста. Долбиться в него еще 
>>> раз - это, во-первых, нарываться на проблемы для принимающей стороны 
>>> (они же бросили соединение, показав, что либо не хотят, либо не 
>>> могут с Вами говорить), во-вторых - для себя - долбиться НЕПРЕРЫВАНО 
>>> в хост, которые не может или не хочет говорить - это трата своих же 
>>> ресурсов.
>>
>>
>> Не нужно просто очередь пер хост, у каждого сообщения своя судьба и 
>> не будет тогда никакой траты ресурсов, если на все сообщения 450 или 
>> еще бяка какая, то пускай валяются в очереди каждое со своим временем 
>> повтора
>
>
> Каждое сообщение и так "само по себе". И нормально само по себе 
> откладывается - по приему 4xx, например. А вот если проблемы с хостом, 
> а не с письмом - как-то падение соединения, неправильные промпты, 
> ответы на HELO, отсутствие соединеия - то откладывается вся очередь на 
> хост. Это - разные задержки.
Задержки может и разные, только управляются одной настройкой.
>  
>
>>>
>>> Помимо документации, есть такая вещь, как Logs. Пожалуйста, 
>>> опубликуйте их здесь, чтобы показать, о какой именно проблеме Вы 
>>> говорите. Я, например, не понимаю, что такое "заблокированный хост".
>>
>>
>> Ну по логам то ничего интересного, если нужно могу включить полную 
>> дагностику
>>
>> 10:46:35.84 2 LIST [12552509] distributed to dron@comstar.ru (1 
>> addresses, 0 removed) as [12552510]
>> 10:46:35.84 2 QUEUE([12552510]) from <kenji@dbzmail.com>, 9663 bytes 
>> (<decb01c606cb$1aea61fe$cbb66b85@dbzmail.com>)
>> 10:46:35.84 2 ENQUEUER-01([12552510]) enqueued
>
>
> Не надо "полной диагностики". Какое отношение то, что Вы привели - 
> имеет к описанной Вами проблеме? Вы же говорили о доставке по SMTP, не 
> так ли?
>
>> сейчас Thu Dec 22 12:21:40 MSK 2005
>>
>> Если найти через монитор это сообщение, то статус Delayed, в очереди 
>> 95 минут
>> если кликнуть на хост, то показываются все сообщения висящие на хост 
>> в очереди, на половину из которых 450 (для этих получателей оно 
>> действительно 450 и это правильно)
>> у хоста в Last Error стоит connection with ... is broken
>
>
> И что? Если сообщение получило 4xx, то оно ИНДИВИДУАЛЬНО отложилось на 
> какое-то время. А если после этого хост упал - то отложилась вся очередь.
Хост не падал, выдержка из логов показывает что сообщение НЕ пыталось доставиться из-за broken на хост. Причин broken ни в логах, ни в monitors нет и никогда не было, и пытаться понять что там унутре решило заблокировать хост не представляется возможным. Та диагностика, которую выдает CGPro, говорит о том что хост broken из-за некторого количества 450, что может и не так. Если в логи кто нибудь напишет причину broken ВСЕМ станет легче.
>
> Там есть еще третий уровень. 4xx может быть выдан для сообщения (mail 
> from, data, "."), а может - для конкретного RCPT TO. В последнем 
> случае - откладываются определенные адреса, а не всё сообщение.
>
> Так что Вы попробуйте, пожалуйста, сначала понять - что у Вас там 
> реально происходит (логи Вам в том помощники), потом решите, 
> соответствует ли эта реальность Вашим ожиданиям, а если нет - то 
> приведите, пожалуйста, подробно, эту реальность, а также Ваше видение 
> того, где эта реальность расходится в Вашими ожиданиями поведения 
> CGatePro в этой реальности.
>
То что у меня происходит я знаю, сидеть пол дня с tcpdump если честно 
большого желания нет и пытаться в очередной раз догадаться почему именно 
в этой ситуации возникли broken тоже. Если сможете предложить нормальный 
метод дигностики, то с удовольствием займусь.
P.S. Напомнить некую инсталяцию на некотором узле, где приходилось реллеить почту на крупные почтовые системы (hotmail, yahoo, mail.ru ) через отдельные smtp сервера исключая CGPro из-за broken? Может стоит наконец сделать настроечку в виде галочки?
-- 
Best regards,
                                          Maxim Cherniavsky
                                          Comstar-UTS, Internet Division
                                          mailto: maxim (at) comstar.ru 
Получено Thu Dec 22 12:52:29 2005
Этот архив был сгенерирован hypermail 2.1.8 : Fri 24 Apr 2015 - 16:14:36 MSK