Re: Re: connection is broken - держаться больше нету сил!

От: Maxim Cherniavsky <CGatePro_at_mx_ru>
Дата: Thu 22 Dec 2005 - 15:49:42 MSK

Vladimir A. Butenko wrote:

>
>>
>> Он вернул 550 и бросил конекшен
>
>
> То есть он даже не упал. Он вернул ошибку и решил, что разговаривать с
> Вами не хочет. Имеет полное право.

Он не хочет разговаривать со мной про это письмо!

>>
>> Да, это все понятно
>> Только может кто нибудь предложить достойный алогитм как на основании
>> проблем с доставкой пары писем, оценить что не надо пробовать
>> доставалять еще пару тысяч писем?
>
>
> Это политика не Ваша и не наша, а политика того самого хоста. Он
> решил, что говорить в Вами ему не хочется. А Вы хотите быть как та
> соседка - "нет, ну почему ты не хочешь со мной разговаривать сейчас?
> Нет, ну почему я должна через час перезванивать - у меня знаешь
> сколько всего есть тебе рассказать!".
>
> Не хочет. Он. Другой конец. Если для Вас это проблема - то решайте это
> с владельцем того хоста, чтобы он не посылал Ваш сервер далеко, а
> просто возвращал ошибки на конкретные письма, которые ему не нравятся.

Вот вроде на одном языке разговариваем, а понять друг друга не можем (или сознательно не хотим, во что верить бы не хотелось)

Еще раз по порядку:
1. в SMTP не предусмотренно возможности сказать удаленному хосту - "отстань от меня со всеми сообщениями на часик, у меня голова болит, я устала"
2. Поэтому делать такие выводы, основываясь на проблеме доставки пары сообщений - это Ваша политика и ничего более

>
>> Мне кажется никто, т.к. это головная боль, и тут проще keep it simple
>> и не заниматся догатками
>
>
> Хм.
>

см выше п.2

>> Может мне в очередь попало письмо, которое вызывает core dump
>> форконутого процесса, который меня обслуживал? Да еще миллион
>> вариантов, например вчерашний пример из жизни с антиспам системой (не
>> самопальная далеко)
>
>
> Какой пример, какой дамп? Кстати, если дамп - то тем более не стоит
> долбиться. Правда, CGatePro письмо, на котором другой хост упал,
> немножко передвинет в очереди - но это так, в порядке гуманитарной
> помощи владельцам падающих хостов.

Пример был вчера, когда антиспам (Symantec Mail Security for MExchange) давал 550 в процессе приема сообщения (в процессе передачи DATA) и это воспринимается CGPro как broken. Сегодня глянув документацию к антиспаму (ftp://ftp.symantec.com/public/english_us_canada/products/sym_mail_security/5.0_mse/manuals/sms_imp_guide.pdf) у меня есть сомнения что там был разрыв tcp. Как только убрали Reject вся почта на хост ушла.

>
>>> В обоих случаях - это проблемы именно хоста. Долбиться в него еще
>>> раз - это, во-первых, нарываться на проблемы для принимающей стороны
>>> (они же бросили соединение, показав, что либо не хотят, либо не
>>> могут с Вами говорить), во-вторых - для себя - долбиться НЕПРЕРЫВАНО
>>> в хост, которые не может или не хочет говорить - это трата своих же
>>> ресурсов.
>>
>>
>> Не нужно просто очередь пер хост, у каждого сообщения своя судьба и
>> не будет тогда никакой траты ресурсов, если на все сообщения 450 или
>> еще бяка какая, то пускай валяются в очереди каждое со своим временем
>> повтора
>
>
> Каждое сообщение и так "само по себе". И нормально само по себе
> откладывается - по приему 4xx, например. А вот если проблемы с хостом,
> а не с письмом - как-то падение соединения, неправильные промпты,
> ответы на HELO, отсутствие соединеия - то откладывается вся очередь на
> хост. Это - разные задержки.

Задержки может и разные, только управляются одной настройкой.

>
>
>>>
>>> Помимо документации, есть такая вещь, как Logs. Пожалуйста,
>>> опубликуйте их здесь, чтобы показать, о какой именно проблеме Вы
>>> говорите. Я, например, не понимаю, что такое "заблокированный хост".
>>
>>
>> Ну по логам то ничего интересного, если нужно могу включить полную
>> дагностику
>>
>> 10:46:35.84 2 LIST [12552509] distributed to dron@comstar.ru (1
>> addresses, 0 removed) as [12552510]
>> 10:46:35.84 2 QUEUE([12552510]) from <kenji@dbzmail.com>, 9663 bytes
>> (<decb01c606cb$1aea61fe$cbb66b85@dbzmail.com>)
>> 10:46:35.84 2 ENQUEUER-01([12552510]) enqueued
>
>
> Не надо "полной диагностики". Какое отношение то, что Вы привели -
> имеет к описанной Вами проблеме? Вы же говорили о доставке по SMTP, не
> так ли?
>
>> сейчас Thu Dec 22 12:21:40 MSK 2005
>>
>> Если найти через монитор это сообщение, то статус Delayed, в очереди
>> 95 минут
>> если кликнуть на хост, то показываются все сообщения висящие на хост
>> в очереди, на половину из которых 450 (для этих получателей оно
>> действительно 450 и это правильно)
>> у хоста в Last Error стоит connection with ... is broken
>
>
> И что? Если сообщение получило 4xx, то оно ИНДИВИДУАЛЬНО отложилось на
> какое-то время. А если после этого хост упал - то отложилась вся очередь.

Хост не падал, выдержка из логов показывает что сообщение НЕ пыталось доставиться из-за broken на хост. Причин broken ни в логах, ни в monitors нет и никогда не было, и пытаться понять что там унутре решило заблокировать хост не представляется возможным. Та диагностика, которую выдает CGPro, говорит о том что хост broken из-за некторого количества 450, что может и не так. Если в логи кто нибудь напишет причину broken ВСЕМ станет легче.

>
> Там есть еще третий уровень. 4xx может быть выдан для сообщения (mail
> from, data, "."), а может - для конкретного RCPT TO. В последнем
> случае - откладываются определенные адреса, а не всё сообщение.
>
> Так что Вы попробуйте, пожалуйста, сначала понять - что у Вас там
> реально происходит (логи Вам в том помощники), потом решите,
> соответствует ли эта реальность Вашим ожиданиям, а если нет - то
> приведите, пожалуйста, подробно, эту реальность, а также Ваше видение
> того, где эта реальность расходится в Вашими ожиданиями поведения
> CGatePro в этой реальности.
>
То что у меня происходит я знаю, сидеть пол дня с tcpdump если честно большого желания нет и пытаться в очередной раз догадаться почему именно в этой ситуации возникли broken тоже. Если сможете предложить нормальный метод дигностики, то с удовольствием займусь.

P.S. Напомнить некую инсталяцию на некотором узле, где приходилось реллеить почту на крупные почтовые системы (hotmail, yahoo, mail.ru ) через отдельные smtp сервера исключая CGPro из-за broken? Может стоит наконец сделать настроечку в виде галочки?

-- 
Best regards,
                                          Maxim Cherniavsky
                                          Comstar-UTS, Internet Division
                                          mailto: maxim (at) comstar.ru 
Получено Thu Dec 22 12:52:29 2005

Этот архив был сгенерирован hypermail 2.1.8 : Fri 24 Apr 2015 - 16:14:36 MSK