3.5.4 linux cpu load

От: Sergei I. Golod <rover_at_mx_ru>
Дата: Sat 09 Feb 2002 - 11:11:18 MSK


Hello.

Вот и я в очередной раз поймал плюху с загрузкой процессора в 99% одним из тредов CGP. Сначала я подумал что это связано с переходом с 3.5.2 на 3.5.4, а теперь уже 3 раз это повторилось. Через /etc/../CommuniGatePro stop он не останавливается, приходится делать killall -9 CGServer. Но! После повторного запуска он начинает активно писать в логи и возникает ощущение, что именно тред связанный с ENQUEUER зависал. Вот пример(причем аналогичное было в дргугие разы):

13:01:54.35 0 SYSTEM server 3.5.4 started under Linux, open files limit=1024
13:01:54.35 0 SYSTEM process core dump limit=0M
13:01:54.37 2 DEQUEUER-01 processor started. n=1
13:01:54.43 2 DIRECTORY(Main) scanning unit schema
13:01:54.44 2 DIRECTORY(Main) scanning unit data
13:01:54.45 2 DIRECTORY(Main) data scanned, 337 records, 33 updates
13:01:54.52 2 DOMAIN(*) scanning account files
13:01:54.53 2 DOMAIN(*) finished scanning account files
13:01:54.62 2 POP accepting connections on port 110([0.0.0.0])
13:01:54.62 2 SYSTEM server tgpi.tob.ru initiated

Вот ниже он начинает:

13:01:54.62 2 ENQUEUER-01 processor started. n=1
13:01:54.62 2 ENQUEUER-01 submitting old Queue files. nFiles=47
13:01:54.62 2 ENQUEUER-01([760171]) enqueued
13:01:54.62 2 ENQUEUER-01([760168]) enqueued
13:01:54.62 2 ENQUEUER-01([760130]) enqueued
13:01:54.62 2 MAILBOX(s01050/INBOX) {70} appended: 72+31+1134 bytes
13:01:54.62 2 MAILBOX(s01050/INBOX) [760171] stored as 70
13:01:54.62 2 ACCOUNT(s01050) [760171] delivered
13:01:54.62 2 DEQUEUER [760171] LOCAL(s01050) delivered
13:01:54.62 2 QUEUE([760171]) deleted
13:01:54.62 2 ENQUEUER-01([760128]) enqueued
13:01:54.66 2 ENQUEUER-01([760102]) enqueued
13:01:54.68 2 ENQUEUER-01([760129]) enqueued
13:01:54.70 2 ENQUEUER-01([760127]) enqueued
13:01:54.71 2 ENQUEUER-01([760126]) enqueued
13:01:54.73 2 ENQUEUER-01([760131]) enqueued
13:01:54.73 2 MAILBOX(sergey/CityCat) {969} appended: 75+34+15948 bytes
13:01:54.73 2 MAILBOX(sergey/CityCat) [760168] stored as 969
13:01:54.73 2 ENQUEUER-01([760132]) enqueued
13:01:54.73 2 LOCALRULES(sergey) [760168] rule(2) message stored in
'/CityCat'
13:01:54.73 2 LOCALRULES(sergey) [760168] rule(2) discarded the message
13:01:54.73 2 ACCOUNT(sergey) [760168] delivered
13:01:54.73 2 DEQUEUER [760168] LOCAL(sergey) delivered
13:01:54.73 2 QUEUE([760168]) deleted
13:01:54.74 2 ENQUEUER-01([760134]) enqueued
13:01:54.78 2 ENQUEUER-01([760136]) enqueued
13:01:54.78 2 ENQUEUER-01([760137]) enqueued
13:01:54.78 1 MAILBOX(s97166/INBOX) BSD mailbox size info (203212) is
incorrect. Real size is 156392.
13:01:54.78 3 MAILBOX(s97166/INBOX) mailbox info is damaged. nMessages=16,size=203212,nextUID=138
13:01:54.78 2 ENQUEUER-01([760133]) enqueued 13:01:54.80 2 ENQUEUER-01([760138]) enqueued

И так дальше, пока всю очередь не разберет. Если подскажете как получить коредамп у такого подвисшего треда(а не упавшего CGP), то я попробую. strace -p PID_треда_с_99% ничего не дает и не выводит.

Сергей. Получено Sat Feb 09 08:11:20 2002

Этот архив был сгенерирован hypermail 2.1.8 : Fri 24 Apr 2015 - 16:12:11 MSK