Re: Проблем със съврвър...
Това ми е мнооого познат проблем. Доста често в 4.00 ам се изпълняват скриптовете от /etc/cron.daily Преди време имах такъв проблем със сдухващ се диск и updatedb скрипта (ако не ме лъже паметта /etc/cron.daily/slocate) Погледни си ежедневните скриптове, пусни всеки един от тях на ръка и като забие, можеш относително лесно да определиш проблема. Ако има проблеми, пиши.
Re: Проблем със съврвър...
Нещо повече в логовете има ли ?
/var/log/messages
apache-то ...
Re: Проблем със съврвър...
Най-напред е желателно както спомена fori да се прегледат cron сценариите
После да се провери за достатъчно свободно място на дисковете
И да се прегледат логовете
1. /var/log/messages
2. логовете на apache, ако са зададени специално, то това е описано в /etc/apache/httpd.conf,
а именно ErrorLog /var/log/apache/error_log
3. логовете на postgress се задават във /etc/postgres/postgresql.conf
Какво означава "сървъра пада" - kernel panic, reboot или нещо друго ?
/off-topic
Според мен е необичайно сървър на linux да пада регулярно, още повече че, повечето от посочените services не изискват root права за изпълнение и имам чувството, че проблема може се дължи на service със ескалирани или неправилно зададни права.
Re: Проблем със съврвър...
Без да се заяждам уважаеми г-н klamer, но
1. Опианите до вас пътища не са баш като федорските
2. Умирането на една линукска машина е неприятен ефект, който на пръв поглед трудно се диагностицира, имайки предвид че при конзолен режим, монитора се гаси след няколко минти неактивност и при паникьосал се келнер, няма как да се види каквото и да е на монитора.
Падането на сървъра най-вероятно не е падане на пода, съдейки по контекста най-вероятно машината фризва.
Re: Проблем със съврвър...
1. Дължа извинение за пътищата: дадените от мен са валидни за slackware, OpenBSD и доколкото си спомням по-старите версии на RedHat(преди 6.x) и FreeBSD.
2. При FreeBSD/OpenBSD има savecore и memdump които запазват някои данни при kernel panic, при debian има LKCD, а при solaris има netdump. Aко някое от тези е достъпно за fedora би могло да се види кой точно процес (или според мен модул) предизиква "фрийзването".
BTW има един начин да се накара linux сървъра да рестартира при panic, което ако работи би било едно временно решение на проблема. Например за reboot след 30 секунди
# echo "30" > /proc/sys/kernel/panic
или като параметър на ядрото при зареждане panic=30
Може да е добра идея да се разреши dump при kernel panic, но във linux аз не съм правил такова нещо. Има един параметър alwaysdump, който би трябвало да разрешава dump-а, но не го съм ползвал и нямам наблюдения как точно се държи.
Re: Проблем със съврвър...
Проверих тези неща. Като цяло няма никакви грешки... само при този скрипт slocate.cron, когато се опитам да го пусна на ръка почва да се изпълнява и имам чувството, че забива и неможе да се изпълни. Изчаках доста време но нямаше промяна. Като цяло под падане на сървъра имам в предвид апачетата да забият и сайтовете да спрат да работят, както и мейл сървъра. Има нещо което страшно много лагва сървъра в един момент, че просто тотално забива. Редовно всяка сутрин си забива ...
Може би правата на нещо някъде си са объркани? Не са роот , а с някакви други примерно? Просто нямам ни най-малка представа.
Дори предлагам срещу заплащане, който може да го оправи да се свърже с мен, защото аз лично неможах да го оправя, а ми е важно. Доста неприятно е да пада постоянно сървъра.
Ако има някой, който има желание нека да се свърже с мен по ICQ или е-мейл.
Благодаря.
Re: Проблем със съврвър...
Не искам да го казвам, но май оправих проблемите от които идваше забиването на сървъра. Като цяло в дейли скриптовете имам един скрипт pgsq_vacuum, който си прави вакуум на всичките бази всяка сутрин. Когато обаче стигне базата на магазините която има близо 230 мб само статистики (милиони записи с цъкания по сайта, сесии и т.н.) скрипта увисва и сървъра забива :). Като цяло спрях и слокейта защото и той правеше проблеми.
Написах си и един скрипт, койт сложих с hourly скриптовете, който да чисти кешовете на сайтовете без да се задръства. Рестартира апача, чисти кеша, пуска апача отново. Става за около 10 сек. Мисля, че не е проблем това да става всеки час. Така е и по - добре. Лошото е обаче е uptime-a ми е малко висок, което ме притеснява като цяло. РАМ-а ми е само 768 мб на единия сървър и почти не остава тъйкато само мейл сървъра се ползва от много клиенти. Дали още 1 гб ще стигне или да поръчам направо 2 Гб?
Re: Проблем със съврвър...
Имайки предвид оптимизациите в ползването на паметта, се исползва приципа на мечо пух - колкото повече, толкова повече. Я сподели малко инфо на тема как точно правиш вакум на таблиците на постгрето?
Re: Проблем със съврвър...
Като цяло в скрипта се изпълнява следното
#!/bin/bash
su -l postgres -c "/usr/bin/vacuumdb -a -f -z"
А до колкото мисля този вакуум в /бин си върви с постгрес заедно.