Site downtime
Макс ИщенкоОпубликовано 30.05.2008 в Новости сайта
Сегодня целый день, с 8 аж до 15 сайт девелоперз “лежал”. Как обычно и бывает, именно в этот день, вся команда разработчиков оказалась в разъеде и никто не мог быстро сайт поднять.
Оказалось, что на сервере кончилось свободное дисковое пространство и соотв все “встало”. Позор, нам, позор. Ни автомониторилики свободного места у нас не используется (хотя тикет висит уже месяцев 5), ни админа “живого” тоже нет, который мог бы чего-то предпринять по своей инициативе. В итоге получили даун-тайм на целый день. ;(
Будем исправляться, извините за неудобства.
Понравилась статья? Подпишись на обновления по RSS/E-mail




(1 голосов, средний: 4 из 5)
Nagios вам в помощь
nagios не для этого писался, не для 1 сервера%)
такие вещи простым скриптом реализуются + крон
Такие вещи реализованы в monit несколько надёжнее (особенно если майлсервером ему дать что-то нелокальное, чтоб по ступору локального спула алерт не пропал).
Совершенно случайно эта полезная ещё по многим параметрам штуковина потихоньку интегрируется в серверные пакеты ALT Linux, не говоря о том, что стоит у меня на всех серверах и серверных контейнерах
PS: можно попробовать обменяться “аварийными” логинами (в конвертиках или иным эквивалентным механизмом) для взаимовыручки — у меня когда-то тоже подобное разъезжание случилось…
er… monit
Линк на главной странице говорит
“Объяснение за недоступность сайта 30-го мая.”
Так писать неверно. Лучше
“Объяснение причин недоступности сайта 30-го мая.”
Вообще я конечно же люблю написать какую-нибудь едкую критику, но тут ни к чему не придраться!