Balancer> О! Летом настроил на нескольких серверах мониторинг параметров через Munin. Сейчас смотрю — с АвиаПорта сообщение в почту «No space left…» Ночью зевнул ошибку и в /var/www/logs за несколько часов улетело 17Гб места. Успел почистить и исправить ошибку Надо, что ли, рассылку на SMS для критических параметров присобачить…// Транслировано с juick.com
С рассылкой СМС у нас на работе используется самописная система.
Архитектура достаточно примитивная - есть сервер мониторинга (где живут все конфигурации, и где прицеплен сотовый модем) и есть хренова тонна очень тупых по устройству "датчиков", которые все что умеют - ответить "нормально" или "ненормально, проблема с ....".
На сервере настроена частота опроса датчиков и время реакции (типа, если была ненормальная нагрузка на ЦП на сервере 15 секунд, а потом пропала - ругаться рано, а вот если место кончилось - ругаться надо сразу).
Как датчик сработал и не починился за указанное время (или не ответил на запрос) - всем причастным идет уведомление по СМС.