COMAR - Computer Art Technology
На главную


Руководство

Установка

Конфиг. файл

Принципиальная схема

Лицензия

FAQ


Статьи

Ссылки

 

 

Опрос
Откуда узнали о нас
Журнал "СисАдмин"
Журнал "Хакер"
Журнал "Компьютерра"
Портал "OpenNET"
Поисковик
От знакомых
Другие источники

 computer art программные и аппаратные разработки
icq 283175359 8-499-502-02-99 
 

FAQ
Watchdog - FAQ

Зачем нужен Watchdog, если у нас и так надежный сервер?

Watchdog - это последняя линия обороны в борьбе за выживание сервера. Это средство повышения отказоустойчивости сервера.

Если Вы сделали все, что могли, чтобы сервер работал надежно, все равно трудно предусмотреть все. Всегда есть вероятность, что сервер войдет в какое-то состояние, из которого его можно вывести только перезапуском.

Если Вы не умываете руки в этой ситуации, списывая все на непредвиденные обстоятельства, а хотите и в этой ситуации снизить риск отказа сервера, - то Watchdog как раз то, что Вам нужно.

Может ли он работать с такой-то операционной системой / ядром?

В данный момент Watchdog может управляться сервером, на котором стоит

  • Linux/FreeBSD (должен работать также на любом Unix, версия значения не имеет),
  • Windows 2000 (должен работать также со всей линейкой: Windows NT, Windows XP, Windows 2003).

Windows версия ПО для Watchdog-а поставляется в виде дистрибутива c инсталлятором, после установки которого ПО готово к работе.

Для всех платформ (и Unix, и Windows), Вы можете использовать дистрибутив, содержащий исходники и документацию.

Исходники написаны на C++ / C вполне переносимо. Должны компилироваться на любой Unix платформе, содержащей C компилятор и C++ для Windows . Реально они компилировались под Linux, FreeBSD и Windows 2000.

Если у Вас другой вариант Unix, попробуйте скомпилировать исходники, скорее всего все будет нормально. В любом случае, пожалуйста, сообщите результат.

Не получится ли, что Watchdog заперезапускает сервер до смерти, перезапустит нормально работающий сервер или сделает еще что-то плохое?

Да это возможно... если это не наш Watchdog ;), или если он неправильно настроен. Наш watchdog имеет гибкие настройки, что бы обойти все подводные камни. В конфигурационном файле по умолчанию все настроено вполне безопасно. Нужно только внимательно прочитать руководство по установке.

Ниже примеры некоторых потенциально опасных ситуаций.

Например сервер "заклинило", Watchdog его перезапустил, а он все равно не заработал, даже признаков жизни не подал. Тут важно не замучить сервер постоянными перезапусками не дающими результата. Для этого (настройки по умолчанию), после третьей безуспешной попытки его перезапустить, Watchdog резко снизит паузу между попытками (с 5 минут по умолчанию до 30 мин).

Другой пример: сервер при перезагрузке обнаружил сильные повреждения файловой системы и остановился для вмешательства администратора. Проверка диска помечается как так называемая "мертвая зона": пока сервер находится в ней, Watchdog блокируется. Причем блокировка пишется в EEPROM, поэтому даже сбой питания ее не снимет. Когда сервер успешно заканчивает проверку/лечение - блокировка снимается. Как пометить "мертвую зону" - написано в руководстве по установке и руководстве пользователя.

Зачем Watchdog, когда есть UPS?

У UPS и Watchdog разные, хоть и связанные задачи: UPC поддерживает питание, а Watchdog помогает восстановить работоспособность сервера, если с ним что-то случилось. Часто он позволяет отказаться от дежурства возле сервера.

Можно ли изменить поведение Watchdog, например, метод проверки работоспособности сервера?

Да, серверный софт для устройства поставляется с исходниками. Unix версия написана на языке С, Windows на C++. Вы можете что-то изменить. Например чтобы изменить проверку работоспособности сервера, надо просто переписать функцию check_server в файле chk_srv.cc.

Зачем Watchdog-у быть таким сложным и дорогим?

Это можно понять, ответив на некоторые вопросы, которые нам задавали покупатели.

****
А что будет, если с сервером что-то случилось, и во время перезагрузки, устроенной Watchdog-ом, он снова повиснет. И будет делать так каждый раз, в ответ на каждый перезапуск его Watchdog-ом.

Понятно, что это проблема такая, что решить ее может только человек, но что будет с сервером после, например, двух суток перезагрузок через каждые 5 мин. Возможно, Watchdog сам станет проблемой, причем более серьезной, чем та, что он решал.

****
А что будет, если программа на сервере, сигнализирующая Watchdog-у, работает, а все остальное, - нет. Ситуация-то обычная: сервер, который, например, откликается на ping и, тем не менее, практически мертвый, - обычное дело. В таком случае Watchdog будет думать, что с сервером все в порядке. Нельзя ли проверять как-то работоспособность сервера, а не просто судить об этом по тому, откликается программа или нет.

****
А можно ли, придя на работу в понедельник, получить протокол действий Watchdog-а. Например, я вижу по логам на сервере, что он был в дауне несколько часов. Но я не знаю, почему. Могу я узнать, пытался ли Watchdog его запускать, и кто в конце концов его завел? В общем, хочется знать, что делал Watchdog, пока меня не было. Разумеется, с указанием времени. Да, и кстати, время будет правильным после временного отключения электричества?

****
А что будет, если сервер после перегрузки его Watchdog-ом на проверке диска, выдаст сообщение, что есть серьезные ошибки и подайте ему админа человека. Watchdog так и будет перезапускать его как идиот, добивая и без того сбойный диск?

****
А нельзя ли сделать, что после какого-то количества не успешных перезапусков пауза между попытками перезапуска была больше? Это, возможно, снизит лишние перезапуски и не так задергает сервер.

****
А всю эту навороченную автоматику можно отключать, если надо? А то часто автоматика становится вредной и опасной, если администратор не может вмешаться в логику ее работы.

****
А серверная программа пишет все, что происходит в логи? И можно ли менять детализацию логов?

****
А у меня ATX-корпус, который ни в какую не заводится после прерывания питания. Ваш Watchdog может нажать кнопку "Power"?

****
А ваш Watchdog перезапускает сервер, отключая у него питание на время? А можно сделать, чтобы он мог "Reset" вместо этого нажимать?

****
А ваш Watchdog перезапускает сервер, нажимая "Reset"? А ведь это бывает не помогает, сам видел компьютер, переклиненный так, что помогло только полное выключение питания.

****
А можно по внешнему виду Watchdog-а понять, что сейчас происходит. Есть какая-то индикация?

****
Все-таки боязно как-то применять такие крутые меры автоматически, нет ли каких-то подводных камней?

Проблемы, затронутые во всех вопросах, кроме последнего, - нами решены. Над последней проблемой мы постоянно работаем.

Чем отличаются Watchdog Pro и Watchdog Lite, какой мне выбрать?

Главные различия между Watchdog Pro и Watchdog Lite описаны в руководстве, вот тут.


ВОПРОСЫ, КОТОРЫЕ НАМ НЕ ЗАДАВАЛИ НИ РАЗУ:

А нет ли разных цветовых вариантов исполнения?

А нельзя ли сделать совсем простое и тупое устройство? Пусть оно будет опасно для сервера, но нам нужно дешевле.

На все эти вопросы мы может твердо ответить, - нет.


 

Тел: 8-499-502-02-99 (г. Москва), email: info@comar.ru, icq: 283175359.


Rambler's Top100