Перейти к контенту

Рекомендуемые сообщения

Здравствуйте!

Возникла следующая неприятная ситуация:

Пару недель назад «сбойнул» один из координаторов failover-ной связки. По данной проблеме было зарегистрировано обращение в техподдержку, отправлены все необходимые данные, но… все рекомендации не привели к положительному результату. Было принято решение о установке координатора заново: установлен дистрибутив SUSE (такой же, как и на второй, работоспособной ноде); установлено ПО ViPNet Coordinator Linux; расшит актуальный dst; скорректирован файл failover.ini… Казалось бы, всё делаю, как обычно… НО(!)

… На первом сервере (S1) failover запущен в активном режиме. Соединяем файловерные интерфейсы, запускаем второй координатор (S2)… он стартует в пассивном режиме (при проверке на S1 командой failover info выводится верная информация о том, что S1 – активный, а S2 – пассивный). Примерно через 40 секунд S2 (по непонятным мне причинам) занимает ip-адрес кластера (который УЖЕ принадлежит S1). После этого S2 «понимает», что такой ip в сети уже есть и уходит в перезагрузку. И так – циклично. При этом, S1 остаётся работоспособным (как и ЧАСТЬ клиентов, находящихся в сети; оставшиеся клиенты перестают работать до момента перезагрузки S1 (при условии, что S2 либо выключен полностью, либо на нём отключен режим failover-а)).

Вопрос: не сталкивались ли вы с чем-то подобным? Возможно, натолкнёте на решение…

p.s. S1 и S2 имеют по 2 интерфейса (eth0 – СПД, eth1 – failover); друг друга пингуют, видны по arp; testip доступен для каждого координатора; файловерные интерфейсы в 4-м режиме, остальные во 2-м. Версия координатора: 3.7.4-4464.

Если необходимы ещё какие-то данные, спрашивайте, постараюсь прояснить ситуацию.

Ссылка на комментарий
Поделиться на других сайтах

failover.ini S1:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.11

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.12

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

failover.ini S2:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.12

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.11

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

Ссылка на комментарий
Поделиться на других сайтах

Присоединиться к обсуждению

Вы можете ответить сейчас, а зарегистрироваться позже. Если у вас уже есть аккаунт, войдите, чтобы ответить от своего имени.

Гость
Ответить в этой теме...

×   Вы вставили отформатированный текст.   Удалить форматирование

  Допустимо не более 75 смайлов.

×   Ваша ссылка была автоматически заменена на медиа-контент.   Отображать как ссылку

×   Ваши публикации восстановлены.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...

Важная информация

Продолжая пользоваться сайтом вы принимаете Условия использования.