Jump to content

Recommended Posts

Здравствуйте!

Возникла следующая неприятная ситуация:

Пару недель назад «сбойнул» один из координаторов failover-ной связки. По данной проблеме было зарегистрировано обращение в техподдержку, отправлены все необходимые данные, но… все рекомендации не привели к положительному результату. Было принято решение о установке координатора заново: установлен дистрибутив SUSE (такой же, как и на второй, работоспособной ноде); установлено ПО ViPNet Coordinator Linux; расшит актуальный dst; скорректирован файл failover.ini… Казалось бы, всё делаю, как обычно… НО(!)

… На первом сервере (S1) failover запущен в активном режиме. Соединяем файловерные интерфейсы, запускаем второй координатор (S2)… он стартует в пассивном режиме (при проверке на S1 командой failover info выводится верная информация о том, что S1 – активный, а S2 – пассивный). Примерно через 40 секунд S2 (по непонятным мне причинам) занимает ip-адрес кластера (который УЖЕ принадлежит S1). После этого S2 «понимает», что такой ip в сети уже есть и уходит в перезагрузку. И так – циклично. При этом, S1 остаётся работоспособным (как и ЧАСТЬ клиентов, находящихся в сети; оставшиеся клиенты перестают работать до момента перезагрузки S1 (при условии, что S2 либо выключен полностью, либо на нём отключен режим failover-а)).

Вопрос: не сталкивались ли вы с чем-то подобным? Возможно, натолкнёте на решение…

p.s. S1 и S2 имеют по 2 интерфейса (eth0 – СПД, eth1 – failover); друг друга пингуют, видны по arp; testip доступен для каждого координатора; файловерные интерфейсы в 4-м режиме, остальные во 2-м. Версия координатора: 3.7.4-4464.

Если необходимы ещё какие-то данные, спрашивайте, постараюсь прояснить ситуацию.

Share this post


Link to post
Share on other sites

failover.ini S1:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.11

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.12

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

failover.ini S2:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.12

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.11

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Create New...

Important Information

By using this site, you agree to our Terms of Use.