Jump to content

Recommended Posts

Здравствуйте!

Возникла следующая неприятная ситуация:

Пару недель назад «сбойнул» один из координаторов failover-ной связки. По данной проблеме было зарегистрировано обращение в техподдержку, отправлены все необходимые данные, но… все рекомендации не привели к положительному результату. Было принято решение о установке координатора заново: установлен дистрибутив SUSE (такой же, как и на второй, работоспособной ноде); установлено ПО ViPNet Coordinator Linux; расшит актуальный dst; скорректирован файл failover.ini… Казалось бы, всё делаю, как обычно… НО(!)

… На первом сервере (S1) failover запущен в активном режиме. Соединяем файловерные интерфейсы, запускаем второй координатор (S2)… он стартует в пассивном режиме (при проверке на S1 командой failover info выводится верная информация о том, что S1 – активный, а S2 – пассивный). Примерно через 40 секунд S2 (по непонятным мне причинам) занимает ip-адрес кластера (который УЖЕ принадлежит S1). После этого S2 «понимает», что такой ip в сети уже есть и уходит в перезагрузку. И так – циклично. При этом, S1 остаётся работоспособным (как и ЧАСТЬ клиентов, находящихся в сети; оставшиеся клиенты перестают работать до момента перезагрузки S1 (при условии, что S2 либо выключен полностью, либо на нём отключен режим failover-а)).

Вопрос: не сталкивались ли вы с чем-то подобным? Возможно, натолкнёте на решение…

p.s. S1 и S2 имеют по 2 интерфейса (eth0 – СПД, eth1 – failover); друг друга пингуют, видны по arp; testip доступен для каждого координатора; файловерные интерфейсы в 4-м режиме, остальные во 2-м. Версия координатора: 3.7.4-4464.

Если необходимы ещё какие-то данные, спрашивайте, постараюсь прояснить ситуацию.

Share this post


Link to post
Share on other sites

failover.ini S1:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.11

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.12

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

failover.ini S2:

[network]

checktime = 10

timeout = 2

activeretries = 6

channelretries = 6

synctime = 5

fastdown = yes

[channel]

device = eth0

ident = iface-0

activeip = 10.XX.76.8

passiveip = 10.XX.76.12

testip = 10.XX.76.1

checkonlyidle = yes

[sendconfig]

activeip = 192.168.200.11

sendtime = 60

device = eth1

config = yes

keys = yes

journals = yes

port = 10090

[misc]

activeconfig = /etc/iplirpsw

passiveconfig = /etc/iplirpsw

maxjournal = 30 #days

reboot = no

[debug]

debuglevel = 3

debuglogfile = file:/var/log/failover.debug.log

[events]

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×

Important Information

By using this site, you agree to our Terms of Use.