<div dir="ltr">Hello,<div>sometimes one could be in need to keep hypervisor up (CentOS 7.2 in my case) but with all ovirt releated services stopped.</div><div><br></div><div>I see that sanlock and wdmd systemd units are bot part of sanlock rpm package.</div><div><br></div><div>In these cases, having only one single host in a lab environment, I follow this comment by Joop </div><div><a href="http://lists.ovirt.org/pipermail/users/2016-June/040214.html">http://lists.ovirt.org/pipermail/users/2016-June/040214.html</a><br></div><div><br></div><div>So, I stop all a VMs, put env in global maintenance and then on host:</div><div>systemctl stop ovirt-ha-agent<br></div><div><div>systemctl stop ovirt-ha-broker</div><div><br></div><div>shutdown engine vm</div><div><br></div><div>On host again:</div><div>systemctl stop vdsmd</div><div>systemctl stop sanlock.service</div></div><div><br></div><div>At this point sometimes I can work, sometimes after some minutes the host restarts itself, I presume due to wdmd</div><div><br></div><div>In fact I see in messages:</div><div><div>Jul  4 17:05:47 ractor wdmd[1258]: test failed rem 26 now 804 ping 760 close 770 renewal 697 expire 777 client 1285 sanlock_2025c2ea-6205-4bc1-b29d-745b47f8f806:1</div><div>Jul  4 17:05:48 ractor wdmd[1258]: test failed rem 25 now 805 ping 760 close 770 renewal 697 expire 777 client 1285 sanlock_2025c2ea-6205-4bc1-b29d-745b47f8f806:1</div><div>Jul  4 17:05:49 ractor wdmd[1258]: test failed rem 24 now 806 ping 760 close 770 renewal 697 expire 777 client 1285 sanlock_2025c2ea-6205-4bc1-b29d-745b47f8f806:1</div><div>Jul  4 17:05:50 ractor wdmd[1258]: test failed rem 23 now 807 ping 760 close 770 renewal 697 expire 777 client 1285 sanlock_2025c2ea-6205-4bc1-b29d-745b47f8f806:1</div><div>Jul  4 17:05:51 ractor wdmd[1258]: test failed rem 22 now 808 ping 760 close 770 renewal 697 expire 777 client 1285 sanlock_2025c2ea-6205-4bc1-b29d-745b47f8f806:1</div><div>Jul  4 17:05:51 ractor systemd[1]: wdmd.service stop-sigterm timed out. Killing.</div><div>Jul  4 17:05:51 ractor systemd[1]: wdmd.service: main process exited, code=killed, status=9/KILL</div><div>Jul  4 17:05:51 ractor systemd[1]: Stopped Watchdog Multiplexing Daemon.</div><div>Jul  4 17:05:51 ractor systemd[1]: Unit wdmd.service entered failed state.</div><div>Jul  4 17:05:51 ractor systemd[1]: wdmd.service failed.</div></div><div><br></div><div>In systemd unit file for sanlock: </div><div><div>[Unit]</div><div>Description=Shared Storage Lease Manager</div><div>After=syslog.target</div><div>Wants=wdmd.service</div></div><div><br></div><div>Nothing special instead for wdmd.</div><div>I tried also to stop it but server still rebooted.</div><div>Also, it seems to me that sometimes sanlock is ale to stop, someties exits with &quot;failed&quot;.</div><div><br></div><div>So the question is if wdmd is able to be stopped or if it is the same behavior of old watchdogd on Linux</div><div><br></div><div>Thanks in advance,</div><div>Gianluca</div><div><br></div></div>