<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 29, 2015 at 2:52 PM, Robert Story <span dir="ltr">&lt;<a href="mailto:rstory@tislabs.com" target="_blank">rstory@tislabs.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Thu, 29 Oct 2015 14:08:22 +0100 Simone wrote:<br>
ST&gt; it seams that two hosts are fighting fir the same host ID:<br>
ST&gt;<br>
ST&gt; MainThread::INFO::2015-10-27<br>
ST&gt; 09:14:56,764::hosted_engine::562::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_sanlock)<br>
ST&gt; Ensuring lease for lockspace hosted-engine, host id 1 is acquired (file:<br>
ST&gt; /var/run/vdsm/storage/2daba0ab-2b3d-4026-bcfc-1cd071c30038/04b08c8e-657f-4bac-9ddf-c9c57373409c/2d7f5020-42c1-442d-8237-fba9d6787080)<br>
ST&gt; MainThread::ERROR::2015-10-27<br>
ST&gt; 09:14:56,766::hosted_engine::578::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_sanlock)<br>
ST&gt; cannot get lock on host id 1: host already holds lock on a different<br>
ST&gt; host id MainThread::ERROR::2015-10-27<br>
ST&gt; 09:14:56,767::agent::177::ovirt_hosted_engine_ha.agent.agent.Agent::(_run_agent)<br>
ST&gt; Error: &#39;(22, &#39;Sanlock lockspace add failure&#39;, &#39;Invalid argument&#39;)&#39; -<br>
ST&gt; trying to restart agent<br>
ST&gt;<br>
ST&gt; can you please share the output of: hosted-engine --vm-status<br>
<br>
Hi Simone, thanks for taking the time to look at this. Here is the outpu:<br>
<br>
<br>
# hosted-engine --vm-status<br>
<br>
!! Cluster is in GLOBAL MAINTENANCE mode !!<br>
<br>
--== Host 1 status ==--<br>
Status up-to-date                  : False<br>
Hostname                           : ares.netsec<br>
Host ID                            : 1<br>
Engine status                      : unknown stale-data<br>
Score                              : 2334<br>
Local maintenance                  : False<br>
Host timestamp                     : 2496391<br>
Extra metadata (valid at timestamp):<br>
        metadata_parse_version=1<br>
        metadata_feature_version=1<br>
        timestamp=2496391 (Tue Oct 27 07:41:00 2015)<br>
        host-id=1<br>
        score=2334<br>
        maintenance=False<br>
        state=EngineUp<br>
<br>
<br>
--== Host 2 status ==--<br>
Status up-to-date                  : False<br>
Hostname                           : hera.netsec<br>
Host ID                            : 2<br>
Engine status                      : unknown stale-data<br>
Score                              : 1689<br>
Local maintenance                  : False<br>
Host timestamp                     : 2038037<br>
Extra metadata (valid at timestamp):<br>
        metadata_parse_version=1<br>
        metadata_feature_version=1<br>
        timestamp=2038037 (Mon Oct 26 08:50:13 2015)<br>
        host-id=2<br>
        score=1689<br>
        maintenance=False<br>
        state=EngineDown<br>
<br>
<br>
--== Host 3 status ==--<br>
Status up-to-date                  : False<br>
Hostname                           : eclipse.netsec<br>
Host ID                            : 3<br>
Engine status                      : unknown stale-data<br>
Score                              : 2000<br>
Local maintenance                  : False<br>
Host timestamp                     : 2298393<br>
Extra metadata (valid at timestamp):<br>
        metadata_parse_version=1<br>
        metadata_feature_version=1<br>
        timestamp=2298393 (Thu Oct 29 09:46:21 2015)<br>
        host-id=3<br>
        score=2000<br>
        maintenance=False<br>
        state=GlobalMaintenance<br>
<br>
<br>
--== Host 4 status ==--<br>
Status up-to-date                  : False<br>
Hostname                           : poseidon.netsec<br>
Host ID                            : 4<br>
Engine status                      : unknown stale-data<br>
Score                              : 2000<br>
Local maintenance                  : False<br>
Host timestamp                     : 123241<br>
Extra metadata (valid at timestamp):<br>
        metadata_parse_version=1<br>
        metadata_feature_version=1<br>
        timestamp=123241 (Thu Oct 29 09:46:30 2015)<br>
        host-id=4<br>
        score=2000<br>
        maintenance=False<br>
        state=GlobalMaintenance<br>
<br>
<br>
--== Host 5 status ==--<br>
Status up-to-date                  : False<br>
Hostname                           : apollo.netsec<br>
Host ID                            : 5<br>
Engine status                      : unknown stale-data<br>
Score                              : 2000<br>
Local maintenance                  : False<br>
Host timestamp                     : 2028116<br>
Extra metadata (valid at timestamp):<br>
        metadata_parse_version=1<br>
        metadata_feature_version=1<br>
        timestamp=2028116 (Mon Oct 26 04:14:46 2015)<br>
        host-id=5<br>
        score=2000<br>
        maintenance=False<br>
        state=EngineDown<br>
<div class="HOEnZb"><div class="h5"><br></div></div></blockquote><div><br></div><div>Here the host IDs seam coherent.</div><div>Can you please specify the name of the hosts where you took the logs in your first log archive (complaining host and engine host) ? </div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">
<br>
<br>
Robert<br>
<br>
--<br>
Senior Software Engineer @ Parsons<br>
</div></div></blockquote></div><br></div></div>