<div dir="ltr"><div>thanks a lot for your help!<br><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016-12-13 12:07 GMT-03:00 Yedidyah Bar David <span dir="ltr">&lt;<a href="mailto:didi@redhat.com" target="_blank">didi@redhat.com</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Tue, Dec 13, 2016 at 4:58 PM, Juan Pablo &lt;<a href="mailto:pablo.localhost@gmail.com">pablo.localhost@gmail.com</a>&gt; wrote:<br>
&gt; thanks for pointing me on the right direction , I have this line a couple of<br>
&gt; minutes before the vm restart<br>
&gt; &quot;:states::128::ovirt_hosted_<wbr>engine_ha.agent.hosted_engine.<wbr>HostedEngine::(score)<br>
&gt; Penalizing score by 1600 due to gateway status&quot;<br>
&gt; so looks like this is causing:<br>
&gt; states::413::ovirt_hosted_<wbr>engine_ha.agent.hosted_engine.<wbr>HostedEngine::(consume)<br>
&gt; Host virt01-int.xxxx.xxxxxx (id 1) score is significantly better than local<br>
&gt; score, shutting down VM on this host<br>
&gt; is this a network related issue? hosted engine and hosts are on the same<br>
&gt; vlan, does a gateway check should be triggering a hosted engine shutdown?<br>
<br>
</span>Seems so.<br>
<br>
ping to the gateway is an important test, because if it fails it might<br>
mean a split-brain.<br>
When you are asked about a &#39;gateway address&#39;, it&#39;s actually used only for that.<br>
It does not need to be your gateway, but it does need to be a very<br>
reliable thing that should always reply.<br>
<br>
Best,<br>
<div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt;<br>
&gt; thanks!<br>
&gt; JP<br>
&gt;<br>
&gt; 2016-12-13 11:37 GMT-03:00 Yedidyah Bar David &lt;<a href="mailto:didi@redhat.com">didi@redhat.com</a>&gt;:<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Dec 13, 2016 at 4:34 PM, Juan Pablo &lt;<a href="mailto:pablo.localhost@gmail.com">pablo.localhost@gmail.com</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt; &gt; Hi guys,<br>
&gt;&gt; &gt; I have ovirt 4.0.5 with 3 hosts and 1 storage setup, using iscsi for<br>
&gt;&gt; &gt; data<br>
&gt;&gt; &gt; and nfs for hosted engine storage.<br>
&gt;&gt; &gt; storage network is on a private vlan.<br>
&gt;&gt; &gt; sometimes I see ETL service stopped / ETL service started in the events<br>
&gt;&gt; &gt; log,<br>
&gt;&gt; &gt; side by side with a hosted engine stop/start...<br>
&gt;&gt; &gt; also, sometimes I get kicked out of the admin portal with no reason<br>
&gt;&gt; &gt; I had another issue which was related to<br>
&gt;&gt; &gt; <a href="https://bugzilla.redhat.com/show_bug.cgi?id=1349829" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/<wbr>show_bug.cgi?id=1349829</a> but looks like it&#39;s<br>
&gt;&gt; &gt; harmless so maybe Im not seeing the problem.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; can you please guide me on finding the issue here?<br>
&gt;&gt;<br>
&gt;&gt; You should start by checking: /var/log/ovirt-hosted-engine-<wbr>ha/agent.log.<br>
&gt;&gt;<br>
&gt;&gt; Best,<br>
&gt;&gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; best regards,<br>
&gt;&gt; &gt; JP<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ______________________________<wbr>_________________<br>
&gt;&gt; &gt; Users mailing list<br>
&gt;&gt; &gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt; <a href="http://lists.phx.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.phx.ovirt.org/<wbr>mailman/listinfo/users</a><br>
&gt;&gt; &gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Didi<br>
&gt;<br>
&gt;<br>
<br>
<br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
Didi<br>
</font></span></blockquote></div><br></div>