<div dir="ltr"><div>Do you have power management configured?<br></div>Was the &quot;failed&quot; host fenced/rebooted?<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Apr 4, 2014 at 2:21 PM, Koen Vanoppen <span dir="ltr">&lt;<a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div dir="ltr"><div><div><div>So... It is possible for a fully automatic migration of the VM to another hypervisor in case Storage connection fails?<br>
</div>How can we make this happen? Because for the moment, when we tested the situation they stayed in pause state.<br>

</div><div>(Test situation:<br><ul><li>Unplug the 2 fibre cables from the hypervisor</li><li>VM&#39;s go in pause state</li><li>VM&#39;s stayed in pause state until the failure was solved</li></ul><p>)</p><p><br></p></div>


They only returned when we restored the fiber connection to the Hypervisor...<br><br></div>Kind Regards,<br><br>Koen<br></div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2014-04-04 13:52 GMT+02:00 Koen Vanoppen <span dir="ltr">&lt;<a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a>&gt;</span>:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div>So... It is possible for a fully automatic migration of the VM to another hypervisor in case Storage connection fails?<br>

</div>How can we make this happen? Because for the moment, when we tested the situation they stayed in pause state.<br>
</div><div>(Test situation:<br><ul><li>Unplug the 2 fibre cables from the hypervisor</li><li>VM&#39;s go in pause state</li><li>VM&#39;s stayed in pause state until the failure was solved</li></ul><p>)</p><p><br></p></div>


They only returned when we restored the fiber connection to the Hypervisor...<br><br></div>Kind Regards,<br><br>Koen<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2014-04-03 16:53 GMT+02:00 Koen Vanoppen <span dir="ltr">&lt;<a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a>&gt;</span>:<div>

<div><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="gmail_quote"><div class=""><div>---------- Forwarded message ----------<br>From: &quot;Doron Fediuck&quot; &lt;<a href="mailto:dfediuck@redhat.com" target="_blank">dfediuck@redhat.com</a>&gt;<br>


Date: Apr 3, 2014 4:51 PM<br>Subject: Re: [Users] HA<br></div></div><div><div class="h5"><div><div>
To: &quot;Koen Vanoppen&quot; &lt;<a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a>&gt;<br>Cc: &quot;Omer Frenkel&quot; &lt;<a href="mailto:ofrenkel@redhat.com" target="_blank">ofrenkel@redhat.com</a>&gt;,  &lt;<a href="mailto:users@ovirt.org" target="_blank">users@ovirt.org</a>&gt;, &quot;Federico Simoncelli&quot; &lt;<a href="mailto:fsimonce@redhat.com" target="_blank">fsimonce@redhat.com</a>&gt;, &quot;Allon Mureinik&quot; &lt;<a href="mailto:amureini@redhat.com" target="_blank">amureini@redhat.com</a>&gt;<br>



<br type="attribution"><br>
<br>
----- Original Message -----<br>
&gt; From: &quot;Koen Vanoppen&quot; &lt;<a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a>&gt;<br>
&gt; To: &quot;Omer Frenkel&quot; &lt;<a href="mailto:ofrenkel@redhat.com" target="_blank">ofrenkel@redhat.com</a>&gt;, <a href="mailto:users@ovirt.org" target="_blank">users@ovirt.org</a><br>
&gt; Sent: Wednesday, April 2, 2014 4:17:36 PM<br>
&gt; Subject: Re: [Users] HA<br>
&gt;<br>
&gt; Yes, indeed. I meant not-operational. Sorry.<br>
&gt; So, if I understand this correctly. When we ever come in a situation that we<br>
&gt; loose both storage connections on our hypervisor, we will have to manually<br>
&gt; restore the connections first?<br>
&gt;<br>
&gt; And thanx for the tip for speeding up thins :-).<br>
&gt;<br>
&gt; Kind regards,<br>
&gt;<br>
&gt; Koen<br>
&gt;<br>
&gt;<br>
&gt; 2014-04-02 15:14 GMT+02:00 Omer Frenkel &lt; <a href="mailto:ofrenkel@redhat.com" target="_blank">ofrenkel@redhat.com</a> &gt; :<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; ----- Original Message -----<br>
&gt; &gt; From: &quot;Koen Vanoppen&quot; &lt; <a href="mailto:vanoppen.koen@gmail.com" target="_blank">vanoppen.koen@gmail.com</a> &gt;<br>
&gt; &gt; To: <a href="mailto:users@ovirt.org" target="_blank">users@ovirt.org</a><br>
&gt; &gt; Sent: Wednesday, April 2, 2014 4:07:19 PM<br>
&gt; &gt; Subject: [Users] HA<br>
&gt; &gt;<br>
&gt; &gt; Dear All,<br>
&gt; &gt;<br>
&gt; &gt; Due our acceptance testing, we discovered something. (Document will<br>
&gt; &gt; follow).<br>
&gt; &gt; When we disable one fiber path, no problem multipath finds it way no pings<br>
&gt; &gt; are lost.<br>
&gt; &gt; BUT when we disabled both the fiber paths (so one of the storage domain is<br>
&gt; &gt; gone on this host, but still available on the other host), vms go in paused<br>
&gt; &gt; mode... He chooses a new SPM (can we speed this up?), put&#39;s the host in<br>
&gt; &gt; non-responsive (can we speed this up, more important) and the VM&#39;s stay on<br>
&gt; &gt; Paused mode... I would expect that they would be migrated (yes, HA is<br>
&gt;<br>
&gt; i guess you mean the host moves to not-operational (in contrast to<br>
&gt; non-responsive)?<br>
&gt; if so, the engine will not migrate vms that are paused to do io error,<br>
&gt; because of data corruption risk.<br>
&gt;<br>
&gt; to speed up you can look at the storage domain monitoring timeout:<br>
&gt; engine-config --get StorageDomainFalureTimeoutInMinutes<br>
&gt;<br>
&gt;<br>
&gt; &gt; enabled) to the other host and reboot there... Any solution? We are still<br>
&gt; &gt; using oVirt 3.3.1 , but we are planning a upgrade to 3.4 after the easter<br>
&gt; &gt; holiday.<br>
&gt; &gt;<br>
&gt; &gt; Kind Regards,<br>
&gt; &gt;<br>
&gt; &gt; Koen<br>
&gt; &gt;<br>
<br>
Hi Koen,<br>
Resuming from paused due to io issues is supported (adding relevant folks).<br>
Regardless, if you did not define power management, you should manually approve<br>
source host was rebooted in order for migration to proceed. Otherwise we risk<br>
split-brain scenario.<br>
<br>
Doron<br>
</div></div></div></div></div>
</blockquote></div></div></div><br></div>
</blockquote></div><br></div>
<br>_______________________________________________<br>
Users mailing list<br>
<a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
<a href="http://lists.ovirt.org/mailman/listinfo/users" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
<br></blockquote></div><br></div>