<div dir="ltr"><div><div><div>Hi Martin, <br><br></div>No deployments have been done and the servers have been restarted several time since then. <br><br></div>I will go to ovirt 4.2 as soon as BZ - 1477589 is fixed. The false routing error blocks migration of VMs to the host with this error. <br><br></div>Alex<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Jan 19, 2018 at 4:29 PM, Martin Sivak <span dir="ltr">&lt;<a href="mailto:msivak@redhat.com" target="_blank">msivak@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<br>
Have you been adding or redeploying a host lately? If yes, then try<br>
restarting ovirt-ha-broker service. If it helps then it might be a<br>
case of this bug: <a href="https://bugzilla.redhat.com/1527394" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/<wbr>1527394</a><br>
<br>
The ovirt-ha-agent and brokers from oVirt 4.2 are fixed already, but<br>
we havent backported the fix yet.<br>
<br>
Best regards<br>
<br>
Martin Sivak<br>
<div><div class="h5"><br>
On Fri, Jan 19, 2018 at 1:01 PM, Alex K &lt;<a href="mailto:rightkicktech@gmail.com">rightkicktech@gmail.com</a>&gt; wrote:<br>
&gt; Hi All,<br>
&gt;<br>
&gt; I have a 3 server ovirt 4.1 selft hosted setup with gluster replica 3.<br>
&gt;<br>
&gt; I see that suddenly one of the hosts reported as unresponsive and at same<br>
&gt; time the /var/log/messages logged:<br>
&gt;<br>
&gt; ovirt-ha-broker ovirt_hosted_engine_ha.broker.<wbr>listener.ConnectionHandler<br>
&gt; ERROR Error handling request, data: &#39;set-storage-domain FilesystemBackend<br>
&gt; dom_type=glusterfs<br>
&gt; sd_uuid=ad7b9e2a-7ae3-46ad-<wbr>9429-5f5ef452eac8&#39;#<wbr>012Traceback (most recent call<br>
&gt; last):#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/broker/listener.py&quot;,<br>
&gt; line 166, in handle#012    data)#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/broker/listener.py&quot;,<br>
&gt; line 299, in _dispatch#012    .set_storage_domain(client, sd_type,<br>
&gt; **options)#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/broker/storage_broker.py&quot;,<br>
&gt; line 66, in set_storage_domain#012    self._backends[client].<wbr>connect()#012<br>
&gt; File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/lib/storage_backends.py&quot;,<br>
&gt; line 462, in connect#012    self._dom_type)#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/lib/storage_backends.py&quot;,<br>
&gt; line 107, in get_domain_path#012    &quot; in {1}&quot;.format(sd_uuid,<br>
&gt; parent))#<wbr>012BackendFailureException: path to storage domain<br>
&gt; ad7b9e2a-7ae3-46ad-9429-<wbr>5f5ef452eac8 not found in<br>
&gt; /rhev/data-center/mnt/<wbr>glusterSD<br>
&gt; Jan 15 11:04:56 v1 journal: vdsm root ERROR failed to retrieve Hosted Engine<br>
&gt; HA info#012Traceback (most recent call last):#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/vdsm/host/api.py&quot;, line 231, in<br>
&gt; _getHaInfo#012    stats = instance.get_all_stats()#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/client/client.py&quot;,<br>
&gt; line 103, in get_all_stats#012    self._configure_broker_conn(<wbr>broker)#012<br>
&gt; File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/client/client.py&quot;,<br>
&gt; line 180, in _configure_broker_conn#012    dom_type=dom_type)#012  File<br>
&gt; &quot;/usr/lib/python2.7/site-<wbr>packages/ovirt_hosted_engine_<wbr>ha/lib/brokerlink.py&quot;,<br>
&gt; line 177, in set_storage_domain#012    .format(sd_type, options,<br>
&gt; e))#012RequestError: Failed to set storage domain FilesystemBackend, options<br>
&gt; {&#39;dom_type&#39;: &#39;glusterfs&#39;, &#39;sd_uuid&#39;:<br>
&gt; &#39;ad7b9e2a-7ae3-46ad-9429-<wbr>5f5ef452eac8&#39;}: Request failed: &lt;class<br>
&gt; &#39;ovirt_hosted_engine_ha.lib.<wbr>storage_backends.<wbr>BackendFailureException&#39;&gt;<br>
&gt;<br>
&gt;<br>
&gt; At VDSM logs i see the following continuously logged:<br>
&gt; [jsonrpc.JsonRpcServer] RPC call VM.getStats failed (error 1) in 0.00<br>
&gt; seconds (__init__:539)<br>
&gt;<br>
&gt; No errors seen at gluster at same time frame.<br>
&gt;<br>
&gt; Any hints on what is causing this issue? It seems a storage access issue but<br>
&gt; gluster was up and volumes ok. The VMs that I am running on top are Windows<br>
&gt; 10 and Windows 2016 64 bit.<br>
&gt;<br>
&gt;<br>
&gt; Thanx,<br>
&gt; Alex<br>
&gt;<br>
&gt;<br>
</div></div>&gt; ______________________________<wbr>_________________<br>
&gt; Users mailing list<br>
&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/<wbr>mailman/listinfo/users</a><br>
&gt;<br>
</blockquote></div><br></div>