<div dir="ltr"><div><div><div><div><div><div>Hi Will,<br><br></div>The engine relies on the status reported by VDSM for the management network &#39;ovirtmgmt&#39; and for its underlying nics/vlans.<br><br></div>In order to see the configuration of &#39;ovirtmgmt&#39; network please paste the output of the following command to be executed on the host:<br></div>vdsClient -s 0 getVdsCaps<br><br></div>In addition, in order to see the reported status of the networks run and paste on the host:<br></div>vdsClient -s 0 getVdsStats<br><br></div>That should give the indication of which nic is reported as down for ovirtmgmt by vdsm.<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 6, 2016 at 11:15 AM, Eliraz Levi <span dir="ltr">&lt;<a href="mailto:elevi@redhat.com" target="_blank">elevi@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">Hi Will how are you?<br>
</span>The log is first pointing about certifications issues:<br>
2016-01-04 00:02:11,259 ERROR [org.ovirt.engine.core.vdsbroker.jsonrpc.JsonRpcVdsServer] (DefaultQuartzScheduler_Worker-81) [] Failed to get peer certification for host &#39;ovirt-node-02&#39;: SSL session is invalid<br>
2016-01-04 00:02:11,259 ERROR [org.ovirt.engine.core.bll.CertificationValidityChecker] (DefaultQuartzScheduler_Worker-81) [] Failed to retrieve peer certifications for host &#39;ovirt-node-02&#39;<br>
<br>
So first thing we should do is to try and solve this problem.<br>
Please try to re install the host.<br>
Thanks.<br>
<span class="HOEnZb"><font color="#888888">Eliraz :)<br>
</font></span><span class="im HOEnZb"><br>
----- Original Message -----<br>
From: &quot;Will Dennis&quot; &lt;<a href="mailto:wdennis@nec-labs.com">wdennis@nec-labs.com</a>&gt;<br>
</span><span class="im HOEnZb">To: &quot;Eliraz Levi&quot; &lt;<a href="mailto:elevi@redhat.com">elevi@redhat.com</a>&gt;, &quot;users&quot; &lt;<a href="mailto:users@ovirt.org">users@ovirt.org</a>&gt;<br>
Sent: Tuesday, 5 January, 2016 5:46:23 AM<br>
Subject: Re: [ovirt-users] host status &quot;Non Operational&quot; - how to diagnose &amp; fix?<br>
<br>
</span><div class="HOEnZb"><div class="h5">I must admit I’m getting a bit weary of fighting oVirt problems at this point… Before I move on to deploying any VMs onto my new infra, I’d like to get the base infra working…<br>
<br>
I’m still experiencing a “Non Operational” problem on my “ovirt-node-02” host:<br>
<a href="http://s1096.photobucket.com/user/willdennis/media/ovirt-node-02_problem.png.html" rel="noreferrer" target="_blank">http://s1096.photobucket.com/user/willdennis/media/ovirt-node-02_problem.png.html</a><br>
<br>
I have pored thru the logs (all the engine logs, plus the syslogs from the engine VM + and my three hypervisor/storage hosts) and I can’t pin down why the one node is having a problem… Of course with how voluminous all these logs are, it’s kind of like looking for a needle in a haystack, and I’m not even sure what the needle looks like, or if it’s even a needle :-/<br>
<br>
I have also rebooted this host in past days, this also did not fix the problem.<br>
<br>
Note that on the screenshot I posted above, that the webadmin hosts screen says that -node-01 has one VM running, and the others 0… You’d think that would be the HE VM running on there, but it’s actually on -node-02:<br>
<br>
$ ansible istgroup-ovirt -f 1 -i prod -u root -m shell -a &quot;hosted-engine --vm-status | grep -e &#39;^Hostname&#39; -e &#39;^Engine&#39;&quot;<br>
ovirt-node-01 | success | rc=0 &gt;&gt;<br>
Hostname                           : ovirt-node-01<br>
Engine status                      : {&quot;reason&quot;: &quot;bad vm status&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;down&quot;}<br>
Hostname                           : ovirt-node-02<br>
Engine status                      : {&quot;health&quot;: &quot;good&quot;, &quot;vm&quot;: &quot;up&quot;, &quot;detail&quot;: &quot;up&quot;}<br>
Hostname                           : ovirt-node-03<br>
Engine status                      : {&quot;reason&quot;: &quot;vm not running on this host&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;unknown&quot;}<br>
<br>
ovirt-node-02 | success | rc=0 &gt;&gt;<br>
Hostname                           : ovirt-node-01<br>
Engine status                      : {&quot;reason&quot;: &quot;bad vm status&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;down&quot;}<br>
Hostname                           : ovirt-node-02<br>
Engine status                      : {&quot;health&quot;: &quot;good&quot;, &quot;vm&quot;: &quot;up&quot;, &quot;detail&quot;: &quot;up&quot;}<br>
Hostname                           : ovirt-node-03<br>
Engine status                      : {&quot;reason&quot;: &quot;vm not running on this host&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;unknown&quot;}<br>
<br>
ovirt-node-03 | success | rc=0 &gt;&gt;<br>
Hostname                           : ovirt-node-01<br>
Engine status                      : {&quot;reason&quot;: &quot;bad vm status&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;down&quot;}<br>
Hostname                           : ovirt-node-02<br>
Engine status                      : {&quot;health&quot;: &quot;good&quot;, &quot;vm&quot;: &quot;up&quot;, &quot;detail&quot;: &quot;up&quot;}<br>
Hostname                           : ovirt-node-03<br>
Engine status                      : {&quot;reason&quot;: &quot;vm not running on this host&quot;, &quot;health&quot;: &quot;bad&quot;, &quot;vm&quot;: &quot;down&quot;, &quot;detail&quot;: &quot;unknown”}<br>
<br>
So it looks like the webadmin UI is wrong as well…<br>
<br>
It would be awesome if the UI would give a reason for the “Non Operational” status somehow… Or if there was a troubleshooter that could be used to analyze the problem… As it is, being so new to all of this, I am completely at the list’s mercy to figure this out.<br>
<br>
This software has such promise, so I’ll keep working thru these issues, but it sure hasn’t been a smooth ride so far…<br>
<br>
<br>
On Jan 4, 2016, at 7:54 AM, Will Dennis &lt;<a href="mailto:wdennis@nec-labs.com">wdennis@nec-labs.com</a>&lt;mailto:<a href="mailto:wdennis@nec-labs.com">wdennis@nec-labs.com</a>&gt;&gt; wrote:<br>
<br>
I put all of the engine logs up there now… Try engine.log-20160103.gzhttp://<a href="http://i1096.photobucket.com/albums/g330/willdennis/ovirt-node-02_problem.png" rel="noreferrer" target="_blank">i1096.photobucket.com/albums/g330/willdennis/ovirt-node-02_problem.png</a><br>
_______________________________________________<br>
Users mailing list<br>
<a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
<a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature"><div dir="ltr"><div>Regards,<br></div>Moti<br></div></div>
</div>