<div dir="ltr">There wasn&#39;t actually any info in syslog other than logging that there was a python exception.  I actually had to track down the python abort file to find that it was getting permission errors on the log file.<br>
</div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Apr 14, 2013 at 3:28 AM, Yaniv Bronheim <span dir="ltr">&lt;<a href="mailto:ybronhei@redhat.com" target="_blank">ybronhei@redhat.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">If only you would accept <a href="http://gerrit.ovirt.org/#/c/10313" target="_blank">http://gerrit.ovirt.org/#/c/10313</a>, Tony could manage to check the syslog for reports and fix it much faster.. :)<br>

Both patches should be backported IMHO<br>
<br>
Thanks,<br>
Yaniv.<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
----- Original Message -----<br>
&gt; From: &quot;Dan Kenigsberg&quot; &lt;<a href="mailto:danken@redhat.com">danken@redhat.com</a>&gt;<br>
&gt; To: &quot;Tony Feldmann&quot; &lt;<a href="mailto:trfeldmann@gmail.com">trfeldmann@gmail.com</a>&gt;, &quot;Yaniv Bronheim&quot; &lt;<a href="mailto:ybronhei@redhat.com">ybronhei@redhat.com</a>&gt;<br>
&gt; Cc: &quot;Joop&quot; &lt;<a href="mailto:jvdwege@xs4all.nl">jvdwege@xs4all.nl</a>&gt;, <a href="mailto:users@ovirt.org">users@ovirt.org</a>, <a href="mailto:vdsm-devel@fedorahosted.org">vdsm-devel@fedorahosted.org</a><br>

&gt; Sent: Friday, April 12, 2013 12:33:07 AM<br>
&gt; Subject: Re: [Users] vdsm unresponsive with python exception<br>
&gt;<br>
&gt; On Thu, Apr 11, 2013 at 03:51:07PM -0500, Tony Feldmann wrote:<br>
&gt; &gt; That was the issue.  Found out yesterday that vdsm.log was somehow changed<br>
&gt; &gt; to root:root.  Just now got a chance to put it back on the mailing list.<br>
&gt; &gt; How does the ownership of that file get cahnged.  When the issue occurred I<br>
&gt; &gt; am certain there was no one on the system.<br>
&gt;<br>
&gt; <a href="http://gerrit.ovirt.org/#/c/12940/" target="_blank">http://gerrit.ovirt.org/#/c/12940/</a> (Separating supervdsm log to<br>
&gt; supervdsm.log file) solves the issue. unfortunately, only on the master<br>
&gt; branch of vdsm.<br>
&gt;<br>
&gt; I think that this is a nasty issue that has to be backported to the<br>
&gt; ovirt-3.2 branch as well, and merits to be part of ovirt-3.2.2.<br>
&gt;<br>
&gt; Regards,<br>
&gt; Dan.<br>
&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; On Thu, Apr 11, 2013 at 2:15 PM, Joop &lt;<a href="mailto:jvdwege@xs4all.nl">jvdwege@xs4all.nl</a>&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt; &gt; Dan Kenigsberg wrote:<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;&gt; On Wed, Apr 10, 2013 at 08:59:01AM -0500, Tony Feldmann wrote:<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt;&gt; I am having a strange issue in my ovirt cluster.  I have 2 hosts, 1<br>
&gt; &gt; &gt;&gt;&gt; running<br>
&gt; &gt; &gt;&gt;&gt; engine and added as a host and one other system added as a host.  Both<br>
&gt; &gt; &gt;&gt;&gt; systems are running gluster across local disks for shared storage.<br>
&gt; &gt; &gt;&gt;&gt; Everything was working fine until last night, where my system that is<br>
&gt; &gt; &gt;&gt;&gt; also<br>
&gt; &gt; &gt;&gt;&gt; running the engine when unresponsive in the admin page.  All vms were<br>
&gt; &gt; &gt;&gt;&gt; still<br>
&gt; &gt; &gt;&gt;&gt; running that were on the host.  I shut down the vms that were on the<br>
&gt; &gt; &gt;&gt;&gt; host<br>
&gt; &gt; &gt;&gt;&gt; from within the guest os as I was not able to do anything to the vm<br>
&gt; &gt; &gt;&gt;&gt; with<br>
&gt; &gt; &gt;&gt;&gt; the host in unresponsive state.  After getting the vms off and<br>
&gt; &gt; &gt;&gt;&gt; rebooting<br>
&gt; &gt; &gt;&gt;&gt; the host, the vdsmd service says that it is running, but it continually<br>
&gt; &gt; &gt;&gt;&gt; restarts the vdsm process and dumps out these messages: detected<br>
&gt; &gt; &gt;&gt;&gt; unhandled<br>
&gt; &gt; &gt;&gt;&gt; Python exception in &#39;/usr/share/vdsm/vdsm&#39;.  All services say they are<br>
&gt; &gt; &gt;&gt;&gt; up<br>
&gt; &gt; &gt;&gt;&gt; and running but the host stays in unresponsive state and the vdsm<br>
&gt; &gt; &gt;&gt;&gt; process<br>
&gt; &gt; &gt;&gt;&gt; keeps respawning.  There is also no data in the vdsm.log.  Can anyone<br>
&gt; &gt; &gt;&gt;&gt; shed<br>
&gt; &gt; &gt;&gt;&gt; any light on this for me?<br>
&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt; <a href="mailto:vdsm-devel@fedorahosted.org">vdsm-devel@fedorahosted.org</a> may be a better place to ask vdsm-specific<br>
&gt; &gt; &gt;&gt; questions.<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt; Could you log into the non-operational host as root, and stop the vdsm<br>
&gt; &gt; &gt;&gt; service.<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt; Then become the vdsm user with<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt;     su -s /bin/bash - vdsm<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt; and run /usr/share/vdsm/vdsm manually. Do you see anything in<br>
&gt; &gt; &gt;&gt; particular?<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; Please have a look at the permissions/owner of /var/log/vdsm/vdsm.log.<br>
&gt; &gt; &gt; Should be vdsm:kvm and not root:root<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Joop<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; Users mailing list<br>
&gt; &gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt; &gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
&gt;<br>
&gt;<br>
</div></div></blockquote></div><br></div>