<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 11, 2017 at 12:49 PM, Milan Zamazal <span dir="ltr">&lt;<a href="mailto:mzamazal@redhat.com" target="_blank">mzamazal@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I just ran ovirt-system-tests on two very different machines.  It passed<br>
on one of them, while it failed on the other one, at a different place:<br>
<br>
  @ Run test: 005_network_by_label.py:<br>
  nose.config: INFO: Ignoring files matching [&#39;^\\.&#39;, &#39;^_&#39;, &#39;^setup\\.py$&#39;]<br>
    # assign_hosts_network_label:<br>
  Error while running thread<br>
  Traceback (most recent call last):<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/lago/utils.py&quot;, line 55, in _ret_via_queue<br>
      queue.put({&#39;return&#39;: func()})<br>
    File &quot;/var/local/lago/ovirt-system-<wbr>tests/basic-suite-master/test-<wbr>scenarios/005_network_by_<wbr>label.py&quot;, line 56, in _assign_host_network_label<br>
      host_nic=nic<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/ovirtsdk/<wbr>infrastructure/brokers.py&quot;, line 16231, in add<br>
      headers={&quot;Correlation-Id&quot;:<wbr>correlation_id, &quot;Expect&quot;:expect}<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/ovirtsdk/<wbr>infrastructure/proxy.py&quot;, line 79, in add<br>
      return self.request(&#39;POST&#39;, url, body, headers, cls=cls)<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/ovirtsdk/<wbr>infrastructure/proxy.py&quot;, line 122, in request<br>
      persistent_auth=self.__<wbr>persistent_auth<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/ovirtsdk/<wbr>infrastructure/<wbr>connectionspool.py&quot;, line 79, in do_request<br>
      persistent_auth)<br>
    File &quot;/usr/lib/python2.7/site-<wbr>packages/ovirtsdk/<wbr>infrastructure/<wbr>connectionspool.py&quot;, line 162, in __do_request<br>
      raise errors.RequestError(response_<wbr>code, response_reason, response_body)<br>
  RequestError:<br>
  status: 409<br>
  reason: Conflict<br>
  detail: Cannot add Label. Operation can be performed only when Host status is  Maintenance, Up, NonOperational.<br></blockquote><div><br></div><div>This is an issue we&#39;ve seen from time to time and have not figured it out yet. Do you have engine logs for it?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
I can also see occasional errors like the following in vdsm.log:<br>
<br>
  ERROR (JsonRpc (StompReactor)) [vds.dispatcher] SSL error receiving from &lt;yajsonrpc.betterAsyncore.<wbr>Dispatcher connected (&#39;::ffff:192.168.201.3&#39;, 47434, 0, 0) at 0x271fd88&gt;: (104, &#39;Connection reset by peer&#39;) (betterAsyncore:119)<br></blockquote><div><br></div><div>This is the core issue of today&#39;s - but probably unrelated to the issue you&#39;ve just described, that we have seen happening from time to time in the past (I&#39;d say that I&#39;ve seen it happening last time ~2 weeks ago or so, but it&#39;s not reproducible easily to me).</div><div>Y.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
So we are probably dealing with an error that occurs &quot;randomly&quot; and is<br>
not related to a particular test.<br>
<br>
Daniel Belenky &lt;<a href="mailto:dbelenky@redhat.com">dbelenky@redhat.com</a>&gt; writes:<br>
<br>
&gt; Link to Jenkins<br>
&gt; &lt;<a href="http://jenkins.ovirt.org/view/experimental%20jobs/job/test-repo_ovirt_experimental_master/4648/artifact/exported-artifacts/basic_suite_master.sh-el7/exported-artifacts/" rel="noreferrer" target="_blank">http://jenkins.ovirt.org/<wbr>view/experimental%20jobs/job/<wbr>test-repo_ovirt_experimental_<wbr>master/4648/artifact/exported-<wbr>artifacts/basic_suite_master.<wbr>sh-el7/exported-artifacts/</a>&gt;<br>
<div class="HOEnZb"><div class="h5">&gt;<br>
&gt; On Wed, Jan 11, 2017 at 10:26 AM, Francesco Romani &lt;<a href="mailto:fromani@redhat.com">fromani@redhat.com</a>&gt;<br>
&gt; wrote:<br>
&gt;<br>
&gt;&gt; Hi all<br>
&gt;&gt;<br>
&gt;&gt; On 01/11/2017 08:52 AM, Eyal Edri wrote:<br>
&gt;&gt;<br>
&gt;&gt; Adding Tomas from Virt.<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Jan 10, 2017 at 10:54 AM, Piotr Kliczewski &lt;<br>
&gt;&gt; <a href="mailto:piotr.kliczewski@gmail.com">piotr.kliczewski@gmail.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt;&gt; On Tue, Jan 10, 2017 at 9:29 AM, Daniel Belenky &lt;<a href="mailto:dbelenky@redhat.com">dbelenky@redhat.com</a>&gt;<br>
&gt;&gt;&gt; wrote:<br>
&gt;&gt;&gt; &gt; Hi all,<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; test-repo_ovirt_experimental_<wbr>master (link to Jenkins) job failed on<br>
&gt;&gt;&gt; &gt; basic_sanity scenario.<br>
&gt;&gt;&gt; &gt; The job was triggered by <a href="https://gerrit.ovirt.org/#/c/69845/" rel="noreferrer" target="_blank">https://gerrit.ovirt.org/#/c/<wbr>69845/</a><br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; From looking at the logs, it seems that the reason is VDSM.<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; In the VDSM log, i see the following error:<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; 2017-01-09 16:47:41,331 ERROR (JsonRpc (StompReactor)) [vds.dispatcher]<br>
&gt;&gt;&gt; SSL<br>
&gt;&gt;&gt; &gt; error receiving from &lt;yajsonrpc.betterAsyncore.<wbr>Dispatcher connected<br>
&gt;&gt;&gt; (&#39;::1&#39;,<br>
&gt;&gt;&gt; &gt; 34942, 0, 0) at 0x36b95f0&gt;: unexpected eof (betterAsyncore:119)<br>
&gt;&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Daniel, could you please remind me the jenkins link? I see something<br>
&gt;&gt; suspicious on the Vdsm log.<br>
&gt;&gt; Most notably, Vdsm received SIGTERM. Is this expected and part of the test?<br>
&gt;&gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; This issue means that the client closed connection while vdsm was<br>
&gt;&gt;&gt; replying. It can happen at any time<br>
&gt;&gt;&gt; when the client is not nice with the connection. As you can see the<br>
&gt;&gt;&gt; client connected locally &#39;::1&#39;.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; Also, when looking at the MOM logs, I see the the following:<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; 2017-01-09 16:43:39,508 - mom.vdsmInterface - ERROR - Cannot connect to<br>
&gt;&gt;&gt; &gt; VDSM! [Errno 111] Connection refused<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Looking at the log at this time vdsm had no open socket.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Correct, but IIRC we have a race on startup - that&#39;s the reason why MOM<br>
&gt;&gt; retries to connect. After the new try, MOM seems to behave<br>
&gt;&gt; correctly:<br>
&gt;&gt;<br>
&gt;&gt; 2017-01-09 16:44:05,672 - mom.RPCServer - INFO - ping()<br>
&gt;&gt; 2017-01-09 16:44:05,673 - mom.RPCServer - INFO - getStatistics()<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Francesco Romani<br>
&gt;&gt; Red Hat Engineering Virtualization R &amp; D<br>
&gt;&gt; IRC: fromani<br>
&gt;&gt;<br>
&gt;&gt;<br>
</div></div><div class="HOEnZb"><div class="h5">______________________________<wbr>_________________<br>
Devel mailing list<br>
<a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
<a href="http://lists.ovirt.org/mailman/listinfo/devel" rel="noreferrer" target="_blank">http://lists.ovirt.org/<wbr>mailman/listinfo/devel</a><br>
</div></div></blockquote></div><br></div></div>