<p dir="ltr"></p>
<p dir="ltr">On Nov 20, 2016 6:33 PM, &quot;Nir Soffer&quot; &lt;<a href="mailto:nsoffer@redhat.com">nsoffer@redhat.com</a>&gt; wrote:<br>
&gt;<br>
&gt; On Sun, Nov 20, 2016 at 6:25 PM, Eyal Edri &lt;<a href="mailto:eedri@redhat.com">eedri@redhat.com</a>&gt; wrote:<br>
&gt; &gt; It happened again in [1]<br>
&gt; &gt;<br>
&gt; &gt; 2016-11-20 10:48:12,106 ERROR (jsonrpc/2) [storage.TaskManager.Task]<br>
&gt; &gt; (Task=&#39;6c1ec6e7-fb37-465b-8e30-1613317683b2&#39;) Unexpected error (task:870)<br>
&gt; &gt; Traceback (most recent call last):<br>
&gt; &gt;   File &quot;/usr/share/vdsm/storage/task.py&quot;, line 877, in _run<br>
&gt; &gt;     return fn(*args, **kargs)<br>
&gt; &gt;   File &quot;/usr/lib/python2.7/site-packages/vdsm/logUtils.py&quot;, line 50, in<br>
&gt; &gt; wrapper<br>
&gt; &gt;     res = f(*args, **kwargs)<br>
&gt; &gt;   File &quot;/usr/share/vdsm/storage/hsm.py&quot;, line 2205, in getAllTasksInfo<br>
&gt; &gt;     allTasksInfo = sp.getAllTasksInfo()<br>
&gt; &gt;   File &quot;/usr/lib/python2.7/site-packages/vdsm/storage/securable.py&quot;, line<br>
&gt; &gt; 77, in wrapper<br>
&gt; &gt;     raise SecureError(&quot;Secured object is not in safe state&quot;)<br>
&gt; &gt; SecureError: Secured object is not in safe state<br>
&gt; &gt; 2016-11-20 10:48:12,109 INFO  (jsonrpc/2) [storage.TaskManager.Task]<br>
&gt; &gt; (Task=&#39;6c1ec6e7-fb37-465b-8e30-1613317683b2&#39;) aborting: Task is aborted:<br>
&gt; &gt; u&#39;Secured object is not in safe state&#39; - code 100 (task:1175)<br>
&gt; &gt; 2016-11-20 10:48:12,110 ERROR (jsonrpc/2) [storage.Dispatcher] Secured<br>
&gt; &gt; object is not in safe state (dispatcher:80)<br>
&gt; &gt; Traceback (most recent call last):<br>
&gt; &gt;   File &quot;/usr/share/vdsm/storage/dispatcher.py&quot;, line 72, in wrapper<br>
&gt; &gt;     result = ctask.prepare(func, *args, **kwargs)<br>
&gt; &gt;   File &quot;/usr/share/vdsm/storage/task.py&quot;, line 105, in wrapper<br>
&gt; &gt;     return m(self, *a, **kw)<br>
&gt; &gt;   File &quot;/usr/share/vdsm/storage/task.py&quot;, line 1183, in prepare<br>
&gt; &gt;     raise self.error<br>
&gt; &gt; SecureError: Secured object is not in safe state<br>
&gt;<br>
&gt; This can also mean that the SPM is not started yet. Maybe you are not<br>
&gt; waiting until the SPM is ready before you try to perform an operation?<br>
&gt;<br>
&gt; Who is the owner of this test? This person should debug this test.</p>
<p dir="ltr">The relevant team for the feature. </p>
<p dir="ltr">&gt;<br>
&gt; &gt; <a href="http://jenkins.ovirt.org/job/test-repo_ovirt_experimental_master/3506/artifact/exported-artifacts/basic_suite_master.sh-el7/exported-artifacts/test_logs/basic-suite-master/post-006_network_by_label.py/lago-basic-suite-master-host1/_var_log_vdsm/vdsm.log">http://jenkins.ovirt.org/job/test-repo_ovirt_experimental_master/3506/artifact/exported-artifacts/basic_suite_master.sh-el7/exported-artifacts/test_logs/basic-suite-master/post-006_network_by_label.py/lago-basic-suite-master-host1/_var_log_vdsm/vdsm.log</a><br>
&gt; &gt;<br>
&gt; &gt; The storage VM is running on the same VM as engine ( to save memory ) and<br>
&gt; &gt; its serving both NFS &amp; ISCSI.<br>
&gt; &gt; Do you think running it on the same VM as engine might cause such issues?<br>
&gt;<br>
&gt; I don&#39;t think so, but this prevents testing lot of interesting negative flows.</p>
<p dir="ltr">Which don&#39;t belong to CI. </p>
<p dir="ltr">&gt;<br>
&gt; For example, when one storage server is down, the system should be<br>
&gt; able to use the other storage domain. Having each storage server in<br>
&gt; its own vm makes this possible.</p>
<p dir="ltr">You have both NFS and ISCSI there. It&#39;s trival to set multiple of each if needed, of course. <br>
I do wish to add more IPs and test iSCSI bonding as well as both NFSv3 and NFSv4. </p>
<p dir="ltr">&gt;<br>
&gt; Also, we may like to test multiple storage servers of same type.<br>
&gt; the storage servers should be decoupled so we can start any number<br>
&gt; of them as needed for the current test.</p>
<p dir="ltr">Right, but not on this suite.<br>
Again, it&#39;s trivial to do so. The main motivation was to conserve resources so everyone could run the tests. </p>
<p dir="ltr">Y.</p>
<p dir="ltr">&gt;<br>
&gt; &gt; On Mon, Oct 17, 2016 at 11:45 PM, Adam Litke &lt;<a href="mailto:alitke@redhat.com">alitke@redhat.com</a>&gt; wrote:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; On 17/10/16 11:51 +0200, Piotr Kliczewski wrote:<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Adam,<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; I see constant failures due to this and found:<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; 2016-10-17 03:55:21,045 ERROR   (jsonrpc/3) [storage.TaskManager.Task]<br>
&gt; &gt;&gt;&gt; Task=`8989d694-7099-449b-bd66-4d63786be089`::Unexpected error<br>
&gt; &gt;&gt;&gt; (task:870)<br>
&gt; &gt;&gt;&gt; Traceback (most recent call last):<br>
&gt; &gt;&gt;&gt;  File &quot;/usr/share/vdsm/storage/task.py&quot;, line 877, in _run<br>
&gt; &gt;&gt;&gt;    return fn(*args, **kargs)<br>
&gt; &gt;&gt;&gt;  File &quot;/usr/lib/python2.7/site-packages/vdsm/logUtils.py&quot;, line 50, in<br>
&gt; &gt;&gt;&gt; wrapper<br>
&gt; &gt;&gt;&gt;    res = f(*args, **kwargs)<br>
&gt; &gt;&gt;&gt;  File &quot;/usr/share/vdsm/storage/hsm.py&quot;, line 2212, in getAllTasksInfo<br>
&gt; &gt;&gt;&gt;    allTasksInfo = sp.getAllTasksInfo()<br>
&gt; &gt;&gt;&gt;  File &quot;/usr/lib/python2.7/site-packages/vdsm/storage/securable.py&quot;,<br>
&gt; &gt;&gt;&gt; line 77, in wrapper<br>
&gt; &gt;&gt;&gt;    raise SecureError(&quot;Secured object is not in safe state&quot;)<br>
&gt; &gt;&gt;&gt; SecureError: Secured object is not in safe state<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; This usually indicates that the SPM role has been lost which happens<br>
&gt; &gt;&gt; most likely due to connection issues with the storage.  What is the<br>
&gt; &gt;&gt; storage environment being used for the system tests?<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Please take a look not sure whether it is related. You can find latest<br>
&gt; &gt;&gt;&gt; build here [1]<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Thanks,<br>
&gt; &gt;&gt;&gt; Piotr<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; [1] <a href="http://jenkins.ovirt.org/job/ovirt_master_system-tests/668/">http://jenkins.ovirt.org/job/ovirt_master_system-tests/668/</a><br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; On Fri, Oct 14, 2016 at 11:22 AM, Evgheni Dereveanchin<br>
&gt; &gt;&gt;&gt; &lt;<a href="mailto:ederevea@redhat.com">ederevea@redhat.com</a>&gt; wrote:<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Hello,<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; We&#39;ve got several cases today where system tests failed<br>
&gt; &gt;&gt;&gt;&gt; when attempting to export templates:<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; <a href="http://jenkins.ovirt.org/job/ovirt_master_system-tests/655/testReport/junit/(root)/004_basic_sanity/template_export/">http://jenkins.ovirt.org/job/ovirt_master_system-tests/655/testReport/junit/(root)/004_basic_sanity/template_export/</a><br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Related engine.log looks something like this:<br>
&gt; &gt;&gt;&gt;&gt; <a href="https://paste.fedoraproject.org/449936/47643643/raw/">https://paste.fedoraproject.org/449936/47643643/raw/</a><br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; I could not find any obvious issues in SPM logs, could someone<br>
&gt; &gt;&gt;&gt;&gt; please take a look to confirm what may be causing this issue?<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Full logs from the test are available here:<br>
&gt; &gt;&gt;&gt;&gt; <a href="http://jenkins.ovirt.org/job/ovirt_master_system-tests/655/artifact/">http://jenkins.ovirt.org/job/ovirt_master_system-tests/655/artifact/</a><br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Regards,<br>
&gt; &gt;&gt;&gt;&gt; Evgheni Dereveanchin<br>
&gt; &gt;&gt;&gt;&gt; _______________________________________________<br>
&gt; &gt;&gt;&gt;&gt; Devel mailing list<br>
&gt; &gt;&gt;&gt;&gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt; &gt;&gt;&gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel">http://lists.ovirt.org/mailman/listinfo/devel</a><br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; --<br>
&gt; &gt;&gt; Adam Litke<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; _______________________________________________<br>
&gt; &gt;&gt; Devel mailing list<br>
&gt; &gt;&gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt; &gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel">http://lists.ovirt.org/mailman/listinfo/devel</a><br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; Eyal Edri<br>
&gt; &gt; Associate Manager<br>
&gt; &gt; RHV DevOps<br>
&gt; &gt; EMEA ENG Virtualization R&amp;D<br>
&gt; &gt; Red Hat Israel<br>
&gt; &gt;<br>
&gt; &gt; phone: +972-9-7692018<br>
&gt; &gt; irc: eedri (on #tlv #rhev-dev #rhev-integ)<br>
&gt; &gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; Devel mailing list<br>
&gt; &gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt; &gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel">http://lists.ovirt.org/mailman/listinfo/devel</a><br>
&gt; _______________________________________________<br>
&gt; Devel mailing list<br>
&gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel">http://lists.ovirt.org/mailman/listinfo/devel</a><br></p>