<div dir="ltr"><div>Nir,<br></div>See attached the repoplot output.<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Apr 14, 2016 at 12:18 PM, Nir Soffer <span dir="ltr">&lt;<a href="mailto:nsoffer@redhat.com" target="_blank">nsoffer@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Thu, Apr 14, 2016 at 12:02 PM, Fred Rolland &lt;<a href="mailto:frolland@redhat.com">frolland@redhat.com</a>&gt; wrote:<br>
&gt; From the log, we can see that the lvextend command took 18 sec, which is<br>
&gt; quite long.<br>
<br>
</span>Fred, can you run repoplot on this log file? it will may explain why this lvm<br>
call took 18 seconds.<br>
<span class="HOEnZb"><font color="#888888"><br>
Nir<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt; 60decf0c-6d9a-4c3b-bee6-de9d2ff05e85::DEBUG::2016-04-13<br>
&gt; 10:52:06,759::lvm::290::Storage.Misc.excCmd::(cmd) /usr/bin/taskset<br>
&gt; --cpu-list 0-23 /usr/bin/sudo -n /usr/sbin/lvm lvextend --config &#39; devices {<br>
&gt; preferred_names = [&quot;^/dev/mapper/&quot;] ignore_suspended_devices=1<br>
&gt; write_cache_state=0 disable_after_error_count=3 filter = [<br>
&gt; &#39;\&#39;&#39;a|/dev/mapper/36000eb3a4f1acbc20000000000000043|&#39;\&#39;&#39;, &#39;\&#39;&#39;r|.*|&#39;\&#39;&#39; ] }<br>
&gt; global {  locking_type=1  prioritise_write_locks=1  wait_for_locks=1<br>
&gt; use_lvmetad=0 }  backup {  retain_min = 50  retain_days = 0 } &#39; --autobackup<br>
&gt; n --size 6016m<br>
&gt; 5de4a000-a9c4-489c-8eee-10368647c413/721d09bc-60e7-4310-9ba2-522d2a4b03d0<br>
&gt; (cwd None)<br>
&gt; ....<br>
&gt; 60decf0c-6d9a-4c3b-bee6-de9d2ff05e85::DEBUG::2016-04-13<br>
&gt; 10:52:22,217::lvm::290::Storage.Misc.excCmd::(cmd) SUCCESS: &lt;err&gt; = &#39;<br>
&gt; WARNING: lvmetad is running but disabled. Restart lvmetad before enabling<br>
&gt; it!\n  WARNING: This metadata update is NOT backed up\n&#39;; &lt;rc&gt; = 0<br>
&gt;<br>
&gt;<br>
&gt; The watermark can be configured by the following value:<br>
&gt;<br>
&gt; &#39;volume_utilization_percent&#39;, &#39;50&#39;,<br>
&gt;     &#39;Together with volume_utilization_chunk_mb, set the minimal free &#39;<br>
&gt;     &#39;space before a thin provisioned block volume is extended. Use &#39;<br>
&gt;     &#39;lower values to extend earlier.&#39;)<br>
&gt;<br>
&gt; On Thu, Apr 14, 2016 at 11:42 AM, Michal Skrivanek<br>
&gt; &lt;<a href="mailto:michal.skrivanek@redhat.com">michal.skrivanek@redhat.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; &gt; On 14 Apr 2016, at 09:57, <a href="mailto:nicolas@devels.es">nicolas@devels.es</a> wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Ok, that makes sense, thanks for the insight both Alex and Fred. I&#39;m<br>
&gt;&gt; &gt; attaching the VDSM log of the SPM node at the time of the pause. I couldn&#39;t<br>
&gt;&gt; &gt; find anything that would clearly identify the problem, but maybe you&#39;ll be<br>
&gt;&gt; &gt; able to.<br>
&gt;&gt;<br>
&gt;&gt; In extreme conditions it will happen. When your storage is slow to respond<br>
&gt;&gt; to extension request, and when your write rate is very high then it may<br>
&gt;&gt; happen, as it is happening to you, that you run out space sooner than the<br>
&gt;&gt; extension finishes. You can change the watermark value I guess(right,<br>
&gt;&gt; Fred?), but better would be to plan a bit more ahead and either use<br>
&gt;&gt; preallocated or create thin and then allocate expected size in advance<br>
&gt;&gt; before the operation causing it (typically it only happens during untarring<br>
&gt;&gt; gigabytes of data, or huge database dump/restore)<br>
&gt;&gt; Even then, the VM should always be automatially resumed once the disk<br>
&gt;&gt; space is allocated<br>
&gt;&gt;<br>
&gt;&gt; Thanks,<br>
&gt;&gt; michal<br>
&gt;&gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Thanks.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Regards.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; El 2016-04-13 13:09, Fred Rolland escribió:<br>
&gt;&gt; &gt;&gt; Hi,<br>
&gt;&gt; &gt;&gt; Yes, just as Alex explained, if the disk has been created as thin<br>
&gt;&gt; &gt;&gt; provisioning, the vdsm will extends once a watermark is reached.<br>
&gt;&gt; &gt;&gt; Usually it should not get to the state the Vm is paused.<br>
&gt;&gt; &gt;&gt; From the log, you can see that the request for extension has been sent<br>
&gt;&gt; &gt;&gt; before the VM got to the No Space Error.<br>
&gt;&gt; &gt;&gt; Later, we can see the VM resuming.<br>
&gt;&gt; &gt;&gt; INFO::2016-04-13<br>
&gt;&gt; &gt;&gt; 10:52:04,182::vm::1026::virt.vm::(extendDrivesIfNeeded)<br>
&gt;&gt; &gt;&gt; vmId=`f9cd282e-110a-4896-98d3-6d320662744d`::Requesting extension for<br>
&gt;&gt; &gt;&gt; volume<br>
&gt;&gt; &gt;&gt; ....<br>
&gt;&gt; &gt;&gt; INFO::2016-04-13 10:52:29,360::vm::3728::virt.vm::(onIOError)<br>
&gt;&gt; &gt;&gt; vmId=`f9cd282e-110a-4896-98d3-6d320662744d`::abnormal vm stop device<br>
&gt;&gt; &gt;&gt; virtio-disk0 error enospc<br>
&gt;&gt; &gt;&gt; ....<br>
&gt;&gt; &gt;&gt; INFO::2016-04-13 10:52:54,317::vm::5084::virt.vm::(_logGuestCpuStatus)<br>
&gt;&gt; &gt;&gt; vmId=`f9cd282e-110a-4896-98d3-6d320662744d`::CPU running: onResume<br>
&gt;&gt; &gt;&gt; Note that the extension is done on the SPM host, so it would be<br>
&gt;&gt; &gt;&gt; interesting to see the vdsm log from the host that was in SPM role at<br>
&gt;&gt; &gt;&gt; this timeframe.<br>
&gt;&gt; &gt;&gt; Regards,<br>
&gt;&gt; &gt;&gt; Fred<br>
&gt;&gt; &gt;&gt; On Wed, Apr 13, 2016 at 2:43 PM, Alex Crow &lt;<a href="mailto:acrow@integrafin.co.uk">acrow@integrafin.co.uk</a>&gt;<br>
&gt;&gt; &gt;&gt; wrote:<br>
&gt;&gt; &gt;&gt;&gt; Hi,<br>
&gt;&gt; &gt;&gt;&gt; If you have set up VM disks as Thin Provisioned, the VM has to<br>
&gt;&gt; &gt;&gt;&gt; pause when the disk image needs to expand. You won&#39;t see this on VMs<br>
&gt;&gt; &gt;&gt;&gt; with preallocated storage.<br>
&gt;&gt; &gt;&gt;&gt; It&#39;s not the SAN that&#39;s running out of space, it&#39;s the VM image<br>
&gt;&gt; &gt;&gt;&gt; needing to be expanded incrementally each time.<br>
&gt;&gt; &gt;&gt;&gt; Cheers<br>
&gt;&gt; &gt;&gt;&gt; Alex<br>
&gt;&gt; &gt;&gt;&gt; On 13/04/16 12:04, <a href="mailto:nicolas@devels.es">nicolas@devels.es</a> wrote:<br>
&gt;&gt; &gt;&gt;&gt; Hi Fred,<br>
&gt;&gt; &gt;&gt;&gt; This is an iSCSI storage. I&#39;m attaching the VDSM logs from the host<br>
&gt;&gt; &gt;&gt;&gt; where this machine has been running. Should you need any further<br>
&gt;&gt; &gt;&gt;&gt; info, don&#39;t hesitate to ask.<br>
&gt;&gt; &gt;&gt;&gt; Thanks.<br>
&gt;&gt; &gt;&gt;&gt; Regards.<br>
&gt;&gt; &gt;&gt;&gt; El 2016-04-13 11:54, Fred Rolland escribió:<br>
&gt;&gt; &gt;&gt;&gt; Hi,<br>
&gt;&gt; &gt;&gt;&gt; What kind of storage do you have ? (ISCSI,FC,NFS...)<br>
&gt;&gt; &gt;&gt;&gt; Can you provide the vdsm logs from the host where this VM runs ?<br>
&gt;&gt; &gt;&gt;&gt; Thanks,<br>
&gt;&gt; &gt;&gt;&gt; Freddy<br>
&gt;&gt; &gt;&gt;&gt; On Wed, Apr 13, 2016 at 1:02 PM, &lt;<a href="mailto:nicolas@devels.es">nicolas@devels.es</a>&gt; wrote:<br>
&gt;&gt; &gt;&gt;&gt; Hi,<br>
&gt;&gt; &gt;&gt;&gt; We&#39;re running oVirt 3.6.4.1-1. Lately we&#39;re seeing a bunch of<br>
&gt;&gt; &gt;&gt;&gt; events like these:<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:30,735 INFO<br>
&gt;&gt; &gt;&gt;&gt; [org.ovirt.engine.core.vdsbroker.VmAnalyzer]<br>
&gt;&gt; &gt;&gt;&gt; (DefaultQuartzScheduler_Worker-86) [60dea18f] VM<br>
&gt;&gt; &gt;&gt;&gt; &#39;f9cd282e-110a-4896-98d3-6d320662744d&#39;(<a href="http://vm.domain.com" rel="noreferrer" target="_blank">vm.domain.com</a> [1] [1]) moved<br>
&gt;&gt; &gt;&gt;&gt; from<br>
&gt;&gt; &gt;&gt;&gt; &#39;Up&#39; --&gt; &#39;Paused&#39;<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:30,815 INFO<br>
&gt;&gt; &gt;&gt; [org.ovirt.engine.core.dal.dbbroker.auditloghandling.AuditLogDirector]<br>
&gt;&gt; &gt;&gt;&gt; (DefaultQuartzScheduler_Worker-86) [60dea18f] Correlation ID: null,<br>
&gt;&gt; &gt;&gt;&gt; Call Stack: null, Custom Event ID: -1, Message: VM <a href="http://vm.domain.com" rel="noreferrer" target="_blank">vm.domain.com</a><br>
&gt;&gt; &gt;&gt;&gt; [1] [1]<br>
&gt;&gt; &gt;&gt;&gt; has been paused.<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:30,898 ERROR<br>
&gt;&gt; &gt;&gt; [org.ovirt.engine.core.dal.dbbroker.auditloghandling.AuditLogDirector]<br>
&gt;&gt; &gt;&gt;&gt; (DefaultQuartzScheduler_Worker-86) [60dea18f] Correlation ID: null,<br>
&gt;&gt; &gt;&gt;&gt; Call Stack: null, Custom Event ID: -1, Message: VM <a href="http://vm.domain.com" rel="noreferrer" target="_blank">vm.domain.com</a><br>
&gt;&gt; &gt;&gt;&gt; [1] [1]<br>
&gt;&gt; &gt;&gt;&gt; has been paused due to no Storage space error.<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:52,320 WARN<br>
&gt;&gt; &gt;&gt;&gt; [org.ovirt.engine.core.vdsbroker.irsbroker.IrsProxyData]<br>
&gt;&gt; &gt;&gt;&gt; (org.ovirt.thread.pool-8-thread-38) [] domain<br>
&gt;&gt; &gt;&gt;&gt; &#39;5de4a000-a9c4-489c-8eee-10368647c413:iscsi01&#39; in problem. vds:<br>
&gt;&gt; &gt;&gt;&gt; &#39;<a href="http://host6.domain.com" rel="noreferrer" target="_blank">host6.domain.com</a> [2] [2]&#39;<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:55,183 INFO<br>
&gt;&gt; &gt;&gt;&gt; [org.ovirt.engine.core.vdsbroker.VmAnalyzer]<br>
&gt;&gt; &gt;&gt;&gt; (DefaultQuartzScheduler_Worker-70) [3da0f3d4] VM<br>
&gt;&gt; &gt;&gt;&gt; &#39;f9cd282e-110a-4896-98d3-6d320662744d&#39;(<a href="http://vm.domain.com" rel="noreferrer" target="_blank">vm.domain.com</a> [1] [1]) moved<br>
&gt;&gt; &gt;&gt;&gt; from<br>
&gt;&gt; &gt;&gt;&gt; &#39;Paused&#39; --&gt; &#39;Up&#39;<br>
&gt;&gt; &gt;&gt;&gt; 2016-04-13 10:52:55,318 INFO<br>
&gt;&gt; &gt;&gt; [org.ovirt.engine.core.dal.dbbroker.auditloghandling.AuditLogDirector]<br>
&gt;&gt; &gt;&gt;&gt; (DefaultQuartzScheduler_Worker-70) [3da0f3d4] Correlation ID: null,<br>
&gt;&gt; &gt;&gt;&gt; Call Stack: null, Custom Event ID: -1, Message: VM <a href="http://vm.domain.com" rel="noreferrer" target="_blank">vm.domain.com</a><br>
&gt;&gt; &gt;&gt;&gt; [1] [1]<br>
&gt;&gt; &gt;&gt;&gt; has recovered from paused back to up.<br>
&gt;&gt; &gt;&gt;&gt; The storage domain is far from being full, though (400+ G available<br>
&gt;&gt; &gt;&gt;&gt; right now). Could this be related to this other issue [1]? If not,<br>
&gt;&gt; &gt;&gt;&gt; how could I debug what&#39;s going on?<br>
&gt;&gt; &gt;&gt;&gt; Thanks.<br>
&gt;&gt; &gt;&gt;&gt;  [1]: <a href="https://www.mail-archive.com/users@ovirt.org/msg32079.html" rel="noreferrer" target="_blank">https://www.mail-archive.com/users@ovirt.org/msg32079.html</a><br>
&gt;&gt; &gt;&gt;&gt; [3]<br>
&gt;&gt; &gt;&gt;&gt; [3]<br>
&gt;&gt; &gt;&gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt;&gt; Users mailing list<br>
&gt;&gt; &gt;&gt;&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt;&gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a> [4] [4]<br>
&gt;&gt; &gt;&gt;&gt; Links:<br>
&gt;&gt; &gt;&gt;&gt; ------<br>
&gt;&gt; &gt;&gt;&gt; [1] <a href="http://vm.domain.com" rel="noreferrer" target="_blank">http://vm.domain.com</a> [1]<br>
&gt;&gt; &gt;&gt;&gt; [2] <a href="http://host6.domain.com" rel="noreferrer" target="_blank">http://host6.domain.com</a> [2]<br>
&gt;&gt; &gt;&gt;&gt; [3] <a href="https://www.mail-archive.com/users@ovirt.org/msg32079.html" rel="noreferrer" target="_blank">https://www.mail-archive.com/users@ovirt.org/msg32079.html</a> [3]<br>
&gt;&gt; &gt;&gt;&gt; [4] <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a> [4]<br>
&gt;&gt; &gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt; Users mailing list<br>
&gt;&gt; &gt;&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a> [4]<br>
&gt;&gt; &gt;&gt; --<br>
&gt;&gt; &gt;&gt; This message is intended only for the addressee and may contain<br>
&gt;&gt; &gt;&gt; confidential information. Unless you are that person, you may not<br>
&gt;&gt; &gt;&gt; disclose its contents or use it in any way and are requested to delete<br>
&gt;&gt; &gt;&gt; the message along with any attachments and notify us immediately.<br>
&gt;&gt; &gt;&gt; This email is not intended to, nor should it be taken to, constitute<br>
&gt;&gt; &gt;&gt; advice.<br>
&gt;&gt; &gt;&gt; The information provided is correct to our knowledge &amp; belief and must<br>
&gt;&gt; &gt;&gt; not<br>
&gt;&gt; &gt;&gt; be used as a substitute for obtaining tax, regulatory, investment,<br>
&gt;&gt; &gt;&gt; legal or<br>
&gt;&gt; &gt;&gt; any other appropriate advice.<br>
&gt;&gt; &gt;&gt; &quot;Transact&quot; is operated by Integrated Financial Arrangements Ltd.<br>
&gt;&gt; &gt;&gt; 29 Clement&#39;s Lane, London EC4N 7AE. Tel: (020) 7608 4900 Fax: (020)<br>
&gt;&gt; &gt;&gt; 7608 5300.<br>
&gt;&gt; &gt;&gt; (Registered office: as above; Registered in England and Wales under<br>
&gt;&gt; &gt;&gt; number: 3727592). Authorised and regulated by the Financial Conduct<br>
&gt;&gt; &gt;&gt; Authority (entered on the Financial Services Register; no. 190856).<br>
&gt;&gt; &gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt; Users mailing list<br>
&gt;&gt; &gt;&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a> [4]<br>
&gt;&gt; &gt;&gt; Links:<br>
&gt;&gt; &gt;&gt; ------<br>
&gt;&gt; &gt;&gt; [1] <a href="http://vm.domain.com" rel="noreferrer" target="_blank">http://vm.domain.com</a><br>
&gt;&gt; &gt;&gt; [2] <a href="http://host6.domain.com" rel="noreferrer" target="_blank">http://host6.domain.com</a><br>
&gt;&gt; &gt;&gt; [3] <a href="https://www.mail-archive.com/users@ovirt.org/msg32079.html" rel="noreferrer" target="_blank">https://www.mail-archive.com/users@ovirt.org/msg32079.html</a><br>
&gt;&gt; &gt;&gt; [4] <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
&gt;&gt; &gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt; Users mailing list<br>
&gt;&gt; &gt;&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
&gt;&gt; &gt; &lt;vdsm.log.gz&gt;_______________________________________________<br>
&gt;&gt; &gt; Users mailing list<br>
&gt;&gt; &gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt;&gt; &gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Users mailing list<br>
&gt; <a href="mailto:Users@ovirt.org">Users@ovirt.org</a><br>
&gt; <a href="http://lists.ovirt.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://lists.ovirt.org/mailman/listinfo/users</a><br>
&gt;<br>
</div></div></blockquote></div><br></div>