<div dir="ltr"><div><div><div><div>Hi All, <br><br></div>Any idea on the below?<br><br></div>I am using oVirt Guest Tools 4.2-1.el7.centos for the VM. <br></div>The Window 2016 server VM (which it the one with the relatively big disks: 500 GB) it is consistently rendered unresponsive when trying to get a snapshot. <br></div><div>I amy provide any other additional logs if needed. <br></div><div><br></div>Alex<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Sun, Mar 25, 2018 at 7:30 PM, Alex K <span dir="ltr">&lt;<a href="mailto:rightkicktech@gmail.com" target="_blank">rightkicktech@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div><div>Hi folks, <br><br></div>I am facing frequently the following issue: <br><br></div>On some large VMs (Windows 2016 with two disk drives, 60GB and 500GB) when attempting to create a snapshot of the VM, the VM becomes unresponsive. <br><br></div>The errors that I managed to collect were: <br><br>vdsm error at host hosting the VM: <br><span style="font-family:monospace,monospace">2018-03-25 14:40:13,442+0000 WARN  (vdsm.Scheduler) [Executor] Worker blocked: &lt;Worker name=jsonrpc/7 running &lt;Task &lt;JsonRpcTask {&#39;params&#39;: {u&#39;frozen&#39;: False, u&#39;vmID&#39;: u&#39;a5c761a2-41cd-40c2-b65f-<wbr>f3819293e8a4&#39;, u&#39;snapDrives&#39;: [{u&#39;baseVolumeID&#39;: u&#39;2a33e585-ece8-4f4d-b45d-<wbr>5ecc9239200e&#39;, u&#39;domainID&#39;: u&#39;888e3aae-f49f-42f7-a7fa-<wbr>76700befabea&#39;, u&#39;volumeID&#39;: u&#39;e9a01ebd-83dd-40c3-8c83-<wbr>5302b0d15e04&#39;, u&#39;imageID&#39;: u&#39;c75b8e93-3067-4472-bf24-<wbr>dafada224e4d&#39;}, {u&#39;baseVolumeID&#39;: u&#39;3fb2278c-1b0d-4677-a529-<wbr>99084e4b08af&#39;, u&#39;domainID&#39;: u&#39;888e3aae-f49f-42f7-a7fa-<wbr>76700befabea&#39;, u&#39;volumeID&#39;: u&#39;78e6b6b1-2406-4393-8d92-<wbr>831a6d4f1337&#39;, u&#39;imageID&#39;: u&#39;d4223744-bf5d-427b-bec2-<wbr>f14b9bc2ef81&#39;}]}, &#39;jsonrpc&#39;: &#39;2.0&#39;, &#39;method&#39;: u&#39;VM.snapshot&#39;, &#39;id&#39;: u&#39;89555c87-9701-4260-9952-<wbr>789965261e65&#39;} at 0x7fca4004cc90&gt; timeout=60, duration=60 at 0x39d8210&gt; task#=155842 at 0x2240e10&gt; (executor:351)<br>2018-03-25 14:40:15,261+0000 INFO  (jsonrpc/3) [jsonrpc.JsonRpcServer] RPC call VM.getStats failed (error 1) in 0.01 seconds (__init__:539)<br>2018-03-25 14:40:17,471+0000 WARN  (jsonrpc/5) [virt.vm] (vmId=&#39;a5c761a2-41cd-40c2-<wbr>b65f-f3819293e8a4&#39;) monitor became unresponsive (command timeout, age=67.9100000001) (vm:5132)</span><br><br>engine.log: <br><span style="font-family:monospace,monospace">2018-03-25 14:40:19,875Z WARN  [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (DefaultQuartzScheduler2) [1d737df7] EVENT_ID: VM_NOT_RESPONDING(126), Correlation ID: null, Call Stack: null, Custom ID: null, Custom Event ID: -1, Message: VM Data-Server is not responding.<br><br>2018-03-25 14:42:13,708Z ERROR [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (DefaultQuartzScheduler5) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] EVENT_ID: VDS_BROKER_COMMAND_FAILURE(10,<wbr>802), Correlation ID: null, Call Stack: null, Custom ID: null, Custom Event ID: -1, Message: VDSM v1.cluster command SnapshotVDS failed: Message timeout which can be caused by communication issues<br>2018-03-25 14:42:13,708Z ERROR [org.ovirt.engine.core.<wbr>vdsbroker.vdsbroker.<wbr>SnapshotVDSCommand] (DefaultQuartzScheduler5) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] Command &#39;SnapshotVDSCommand(HostName = v1.cluster, SnapshotVDSCommandParameters:{<wbr>runAsync=&#39;true&#39;, hostId=&#39;a713d988-ee03-4ff0-<wbr>a0cd-dc4cde1507f4&#39;, vmId=&#39;a5c761a2-41cd-40c2-b65f-<wbr>f3819293e8a4&#39;})&#39; execution failed: VDSGenericException: VDSNetworkException: Message timeout which can be caused by communication issues<br>2018-03-25 14:42:13,708Z WARN  [org.ovirt.engine.core.bll.<wbr>snapshots.<wbr>CreateAllSnapshotsFromVmComman<wbr>d] (DefaultQuartzScheduler5) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] Could not perform live snapshot due to error, VM will still be configured to the new created snapshot: EngineException: org.ovirt.engine.core.<wbr>vdsbroker.vdsbroker.<wbr>VDSNetworkException: VDSGenericException: VDSNetworkException: Message timeout which can be caused by communication issues (Failed with error VDS_NETWORK_ERROR and code 5022)<br>2018-03-25 14:42:13,708Z WARN  [org.ovirt.engine.core.<wbr>vdsbroker.VdsManager] (org.ovirt.thread.pool-6-<wbr>thread-15) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] Host &#39;v1.cluster&#39; is not responding. It will stay in Connecting state for a grace period of 61 seconds and after that an attempt to fence the host will be issued.<br>2018-03-25 14:42:13,725Z WARN  [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (org.ovirt.thread.pool-6-<wbr>thread-15) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] EVENT_ID: VDS_HOST_NOT_RESPONDING_<wbr>CONNECTING(9,008), Correlation ID: null, Call Stack: null, Custom ID: null, Custom Event ID: -1, Message: Host v1.cluster is not responding. It will stay in Connecting state for a grace period of 61 seconds and after that an attempt to fence the host will be issued.<br>2018-03-25 14:42:13,751Z WARN  [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (DefaultQuartzScheduler5) [17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa] EVENT_ID: USER_CREATE_LIVE_SNAPSHOT_<wbr>FINISHED_FAILURE(170), Correlation ID: 17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa, Job ID: 16e48c28-a8c7-4841-bd81-<wbr>1f2d370f345d, Call Stack: org.ovirt.engine.core.common.<wbr>errors.EngineException: EngineException: org.ovirt.engine.core.<wbr>vdsbroker.vdsbroker.<wbr>VDSNetworkException: VDSGenericException: VDSNetworkException: Message timeout which can be caused by communication issues (Failed with error VDS_NETWORK_ERROR and code 5022)<br>2018-03-25 14:42:14,372Z ERROR [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (DefaultQuartzScheduler5) [] EVENT_ID: USER_CREATE_SNAPSHOT_FINISHED_<wbr>FAILURE(69), Correlation ID: 17789048-009a-454b-b8ad-<wbr>2c72c7cd37aa, Job ID: 16e48c28-a8c7-4841-bd81-<wbr>1f2d370f345d, Call Stack: org.ovirt.engine.core.common.<wbr>errors.EngineException: EngineException: org.ovirt.engine.core.<wbr>vdsbroker.vdsbroker.<wbr>VDSNetworkException: VDSGenericException: VDSNetworkException: Message timeout which can be caused by communication issues (Failed with error VDS_NETWORK_ERROR and code 5022)<br>2018-03-25 14:42:14,372Z WARN  [org.ovirt.engine.core.bll.<wbr>ConcurrentChildCommandsExecuti<wbr>onCallback] (DefaultQuartzScheduler5) [] Command &#39;CreateAllSnapshotsFromVm&#39; id: &#39;bad4f5be-5306-413f-a86a-<wbr>513b3cfd3c66&#39; end method execution failed, as the command isn&#39;t marked for endAction() retries silently ignoring<br>2018-03-25 14:42:15,951Z WARN  [org.ovirt.engine.core.dal.<wbr>dbbroker.auditloghandling.<wbr>AuditLogDirector] (DefaultQuartzScheduler5) [5017c163] EVENT_ID: VDS_NO_SELINUX_ENFORCEMENT(25)<wbr>, Correlation ID: null, Call Stack: null, Custom ID: null, Custom Event ID: -1, Message: Host v1.cluster does not enforce SELinux. Current status: DISABLED<br>2018-03-25 14:42:15,951Z WARN  [org.ovirt.engine.core.<wbr>vdsbroker.VdsManager] (DefaultQuartzScheduler5) [5017c163] Host &#39;v1.cluster&#39; is running with SELinux in &#39;DISABLED&#39; mode<br></span><br>As soon as the VM is unresponsive, the VM console that was already open freezes. I can resume the VM only by powering off and on. <br></div><br>I am using ovirt 4.1.9 with 3 nodes and self-hosted engine. I am running mostly Windows 10 and Windows 2016 server VMs. I have installed latest guest agents from: <br><br><a href="http://resources.ovirt.org/pub/ovirt-4.2/iso/oVirt-toolsSetup/4.2-1.el7.centos/" target="_blank">http://resources.ovirt.org/<wbr>pub/ovirt-4.2/iso/oVirt-<wbr>toolsSetup/4.2-1.el7.centos/</a><br><br></div><div>At the screen where one takes a snapshot I get a warning saying &quot;Could not detect guest agent on the VM. Note that without guest agent the data on the created snapshot may be inconsistent&quot;. See attached. I have verified that ovirt guest tools are installed and shown at installed apps at engine GUI. Also Ovirt Guest Agent (32 bit) and qemu-ga are listed as running at the windows tasks manager. Shouldn&#39;t ovirt guest agent be 64 bit on Windows 64 bit?<br></div><div><br></div><div>Any advice will be much appreciated. <br><span class="HOEnZb"><font color="#888888"><br></font></span></div><span class="HOEnZb"><font color="#888888"><div>Alex<br></div><div><br></div><div><br><br><br></div><div><div><br></div></div></font></span></div>
</blockquote></div><br></div>