<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 12pt;
font-family:Calibri
}
--></style></head>
<body class='hmmessage'><div dir='ltr'>&gt; Date: Tue, 11 Mar 2014 15:16:36 +0100<br><div>&gt; From: sbonazzo@redhat.com<br>&gt; To: giuseppe.ragusa@hotmail.com; jbrooks@redhat.com; msivak@redhat.com<br>&gt; CC: users@ovirt.org; fsimonce@redhat.com; gpadgett@redhat.com<br>&gt; Subject: Re: [Users] hosted engine help<br>&gt; <br>&gt; Il 10/03/2014 22:32, Giuseppe Ragusa ha scritto:<br>&gt; &gt; Hi all,<br>&gt; &gt; <br>&gt; &gt;&gt; Date: Mon, 10 Mar 2014 12:56:19 -0400<br>&gt; &gt;&gt; From: jbrooks@redhat.com<br>&gt; &gt;&gt; To: msivak@redhat.com<br>&gt; &gt;&gt; CC: users@ovirt.org<br>&gt; &gt;&gt; Subject: Re: [Users] hosted engine help<br>&gt; &gt;&gt;<br>&gt; &gt;&gt;<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; ----- Original Message -----<br>&gt; &gt;&gt; &gt; From: "Martin Sivak" &lt;msivak@redhat.com&gt;<br>&gt; &gt;&gt; &gt; To: "Dan Kenigsberg" &lt;danken@redhat.com&gt;<br>&gt; &gt;&gt; &gt; Cc: users@ovirt.org<br>&gt; &gt;&gt; &gt; Sent: Saturday, March 8, 2014 11:52:59 PM<br>&gt; &gt;&gt; &gt; Subject: Re: [Users] hosted engine help<br>&gt; &gt;&gt; &gt;<br>&gt; &gt;&gt; &gt; Hi Jason,<br>&gt; &gt;&gt; &gt;<br>&gt; &gt;&gt; &gt; can you please attach the full logs? We had very similar issue before I we<br>&gt; &gt;&gt; &gt; need to see if is the same or not.<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; I may have to recreate it -- I switched back to an all in one engine after my<br>&gt; &gt;&gt; setup started refusing to run the engine at all. It's no fun losing your engine!<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; This was a migrated-from-standalone setup, maybe that caused additional wrinkles...<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; Jason<br>&gt; &gt;&gt;<br>&gt; &gt;&gt; &gt;<br>&gt; &gt;&gt; &gt; Thanks<br>&gt; &gt; <br>&gt; &gt; I experienced the exact same symptoms as Jason on a from-scratch installation on two physical nodes with CentOS 6.5 (fully up-to-date) using oVirt<br>&gt; &gt; 3.4.0_pre (latest test-day release) and GlusterFS 3.5.0beta3 (with Gluster-provided NFS as storage for the self-hosted engine VM only).<br>&gt; <br>&gt; Using GlusterFS with hosted-engine storage is not supported and not recommended.<br>&gt; HA daemon may not work properly there.<br><br>If it is unsupported (and particularly "not recommended") even with the interposed NFS (the native Gluster-provided NFSv3 export of a volume), then which is the recommended way to setup a fault-tolerant load-balanced 2 node oVirt cluster (without external dedicated SAN/NAS)?<br><br>&gt; &gt; I roughly followed the guide from Andrew Lau:<br>&gt; &gt; <br>&gt; &gt; http://www.andrewklau.com/ovirt-hosted-engine-with-3-4-0-nightly/<br>&gt; &gt; <br>&gt; &gt; with some variations due to newer packages (resolved bugs) and different hardware setup (no VLANs in my setup: physically separated networks; custom<br>&gt; &gt; second nic added to Engine VM template before deploying etc.)<br>&gt; &gt; <br>&gt; &gt; The self-hosted installation on first node + Engine VM (configured for managing both oVirt and the storage; Datacenter default set to NFS because no<br>&gt; &gt; GlusterFS offered) went apparently smooth, but the HA-agent failed to start at the very end (same errors in logs as Jason: the storage domain seems<br>&gt; &gt; "missing") and I was only able to start it all manually with:<br>&gt; &gt; <br>&gt; &gt; hosted-engine --connect-storage<br>&gt; &gt; hosted-engine --start-pool<br>&gt; <br>&gt; The above commands are used for development and shouldn't be used for starting the engine.<br><br>Directly starting the engine (with the command below) failed because of storage unavailability, so I used the above "trick" as a "last resort" to at least prove that the engine was able to start and had not been somewhat "destroyed" or "lost" in the process (but I do understand that it is an extreme debug-only action).<br><br>&gt; &gt; hosted-engine --vm-start<br>&gt; &gt; <br>&gt; &gt; then the Engine came up and I could use it, I even registered the second node (same final error in HA-agent) and tried to add GlusterFS storage<br>&gt; &gt; domains for further VMs and ISOs (by the way: the original NFS-GlusterFS domain for Engine VM only is not present inside the Engine web UI) but it<br>&gt; &gt; always failed activating the domains (they remain "Inactive").<br>&gt; &gt; <br>&gt; &gt; Furthermore the engine gets killed some time after starting (from 3 up to 11 hours later) and the only way to get it back is repeating the above commands.<br>&gt; <br>&gt; Need logs for this.<br><br>I will try to reproduce it all, but I can recall that on libvirt logs (HostedEngine.log) there was always clear indication of the PID that killed the Engine VM and each time it belonged to an instance of sanlock.<br><br>&gt; &gt; I always managed GlusterFS "natively" (not through oVirt) from the commandline and verified that the NFS-exported Engine-VM-only volume gets<br>&gt; &gt; replicated, but I obviously failed to try migration because the HA part results inactive and oVirt refuse to migrate the Engine.<br>&gt; &gt; <br>&gt; &gt; Since I tried many times, with variations and further manual actions between (like trying to manually mount the NFS Engine domain, restarting the<br>&gt; &gt; HA-agent only etc.), my logs are "cluttered", so I should start from scratch again and pack up all logs in one swipe.<br>&gt; <br>&gt; +1<br><br>;&gt;<br><br>&gt; &gt; Tell me what I should capture and at which points in the whole process and I will try to follow up as soon as possible.<br>&gt; <br>&gt; What:<br>&gt; hosted-engine-setup, hosted-engine-ha, vdsm, libvirt, sanlock from the physical hosts and engine and server logs from the hosted engine VM.<br>&gt; <br>&gt; When:<br>&gt; As soon as you see an error.<br><br>If the setup design (wholly GlusterFS based) is somewhat flawed, please point me to some hint/docs/guide for the right way of setting it up on 2 standalone physical nodes, so as not to waste your time in chasing "defects" in something that is not supposed to be working anyway.<br><br>I will follow your advice and try it accordingly.<br><br>Many thanks again,<br>Giuseppe<br><br>&gt; &gt; Many thanks,<br>&gt; &gt; Giuseppe<br>&gt; &gt; <br>&gt; &gt;&gt; &gt; --<br>&gt; &gt;&gt; &gt; Martin Sivák<br>&gt; &gt;&gt; &gt; msivak@redhat.com<br>&gt; &gt;&gt; &gt; Red Hat Czech<br>&gt; &gt;&gt; &gt; RHEV-M SLA / Brno, CZ<br>&gt; &gt;&gt; &gt;<br>&gt; &gt;&gt; &gt; ----- Original Message -----<br>&gt; &gt;&gt; &gt; &gt; On Fri, Mar 07, 2014 at 10:17:43AM +0100, Sandro Bonazzola wrote:<br>&gt; &gt;&gt; &gt; &gt; &gt; Il 07/03/2014 01:10, Jason Brooks ha scritto:<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; Hey everyone, I've been testing out oVirt 3.4 w/ hosted engine, and<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; while I've managed to bring the engine up, I've only been able to do it<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; manually, using "hosted-engine --vm-start".<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; The ovirt-ha-agent service fails reliably for me, erroring out with<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; "RequestError: Request failed: success."<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; I've pasted error passages from the ha agent and vdsm logs below.<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; &gt; &gt; &gt; Any pointers?<br>&gt; &gt;&gt; &gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; &gt; &gt; looks like a VDSM bug, Dan?<br>&gt; &gt;&gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; &gt; Why? The exception is raised from deep inside the ovirt_hosted_engine_ha<br>&gt; &gt;&gt; &gt; &gt; code.<br>&gt; &gt;&gt; &gt; &gt; _______________________________________________<br>&gt; &gt;&gt; &gt; &gt; Users mailing list<br>&gt; &gt;&gt; &gt; &gt; Users@ovirt.org<br>&gt; &gt;&gt; &gt; &gt; http://lists.ovirt.org/mailman/listinfo/users<br>&gt; &gt;&gt; &gt; &gt;<br>&gt; &gt;&gt; &gt; _______________________________________________<br>&gt; &gt;&gt; &gt; Users mailing list<br>&gt; &gt;&gt; &gt; Users@ovirt.org<br>&gt; &gt;&gt; &gt; http://lists.ovirt.org/mailman/listinfo/users<br>&gt; &gt;&gt; &gt;<br>&gt; &gt;&gt; _______________________________________________<br>&gt; &gt;&gt; Users mailing list<br>&gt; &gt;&gt; Users@ovirt.org<br>&gt; &gt;&gt; http://lists.ovirt.org/mailman/listinfo/users<br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt; _______________________________________________<br>&gt; &gt; Users mailing list<br>&gt; &gt; Users@ovirt.org<br>&gt; &gt; http://lists.ovirt.org/mailman/listinfo/users<br>&gt; &gt; <br>&gt; <br>&gt; <br>&gt; -- <br>&gt; Sandro Bonazzola<br>&gt; Better technology. Faster innovation. Powered by community collaboration.<br>&gt; See how it works at redhat.com<br></div>                                               </div></body>
</html>