<html><head></head><body bgcolor="#ffffff" text="#2e3436" link="#2a76c6" vlink="#215d9c"><div><br></div><div>On Fri, 2016-04-01 at 21:39 -0400, Brett I. Holcomb wrote:</div><blockquote type="cite"><div>Two items here.</div><div><br></div><div>oVirt version 3.6.4 &nbsp;Fresh install, not an upgrade.</div><div><br></div><div><br></div><div>First, I noticed this issue when I did an install on a test machine but I didn't have the data to present. &nbsp;Because of that and some other posts dealing with the network issue I kept notes when I installed on my production system. &nbsp; I'm doing a hosted-engine setup.</div><div><br></div><div>As part of the preparation I did the following before installing and deploying.</div><div><br></div><div>* Removed NetworkManager with yum remove NetworkManager</div><div>* The NIC that will be used for the oVirt management NIC is connected to a switch port expecting VLAN 50 so I set up a VLAN50 ifcfg file.</div><div>* The IP address of the &nbsp;server, prefix, gateway, and TWO DNS servers were setup in the ifcfg file. and name resolution worked. &nbsp;I could ping the host by name as well as the oVirt Engine VM which was in DNS so the name resolved but obviously nothing would reply. &nbsp;Other servers and workstations could resolve the host and engine names.</div><div><br></div><div>1. &nbsp;On the host I ran hosted-engine --deploy and installed the OS (Centos 7 (1511) on the Engine VM. &nbsp;I rebooted the Engine VM, told the deployment that the Engine VM was running and it then continued and deployment told me to install the engine on the Engine VM.</div><div>2. &nbsp;I updated the Engine VM via yum update, &nbsp;installed the oVirt repositories, and ran the engine-setup which completed successfully.</div><div>3. I then went back to the host and told it the Engine was setup and at this point things went bad. &nbsp;The deployment started whining about not being able to resolve myenginevm.mydomain.com host, did cleanup, per-termination, termination, and said the deployment failed and the system was unreliable, fix it, &nbsp;whine, whine, whine.</div><div>4. &nbsp;I tried a ping on myenginevm.mydomain.com and it failed.</div><div><br></div><div>What I found was that when the bridge was created (ifcfg-ovirtmgmt) the DNS servers were left out! &nbsp;They were in the original NIC ifcfg file but it appears the deployment didn't bother to bring them over to the bridge ifcfg. &nbsp;I find this very puzzling since the deployment insists on FQDNs so it should be smart enough to bring over the DNS server settings and not leave them out. &nbsp;My /etc/resolv.conf file also had no DNS servers in it.</div><div><br></div><div>I added the DNS server to the bridge ifcfg file, did a systemctl restart network and all is well again. &nbsp;The host can ping the VM!&nbsp;</div><div><br></div><div>However, the deployment thinks it failed and I can not restart the Engine VM. &nbsp;I tried a reboot, made sure the ovirt daemons were running but if I try and do anything such as hosted-engine vm-start I get &nbsp;"Unable to read vm.conf, please check ovirt-ha-agent logs".</div><div><br></div><div>Second, I think that having the deployment fail simply because it can not contact the Engine VM is a very huge error/bug/whatever - its silly. &nbsp;The deployment went well, the VM exists and is running but due to the deployment messing up the DNS servers it just can't find it. &nbsp;The deployment should first, handle the name server setup correctly and second fail gracefully.. &nbsp;</div><div><br></div><div>I rebooted the server but still get the error about not being able to read vm.conf. &nbsp;At this point I now have to run through the entire deployment again just because one phase messed up unless there is a way to work around this. &nbsp;However, in the work that I've done with oVirt I've notice the deployment is not real robust and when it encounters errors that should allow it to recover. &nbsp;I suggest that consideration be given to making the deployment smarter and more robust.&nbsp;</div><div><br></div><div><br></div><pre>_______________________________________________
Users mailing list
<a href="mailto:Users@ovirt.org">Users@ovirt.org</a>
<a href="http://lists.ovirt.org/mailman/listinfo/users
">http://lists.ovirt.org/mailman/listinfo/users
</a></pre></blockquote><div><br></div><div><br></div><div>More info.&nbsp;</div><div><br></div><div>This gets broken during the hosted-engine --deploy first phase (before the OS is installed on the Engine VM) which makes sense because I assume that's when the bridge is created.</div><div><br></div><div>I added another logical network with a VLAN tag and this broke name resolution again. &nbsp;I had to do systemctl restart network again and then name resolution was back.</div><div><br></div><div>I'm attempting to use the web portal but it's very/very slow. &nbsp;When I select the admin portal it can take 5+ minutes before it displays the login page if it ever does and doesn't time out. &nbsp;Once I get the Admin login it goes pretty quickly. &nbsp;I'm using Firefox 45.0.1 on Fedora 23. &nbsp;Any reason for this? &nbsp;From what I see the message about not supporting the browser is bogus. &nbsp;My host has 64 gig memory, and E2620-v3 processor.</div><div><br></div><div><br></div><div><br></div><div><br></div></body></html>