<div dir="ltr"><div><div>In my case, simply adding Skylake-Client a supported CPU family did the trick: <a href="https://github.com/lago-project/lago/pull/448">https://github.com/lago-project/lago/pull/448</a><br><br></div>i wonder if Westmere is a good fallback -- it works for you on Broadwell, right?<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Feb 8, 2017 at 1:58 PM, Nadav Goldin <span dir="ltr">&lt;<a href="mailto:ngoldin@redhat.com" target="_blank">ngoldin@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I would first try testing it without OST, because in OST it will pick<br>
the CPU via the cluster family(which is controlled in virt.py). You<br>
can try specifying the &#39;cpu_model&#39; in the init file, skipping the &#39;cpu<br>
family&#39; logic, something like:<br>
<br>
&gt; cat LagoInitFile<br>
domains:<br>
  vm-el73:<br>
    memory: 2048<br>
    service_provider: systemd<br>
    cpu_model: Broadwell<br>
    nics:<br>
      - net: lago<br>
    disks:<br>
      - template_name: el7.3-base<br>
        type: template<br>
        name: root<br>
        dev: vda<br>
        format: qcow2<br>
nets:<br>
  lago:<br>
    type: nat<br>
    dhcp:<br>
      start: 100<br>
      end: 254<br>
    management: true<br>
    dns_domain_name: lago.local<br>
<br>
&gt; lago init &amp;&amp; lago start<br>
<br>
Then install lago again in the VM, copy the same init file, and check<br>
if for different combinations of cpu_model it works for you - would<br>
give us a hint how to solve this. The &#39;cpu_model&#39; basically translates<br>
to this xml definition in libvirt:<br>
  &lt;cpu mode=&#39;custom&#39; match=&#39;exact&#39;&gt;<br>
    &lt;model fallback=&#39;allow&#39;&gt;Broadwell&lt;/<wbr>model&gt;<br>
    &lt;topology sockets=&#39;2&#39; cores=&#39;1&#39; threads=&#39;1&#39;/&gt;<br>
    &lt;feature policy=&#39;optional&#39; name=&#39;vmx&#39;/&gt;<br>
    &lt;feature policy=&#39;optional&#39; name=&#39;svm&#39;/&gt;<br>
  &lt;/cpu&gt;<br>
<br>
I tried manually editing it also to host-passthrough, but still failed<br>
on the same error. The thing is that the &#39;kvm_put_msrs: Assertion `ret<br>
== n&#39; failed.&#39; error doesn&#39;t give any indication where it failed(or if<br>
the cpu is missing a flag), maybe there is a way to debug this at<br>
qemu/kvm level? I&#39;m not sure.<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
<br>
<br>
<br>
<br>
On Wed, Feb 8, 2017 at 1:18 PM, Ondrej Svoboda &lt;<a href="mailto:osvoboda@redhat.com">osvoboda@redhat.com</a>&gt; wrote:<br>
&gt; It is a Skylake-H, and I can see it is not mentioned in lago/virt.py.<br>
&gt;<br>
&gt; I guess I&#39;ll step through the code (as well as other places discovered by<br>
&gt; &#39;git grep cpu&#39;) and see if I could solve this by adding the Skylake family<br>
&gt; to _CPU_FAMILIES.<br>
&gt;<br>
&gt; Do you have other pointers?<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Ondra<br>
&gt;<br>
&gt; On Tue, Feb 7, 2017 at 10:40 PM, Nadav Goldin &lt;<a href="mailto:ngoldin@redhat.com">ngoldin@redhat.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; What is the host CPU you are using?<br>
&gt;&gt; I came across the same error few days ago, but without running OST, I<br>
&gt;&gt; tried running with Lago:<br>
&gt;&gt; fc24 host -&gt; el7 vm -&gt; el7 vm.<br>
&gt;&gt;<br>
&gt;&gt; I have a slight suspect that it is related to the CPU model we<br>
&gt;&gt; configure in libvirt, I tried a mixture of few<br>
&gt;&gt; combinations(host-pass-<wbr>through, pinning down the CPU model), but it<br>
&gt;&gt; always failed on the same error:<br>
&gt;&gt; kvm_put_msrs: Assertion `ret == n&#39; failed.<br>
&gt;&gt;<br>
&gt;&gt; My CPU is Broadwell btw.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Milan, any ideas? you think it might be related?<br>
&gt;&gt;<br>
&gt;&gt; Nadav.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Feb 7, 2017 at 11:14 PM, Ondrej Svoboda &lt;<a href="mailto:osvoboda@redhat.com">osvoboda@redhat.com</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt; &gt; Yes, I stated that in my message.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; root@osvoboda-t460p /home/src/ovirt-system-tests (git)-[master] # cat<br>
&gt;&gt; &gt; /sys/module/kvm_intel/<wbr>parameters/nested<br>
&gt;&gt; &gt; :(<br>
&gt;&gt; &gt; Y<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On Tue, Feb 7, 2017 at 1:39 PM, Eyal Edri &lt;<a href="mailto:eedri@redhat.com">eedri@redhat.com</a>&gt; wrote:<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; Did you follow the instructions on [1] ?<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; Specifically, verifying  &#39; cat /sys/module/kvm_intel/<wbr>parameters/nested<br>
&gt;&gt; &gt;&gt; &#39;<br>
&gt;&gt; &gt;&gt; gives you &#39;Y&#39;.<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; [1]<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; <a href="http://ovirt-system-tests.readthedocs.io/en/latest/docs/general/installation.html" rel="noreferrer" target="_blank">http://ovirt-system-tests.<wbr>readthedocs.io/en/latest/docs/<wbr>general/installation.html</a><br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; On Tue, Feb 7, 2017 at 2:29 PM, Ondrej Svoboda &lt;<a href="mailto:osvoboda@redhat.com">osvoboda@redhat.com</a>&gt;<br>
&gt;&gt; &gt;&gt; wrote:<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Hi everyone,<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Even though I have nested virtualization enabled in my Arch Linux<br>
&gt;&gt; &gt;&gt;&gt; system<br>
&gt;&gt; &gt;&gt;&gt; which I use to run OST, vm_run is the first test to fail in<br>
&gt;&gt; &gt;&gt;&gt; 004_basic_sanity<br>
&gt;&gt; &gt;&gt;&gt; (followed by snapshots_merge and suspend_resume_vm).<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Can you point me to what I might be missing? I believe I get the same<br>
&gt;&gt; &gt;&gt;&gt; failure even on Fedora.<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; This is what host0&#39;s CPU capabilities look like (vmx is there):<br>
&gt;&gt; &gt;&gt;&gt; [root@lago-basic-suite-master-<wbr>host0 ~]# cat /proc/cpuinfo<br>
&gt;&gt; &gt;&gt;&gt; processor    : 0<br>
&gt;&gt; &gt;&gt;&gt; vendor_id    : GenuineIntel<br>
&gt;&gt; &gt;&gt;&gt; cpu family    : 6<br>
&gt;&gt; &gt;&gt;&gt; model        : 44<br>
&gt;&gt; &gt;&gt;&gt; model name    : Westmere E56xx/L56xx/X56xx (Nehalem-C)<br>
&gt;&gt; &gt;&gt;&gt; stepping    : 1<br>
&gt;&gt; &gt;&gt;&gt; microcode    : 0x1<br>
&gt;&gt; &gt;&gt;&gt; cpu MHz        : 2711.988<br>
&gt;&gt; &gt;&gt;&gt; cache size    : 16384 KB<br>
&gt;&gt; &gt;&gt;&gt; physical id    : 0<br>
&gt;&gt; &gt;&gt;&gt; siblings    : 1<br>
&gt;&gt; &gt;&gt;&gt; core id        : 0<br>
&gt;&gt; &gt;&gt;&gt; cpu cores    : 1<br>
&gt;&gt; &gt;&gt;&gt; apicid        : 0<br>
&gt;&gt; &gt;&gt;&gt; initial apicid    : 0<br>
&gt;&gt; &gt;&gt;&gt; fpu        : yes<br>
&gt;&gt; &gt;&gt;&gt; fpu_exception    : yes<br>
&gt;&gt; &gt;&gt;&gt; cpuid level    : 11<br>
&gt;&gt; &gt;&gt;&gt; wp        : yes<br>
&gt;&gt; &gt;&gt;&gt; flags        : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge<br>
&gt;&gt; &gt;&gt;&gt; mca<br>
&gt;&gt; &gt;&gt;&gt; cmov pat pse36 clflush mmx fxsr sse sse2 syscall nx lm constant_tsc<br>
&gt;&gt; &gt;&gt;&gt; rep_good<br>
&gt;&gt; &gt;&gt;&gt; nopl xtopology pni pclmulqdq vmx ssse3 cx16 sse4_1 sse4_2 x2apic<br>
&gt;&gt; &gt;&gt;&gt; popcnt aes<br>
&gt;&gt; &gt;&gt;&gt; hypervisor lahf_lm arat tpr_shadow vnmi flexpriority ept vpid<br>
&gt;&gt; &gt;&gt;&gt; bogomips    : 5423.97<br>
&gt;&gt; &gt;&gt;&gt; clflush size    : 64<br>
&gt;&gt; &gt;&gt;&gt; cache_alignment    : 64<br>
&gt;&gt; &gt;&gt;&gt; address sizes    : 40 bits physical, 48 bits virtual<br>
&gt;&gt; &gt;&gt;&gt; power management:<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; journalctl -b on host0 shows that libvirt complains about NUMA<br>
&gt;&gt; &gt;&gt;&gt; configuration:<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 libvirtd[12888]: libvirt<br>
&gt;&gt; &gt;&gt;&gt; version: 2.0.0, package: 10.el7_3.4 (CentOS BuildSystem<br>
&gt;&gt; &gt;&gt;&gt; &lt;<a href="http://bugs.centos.org" rel="noreferrer" target="_blank">http://bugs.centos.org</a>&gt;, <a href="tel:2017-01-17-23" value="+12017011723">2017-01-17-23</a>:37:48, <a href="http://c1bm.rdu2.centos.org" rel="noreferrer" target="_blank">c1bm.rdu2.centos.org</a>)<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 kernel: ovirtmgmt: port<br>
&gt;&gt; &gt;&gt;&gt; 2(vnet0) entered disabled state<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 kernel: device vnet0<br>
&gt;&gt; &gt;&gt;&gt; left<br>
&gt;&gt; &gt;&gt;&gt; promiscuous mode<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 kernel: ovirtmgmt: port<br>
&gt;&gt; &gt;&gt;&gt; 2(vnet0) entered disabled state<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 libvirtd[12888]:<br>
&gt;&gt; &gt;&gt;&gt; hostname:<br>
&gt;&gt; &gt;&gt;&gt; lago-basic-suite-master-host0.<wbr>lago.local<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 libvirtd[12888]: Unable<br>
&gt;&gt; &gt;&gt;&gt; to<br>
&gt;&gt; &gt;&gt;&gt; read from monitor: Connection reset by peer<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 libvirtd[12888]:<br>
&gt;&gt; &gt;&gt;&gt; internal<br>
&gt;&gt; &gt;&gt;&gt; error: qemu unexpectedly closed the monitor:<br>
&gt;&gt; &gt;&gt;&gt; 2017-02-07T11:33:23.058571Z<br>
&gt;&gt; &gt;&gt;&gt; qemu-kvm: warning: CPU(s) not present in any NUMA nodes: 1 2 3 4 5 6 7<br>
&gt;&gt; &gt;&gt;&gt; 8 9<br>
&gt;&gt; &gt;&gt;&gt; 10 11 12 13 14 15<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 2017-02-07T11:33:23.058826Z qemu-kvm: warning: All CPU(s) up to<br>
&gt;&gt; &gt;&gt;&gt; maxcpus<br>
&gt;&gt; &gt;&gt;&gt; should be described in NUMA config<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; qemu-kvm:<br>
&gt;&gt; &gt;&gt;&gt; /builddir/build/BUILD/qemu-2.<wbr>6.0/target-i386/kvm.c:1736: kvm_put_msrs:<br>
&gt;&gt; &gt;&gt;&gt; Assertion `ret == n&#39; failed.<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 NetworkManager[657]:<br>
&gt;&gt; &gt;&gt;&gt; &lt;info&gt;<br>
&gt;&gt; &gt;&gt;&gt; [1486467203.1025] device (vnet0): state change: disconnected -&gt;<br>
&gt;&gt; &gt;&gt;&gt; unmanaged<br>
&gt;&gt; &gt;&gt;&gt; (reason &#39;unmanaged&#39;) [30 10 3]<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 kvm[22059]: 0 guests now<br>
&gt;&gt; &gt;&gt;&gt; active<br>
&gt;&gt; &gt;&gt;&gt; Feb 07 06:33:23 lago-basic-suite-master-host0 systemd-machined[22044]:<br>
&gt;&gt; &gt;&gt;&gt; Machine qemu-1-vm0 terminated.<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Thanks,<br>
&gt;&gt; &gt;&gt;&gt; Ondra<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; ______________________________<wbr>_________________<br>
&gt;&gt; &gt;&gt;&gt; Devel mailing list<br>
&gt;&gt; &gt;&gt;&gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt;&gt; &gt;&gt;&gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel" rel="noreferrer" target="_blank">http://lists.ovirt.org/<wbr>mailman/listinfo/devel</a><br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; --<br>
&gt;&gt; &gt;&gt; Eyal Edri<br>
&gt;&gt; &gt;&gt; Associate Manager<br>
&gt;&gt; &gt;&gt; RHV DevOps<br>
&gt;&gt; &gt;&gt; EMEA ENG Virtualization R&amp;D<br>
&gt;&gt; &gt;&gt; Red Hat Israel<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; phone: <a href="tel:%2B972-9-7692018" value="+97297692018">+972-9-7692018</a><br>
&gt;&gt; &gt;&gt; irc: eedri (on #tlv #rhev-dev #rhev-integ)<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ______________________________<wbr>_________________<br>
&gt;&gt; &gt; Devel mailing list<br>
&gt;&gt; &gt; <a href="mailto:Devel@ovirt.org">Devel@ovirt.org</a><br>
&gt;&gt; &gt; <a href="http://lists.ovirt.org/mailman/listinfo/devel" rel="noreferrer" target="_blank">http://lists.ovirt.org/<wbr>mailman/listinfo/devel</a><br>
&gt;<br>
&gt;<br>
</div></div></blockquote></div><br></div>