<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head><body>I have only one switch so two interfaces are connected to the same switch. The configuration in switch is corrected. &nbsp;I opened a ticket for switch Tech support and the configuration was validated.<div><br></div><div>This configuration worked without problems h24 for one year! !!!! &nbsp;All problems started after a kernel update.... so something was changed in kernel. ....</div><br><br><div style="font-size:100%;text-align:left;color:#000000">-------- Messaggio originale --------<br>Da: Dan Kenigsberg &lt;danken@redhat.com&gt; <br>Data: 04/02/2016  22:02  (GMT+01:00) <br>A: Stefano Danzi &lt;s.danzi@hawai.it&gt;, ydary@redhat.com <br>Cc: Jon Archer &lt;jon@rosslug.org.uk&gt;, mburman@redhat.com, users@ovirt.org <br>Oggetto: Re: [ovirt-users] R: Re: Network instability after upgrade 3.6.0 -&gt;
  3.6.1 <br><br></div>On Thu, Feb 04, 2016 at 06:26:14PM +0100, Stefano Danzi wrote:<br>&gt; <br>&gt; <br>&gt; Il 04/02/2016 16.55, Dan Kenigsberg ha scritto:<br>&gt; &gt;On Wed, Jan 06, 2016 at 08:45:16AM +0200, Dan Kenigsberg wrote:<br>&gt; &gt;&gt;On Mon, Jan 04, 2016 at 01:54:37PM +0200, Dan Kenigsberg wrote:<br>&gt; &gt;&gt;&gt;On Mon, Jan 04, 2016 at 12:31:38PM +0100, Stefano Danzi wrote:<br>&gt; &gt;&gt;&gt;&gt;I did some tests:<br>&gt; &gt;&gt;&gt;&gt;<br>&gt; &gt;&gt;&gt;&gt;kernel-3.10.0-327.3.1.el7.x86_64 -&gt; bond mode 4 doesn't work (if I detach<br>&gt; &gt;&gt;&gt;&gt;one network cable the network is stable)<br>&gt; &gt;&gt;&gt;&gt;kernel-3.10.0-229.20.1.el7.x86_64 -&gt; bond mode 4 works fine<br>&gt; &gt;&gt;&gt;Would you be kind to file a kernel bug in bugzilla.redhat.com?<br>&gt; &gt;&gt;&gt;Summarize the information from this thread (e.g. your ifcfgs and in what<br>&gt; &gt;&gt;&gt;way does mode 4 doesn't work).<br>&gt; &gt;&gt;&gt;<br>&gt; &gt;&gt;&gt;To get the bug solved quickly we'd better find paying RHEL7 customer<br>&gt; &gt;&gt;&gt;subscribing to it. But I'll try to push from my direction.<br>&gt; &gt;&gt;Stefano has been kind to open<br>&gt; &gt;&gt;<br>&gt; &gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; Bug 1295423 - Unstable network link using bond mode = 4<br>&gt; &gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; https://bugzilla.redhat.com/show_bug.cgi?id=1295423<br>&gt; &gt;&gt;<br>&gt; &gt;&gt;which we fail to reproduce on our own lab. I'd be pleased if anybody who<br>&gt; &gt;&gt;experiences it, and their networking config to the bug (if it is<br>&gt; &gt;&gt;different). Can you also lay out your switch's hardware and<br>&gt; &gt;&gt;configuration?<br>&gt; &gt;Stefano, could you share your /proc/net/bonding/* files with us?<br>&gt; &gt;I heard about similar reports were the bond slaves had mismatching<br>&gt; &gt;aggregator id. Could it be your case as well?<br>&gt; &gt;<br>&gt; <br>&gt; Here:<br>&gt; <br>&gt; [root@ovirt01 ~]# cat /proc/net/bonding/bond0<br>&gt; Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)<br>&gt; <br>&gt; Bonding Mode: IEEE 802.3ad Dynamic link aggregation<br>&gt; Transmit Hash Policy: layer2 (0)<br>&gt; MII Status: up<br>&gt; MII Polling Interval (ms): 100<br>&gt; Up Delay (ms): 0<br>&gt; Down Delay (ms): 0<br>&gt; <br>&gt; 802.3ad info<br>&gt; LACP rate: slow<br>&gt; Min links: 0<br>&gt; Aggregator selection policy (ad_select): stable<br>&gt; Active Aggregator Info:<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Aggregator ID: 2<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Number of ports: 1<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Actor Key: 9<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Partner Key: 1<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Partner Mac Address: 00:00:00:00:00:00<br>&gt; <br>&gt; Slave Interface: enp4s0<br>&gt; MII Status: up<br>&gt; Speed: 1000 Mbps<br>&gt; Duplex: full<br>&gt; Link Failure Count: 2<br>&gt; Permanent HW addr: **:**:**:**:**:f1<br>&gt; Slave queue ID: 0<br>&gt; Aggregator ID: 1<br><br>---------------^^^<br><br><br>&gt; Actor Churn State: churned<br>&gt; Partner Churn State: churned<br>&gt; Actor Churned Count: 4<br>&gt; Partner Churned Count: 5<br>&gt; details actor lacp pdu:<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; system priority: 65535<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port key: 9<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port priority: 255<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port number: 1<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port state: 69<br>&gt; details partner lacp pdu:<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; system priority: 65535<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; oper key: 1<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port priority: 255<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port number: 1<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; port state: 1<br>&gt; <br>&gt; Slave Interface: enp5s0<br>&gt; MII Status: up<br>&gt; Speed: 1000 Mbps<br>&gt; Duplex: full<br>&gt; Link Failure Count: 1<br>&gt; Permanent HW addr: **:**:**:**:**:f2<br>&gt; Slave queue ID: 0<br>&gt; Aggregator ID: 2<br><br>---------------^^^<br><br><br>it sounds awfully familiar - mismatching aggregator IDs, and an all-zero<br>partner mac. Can you double-check that both your nics are wired to the<br>same switch, which is properly configured to use lacp on these two<br>ports?<br><br></body></html>