I have oVirt 3.1 with two nodes, one of them is running good without restarting the other keep restarting, the maximum uptime that the server can get is 10 days before it restart, I think that it might be something related to the disk.<br>
<br>FYI, the disk are 2 disk of 1TB (RAID-0) to get 2TB.<br><br># /var/log/messages<br>Dec 21 05:28:44 hypervisor01a ntpd[945]: 0.0.0.0 c61c 0c clock_step +17997.588918 s<br>Dec 21 05:28:44 hypervisor01a ntpd[945]: 0.0.0.0 c614 04 freq_mode<br>
Dec 21 05:28:45 hypervisor01a kdump: No crashkernel parameter specified for running kernel<br>Dec 21 05:28:45 hypervisor01a kdumpctl[1366]: Starting kdump:<br>Dec 21 05:28:45 hypervisor01a kdump: failed to start up<br>Dec 21 05:28:45 hypervisor01a systemd[1]: kdump.service: main process exited, code=exited, status=1<br>
Dec 21 05:28:45 hypervisor01a systemd[1]: Unit kdump.service entered failed state.<br>Dec 21 05:28:45 hypervisor01a systemd[1]: Startup finished in 888ms 157us (kernel) + 2s 521ms 289us (initrd) + 15s 577ms 672us (userspace) = 18s 987ms 118us.<br>
Dec 21 05:28:45 hypervisor01a ntpd[945]: 0.0.0.0 c618 08 no_sys_peer<br>Dec 21 05:29:04 hypervisor01a vdsm TaskManager.Task ERROR Task=`5f51ff52-f9a4-4854-a41d-d5d33c872458`::Unexpected error<br>Dec 21 05:29:04 hypervisor01a vdsm Storage.Dispatcher.Protect ERROR {&#39;status&#39;: {&#39;message&#39;: &quot;Unknown pool id, pool not connected: (&#39;dbb49db6-9a24-4395-a8bd-c9f222eaecab&#39;,)&quot;, &#39;code&#39;: 309}}<br>
Dec 21 05:29:04 hypervisor01a vdsm TaskManager.Task ERROR Task=`7b0cf3b0-6d26-4421-a221-29f2ecaaeb1f`::Unexpected error<br>Dec 21 05:29:04 hypervisor01a vdsm Storage.Dispatcher.Protect ERROR {&#39;status&#39;: {&#39;message&#39;: &quot;Unknown pool id, pool not connected: (&#39;dbb49db6-9a24-4395-a8bd-c9f222eaecab&#39;,)&quot;, &#39;code&#39;: 309}}<br>
Dec 21 05:29:04 hypervisor01a kernel: [   37.944421] ata1: hard resetting link<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.247979] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.248802] ata1.00: configured for UDMA/133<br>
Dec 21 05:29:04 hypervisor01a kernel: [   38.248807] ata1: EH complete<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.249013] ata2: hard resetting link<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.553112] ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)<br>
Dec 21 05:29:04 hypervisor01a kernel: [   38.553881] ata2.00: configured for UDMA/133<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.553886] ata2: EH complete<br>Dec 21 05:29:04 hypervisor01a kernel: [   38.554064] ata3: hard resetting link<br>
Dec 21 05:29:05 hypervisor01a kernel: [   38.858275] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)<br>Dec 21 05:29:05 hypervisor01a kernel: [   38.861154] ata3.00: configured for UDMA/133<br>Dec 21 05:29:05 hypervisor01a kernel: [   38.861159] ata3: EH complete<br>
Dec 21 05:29:05 hypervisor01a kernel: [   38.861352] ata4: hard resetting link<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.165397] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.168223] ata4.00: configured for UDMA/133<br>
Dec 21 05:29:05 hypervisor01a kernel: [   39.168229] ata4: EH complete<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.168421] ata5: hard resetting link<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.472459] ata5: SATA link up 1.5 Gbps (SStatus 113 SControl 300)<br>
Dec 21 05:29:05 hypervisor01a kernel: [   39.480040] ata5.00: configured for UDMA/100<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.485478] ata5: EH complete<br>Dec 21 05:29:05 hypervisor01a kernel: [   39.485642] ata6: limiting SATA link speed to 1.5 Gbps<br>
Dec 21 05:29:05 hypervisor01a kernel: [   39.485647] ata6: hard resetting link<br>Dec 21 05:29:06 hypervisor01a kernel: [   39.790610] ata6: SATA link down (SStatus 0 SControl 310)<br><br># RAID-0<br>mdadm --detail /dev/md127<br>
/dev/md127:<br>        Version : 1.2<br>  Creation Time : Sun Nov 18 14:47:15 2012<br>     Raid Level : raid0<br>     Array Size : 1953524736 (1863.03 GiB 2000.41 GB)<br>   Raid Devices : 2<br>  Total Devices : 2<br>    Persistence : Superblock is persistent<br>
<br>    Update Time : Sun Nov 18 14:47:15 2012<br>          State : clean <br> Active Devices : 2<br>Working Devices : 2<br> Failed Devices : 0<br>  Spare Devices : 0<br><br>     Chunk Size : 512K<br><br>           Name : hypervisor01-a:0  (local to host hypervisor01-a)<br>
           UUID : 9eb1324d:57eed46d:c23ae815:0666e238<br>         Events : 0<br><br>    Number   Major   Minor   RaidDevice State<br>       0     253        2        0      active sync   /dev/dm-2<br>       1     253        3        1      active sync   /dev/dm-3<br>
<br>