<html>
  <head>
    <meta content="text/html; charset=utf-8" http-equiv="Content-Type">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    I don't really think this is practical:<br>
    <br>
    <blockquote
cite="mid:CAJgorsZ_8CXErXzt45TXarPqJ8SKfRL8-W4objPxL6xr4pm49Q@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div class="gmail_extra">
          <div class="gmail_quote">
            <div>- If the PSU failed, your UPS could alert you. If you
              have one...</div>
          </div>
        </div>
      </div>
    </blockquote>
    <br>
    If you have only one PSU in a host, a UPS is not going to stop you
    losing all the VMs on that host. OK, if you had N+1 PSUs, you may be
    able to monitor for this (IPMI/LOM/DRAC etc)and use the API to put a
    host into maintenance. Also a lot of people rely on low-cost
    white-box servers and decide that it's OK if a single PSU in a host
    dies, as, well, we have HA to start on other hosts. If they have N+1
    PSUs in the hosts do they really have to migrate everything off?
    Swings and roundabouts really.<br>
    <br>
    I'm also not sure I've seen any practical DC setups where a UPS can
    monitor the load for every single attached physical machine and
    figure out that one of the redundant PSUs in it has failed - I'd
    love to know if there are as that would be really cool.<br>
    <br>
    <blockquote
cite="mid:CAJgorsZ_8CXErXzt45TXarPqJ8SKfRL8-W4objPxL6xr4pm49Q@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div class="gmail_extra">
          <div class="gmail_quote">
            <div>- If the machine is going down in an ordinary flow,
              surely it can be done. <br>
            </div>
          </div>
        </div>
      </div>
    </blockquote>
    <br>
    Isn't that what "Maintenance mode" is for?<br>
    <br>
    <blockquote
cite="mid:CAJgorsZ_8CXErXzt45TXarPqJ8SKfRL8-W4objPxL6xr4pm49Q@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div class="gmail_extra">
          <div class="gmail_quote">
            <div> </div>
            <blockquote class="gmail_quote" style="margin:0 0 0
              .8ex;border-left:1px #ccc solid;padding-left:1ex">
              <br>
              Even if it was a network failure and the host was still
              up, how would you live migrate a VM from a host you can't
              even talk to?<br>
            </blockquote>
            <div><br>
            </div>
            <div>It could be suspended to disk (local) - if the disk is
              available.</div>
            <div>Then the decision if it is to be resumed from local
              disk or not (as it might be HA'ed and is running
              elsewhere) need to be taken later, of course.</div>
          </div>
        </div>
      </div>
    </blockquote>
    <br>
    Yes, but that's not even remotely possible with Ovirt right now. I
    was trying to be practical as the OP has only just started using
    Ovirt and I think it might be a bit much to ask him to start coding
    up what he'd like.<br>
    <br>
    <blockquote
cite="mid:CAJgorsZ_8CXErXzt45TXarPqJ8SKfRL8-W4objPxL6xr4pm49Q@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div class="gmail_extra">
          <div class="gmail_quote">
            <div><br>
            </div>
            <div> </div>
            <blockquote class="gmail_quote" style="margin:0 0 0
              .8ex;border-left:1px #ccc solid;padding-left:1ex">
              <br>
              The only way you could do it was if you somehow magically
              knew far enough in advance that the host was about to fail
              (!) and that gave enough time to migrate the machines off.
              But how would you ever know that "machine <a
                moz-do-not-send="true" href="http://quux.bar.net"
                rel="noreferrer" target="_blank">quux.bar.net</a> is
              going to fail in 7 minutes"?</blockquote>
            <div><br>
            </div>
            <div>I completely agree there are situations in which you
              can't foresee the failure. </div>
            <div>But in many, you can. In those cases, it makes sense
              for the host to self-initiate 'move to maintenance' mode.
              The policy of what to do when
              'self-moving-to-maintenance-mode' could be pre-fetched
              from the engine.</div>
            <div>Y.</div>
          </div>
        </div>
      </div>
    </blockquote>
    <br>
    Hmm, I would love that to be true. But I've seen so many so called
    "corner-cases" that I now think the failure area in a datacenter is
    a fractal with infinite corners. Yes, you could monitor SMART on
    local drives, pick up uncorrected ECC errors, use "sensors" to check
    for sagging voltages or high temps, but I don't think you can ever
    hope to catch everything, and you could end up doing a migration
    "storm" for . I've had more than enough of "Enterprise Spec"
    switches suddenly going nuts and spamming corrupt MACs all over the
    LAN to know you can't ever account for everything.<br>
    <br>
    I think it's better to adopt the model of redundancy in software and
    services, so no-one even notices if a VM host goes away, there's
    always something else to take up the slack. Just like the origins of
    the Internet - the network should be dumb and the applications
    should cope with it! Any infrastructure that can't cope with the
    loss of a few VMs for a few minutes probably needs a refresh.<br>
    <br>
    Cheers<br>
    <br>
    Alex<br>
    <br>
    <br>
    <br>
    <br>
  
<br>
 .

<br>
</body>
</html>