There are a few things I&#39;d like to clarify, regarding this subject:<br>
1. Data aggregation, as requested now by Tomas, and by other people in<br>
the past.<br>
We used to have that &#39;detail&#39; parameter, to aggregate certain very<br>
specific types of data, in particular to aggregate VM disks and NICs. We<br>
removed that in version 4 of the API because the implementation was<br>
extremely inefficient, from the engine point of view. An innocent<br>
request like this:<br>
  GET /ovirt-engine/api/vms?detail=+<wbr>disks,+nics<br>
Would generate, with the implementation we used to have, 1 query for the<br>
VMs and then as many queries for disks and NICs as VMs in the system. In<br>
our scale test environments, for example, with approx 4000 VMs and 10000<br>
disks, that would take more than 20 hours to execute.<br>
In addition, we didn&#39;t have in the past any mechanism to make this<br>
available in a generic one, because there was no knowledge in the API of<br>
what are &#39;details&#39;.<br>
In version 4 of the API we introduced a formal (kind of) specification<br>
of the API (a.k.a. the model), and int includes knowledge about what are<br>
&#39;links&#39;. For example, the specification of the VM type contains this:<br>
  @Link DiskAttachment[] diskAttachments();<br>
  @Link Nic[] nics();<br>
With this information we are now in a position where we can implement<br>
this in a generic way.<br>
We intend to implement this using a mechanism similar to the existing<br>
&#39;detail&#39; parameter:<br>
  GET /ovirt-engine/api/vms/123?<wbr>follow=disk_attachments,nics<br>
The naive implementation of this is to let the API call itself. For<br>
example, when the user requests to follow the &#39;disk_attachments&#39; detail<br>
the API can just call itself to get that:<br>
  GET /ovirt-engine/api/vms/123/<wbr>disk_attachments<br>
However, we can&#39;t use that naive approach, if we do we end with the<br>
1+C*N query problem described before. We need to use specific<br>
implementations for certain frequent use cases, like VMs+disks+nics, and<br>
that needs work in the API and in the backend.<br>
Tomas, if you want to help moving this forward, please open a RFE and<br>
makes sure it gets attention.<br></blockquote><div><br></div><div>This sounds pretty good! I will open, but since we are talking already here I&#39;ll just use the opportunity to clarify the topic more and than I&#39;ll open the BZ.</div><div><br></div><div>What I can imagine is the GetAllVmsQuery will accept in params also the list of details it should provide. Than, the GetAllVmsQuery will implement the efficient way of retrieving this info as well.</div><div><br></div><div>So, from the API perspective, it will be about taking the ?follow=&lt;something&gt; part and passing it to the backend query params.</div><div><br></div><div>What you think?</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
2. Reuse of TLS sessions.<br>
The part of creating TLS sessions that is expensive is the generation of<br>
the shared session key. That can be avoided if both the server and the<br>
client are careful and reuse the session, using the session cache<br>
mechanism built-in into TLS itself. The web servers that we use (Apache<br>
and Undertow) do implement this mechanism, and so do most of our<br>
clients. Make sure that your client uses it as well. In Java this is<br>
achieved re-using the SSLContext. We already do that for the engine to<br>
VDSM communciation for example. In JavaScript the browser already takes<br>
care of this.<br>
3. Parallelism and latency.<br>
A typical problem that we have is that we send many request to the<br>
server. For example, to retrieve user sessions for a set of VMs we tend<br>
to send many requests like this:<br>
  GET /ovirt-engine/api/vms/1/<wbr>sessions<br>
  GET /ovirt/engine/api/vms/2/<wbr>sessions<br>
  GET /ovirt-engine/api/vms/3/<wbr>sessions<br>
And we do that in a synchronous way: send one, wait for the result, send<br>
another one, wait for the result, etc. This means that we don&#39;t take<br>
advantage of the parallelism of the server and that we add to each<br>
request the network round trip time. So if we have N requests, we have<br>
to wait at least N*RTT.<br>
The web servers that we use support multiple connections, and the<br>
protocol that we use, HTTP, supports pipe-lining. This means that you<br>
can send multiple requests in parallel, and that you can send multiple<br>
requests without waiting for the response. To give you an idea of the<br>
improvement that can be achieved, we recently added asynchronous request<br>
support to the Ruby SDK, with multiple connections and pipe-lining. In<br>
our scale testing environment that reduced the time to collect a<br>
complete inventory from approx 30 min to approx 2 min. Here you have an<br>
<a href="https://github.com/oVirt/ovirt-engine-sdk-ruby/blob/master/sdk/examples/asynchronous_inventory.rb" rel="noreferrer" target="_blank">https://github.com/oVirt/<wbr>ovirt-engine-sdk-ruby/blob/<wbr>master/sdk/examples/<wbr>asynchronous_inventory.rb</a><br>
So make sure that you take advantage of that in your clients. Sadly<br>
pipe-lining is disabled by default in most browsers, so this isn&#39;t<br>
helpful for JavaScript applications.<br></blockquote><div><br></div><div>But we can try what we can do in moVirt about this: <a href="https://github.com/oVirt/moVirt/issues/260">https://github.com/oVirt/moVirt/issues/260</a></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
4. HTTP/2 support.<br>
The application server that we use, WildFly, supports HTTP/2, including<br>
ALPN, out of the box, since version 10.1. We need a mechanism to enable it:<br>
  core: Add support for enabling HTTP/2<br>
  <a href="https://gerrit.ovirt.org/74621" rel="noreferrer" target="_blank">https://gerrit.ovirt.org/74621</a><br>
And then we need to get Apache out of the way, for API traffic, at<br>
least. I think that is something we can do in the context of the engine<br>
&quot;podification&quot; effort.<br>
However, note that HTTP/2 won&#39;t have that big impact in performance for<br>
applications that continue to use a synchronous/serial style of<br>
interaction with the API.<br>
&gt;     &gt;<br>