<div dir="ltr">There's several issues involved in doing automated regression checking for benchmarks:<div><br></div><div>- You need a platform which is stable. Right now all our CI runs on virtualized instances, and I don't think there's any particular guarantee it'll be the same underlying hardware, further virtualized systems tend to be very noisy and not give you the stability you need.</div>
<div>- You need your benchmarks to be very high precision, if you really want to rule out regressions of more than N% without a lot of false positives.</div><div>- You need more than just checks on individual builds, you need long term trend checking - 100 1% regressions are worse than a single 50% regression.</div>
<div><br></div><div>Alex</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Oct 20, 2013 at 11:24 AM, Tim Bell <span dir="ltr"><<a href="mailto:Tim.Bell@cern.ch" target="_blank">Tim.Bell@cern.ch</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="EN-GB" link="blue" vlink="purple">
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">From a user perspective, I want that a gate on changes which significantly degrade performance to be rejected.<u></u><u></u></span></p>

<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Tempest (and its associated CI) provide a current check on functionality. It is inline and understood.<u></u><u></u></span></p>

<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Let’s just add a set of benchmarks to Tempest which can validate that improved functionality does not significantly degrade performance.
 If we do not have this check, the users who are deploying early will be the ones whose services are affected which is not the long term direction.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Thus, I ask, are there blocking items that would not permit Tempest to be extended to cover benchmarking and ensure changes which
 impact performance are picked up early ?<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Tim<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"><u></u> <u></u></span></p>
<div style="border:none;border-left:solid blue 1.5pt;padding:0cm 0cm 0cm 4.0pt">
<div>
<div style="border:none;border-top:solid #e1e1e1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri","sans-serif"">From:</span></b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri","sans-serif""> Boris Pavlovic [mailto:<a href="mailto:bpavlovic@mirantis.com" target="_blank">bpavlovic@mirantis.com</a>]
<br>
<b>Sent:</b> 20 October 2013 19:34</span></p><div class="im"><br>
<b>To:</b> OpenStack Development Mailing List<br>
</div><b>Subject:</b> Re: [openstack-dev] Announce of Rally - benchmarking system for OpenStack<u></u><u></u><p></p>
</div>
</div><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<p class="MsoNormal">Hi Sean, <u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">>> Honestly, there has been so much work done in Tempest with the stress tests and the scenario tests in this release, and a large growing community around those, that it doesn't
 make any sense to me that you put item #3 as a non Tempest thing.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">I really don't like to copy paste functionality that is already implemented, but I have some other ideas about benchmark engine, I would like to implement them and try as soon as possible,
 to determine "what we actually need". It is much simpler to make such experiments in Rally, because there is a small community around it, and I don't care at this moment about backward comparability. </span><u></u><u></u></p>

</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">When I determine all benchmark engine parameters (what I need). I will make one more deep investigation, to see how complex will be to implement the same in tempest. If it will be possible
 and not extra complex we will start implementing required functionality in tempest. And when tempest will be ready we will switch to it.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">>> <span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Are you guys doing a summit session somewhere on this.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">There is a slot, but it is not approved <a href="http://summit.openstack.org/cfp/details/158" target="_blank">http://summit.openstack.org/cfp/details/158</a> yet. </span><u></u><u></u></p>

</div>
<div>
<p class="MsoNormal">Also there is a talk: <a href="http://openstacksummitnovember2013.sched.org/event/661ddc95f6b06ed3a634f12de09afa1d#.UmQITpTk9Z9" target="_blank">
http://openstacksummitnovember2013.sched.org/event/661ddc95f6b06ed3a634f12de09afa1d#.UmQITpTk9Z9</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">>> It also feels like the efforts around #4 would be much better served in the OpenStack community if they were integrated around testr and subunit so they could be reused
 in many contexts.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">I already tried to use pytest as a base and that was the biggest mistake..</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">>> I also think 1.b.3 is probably better done in the way the coverage extension was done for nova, something which is baked in and can be administratively turned on, not something
 which requires a hot patch to the system.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I hope these patches will be merged. But you see there is a "community deadlock" here. You are not able to merge such patches in upstream until you make two things:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">1) Get a real examples of usage (so e.g. with hot patching in Rally)<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">2) Approve that such changes don't impact on performance. (Rally)<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">So we will prepare all patches, show live demonstration and approve that they don't impact on performance (especially when they are turned off) ;)<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">>> It's cool to have performance analysis tooling, but if it arrives in a way that doesn't integrate well with the rest of OpenStack, the impact is going to be far less than
 it could be. I'd like us to get the full bang for our buck out of efforts like this, especially if there is hope for it to graduate from stackforge into one of our standard toolkits.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">I don't understand the phrase "</span><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">doesn't integrate well with the rest of OpenStack</span><span style="font-family:"Arial","sans-serif"">"</span><u></u><u></u></p>

</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">1. Project has classical OpenStack structure </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">2. We use all common code from oslo (db, localizations, oslo.config in future we are planing to use oslo.messaging)</span><u></u><u></u></p>

</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">3. As a base and first engine we decide to use DevStack</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">4. To verify deployments (we will use tempest asap)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">5. In benchmark engine we are using only native OS python clients to make requests to OpenStack API</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">6. OpenStack development workflow:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">6.a) project is on stackforge and we use "stock jenkins"<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">6.b) launchpad with BPs, Bugs and Questions<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">6.c) wiki on <a href="http://wiki.openstack.org/wiki/Rally" target="_blank">
http://wiki.openstack.org/wiki/Rally</a>, <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">What "the rest of OpenStack" are you speaking?<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">Best regards,</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">Boris Pavlovic</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">---</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif"">Mirantis Inc.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><u></u> <u></u></p>
<div>
<p class="MsoNormal">On Sun, Oct 20, 2013 at 2:38 AM, Sean Dague <<a href="mailto:sean@dague.net" target="_blank">sean@dague.net</a>> wrote:<u></u><u></u></p>
<blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<p class="MsoNormal">On 10/18/2013 12:17 PM, Boris Pavlovic wrote:<u></u><u></u></p>
</div>
<div>
<div>
<blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<p class="MsoNormal">John,<br>
<br>
Actually seems like a pretty good suggestion IMO, at least something<br>
worth some investigation and consideration before quickly discounting<br>
it.  Rather than "that's not what tempest is", maybe it's something<br>
tempest "could do".  Don't know, not saying one way or the other, just<br>
wondering if it's worth some investigation or thought.<br>
<br>
<br>
These investigations I made before start working around Rally. It was<br>
about 3 months ago.<br>
It is not "quickly discounting" I didn't have yesterday time to make<br>
long response, so I will write it today:<br>
<br>
I really don't like to make a copy of another projects, so I tried to<br>
reuse all projects & libs that we already have.<br>
<br>
To explain why we shouldn't merge Rally & Tempest in one project (and<br>
should keep both)  we should analyze their use cases.<br>
<br>
<br>
1. DevStack - one "click" and get your OpenStack cloud from sources<br>
<br>
2. Tempest - one "click" and get your OpenStack Cloud verified<br>
<br>
Both of these projects are great, because they are very useful and solve<br>
complicated tasks without "pain" for end user. (and I like them)<br>
<br>
3. Rally is also one "click" system that solve OpenStack benchmarking.<br>
<br>
To clarify situation. We should analyze what I mean by one "click"<br>
benchmarking and what are the use cases.<br>
<br>
Use Cases:<br>
1. Investigate how deployments influence on OS performance (find the set<br>
of good OpenStack deployment architectures)<br>
2. Automatically get numbers & profiling info about how your changes<br>
influence on OS performance<br>
3. Using Rally profiler detect scale & performance issues.<br>
Like here when we are trying to delete 3 VMs by one request they are<br>
deleted one by one because of DB lock on quotas table<br>
<a href="http://37.58.79.43:8080/traces/0011f252c9d98e31" target="_blank">http://37.58.79.43:8080/traces/0011f252c9d98e31</a><br>
4. Determine maximal load that could handle production cloud<br>
<br>
To cover these cases we should actually test OpenStack deployments<br>
making simultaneously OpenStack API calls.<br>
<br>
So to get results we have to:<br>
1. Deploy OpenStack cloud somewhere. (Or get existing cloud)<br>
2. Verify It<br>
3. Run Benchmarks<br>
4. Collect all results & present it in human readable form.<br>
<br>
<br>
The goal of Rally was designed to automate these steps:<br>
1.a Use existing cloud.<br>
1.b.1 Automatically get (virtual) Servers from (soft layer, Amazon,<br>
RackSpace or you private public cloud, or OpenStack cloud)<br>
1.b.2 DeployOpenStack on these servers from source (using Devstack,<br>
Anvli, Fuel or TrippleO...).<br>
1.b.3 Patch this OpenStack with tomograph to get profiling information<br>
(I hope we will merge these patches into upstream).<br>
2. Using tempest verify this cloud (we are going to switch from<br>
fuel-ostf-tests)<br>
3. Run specified parametrized (to be able to make different load)<br>
benchmark scenarios<br>
4. Collect all information about execution & present it in human<br>
readable form. (Tomograph, Zipking, matplotlib...)<u></u><u></u></p>
</blockquote>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>
<p class="MsoNormal">Honestly, there has been so much work done in Tempest with the stress tests and the scenario tests in this release, and a large growing community around those, that it doesn't make any sense to me that you put item #3 as a non Tempest thing.<br>

<br>
It feels very "not invented here".<br>
<br>
Are you guys doing a summit session somewhere on this.<br>
<br>
It also feels like the efforts around #4 would be much better served in the OpenStack community if they were integrated around testr and subunit so they could be reused in many contexts.<br>
<br>
I also think 1.b.3 is probably better done in the way the coverage extension was done for nova, something which is baked in and can be administratively turned on, not something which requires a hot patch to the system.<br>

<br>
It's cool to have performance analysis tooling, but if it arrives in a way that doesn't integrate well with the rest of OpenStack, the impact is going to be far less than it could be. I'd like us to get the full bang for our buck out of efforts like this, especially
 if there is hope for it to graduate from stackforge into one of our standard toolkits.<span style="color:#888888"><br>
<br>
<span>        -Sean</span><br>
<br>
<span>-- </span><br>
<span>Sean Dague</span><br>
<span><a href="http://dague.net" target="_blank">http://dague.net</a></span></span><u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"><br>
<br>
_______________________________________________<br>
OpenStack-dev mailing list<br>
<a href="mailto:OpenStack-dev@lists.openstack.org" target="_blank">OpenStack-dev@lists.openstack.org</a><br>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev</a><u></u><u></u></p>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div></div></div>
</div>
</div>

<br>_______________________________________________<br>
OpenStack-dev mailing list<br>
<a href="mailto:OpenStack-dev@lists.openstack.org">OpenStack-dev@lists.openstack.org</a><br>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr">"I disapprove of what you say, but I will defend to the death your right to say it." -- Evelyn Beatrice Hall (summarizing Voltaire)<br>
"The people's good is the highest law." -- Cicero<br><div>GPG Key fingerprint: 125F 5C67 DFE9 4084</div></div>
</div>