<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Sep 15, 2014 at 4:30 PM, Michael Still <span dir="ltr"><<a href="mailto:mikal@stillhq.com" target="_blank">mikal@stillhq.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><span class="">On Tue, Sep 16, 2014 at 12:30 AM, Russell Bryant <<a href="mailto:rbryant@redhat.com">rbryant@redhat.com</a>> wrote:<br>
> On 09/15/2014 05:42 AM, Daniel P. Berrange wrote:<br>
>> On Sun, Sep 14, 2014 at 07:07:13AM +1000, Michael Still wrote:<br>
>>> Just an observation from the last week or so...<br>
>>><br>
>>> The biggest problem nova faces at the moment isn't code review latency. Our<br>
>>> biggest problem is failing to fix our bugs so that the gate is reliable.<br>
>>> The number of rechecks we've done in the last week to try and land code is<br>
>>> truly startling.<br>
>><br>
>> I consider both problems to be pretty much equally as important. I don't<br>
>> think solving review latency or test reliabilty in isolation is enough to<br>
>> save Nova. We need to tackle both problems as a priority. I tried to avoid<br>
>> getting into my concerns about testing in my mail on review team bottlenecks<br>
>> since I think we should address the problems independantly / in parallel.<br>
><br>
> Agreed with this.  I don't think we can afford to ignore either one of them.<br>
<br>
</span>Yes, that was my point. I don't mind us debating how to rearrange<br>
hypervisor drivers. However, if we think that will solve all our<br>
problems we are confused.<br>
<br>
So, how do we get people to start taking bugs / gate failures more seriously?<br>
<span class=""><font color="#888888"><br>
Michael<br>
<br></font></span></blockquote><div><div><div><div><div><div><div><br></div>What do you think about having 
an irc channel for working through gate bugs? I've always found looking 
at gate failures frustrating because I seem to be expected to work 
through these by myself, and maybe somebody's already looking at it or 
has more information that I don't know about. There have been times 
already where a gate bug that could have left everything broken for a 
while wound up fixed pretty quickly because we were able to find the 
right person hanging out in irc. Sometimes all it takes is for someone 
with the right knowledge to be there. A hypothetical exchange:<br><br></div>rechecker: I got this error where the tempest-foo test failed ... http://...<br></div>tempest-expert: That test calls the compute-bar nova API<br></div>nova-expert: That API calls the network-baz neutron API<br></div>neutron-expert: When you call that API you need to also call this other API to poll for it to be done... is nova doing that?<br></div>nova-expert: Nope. Fix on the way.<br><div><div><div><div><div><div><br></div>- Brant<br></div></div></div></div></div><br></div></div></div></div>