<div dir="ltr">See my response inline.<br><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Oct 18, 2016 at 6:07 AM, Dmitry Tantsur <span dir="ltr"><<a href="mailto:dtantsur@redhat.com" target="_blank">dtantsur@redhat.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="gmail-HOEnZb"><div class="gmail-h5">On 10/17/2016 11:10 PM, Wesley Hayutin wrote:<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
Greetings,<br>
<br>
The RDO CI team is considering adding retries to our calls to introspection<br>
again [1].<br>
This is very handy for bare metal environments where retries may be needed due<br>
to random chaos in the environment itself.<br>
<br>
We're trying to balance two things here..<br>
1. reduce the number of false negatives in CI<br>
2. try not to overstep what CI should vs. what the product should do.<br>
<br>
We would like to hear your comments if you think this is acceptable for CI or if<br>
this may be overstepping.<br>
<br>
Thank you<br>
<br>
<br>
[1] <a href="http://paste.openstack.org/show/586035/" rel="noreferrer" target="_blank">http://paste.openstack.org/sho<wbr>w/586035/</a><br>
</blockquote>
<br></div></div>
Hi!<br>
<br>
I probably lack some context of what exactly problems you face. I don't have any disagreement with retrying it, just want to make sure we're not missing actual bugs.<br></blockquote><div><br></div><div>I agree, we have to be careful not to paper over bugs while we try to overcome typical environmental delays that come w/ booting, rebooting $x number of random hardware nodes.</div><div>To make this a little more crystal clear, I'm trying to determine is where progressive delays and retries should be injected into the workflow of deploying an overcloud.<br></div><div>Should we add options in the product itself that allow for $x number of retries w/ a configurable set of delays for introspection? [2]  Is the expectation this works the first time everytime?<br></div><div>Are we overstepping what CI should do by implementing [1].</div><div><br></div><div>Additionally would it be appropriate to implement [1], while [2] is developed for the next release and is it OK to use [1] with older releases?</div><div><br></div><div>Thanks for your time and responses.</div><div><br></div><div><br></div><div>[1] <a href="http://paste.openstack.org/show/586035/" rel="noreferrer" target="_blank">http://paste.openstack.org/sho<wbr>w/586035/</a></div><div>[2] <a href="https://github.com/openstack/tripleo-common/blob/master/workbooks/baremetal.yaml#L169">https://github.com/openstack/tripleo-common/blob/master/workbooks/baremetal.yaml#L169</a></div></div><br></div></div>