<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>
<div>We did have an issue using celery  on an internal application that we wrote - but I believe it was fixed after much failover testing and code changes.  We also use logstash via rabbitmq and haven't noticed any issues there either.</div>
<div><br>
</div>
<div>So this seems to be just openstack/oslo related.</div>
<div><br>
</div>
<div>We have tried a number of different configurations - all of them had their issues.  We started out listing all the members in the cluster on the rabbit_hosts line.  This worked most of the time without issue, until we would restart one of the servers,
 then it seemed like the clients wouldn't figure out they were disconnected and reconnect to the next host.  </div>
<div><br>
</div>
<div>In an attempt to solve that we moved to using harpoxy to present a vip that we configured in the rabbit_hosts line.  This created issues with long lived connections disconnects and a bunch of other issues.  In our production environment we moved to load
 balanced rabbitmq, but using a real loadbalancer, and don’t have the weird disconnect issues.  However, anytime we reboot/take down a rabbitmq host or pull a member from the cluster we have issues, or if their is a network disruption we also have issues.</div>
<div><br>
</div>
<div>Thinking the best course of action is to move rabbitmq off on to its own box and to leave it alone.</div>
<div><br>
</div>
<div>Does anyone have a rabbitmq setup that works well and doesn’t have random issues when pulling nodes for maintenance?</div>
<div>
<div>
<div>____________________________________________</div>
<div> </div>
<div>Kris Lindgren</div>
<div>Senior Linux Systems Engineer</div>
<div>GoDaddy, LLC.</div>
</div>
<div><br>
</div>
</div>
</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style="font-weight:bold">From: </span>Joe Topjian <<a href="mailto:joe@topjian.net">joe@topjian.net</a>><br>
<span style="font-weight:bold">Date: </span>Thursday, January 15, 2015 at 9:29 AM<br>
<span style="font-weight:bold">To: </span>"Kris G. Lindgren" <<a href="mailto:klindgren@godaddy.com">klindgren@godaddy.com</a>><br>
<span style="font-weight:bold">Cc: </span>"<a href="mailto:openstack-operators@lists.openstack.org">openstack-operators@lists.openstack.org</a>" <<a href="mailto:openstack-operators@lists.openstack.org">openstack-operators@lists.openstack.org</a>><br>
<span style="font-weight:bold">Subject: </span>Re: [Openstack-operators] Way to check compute <-> rabbitmq connectivity<br>
</div>
<div><br>
</div>
<div>
<div>
<div dir="ltr">Hi Kris,
<div><br>
</div>
<div class="gmail_extra">
<div class="gmail_quote">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word;color:rgb(0,0,0);font-size:14px;font-family:Calibri,sans-serif">
<div>
<div> Our experience is pretty much the same on anything that is using rabbitmq - not just nova-compute.  </div>
</div>
</div>
</blockquote>
<div><br>
</div>
<div>Just to clarify: have you experienced this outside of OpenStack (or Oslo)? </div>
<div><br>
</div>
<div>We've seen similar issues with rabbitmq and OpenStack. We used to run rabbit through haproxy and tried a myriad of options like setting no timeouts, very very long timeouts, etc, but would always eventually see similar issues as described.</div>
<div><br>
</div>
<div>Last month, we reconfigured all OpenStack components to use the `rabbit_hosts` option with all nodes in our cluster listed. So far this has worked well, though I probably just jinxed myself. :)</div>
<div><br>
</div>
<div>We still have other services (like Sensu) using the same rabbitmq cluster and accessing it through haproxy. We've never had any issues there.</div>
<div><br>
</div>
<div>What's also strange is that I have another OpenStack deployment (from Folsom to Icehouse) with just a single rabbitmq server installed directly on the cloud controller (meaning: no nova-compute). I never have any rabbit issues in that cloud. </div>
</div>
</div>
</div>
</div>
</div>
</span>
</body>
</html>