<div dir="ltr">Hi Albert. In my case, I usually do restart the RMQ container directly when RMQ got some issue.<div><br></div><div>BTW, for the env which use only 2 ethernets ( 1 for Neutron External & another for other interfaces.) and both 1Gb/s speed, or disk I/O is not so powerful for system, often met RMQ brain split.</div><div>That made me need to restart whole RMA cluster sometimes.</div><div>I still investigate this issue without hardware or network changes. The temp workaround is increase net.ticktime in RMQ configuration. Although the issue still exist but not so often at least.</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Mark Goddard <<a href="mailto:mark@stackhpc.com">mark@stackhpc.com</a>> 於 2020年10月7日 週三 下午9:19寫道:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On Wed, 7 Oct 2020 at 13:11, Braden, Albert <<a href="mailto:C-Albert.Braden@charter.com" target="_blank">C-Albert.Braden@charter.com</a>> wrote:<br>
><br>
> When I learned OpenStack at eBay we ran RMQ on dedicated VMs. My new employer runs kolla and everything is in containers. When I was running RMQ on VMs, it would lock up and we would have to restart it on all 3 VMs. If that didn't work, we had a "cold start" procedure where we would stop all 3, delete the contents of /var/lib/rabbitmq/mnesia/ and then run some commands to set the correct config and permissions before starting.<br>
><br>
><br>
><br>
> What is the correct way to restart RMQ in kolla? Should I log into the containers and restart services there, or use rabbitmqctl, or just stop and start the containers? Is stop/starting the containers the equivalent of the "cold start" procedure?<br>
<br>
Hi Albert. You shouldn't ever need to exec into containers to restart<br>
services - restart the containers. Kolla Ansible has some<br>
orchestration in place to avoid restarting all nodes at once. However,<br>
the deploy command won't restart containers unless something has<br>
changed. For a cold start, you would need to stop the containers (you<br>
could use kolla-ansible stop --tags rabbitmq), then run a deploy<br>
again. Note that state in Kolla is stored in Docker volumes, which get<br>
bind mounted into containers.<br>
Mark<br>
<br>
><br>
><br>
><br>
> I apologize for the nonsense below. So far I have not been able to stop it from being attached to my external emails. I'm working on it.<br>
><br>
><br>
><br>
> The contents of this e-mail message and<br>
> any attachments are intended solely for the<br>
> addressee(s) and may contain confidential<br>
> and/or legally privileged information. If you<br>
> are not the intended recipient of this message<br>
> or if this message has been addressed to you<br>
> in error, please immediately alert the sender<br>
> by reply e-mail and then delete this message<br>
> and any attachments. If you are not the<br>
> intended recipient, you are notified that<br>
> any use, dissemination, distribution, copying,<br>
> or storage of this message or any attachment<br>
> is strictly prohibited.<br>
<br>
</blockquote></div>