<div dir="ltr">Hi,<div><br></div><div>I can just tell you that we are doing a similar check for dhcp-agent, but here we just execute a suitable SQL-statement to detect more than 1 agent / AZ.</div><div><br></div><div>Doing the same for L3 shouldn't be that hard, but I dont know if this is what you are looking for?</div><div><br></div><div> Fabian</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Am Mo., 17. Aug. 2020 um 14:11 Uhr schrieb Mohammed Naser <<a href="mailto:mnaser@vexxhost.com">mnaser@vexxhost.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi all,<br>
<br>
Over the past few days, we were troubleshooting an issue that ended up<br>
having a root cause where keepalived has somehow ended up active in<br>
two different L3 agents.  We've yet to find the root cause of how this<br>
happened but removing it and adding it resolved the issue for us.<br>
<br>
As we work on improving our monitoring, we wanted to implement<br>
something that gets us the info of # of active routers to check if<br>
there's a router that has >1 active L3 agent but it's hard because<br>
hitting the /l3-agents endpoint on _every_ single router hurts a lot<br>
on performance.<br>
<br>
Is there something else that we can watch which might be more<br>
productive?  FYI -- this all goes in the open and will end up inside<br>
the openstack-exporter:<br>
<a href="https://github.com/openstack-exporter/openstack-exporter" rel="noreferrer" target="_blank">https://github.com/openstack-exporter/openstack-exporter</a> and the Helm<br>
charts will end up with the alerts:<br>
<a href="https://github.com/openstack-exporter/helm-charts" rel="noreferrer" target="_blank">https://github.com/openstack-exporter/helm-charts</a><br>
<br>
Thanks!<br>
Mohammed<br>
<br>
-- <br>
Mohammed Naser<br>
VEXXHOST, Inc.<br>
<br>
</blockquote></div>