On Mon, Jun 19, 2023 at 11:04 AM Roberto Bartzen Acosta <roberto.acosta@luizalabs.com> wrote:
Hello Neutron folks,

We discussed in the Operators feedback session about OVN heartbeat and the use of "infinity" values for large-scale deployments because we have a significant infrastructure impact when a short 'agent_down_time' is configured.

This is tangentially related, but note that using "infinity" values for agent_down_time is unsafe: https://bugzilla.redhat.com/show_bug.cgi?id=2215407 (depending on whether your "infinity" value is larger than ~15 days, assuming 32 bit ints used on your platform).
 


The merged patch [1] limited the maximum delay to 10 seconds. I understand the requirement to use random values to avoid load spikes, but why does this fix limit the heartbeat to 10 seconds? What is the goal of the agent_down_time parameter in this case? How will it work for someone who has hundreds of compute nodes / metadata agents? 

Regards,
Roberto

[1] - https://review.opendev.org/c/openstack/neutron/+/883687


‘Esta mensagem é direcionada apenas para os endereços constantes no cabeçalho inicial. Se você não está listado nos endereços constantes no cabeçalho, pedimos-lhe que desconsidere completamente o conteúdo dessa mensagem e cuja cópia, encaminhamento e/ou execução das ações citadas estão imediatamente anuladas e proibidas’.

 ‘Apesar do Magazine Luiza tomar todas as precauções razoáveis para assegurar que nenhum vírus esteja presente nesse e-mail, a empresa não poderá aceitar a responsabilidade por quaisquer perdas ou danos causados por esse e-mail ou por seus anexos’.