<div dir="ltr"><div>Dear All,</div><div><br></div><div>We were able to solve the issue. The problem was after the reboot rabbitmq is overloaded because ceilometer started after the reboot which was in stopped state. Due to this the controller nodes resource utilization was very high and cpu cores maxed out. As a result we got timeouts in our neutron and rabbitmq logs. We stopped the ceilometer components both on controllers and compute nodes, cleaned the ceilometer queues from rabbitmq, emptied the ovsdb and restarted the neutron components in all the controllers. Then slowly all the tags in ports are recovered and VM's are reachable.   <br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Apr 10, 2019 at 7:15 PM Jakub Libosvar <<a href="mailto:jlibosva@redhat.com">jlibosva@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Is your ovs-vswitchd process running on controllers? Sounds like agent<br>
can talk to ovsdb (it was able to connect) but then times out when<br>
waiting for response from vswitchd process.<br>
<br>
Do these command run successfully on the problematic controller?<br>
ovs-vsctl show<br>
ovs-ofctl show br-int<br>
<br>
Kuba<br>
<br>
On 10/04/2019 14:20, Yedhu Sastri wrote:<br>
> Dear All,<br>
> <br>
> We did a minor upgrade on our OpenStack environment Newton HA cluster from<br>
> 14.2.12 to 14.2.16 using the following link.<br>
> <br>
> <a href="https://docs.openstack.org/openstack-ansible/newton/upgrade-guide/minor-upgrade.html" rel="noreferrer" target="_blank">https://docs.openstack.org/openstack-ansible/newton/upgrade-guide/minor-upgrade.html</a><br>
> <br>
> The upgrade was successful and we tested creation of VM's and it was also<br>
> successful we were able to ssh into the VM's.<br>
> <br>
> Then we rebooted the controllers one by one. But after that we can create<br>
> the VM's but it is not getting IP from dhcp agent.<br>
> <br>
> In the openvswitch-agent.log we are getting 'OVS transaction timeout'. Any<br>
> help is much appreciated.<br>
> <br>
> 2019-04-09 17:25:29.063 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] port_unbound():<br>
> net_uuid None not managed by VLAN manager<br>
> 2019-04-09 17:25:29.088 3504 INFO neutron.agent.common.ovs_lib<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Port<br>
> 04275c8a-2d12-477b-b435-f6483d418e93 not present in bridge br-int<br>
> 2019-04-09 17:25:29.089 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] port_unbound():<br>
> net_uuid None not managed by VLAN manager<br>
> 2019-04-09 17:25:29.198 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] port_unbound():<br>
> net_uuid None not managed by VLAN manager<br>
> 2019-04-09 17:25:29.228 3504 INFO neutron.agent.common.ovs_lib<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Port<br>
> 5c25b580-9dcb-4930-a2fe-9cab951114dd not present in bridge br-int<br>
> 2019-04-09 17:25:29.228 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] port_unbound():<br>
> net_uuid None not managed by VLAN manager<br>
> 2019-04-09 17:25:29.229 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Remove device filter<br>
> for [u'63cb0c6a-6e82-41a8-ad46-511ee84579ad',<br>
> u'9764e98a-bb32-4d37-9460-5a546f351e5a',<br>
> u'2c075f29-156c-4787-b40f-434c437164e4',<br>
> u'f00de46f-301a-4789-add1-a8239ee6c859',<br>
> u'e26c1806-8041-4ce2-aea0-74ca469add67',<br>
> u'9fa17447-d25d-441b-9983-b81e43c6e6d2',<br>
> u'3ef24ce6-19b5-47c8-9510-767e64d33e9f',<br>
> u'c2d37add-65a0-4fc9-914c-2382af70b1ca',<br>
> u'a8b7c7aa-a5d0-47b3-a944-7b6c4428eda8',<br>
> u'bf6f7608-0573-43f7-822a-878d7708d985',<br>
> u'046670cd-77dd-4ce8-bb4b-f1489264375b',<br>
> u'b7aefa18-d768-47a8-bb5f-6b1e838deaeb',<br>
> u'04275c8a-2d12-477b-b435-f6483d418e93',<br>
> u'124eb5e6-2b8a-44a9-aa8b-f6d9bc87f13f',<br>
> u'5c25b580-9dcb-4930-a2fe-9cab951114dd']<br>
> 2019-04-09 17:27:09.740 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-5984df4b-c30f-403c-8e87-86c4ccf50a9f - - - - -] Provider rule updated<br>
> 2019-04-09 17:27:41.961 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-67c36a44-f778-48f0-b7ae-0a5244ff95c1 - - - - -] Provider rule updated<br>
> 2019-04-09 17:28:28.334 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-aeffc24f-a354-412e-b458-950c1d4b52ef - - - - -] Provider rule updated<br>
> 2019-04-09 17:28:46.276 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-2dd51325-40c4-4ff0-a384-bccbe3ca0bfc - - - - -] Provider rule updated<br>
> 2019-04-09 17:28:46.278 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-6d48bfd9-0230-4a82-a477-d9e4171db519 - - - - -] Provider rule updated<br>
> 2019-04-09 17:30:32.695 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-01b9b7a8-84a4-42cc-aebb-db846eb2b8f0 - - - - -] Provider rule updated<br>
> 2019-04-09 17:30:54.288 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-de1755bd-0e21-4b75-9fde-db422ee9a79a - - - - -] Provider rule updated<br>
> 2019-04-09 17:32:12.377 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-26bc4547-edb7-4092-b4f4-6465c29dfbe4 - - - - -] Provider rule updated<br>
> 2019-04-09 17:32:21.444 3504 WARNING<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Device<br>
> 0d535260-dd98-4027-a2ba-4c5412d4eab0 not defined on plugin or binding failed<br>
> 2019-04-09 17:32:21.461 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Port<br>
> d3baa557-a367-4a6d-8d58-7183df4243a6 updated. Details: {u'profile': {},<br>
> u'network_qos_policy_id': None, u'qos_policy_id': None,<br>
> u'allowed_address_pairs': [], u'admin_state_up': True, u'network_id':<br>
> u'680c9bdd-9cea-4059-8c8c-2928dd0ee48f', u'segmentation_id': 65606,<br>
> u'device_owner': u'network:router_ha_interface', u'physical_network': None,<br>
> u'mac_address': u'fa:16:3e:b3:9a:60', u'device':<br>
> u'd3baa557-a367-4a6d-8d58-7183df4243a6', u'port_security_enabled': False,<br>
> u'port_id': u'd3baa557-a367-4a6d-8d58-7183df4243a6', u'fixed_ips':<br>
> [{u'subnet_id': u'5b49f8e5-991d-4ecd-a584-df605063aecb', u'ip_address':<br>
> u'169.254.192.9'}], u'network_type': u'vxlan'}<br>
> 2019-04-09 17:32:21.461 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Assigning 1 as local<br>
> vlan for net-id=680c9bdd-9cea-4059-8c8c-2928dd0ee48f<br>
> 2019-04-09 17:32:35.477 3504 INFO oslo_messaging._drivers.amqpdriver [-] No<br>
> calling threads waiting for msg_id : a9314d944ff8486abf909d4cc271f9a0<br>
> 2019-04-09 17:32:39.016 3504 INFO neutron.agent.securitygroups_rpc<br>
> [req-51453b2c-b454-45bd-b7f8-c78560437016 - - - - -] Provider rule updated<br>
> 2019-04-09 17:32:54.141 3504 ERROR<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.openflow.native.ofswitch<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Switch connection<br>
> timeout<br>
> 2019-04-09 17:32:57.964 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.openflow.native.ovs_bridge<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Bridge br-tun changed<br>
> its datapath-ID from 6a740a5da349 to 00006a740a5da349<br>
> 2019-04-09 17:32:58.015 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Port<br>
> 0d8dc3c9-c115-45f8-bbb2-cc715b7c1079 updated. Details: {u'profile': {},<br>
> u'network_qos_policy_id': None, u'qos_policy_id': None,<br>
> u'allowed_address_pairs': [], u'admin_state_up': True, u'network_id':<br>
> u'4ffb2c28-f9f1-4a25-82a0-df7f7a002434', u'segmentation_id': 625,<br>
> u'device_owner': u'network:router_gateway', u'physical_network':<br>
> u'outbound1', u'mac_address': u'fa:16:3e:aa:d7:56', u'device':<br>
> u'0d8dc3c9-c115-45f8-bbb2-cc715b7c1079', u'port_security_enabled': False,<br>
> u'port_id': u'0d8dc3c9-c115-45f8-bbb2-cc715b7c1079', u'fixed_ips':<br>
> [{u'subnet_id': u'764f08fc-1979-402c-b93c-834d7148a8a5', u'ip_address':<br>
> u'10.97.179.34'}], u'network_type': u'vlan'}<br>
> 2019-04-09 17:32:58.016 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Assigning 2 as local<br>
> vlan for net-id=4ffb2c28-f9f1-4a25-82a0-df7f7a002434<br>
> 2019-04-09 17:32:58.030 3504 INFO<br>
> neutron.plugins.ml2.drivers.openvswitch.agent.ovs_neutron_agent<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Port<br>
> 1239fa6c-265a-4f16-ab00-c86fe40545d9 updated. Details: {u'profile': {},<br>
> u'network_qos_policy_id': None, u'qos_policy_id': None,<br>
> u'allowed_address_pairs': [], u'admin_state_up': True, u'network_id':<br>
> u'4ffb2c28-f9f1-4a25-82a0-df7f7a002434', u'segmentation_id': 625,<br>
> u'device_owner': u'network:router_gateway', u'physical_network':<br>
> u'outbound1', u'mac_address': u'fa:16:3e:4d:73:46', u'device':<br>
> u'1239fa6c-265a-4f16-ab00-c86fe40545d9', u'port_security_enabled': False,<br>
> u'port_id': u'1239fa6c-265a-4f16-ab00-c86fe40545d9', u'fixed_ips':<br>
> [{u'subnet_id': u'764f08fc-1979-402c-b93c-834d7148a8a5', u'ip_address':<br>
> u'10.97.179.99'}], u'network_type': u'vlan'}<br>
> 2019-04-09 17:33:13.289 3504 ERROR neutron.agent.ovsdb.impl_idl<br>
> [req-04b10d7a-3f2c-4eda-8d86-c36f994323d9 - - - - -] Traceback (most recent<br>
> call last):<br>
>   File<br>
> "/openstack/venvs/neutron-14.2.16/lib/python2.7/site-packages/neutron/agent/ovsdb/native/connection.py",<br>
> line 117, in run<br>
>     txn.results.put(txn.do_commit())<br>
>   File<br>
> "/openstack/venvs/neutron-14.2.16/lib/python2.7/site-packages/neutron/agent/ovsdb/impl_idl.py",<br>
> line 91, in do_commit<br>
>     raise RuntimeError(_("OVS transaction timed out"))<br>
> RuntimeError: OVS transaction timed out<br>
> <br>
> <br>
> <br>
<br>
<br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><p><span style="font-family:Arial,sans-serif">With kind regards,</span><br></p>

<span style="font-family:Arial,sans-serif">Yedhu Sastri </span></div></div></div></div></div>