<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Hello Julia, Thanks for your response.<br></div><div class="gmail_default" style="font-family:verdana,sans-serif">I am using a RedHat Openstack Platform 16.1, which is running on RHEL 8.2.</div><div class="gmail_default" style="font-family:verdana,sans-serif">All are physical servers;</div><div class="gmail_default" style="font-family:verdana,sans-serif">- One Undercloud Director.</div><div class="gmail_default" style="font-family:verdana,sans-serif">- Overcloud consists of two nodes. (This is for Certification purposes)</div><div class="gmail_default" style="font-family:verdana,sans-serif">It is unlikely that it's a mac addr. mismatch (I wish...) since I've already deployed these nodes several times, using the same nodes.json</div><div class="gmail_default" style="font-family:verdana,sans-serif">Just for reference , here is the output:</div><div class="gmail_default" style="font-family:verdana,sans-serif">(undercloud) [stack@interop010 ~]$ openstack baremetal port list<br>+--------------------------------------+-------------------+<br>| UUID                                                      | Address           |<br>+--------------------------------------+-------------------+<br>| 2d404695-f236-4d32-8b65-5ca1fa6b756a | a0:36:9f:95:dd:e2 |<br>| 32669178-0408-4ff1-b4b4-df65fc7643c9 | 6c:ae:8b:69:ee:80 |<br>+--------------------------------------+-------------------+</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">The operation was working well until I have 'lost' the undercloud node, but overcloud stayed working.</div><div class="gmail_default" style="font-family:verdana,sans-serif">I might need to delete these nodes and run introspection again.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Igal<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Mar 24, 2021 at 7:31 PM Julia Kreger <<a href="mailto:juliaashleykreger@gmail.com">juliaashleykreger@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">So versions and overall configuration might help, *but* often these<br>
issues are just a typo with a MAC address or the wrong port. Can you<br>
verify that the MAC address your seeing DHCP requests for matchs what<br>
is recorded for the node in the `openstack baremetal port list`<br>
output?<br>
<br>
On Wed, Mar 24, 2021 at 8:18 AM Igal Katzir <<a href="mailto:ikatzir@infinidat.com" target="_blank">ikatzir@infinidat.com</a>> wrote:<br>
><br>
> Hello all,<br>
><br>
> While troubleshooting this, another observation I see is that when I run put the node in state provide:<br>
> 'openstack baremetal node provide 97b9a603-f64f-47c1-9fb4-6c68a5b38ff6’<br>
> It starts the cleaning process, then the node boots into PXE but the undercloud ignores it.<br>
> When I tap the port I see that requests reach its interface:<br>
><br>
> (undercloud) [stack@interop010 ~]$ sudo tcpdump -i br-ctlplane<br>
> 10:43:10.600421 IP 0.0.0.0.bootpc > 255.255.255.255.bootps: BOOTP/DHCP, Request from a0:36:9f:95:dd:e2 (oui Unknown), length 548<br>
><br>
> But on the same time the dnsmasq ignores it:<br>
> (undercloud) [stack@interop010 ~]$ sudo tail -f /var/log/containers/ironic-inspector/dnsmasq.log<br>
> Mar 24 10:39:43 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) 6c:ae:8b:69:ee:80 ignored<br>
> Mar 24 10:40:36 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) a0:36:9f:95:dd:e2 ignored<br>
> Mar 24 10:40:39 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) a0:36:9f:95:dd:e2 ignored<br>
> Mar 24 10:40:48 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) 6c:ae:8b:69:ee:80 ignored<br>
> Mar 24 10:41:52 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) 6c:ae:8b:69:ee:80 ignored<br>
> Mar 24 10:42:57 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) 6c:ae:8b:69:ee:80 ignored<br>
> Mar 24 10:43:06 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) a0:36:9f:95:dd:e2 ignored<br>
> Mar 24 10:43:10 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) a0:36:9f:95:dd:e2 ignored<br>
> Mar 24 10:43:14 dnsmasq-dhcp[7]: DHCPDISCOVER(br-ctlplane) a0:36:9f:95:dd:e2 ignored<br>
><br>
> Why is that?<br>
> What is needed for the cleanup to start?<br>
><br>
> Thanks,<br>
> Igal<br>
><br>
> On 24 Mar 2021, at 0:09, Igal Katzir <<a href="mailto:ikatzir@infinidat.com" target="_blank">ikatzir@infinidat.com</a>> wrote:<br>
><br>
> Hello Team,<br>
><br>
> I had a situation where my undercloud-node had a problem with it’s disk and has disconnected from overcloud.<br>
> I couldn’t restore the undercloud controller and ended up re-installing it (running 'openstack undercloud install’).<br>
> The installation ended successfully but now I’m in a situation where Cleanup of the overcloud deployed nodes fails:<br>
><br>
> (undercloud) [stack@interop010 ~]$ openstack baremetal node list<br>
> +--------------------------------------+------------+---------------+-------------+--------------------+-------------+<br>
> | UUID                                       | Name       | Instance    UUID        | Power State | Provisioning State | Maintenance |<br>
> +--------------------------------------+------------+---------------+-------------+--------------------+-------------+<br>
> | 97b9a603-f64f-47c1-9fb4-6c68a5b38ff6 | interop025 | None          | power on    | clean failed       | True        |<br>
> | 4b02703a-f765-4ebb-85ed-75e88b4cbea5 | interop026 | None          | power on    | clean failed       | True        |<br>
> +--------------------------------------+------------+---------------+-------------+--------------------+-------------+<br>
><br>
> I’ve tried to move node to available state but cannot:<br>
> (undercloud) [stack@interop010 ~]$ openstack baremetal node provide 97b9a603-f64f-47c1-9fb4-6c68a5b38ff6<br>
> The requested action "provide" can not be performed on node "97b9a603-f64f-47c1-9fb4-6c68a5b38ff6" while it is in state "clean failed". (HTTP 400)<br>
><br>
> My question is:<br>
> How do I make the nodes available again?<br>
> as the deployment of overcloud fails with:<br>
> ERROR due to "Message: No valid host was found. , Code: 500”<br>
><br>
> Thanks,<br>
> Igal<br>
><br>
><br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><span style="font-family:"trebuchet ms",sans-serif">Regards</span>,<br><span style="font-family:"trebuchet ms",sans-serif"><b>Igal Katzir<br></b></span></div><div><span style="font-family:"trebuchet ms",sans-serif"><span style="color:rgb(61,133,198)">Cell +972-54-5597086</span><b><br></b></span></div><span style="font-family:"trebuchet ms",sans-serif">Interoperability Team <br></span></div><div dir="ltr"><span style="font-family:"trebuchet ms",sans-serif"><b>INFINIDAT</b></span></div><div dir="ltr"><span style="font-family:"trebuchet ms",sans-serif"><b><br></b><br><br><br></span></div></div></div></div></div></div></div></div></div></div></div></div>