<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle18
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle19
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle20
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle21
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle23
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">That patch didn’t fix it. It looks like we have a different issue. Can anyone help?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Albert Braden <Albert.Braden@synopsys.com> <br>
<b>Sent:</b> Tuesday, December 10, 2019 10:10 AM<br>
<b>To:</b> openstack-discuss@lists.openstack.org<br>
<b>Subject:</b> RE: neutron-metadata-agent broken pipe<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">It looks like we may be encountering this bug:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><a href="https://bugs.launchpad.net/neutron/+bug/1853071">https://bugs.launchpad.net/neutron/+bug/1853071</a><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I’m testing this patch now.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><a href="https://review.opendev.org/#/c/697405/">https://review.opendev.org/#/c/697405/</a><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Albert Braden <br>
<b>Sent:</b> Monday, December 9, 2019 1:11 PM<br>
<b>To:</b> <a href="mailto:openstack-discuss@lists.openstack.org">openstack-discuss@lists.openstack.org</a><br>
<b>Subject:</b> RE: neutron-metadata-agent broken pipe<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">From my VM, if I try the metadata server repeatedly, it eventually gets a response:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">albertb@<html><body><h1>503:~ $ curl <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_meta-2Ddata_instance-2Did&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=dAR8ULtj-DCnAa8gFz_kCfaFc-yZFf7iRxJcUNjHG6g&e=">
http://169.254.169.254/2009-04-04/meta-data/instance-id</a><o:p></o:p></p>
<p class="MsoNormal"><html><body><h1>503 Service Unavailable</h1><o:p></o:p></p>
<p class="MsoNormal">No server is available to handle this request.<o:p></o:p></p>
<p class="MsoNormal"></body></html><o:p></o:p></p>
<p class="MsoNormal">albertb@<html><body><h1>503:~ $ curl <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_meta-2Ddata_instance-2Did&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=dAR8ULtj-DCnAa8gFz_kCfaFc-yZFf7iRxJcUNjHG6g&e=">
http://169.254.169.254/2009-04-04/meta-data/instance-id</a><o:p></o:p></p>
<p class="MsoNormal"><html><body><h1>504 Gateway Time-out</h1><o:p></o:p></p>
<p class="MsoNormal">The server didn't respond in time.<o:p></o:p></p>
<p class="MsoNormal"></body></html><o:p></o:p></p>
<p class="MsoNormal">albertb@<html><body><h1>503:~ $ curl <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_meta-2Ddata_instance-2Did&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=dAR8ULtj-DCnAa8gFz_kCfaFc-yZFf7iRxJcUNjHG6g&e=">
http://169.254.169.254/2009-04-04/meta-data/instance-id</a><o:p></o:p></p>
<p class="MsoNormal">i-000017ccalbertb@<html><body><h1>503:~ $<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Then I see this in neutron-metadata-agent.log:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">2019-12-09 12:41:55.213 266833 INFO eventlet.wsgi.server [-] 10.195.72.75,<local> "GET /2009-04-04/meta-data/instance-id HTTP/1.1" status: 200  len: 146 time: 0.3922560<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">When it fails (503/504) nothing is logged by Neutron but I see haproxy logs:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Dec  9 13:06:14 us01odc-p02-ctrl3 haproxy-metadata-proxy-569e2c42-3935-48e9-ae41-074650e57b2b[267096]: 10.195.72.75:53266 [09/Dec/2019:13:06:14.475] listener listener/metadata 0/0/-1/-1/0 503 212 - - SC-- 58/58/57/57/3 0/0 "GET /2009-04-04/meta-data/instance-id
 HTTP/1.1"<o:p></o:p></p>
<p class="MsoNormal">Dec  9 13:06:59 us01odc-p02-ctrl3 haproxy-metadata-proxy-569e2c42-3935-48e9-ae41-074650e57b2b[267096]: 10.195.72.75:53268 [09/Dec/2019:13:06:27.067] listener listener/metadata 0/0/0/-1/32001 504 194 - - sH-- 90/90/89/89/0 0/0 "GET /2009-04-04/meta-data/instance-id
 HTTP/1.1"<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The load on my controllers is around 15 but they have 48 CPU so 15 should be OK.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">When I look at RMQ I see everything fine except for the q-plugin queue; it has 3 consumers but there are thousands of unacked messages and the number gradually increases. Could that be causing the neutron-metadata issue?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Albert Braden <<a href="mailto:Albert.Braden@synopsys.com">Albert.Braden@synopsys.com</a>>
<br>
<b>Sent:</b> Monday, December 9, 2019 12:20 PM<br>
<b>To:</b> <a href="mailto:openstack-discuss@lists.openstack.org">openstack-discuss@lists.openstack.org</a><br>
<b>Subject:</b> RE: neutron-metadata-agent broken pipe<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">When I try to build a VM I see this in the VM logs:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">2019-12-09 20:02:21,396 - url_helper.py[WARNING]: Calling 'http://169.254.169.254/2009-04-04/meta-data/instance-id' failed [0/120s]: bad status code [503]<o:p></o:p></p>
<p class="MsoNormal">2019-12-09 20:03:41,084 - util.py[WARNING]: Failed fetching userdata from url
<a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_user-2Ddata&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=JPv_swVY0usZe3pulTrue-YU9tSB9STeSOeM31D0XGs&e=">
http://169.254.169.254/2009-04-04/user-data</a><o:p></o:p></p>
<p class="MsoNormal">2019-12-09 12:03:53,041 - util.py[WARNING]: Failed running /var/lib/cloud/scripts/per-boot/config_instance.sh [1]<o:p></o:p></p>
<p class="MsoNormal">2019-12-09 12:03:53,043 - cc_scripts_per_boot.py[WARNING]: Failed to run module scripts-per-boot (per-boot in /var/lib/cloud/scripts/per-boot)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This is the failing line from the script:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">name=`curl -s <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_meta-2Ddata_hostname-2560&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=HM_BR79M_6H0rb1UCrVgXrNnbxSQCx20btqfOkCf6pI&e=">
http://169.254.169.254/2009-04-04/meta-data/hostname`</a><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">When I try this from the VM I get this error:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">albertb@<html><body><h1>503:~ $ curl -s <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__169.254.169.254_2009-2D04-2D04_meta-2Ddata_hostname&d=DwMFAg&c=DPL6_X_6JkXFx7AXWqB0tg&r=XrJBXYlVPpvOXkMqGPz6KucRW_ils95ZMrEmlTflPm8&m=RTlZ5Jyptp6PGLJVV7aNKTeilTRd8FEteQ8FQa0h-q8&s=LxPWgb-9sfuKnK1sfmxB5LoRjKcmJ7Hs97fUlcmlnK4&e=">
http://169.254.169.254/2009-04-04/meta-data/hostname</a><o:p></o:p></p>
<p class="MsoNormal"><html><body><h1>503 Service Unavailable</h1><o:p></o:p></p>
<p class="MsoNormal">No server is available to handle this request.<o:p></o:p></p>
<p class="MsoNormal"></body></html><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">When I check neutron-metadata-agent.log for the time when the VM was failing I see the “broken pipe” errors:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">2019-12-09 11:56:00.075 664593 INFO eventlet.wsgi.server [-] Traceback (most recent call last):<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/dist-packages/eventlet/wsgi.py", line 521, in handle_one_response<o:p></o:p></p>
<p class="MsoNormal">    write(b''.join(towrite))<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/dist-packages/eventlet/wsgi.py", line 462, in write<o:p></o:p></p>
<p class="MsoNormal">    wfile.flush()<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/socket.py", line 307, in flush<o:p></o:p></p>
<p class="MsoNormal">    self._sock.sendall(view[write_offset:write_offset+buffer_size])<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/dist-packages/eventlet/greenio/base.py", line 390, in sendall<o:p></o:p></p>
<p class="MsoNormal">    tail = self.send(data, flags)<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/dist-packages/eventlet/greenio/base.py", line 384, in send<o:p></o:p></p>
<p class="MsoNormal">    return self._send_loop(self.fd.send, data, flags)<o:p></o:p></p>
<p class="MsoNormal">  File "/usr/lib/python2.7/dist-packages/eventlet/greenio/base.py", line 371, in _send_loop<o:p></o:p></p>
<p class="MsoNormal">    return send_method(data, *args)<o:p></o:p></p>
<p class="MsoNormal">error: [Errno 32] Broken pipe<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Why is my neutron-metadata server failing? Has anyone else seen this problem? We are running Rocky with about 200 hypervisors; it started after we added 100.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>