<div dir="ltr"><div>We use Fuel for deployment, with a fairly simple network configuration (Controller/Network node are the same) and OpenDaylight as the neutron driver. However, we also have SR-IOV configured for some nics, and there might be something interesting here. </div><div><br></div>The instance was created with an SR-IOV port, and in the logs I see "Assigning a pci device without numa affinity toinstance 389109a4-540e-48d9-82b1-873b02cb4d31 which has numa topology". Then shortly after creation fails and the hypervisor seems to crash.<div><br></div><div>So today I tried to create an instance without SR-IOV and hw:policy=dedicated, and it worked fine. Then I did the same but added an SR-IOV port, and I get the same crash (though not across all nodes this time...)</div><div><br></div><div>I assume we have some kind of misconfiguration somewhere, though the entire hypervisor crashing doesn't seem correct either :-)</div><div><br></div><div>/Tomas</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 17 September 2017 at 00:32, Steve Gordon <span dir="ltr"><<a href="mailto:sgordon@redhat.com" target="_blank">sgordon@redhat.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">----- Original Message -----<br>
> From: "Tomas Brännström" <<a href="mailto:tomas.a.brannstrom@tieto.com">tomas.a.brannstrom@tieto.com</a>><br>
> To: <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
> Sent: Friday, September 15, 2017 5:56:34 AM<br>
> Subject: [Openstack] QEMU/KVM crash when mixing cpu_policy:dedicated and non-dedicated flavors?<br>
><br>
> Hi<br>
> I just noticed a strange (?) issue when I tried to create an instance with<br>
> a flavor with hw:cpu_policy=dedicated. The instance failed with error:<br>
><br>
> Unable to read from monitor: Connection reset by peer', u'code': 500,<br>
> u'details': u'  File<br>
> "/usr/lib/python2.7/dist-<wbr>packages/nova/compute/manager.<wbr>py", line 1926, in<br>
> _do_build_and_run_instance\n    filter_properties)<br>
> File "/usr/lib/python2.7/dist-<wbr>packages/nova/compute/manager.<wbr>py", line 2116,<br>
> in _build_and_run_instance\n    instance_uuid=instance.uuid,<br>
> reason=six.text_type(e))<br>
><br>
> And all other instances were shut down, even those living on another<br>
> compute host than the new one was scheduled to. A quick googling reveals<br>
> that this could be due to the hypervisor crashing (though why would it<br>
> crash on unrelated compute hosts??).<br>
<br>
</span>Are there any more specific messages in the system logs or elsewhere? Check /var/log/libvirt/* in particular, though I suspect it will be the original source of the above message it may have some additional useful information earlier.<br>
<span class=""><br>
><br>
> The only odd thing here that I can think of was that the existing instances<br>
> did -not- use dedicated cpu policy -- can there be problems like this when<br>
> attempting to mix dedicated and non-dedicated policies?<br>
<br>
</span>The main problem if you mix them *on the same node* is that Nova wont account properly for this when placing guests, the current design assumes that a node will be used either for "normal" instances (with CPU overcommit) or "dedicated" instances (no CPU overcommit, pinning) and the two will be separated via the use of host aggregates and flavors. This in and of itself should not result in a QEMU crash though it may eventually result in issues w.r.t. balancing of scheduling/placement decisions. If instances on other nodes went down at the same time I'd be looking for a broader issue, what is your storage and networking setup like?<br>
<br>
-Steve<br>
<span class="im HOEnZb"><br>
> This was with Mitaka.<br>
><br>
> /Tomas<br>
><br>
</span><div class="HOEnZb"><div class="h5">> ______________________________<wbr>_________________<br>
> Mailing list: <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" rel="noreferrer" target="_blank">http://lists.openstack.org/<wbr>cgi-bin/mailman/listinfo/<wbr>openstack</a><br>
> Post to     : <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
> Unsubscribe : <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" rel="noreferrer" target="_blank">http://lists.openstack.org/<wbr>cgi-bin/mailman/listinfo/<wbr>openstack</a><br>
><br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
Steve Gordon,<br>
Principal Product Manager,<br>
Red Hat OpenStack Platform<br>
</font></span></blockquote></div><br></div>