<div dir="ltr">As Kris Lindgren noted, this has bit us big time. Defaults appear wrong, desired behavior would be other than it is. I'm re-reading this entire thread now (sorry for not weighing in earlier.)</div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, May 15, 2015 at 12:52 PM, Aubrey Wells <span dir="ltr"><<a href="mailto:awells@digiumcloud.com" target="_blank">awells@digiumcloud.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Greetings,<div>Trying to decide if this is a bug or just a config option that I can't find. The setup I'm currently testing in my lab with is two compute nodes running Kilo, one has 40 cores (2x 10c with HT) and one has 16 cores (2x 4c + HT). I don't have any CPU pinning enabled in my nova config, which seems to have the effect of setting in libvirt.xml a vcpu cpuset element like (if created on the 40c node):</div><div><br></div><div><vcpu cpuset="1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39">1</vcpu><br clear="all"><div><div><div dir="ltr"><br></div><div>And then if I migrate that instance to the 16c node, it will bomb out with an exception:</div><div><br></div><div>Live Migration failure: Invalid value '0,2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38' for 'cpuset.cpus': Invalid argument<br></div><div><br></div><div>Which makes sense, since that node doesn't have any vcpus after 15 (0-15).</div><div dir="ltr"><br></div><div dir="ltr">I can fix the symptom by commenting out a line in nova/virt/libvirt/config.py (circa line 1831) so it always has an empty cpuset and thus doesn't write that line to libvirt.xml:</div>







<div dir="ltr"><span># vcpu.</span><span>set</span><span>(</span><span>"cpuset"</span><span>, hardware.format_cpu_spec(self.cpuset))</span><br></div><div dir="ltr"><span><br></span></div><div>And the instance will happily migrate to the host with less CPUs, but this loses some of the benefit of openstack trying to evenly spread out the core usage on the host, at least that's what I think the purpose of that is.</div><div dir="ltr"><br></div><div>I'd rather fix it the right way if there's a config option I don't see or file a bug if its a bug.</div><div><br></div><div>What I think should be happening is that when it creates the libvirt definition on the destination compute node, it write out the correct cpuset per the specs of the hardware its going on to.</div><div><br></div><div>If it matters, in my nova-compute.conf file, I also have cpu mode and model defined to allow me to migrate between the two different architectures to begin with (the 40c is Sandybridge and the 16c is Westmere so I set it to the lowest common denominator of Westmere):</div><div><br></div><div><div>cpu_mode=custom</div><div>cpu_model=Westmere</div></div><div dir="ltr"><span><br></span></div><div><span>Any help is appreciated.</span></div><div dir="ltr"><span><br></span></div><div dir="ltr"><div>---------------------</div><div>Aubrey</div><div><br></div></div></div></div>
</div></div>
<br>_______________________________________________<br>
OpenStack-operators mailing list<br>
<a href="mailto:OpenStack-operators@lists.openstack.org">OpenStack-operators@lists.openstack.org</a><br>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-operators" rel="noreferrer" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-operators</a><br>
<br></blockquote></div><br></div>