<div dir="ltr"><div><div><div>Hi,<br><br></div>I have experienced "rcu_sched detected stalls on CPUs/tasks" in ubuntu vms, which result in dead vm that can't be rebooted/deleted, and I believe it's because of either bug in hypervisor kernel or guest kernel.<br>
<br>I'd like to know which os version and kernel version do you use in production. Both public and private clouds are welcome. My company plans to run a small (to medium) private cloud. Hypervisor runs ubuntu 12.04 and the first guest OSes will be ubuntu 12.04 and CentOS 6. So kernel version for those is much appreciated.<br>
<br></div><div>Is there a wiki page about this?<br></div><div><br>PS. Here is a combination that have the above mentioned error:<br><br></div>    hypervisor os: ubuntu 12.04.3<br>    hypervisor kernel: 3.8.0-35-generic<br>
    vm os: ubuntu 12.04<br>    vm kernel: 3.2.0-56-virtual<br>    openstack: havana<br>    libvirt: 1.1.1-0ubuntu8~cloud2<br><br></div><div>Relevant old bugs on similar issues:<br>rhel5.5 running as kvm guest hangs randomly<br>
<a href="https://bugzilla.redhat.com/show_bug.cgi?id=619798">https://bugzilla.redhat.com/show_bug.cgi?id=619798</a><br><br>Bug #503138 “Lucid & Natty, KVM, After kernel message hrtimer: ...” : Bugs : “kvm” package : Ubuntu<br>
<a href="https://bugs.launchpad.net/ubuntu/+source/kvm/+bug/503138">https://bugs.launchpad.net/ubuntu/+source/kvm/+bug/503138</a><br><br></div><div>I don't have a 100% way to reproduce the problem, but it happens quite often, no matter when the vm is idle or loaded, which is not acceptable in production.<br>
</div><div><br></div>Thanks,<br>Yuanle<br></div>