<div dir="ltr">Our compute nodes are using vhost_net, we haven't made any changes to buffer our NIC.<div>The system is not over loaded, cpu usage aren't higher than 30%</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 12 December 2014 at 02:35, mad Engineer <span dir="ltr"><<a href="mailto:themadengin33r@gmail.com" target="_blank">themadengin33r@gmail.com</a>></span> wrote:<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">so looks like its not the issue with openvswitch,missed is quite<br>
normal,it is not the reason for packet loss<br>
is your guests using vhost_net?<br>
do<br>
ps aux|grep vhost<br>
also have you made any changes to buffer size of your NIC?<br>
is the system over loaded what is the cpu usage<br>
<div class="HOEnZb"><div class="h5"><br>
On Thu, Dec 11, 2014 at 6:20 PM, André Aranha <<a href="mailto:andre.f.aranha@gmail.com">andre.f.aranha@gmail.com</a>> wrote:<br>
> Thanks for the advice, i've run the command in NetworkNode and in a<br>
> ComputeNode and lost is 0, but missed is a high value.<br>
><br>
> NetworkNode<br>
> system@ovs-system:<br>
> lookups: hit:425667155 missed:2962922 lost:0<br>
> flows: 27<br>
> port 0: ovs-system (internal)<br>
> port 1: br-ex (internal)<br>
> port 2: br-tun (internal)<br>
> port 3: eth1<br>
> port 4: br-int (internal)<br>
> port 5: tapbdc3d959-d8 (internal)<br>
> port 6: gre_system (gre: df_default=false, ttl=0)<br>
> port 7: qr-4063db49-6b (internal)<br>
> port 8: qg-e427e527-92 (internal)<br>
><br>
><br>
> ComputeNode<br>
> system@ovs-system:<br>
> lookups: hit:28660666 missed:200922 lost:0<br>
> flows: 19<br>
> port 0: ovs-system (internal)<br>
> port 1: br-int (internal)<br>
> port 2: br-tun (internal)<br>
> port 3: gre_system (gre: df_default=false, ttl=0)<br>
> port 4: em1<br>
> port 5: br-private (internal)<br>
> port 6: qvo9a959049-a0<br>
> port 7: qvodd0ef077-e1<br>
> port 8: qvoac2b566b-65<br>
> port 9: qvo9e4ab149-5c<br>
> port 10: qvoc2d2625c-0c<br>
> port 11: qvo3069daeb-4a<br>
> port 12: qvo7f82a3cf-0c<br>
> port 13: qvo83b77d2d-1a<br>
> port 14: qvobbadd8c2-30<br>
> port 15: qvocfd0b8e8-ad<br>
> port 16: qvo714fab88-60<br>
> port 17: qvob9ddde49-86<br>
> port 18: qvo42ef9f3b-ac<br>
> port 19: qvof4ae7868-41<br>
> port 20: qvoa4408a18-03<br>
> port 22: qvo36c64d52-9b<br>
><br>
> On 11 December 2014 at 06:17, mad Engineer <<a href="mailto:themadengin33r@gmail.com">themadengin33r@gmail.com</a>> wrote:<br>
>><br>
>> sorry its 2.3.0 not 2.1.3<br>
>><br>
>> On Thu, Dec 11, 2014 at 2:43 PM, mad Engineer <<a href="mailto:themadengin33r@gmail.com">themadengin33r@gmail.com</a>><br>
>> wrote:<br>
>> > Not in openstack,i had performance issue, with OVS and bursty traffic<br>
>> > upgrading to later version improved the performance.A lot of<br>
>> > performance features have been added in  2.1.3.<br>
>> ><br>
>> > Do you have lots of lost: value in<br>
>> > ovs-dpctl show<br>
>> ><br>
>> ><br>
>> > On Thu, Dec 11, 2014 at 2:33 AM, André Aranha <<a href="mailto:andre.f.aranha@gmail.com">andre.f.aranha@gmail.com</a>><br>
>> > wrote:<br>
>> >> Yes, we are using version 2.0.2.<br>
>> >> The process uses only about 0.3% on network node and compute node.<br>
>> >> Did you have the same issue?<br>
>> >><br>
>> >> On 10 December 2014 at 14:31, mad Engineer <<a href="mailto:themadengin33r@gmail.com">themadengin33r@gmail.com</a>><br>
>> >> wrote:<br>
>> >>><br>
>> >>> are you using openvswitch? which version?<br>
>> >>> if yes,is it consuming a lot of CPU?<br>
>> >>><br>
>> >>> On Wed, Dec 10, 2014 at 7:45 PM, André Aranha<br>
>> >>> <<a href="mailto:andre.f.aranha@gmail.com">andre.f.aranha@gmail.com</a>><br>
>> >>> wrote:<br>
>> >>> > Well, here we are using de Icehouse with Ubuntu 14.04 LTS<br>
>> >>> ><br>
>> >>> > We found this thread in the community  and we apply the changes in<br>
>> >>> > the<br>
>> >>> > compute nodes (change VHOST_NET_ENABLED to 1 in<br>
>> >>> > /etc/default/qemu-kvm).<br>
>> >>> > After do this, a few instances the problem doesn't exists anymore.<br>
>> >>> > This<br>
>> >>> > link<br>
>> >>> > show an investigation to find the problem.<br>
>> >>> ><br>
>> >>> > About the MTU in our cloud (using iperf),<br>
>> >>> ><br>
>> >>> > 1-from any the Desktop to the Network Node<br>
>> >>> > MSS size 1448 bytes (MTU 1500 bytes, ethernet)<br>
>> >>> ><br>
>> >>> > 2-from any Desktop to the instance<br>
>> >>> > MSS size 1348 bytes (MTU 1388 bytes, unknown interface)<br>
>> >>> ><br>
>> >>> > 3- from any instance to the Network Node<br>
>> >>> > MSS size 1348 bytes (MTU 1388 bytes, unknown interface)<br>
>> >>> ><br>
>> >>> > 4- from any instance to the Desktop<br>
>> >>> > MSS size 1348 bytes (MTU 1388 bytes, unknown interface)<br>
>> >>> ><br>
>> >>> > 5-from Network Node to any ComputeNode<br>
>> >>> > MSS size 1448 bytes (MTU 1500 bytes, ethernet)<br>
>> >>> ><br>
>> >>> > 6-from any ComputeNode to NetworkNode<br>
>> >>> > MSS size 1448 bytes (MTU 1500 bytes, ethernet)<br>
>> >>> ><br>
>> >>> > On 10 December 2014 at 10:31, somshekar kadam<br>
>> >>> > <<a href="mailto:som_kadam@yahoo.co.in">som_kadam@yahoo.co.in</a>><br>
>> >>> > wrote:<br>
>> >>> >><br>
>> >>> >> Sorry for wrong post mail chain.<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> Regards<br>
>> >>> >> Neelu<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> On Wednesday, 10 December 2014 6:59 PM, somshekar kadam<br>
>> >>> >> <<a href="mailto:som_kadam@yahoo.co.in">som_kadam@yahoo.co.in</a>> wrote:<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> Hi All,<br>
>> >>> >><br>
>> >>> >> Please recommend which stable Host OS to use for Controller and<br>
>> >>> >> Compute<br>
>> >>> >> node.<br>
>> >>> >> I have tried Fedora20 seems lot of tweaking is required, corerct me<br>
>> >>> >> If<br>
>> >>> >> I<br>
>> >>> >> am wrong.<br>
>> >>> >> I see that most of it is tested on ubuntu and centos.<br>
>> >>> >> I am planning to use JUNO stable version.<br>
>> >>> >> Please help on this<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> Regards<br>
>> >>> >> Neelu<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> On Wednesday, 10 December 2014 5:42 PM, Hannah Fordham<br>
>> >>> >> <<a href="mailto:hfordham@radiantworlds.com">hfordham@radiantworlds.com</a>> wrote:<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> I'm afraid we didn't, we're still struggling with some VMs with<br>
>> >>> >> this<br>
>> >>> >> problem. Sorry!<br>
>> >>> >><br>
>> >>> >> On 9 December 2014 14:09:32 GMT+00:00, "André Aranha"<br>
>> >>> >> <<a href="mailto:andre.f.aranha@gmail.com">andre.f.aranha@gmail.com</a>> wrote:<br>
>> >>> >><br>
>> >>> >> Hi,<br>
>> >>> >><br>
>> >>> >> We are with the same issue here, and already try some solutions<br>
>> >>> >> that<br>
>> >>> >> didn't work at all. Did you solved this problem?<br>
>> >>> >><br>
>> >>> >> Thank you,<br>
>> >>> >> Andre Aranha<br>
>> >>> >><br>
>> >>> >> On 27 August 2014 at 08:17, Hannah Fordham<br>
>> >>> >> <<a href="mailto:hfordham@radiantworlds.com">hfordham@radiantworlds.com</a>><br>
>> >>> >> wrote:<br>
>> >>> >><br>
>> >>> >> I’ve been trying to figure this one out for a while, so I’ll try<br>
>> >>> >> and be<br>
>> >>> >> as<br>
>> >>> >> thorough as possible in this post but apologies if I miss anything<br>
>> >>> >> pertinent<br>
>> >>> >> out.<br>
>> >>> >><br>
>> >>> >> First off, I’m running a set up with one control node and 5 compute<br>
>> >>> >> nodes,<br>
>> >>> >> all created using the Stackgeek scripts -<br>
>> >>> >> <a href="http://www.stackgeek.com/guides/gettingstarted.html" target="_blank">http://www.stackgeek.com/guides/gettingstarted.html</a>. The first two<br>
>> >>> >> (compute1<br>
>> >>> >> and compute 2) were created at the same time, compute3, 4 and 5<br>
>> >>> >> were<br>
>> >>> >> added<br>
>> >>> >> as needed later. My VMs are predominantly CentOS, while my<br>
>> >>> >> Openstack<br>
>> >>> >> nodes<br>
>> >>> >> are Ubuntu 14.04.1<br>
>> >>> >><br>
>> >>> >> The symptom: irregular high latency/packet loss to VMs on all<br>
>> >>> >> compute<br>
>> >>> >> boxes except compute3. Mostly a pain when trying to do anything via<br>
>> >>> >> ssh<br>
>> >>> >> on a<br>
>> >>> >> VM because the lag makes it difficult to do anything, but it shows<br>
>> >>> >> itself<br>
>> >>> >> quite nicely through pings as well:<br>
>> >>> >> --- 10.0.102.47 ping statistics ---<br>
>> >>> >> 111 packets transmitted, 103 received, 7% packet loss, time<br>
>> >>> >> 110024ms<br>
>> >>> >> rtt min/avg/max/mdev = 0.096/367.220/5593.100/1146.920 ms, pipe 6<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> I have tested these pings:<br>
>> >>> >> VM to itself (via its external IP) seems fine<br>
>> >>> >> VM to another VM is not fine<br>
>> >>> >> Hosting compute node to VM is not fine<br>
>> >>> >> My PC to VM is not fine (however the other way round works fine)<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> Top on a (32 core) compute node with laggy VMs:<br>
>> >>> >> top - 12:09:20 up 33 days, 21:35,  1 user,  load average: 2.37,<br>
>> >>> >> 4.95,<br>
>> >>> >> 6.23<br>
>> >>> >> Tasks: 431 total,   2 running, 429 sleeping,   0 stopped,   0<br>
>> >>> >> zombie<br>
>> >>> >> %Cpu(s):  0.6 us,  3.4 sy,  0.0 ni, 96.0 id,  0.0 wa,  0.0 hi,  0.0<br>
>> >>> >> si,<br>
>> >>> >> 0.0 st<br>
>> >>> >> KiB Mem:  65928256 total, 44210348 used, 21717908 free,   341172<br>
>> >>> >> buffers<br>
>> >>> >> KiB Swap:  7812092 total,  1887864 used,  5924228 free.  7134740<br>
>> >>> >> cached<br>
>> >>> >> Mem<br>
>> >>> >><br>
>> >>> >> And for comparison, on the one compute node that doesn’t seem to be<br>
>> >>> >> suffering from this:<br>
>> >>> >> top - 12:12:20 up 33 days, 21:38,  1 user,  load average: 0.28,<br>
>> >>> >> 0.18,<br>
>> >>> >> 0.15<br>
>> >>> >> Tasks: 399 total,   3 running, 396 sleeping,   0 stopped,   0<br>
>> >>> >> zombie<br>
>> >>> >> %Cpu(s):  0.3 us,  0.1 sy,  0.0 ni, 98.9 id,  0.6 wa,  0.0 hi,  0.0<br>
>> >>> >> si,<br>
>> >>> >> 0.0 st<br>
>> >>> >> KiB Mem:  65928256 total, 49986064 used, 15942192 free,   335788<br>
>> >>> >> buffers<br>
>> >>> >> KiB Swap:  7812092 total,   919392 used,  6892700 free. 39272312<br>
>> >>> >> cached<br>
>> >>> >> Mem<br>
>> >>> >><br>
>> >>> >> Top on a laggy VM:<br>
>> >>> >> top - 11:02:53 up 27 days, 33 min,  3 users,  load average: 0.00,<br>
>> >>> >> 0.00,<br>
>> >>> >> 0.00<br>
>> >>> >> Tasks:  91 total,   1 running,  90 sleeping,   0 stopped,   0<br>
>> >>> >> zombie<br>
>> >>> >> Cpu(s):  0.2%us,  0.1%sy,  0.0%ni, 99.5%id,  0.1%wa,  0.0%hi,<br>
>> >>> >> 0.0%si,<br>
>> >>> >> 0.0%st<br>
>> >>> >> Mem:   1020400k total,   881004k used,   139396k free,   162632k<br>
>> >>> >> buffers<br>
>> >>> >> Swap:  1835000k total,    14984k used,  1820016k free,   220644k<br>
>> >>> >> cached<br>
>> >>> >><br>
>> >>> >> <a href="http://imgur.com/blULjDa" target="_blank">http://imgur.com/blULjDa</a> shows the hypervisor panel of Horizon. As<br>
>> >>> >> you<br>
>> >>> >> can<br>
>> >>> >> see, Compute 3 has fewer resources used, but none of the compute<br>
>> >>> >> nodes<br>
>> >>> >> should be anywhere near overloaded from what I can tell.<br>
>> >>> >><br>
>> >>> >> Any ideas? Let me know if I’m missing anything obvious that would<br>
>> >>> >> help<br>
>> >>> >> with figuring this out!<br>
>> >>> >><br>
>> >>> >> Hannah<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> ***********<br>
>> >>> >><br>
>> >>> >> Radiant Worlds Limited is registered in England (company no:<br>
>> >>> >> 07822337).<br>
>> >>> >> This message is intended solely for the addressee and may contain<br>
>> >>> >> confidential information. If you have received this message in<br>
>> >>> >> error<br>
>> >>> >> please<br>
>> >>> >> send it back to us and immediately and permanently delete it from<br>
>> >>> >> your<br>
>> >>> >> system. Do not use, copy or disclose the information contained in<br>
>> >>> >> this<br>
>> >>> >> message or in any attachment. Please also note that transmission<br>
>> >>> >> cannot<br>
>> >>> >> be<br>
>> >>> >> guaranteed to be secure or error-free.<br>
>> >>> >><br>
>> >>> >> _______________________________________________<br>
>> >>> >> Mailing list:<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >> Post to     : <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
>> >>> >> Unsubscribe :<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> --<br>
>> >>> >> Sent from my Android device with K-9 Mail. Please excuse my<br>
>> >>> >> brevity.<br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> ***********<br>
>> >>> >><br>
>> >>> >> Radiant Worlds Limited is registered in England (company no:<br>
>> >>> >> 07822337).<br>
>> >>> >> This message is intended solely for the addressee and may contain<br>
>> >>> >> confidential information. If you have received this message in<br>
>> >>> >> error<br>
>> >>> >> please<br>
>> >>> >> send it back to us and immediately and permanently delete it from<br>
>> >>> >> your<br>
>> >>> >> system. Do not use, copy or disclose the information contained in<br>
>> >>> >> this<br>
>> >>> >> message or in any attachment. Please also note that transmission<br>
>> >>> >> cannot<br>
>> >>> >> be<br>
>> >>> >> guaranteed to be secure or error-free.<br>
>> >>> >><br>
>> >>> >> _______________________________________________<br>
>> >>> >> Mailing list:<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >> Post to    : <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
>> >>> >> Unsubscribe :<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >><br>
>> >>> >> _______________________________________________<br>
>> >>> >> Mailing list:<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >> Post to    : <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
>> >>> >> Unsubscribe :<br>
>> >>> >> <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> >><br>
>> >>> >><br>
>> >>> ><br>
>> >>> ><br>
>> >>> > _______________________________________________<br>
>> >>> > Mailing list:<br>
>> >>> > <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> > Post to     : <a href="mailto:openstack@lists.openstack.org">openstack@lists.openstack.org</a><br>
>> >>> > Unsubscribe :<br>
>> >>> > <a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack</a><br>
>> >>> ><br>
>> >><br>
>> >><br>
><br>
><br>
</div></div></blockquote></div></div>