Hi folks<div><br></div><div>IMO, quantum should follow the nova scheduler architecture. </div><div>Because the scheduler problem is common in nova, quantum, cinder ( may be glance ).</div><div>We have done tons of discussion about scheduling staff in nova-scheduler. </div>
<div>so  why not start to archive nova-network compatible scheduling , </div><div>such as we are working on floating ips or security groups? </div><div><br></div><div>Scheduling have also role of distribute load for resource efficient way. </div>
<div>nova-scheduler has pluggable architecture and some driver implement different scheduling </div><div>strategies.</div><div>There are also several availability strategites ( N-Act, M-Sby, Act-Act, Act-hot standby)  and methods (VRRP or simple vip based failover) based on service requirement.</div>
<div>These strategies could be implemented as a one nova-scheduler driver.</div><div><br></div><div>( IMO, in future, nova-scheduler should be one core Project )</div><div><br></div><div><br></div><div class="gmail_extra">
<br><br><div class="gmail_quote">2012/11/27 Vinay Bannai <span dir="ltr"><<a href="mailto:vbannai@gmail.com" target="_blank">vbannai@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Gary,<div><br></div><div>Given a lack of a standard way of dealing with active/standby DHCP server, I agree that LB does provide an interesting allure to piggy back on top of that. </div><div>I am all for discussing this further but I would also like to explore if a more simpler solution exists. </div>


<div> </div><div>Please see my comments and questions in-line. <br><br>Vinay<br><br><div class="gmail_quote"><div class="im">On Tue, Nov 27, 2012 at 3:50 AM, Gary Kotton <span dir="ltr"><<a href="mailto:gkotton@redhat.com" target="_blank">gkotton@redhat.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  
    
  
  <div bgcolor="#FFFFFF" text="#000000"><div>
    On 11/27/2012 06:06 AM, Mark McClain wrote:
    <blockquote type="cite">
      <pre>All-

I wanted to continue the discussion from the today's meeting about the L3 agents.  The two proposed solutions take different approaches, so I think we first should agree on what we're trying to solve: scaling or availability or both.

Nachi and Yong call their proposal "scheduler", but really it is really a horizontal scale out model.  Scheduling is the means they've chosen to distribute the load.  While their solution scales out horizontally, it does not address fully availability.  Gary's proposal fronts the l3 services with a load balancing like service.  It addresses availability by using an active/standby setup, but does not cover what happens when vertical scaling maxes out due to too many tenant networks and/or routers to fit on a physical node.

I think the answer is to do both by incorporating a combination of the two proposals.  The L3 and DHCP agents are different enough that we may not be able to find a universal solution and that's is ok.

Lastly, deployers have different SLAs and may even have different SLAs for different tenants, so we need to make sure we have a foundation for vendors and deployers to meet their varying SLAs.

Thoughts?</pre>
    </blockquote>
    <br></div>
    It would be great if we could have a universal solution. I feel that
    due to the different roles of the services this will be very
    challenging to achieve. I'll try and explain in more detail below.<br>
    <br>
    <b>DHCP agents</b>:<br>
    At the moment each DHCP agent is able to allocate the IP address for
    a specific mac address. Each agent has this information as it is
    received from the notifications from the Quantum service. The
    problems with the DHCP agent are as follows (please feel free to add
    or remove):<br>
    i. For each networking providing DHCP services (currently only
    implemented by dnsmasq in Quantum) a dnsmasq process is created by
    the agent. This is problematic when the number of networks is large.<br></div></blockquote><div><br></div></div><div>I am not sure that would be a problem. Can we quantify the impact of handling large networks? </div>
<div class="im"><div>

 </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="#FFFFFF" text="#000000">
    ii. When interacting with Nova firewall rules are created to enable
    the traffic to arrive from the DHCP server to the VM. This is
    problematic if the DHCP agent terminates and the VM wishes to renew
    a IP.<br></div></blockquote><div><br></div></div><div>I saw that in a previous post, Dan also mentioned this. I am a little curious as why the Nova firewall rules need to be tweaked. Isn't the VM connected to the bridge (in case of a VLAN)? Or is it only for the case where GRE or other non-L2 based overlays are used?</div>
<div class="im">

<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="#FFFFFF" text="#000000">
    <br>
    Originally I suggested that we use a load balancer to distribute the
    traffic amongst the DHCP agents. Sadly this is not relevant for two
    reasons:<br>
    i. HA proxy does not have UDP support. This would have enabled a
    virtual IP address for the DHCP server => no changes to the nova
    rules. The load balancer would have detected if agents were down and
    redirect traffic to agents that are up.<br>
    ii. It does not address point #ii above. I suggested to have a flag
    or configuration variable for each agent that indicate a list of
    networks that the agent can service.  This will enable the agent to
    limit the resources that can be consumed on a specific host.
    Naturally the devil is in the details on how one can go about this
    if it is relevant.<br>
    <br>
    I think that if we had the "supported list of networks" configurable
    for the DHCP agents then the vendor can deploy as many DHCP agents
    as she/he wishes. I would prefer that this information is not on the
    Quantum service but locally on the agents. This will offer a
    solution for scale and high availability of DHCP resources.<br>
    <br>
    Only problem is the ensuring that the DHCP traffic gets to the VM
    :). I do not think that it is feasible to update the hosts each time
    with a rule for a new DHCP agent that is added. One option to
    consider to to rewrite the source IP of the traffic sent from the
    DHCP agent. This is essentially what is done by a load balancer.<br></div></blockquote><div><br></div></div><div>I am not clear again as to why the host needs to be updated for each new DHCP agent. </div><div class="im">
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div bgcolor="#FFFFFF" text="#000000">
    <br>
    <b>L3 agents</b>:<br>
    Problems here are:<br>
    i. HA - what if a L3 agent goes down.<br>
    ii. Scale - how can we deploy a number of l3 agents<br>
    iii. Amount of firewall rules<br>
    <br>
    In the first case if the L3 agent goes down then someone accessing a
    floating IP will be unable to access that IP. This is something that
    is critical for anyone running a cloud.<br>
    <br>
    I have thought about a number of options but each has its
    shortcomings:<br>
    i. L3 agents to run VRRP. This will enable l3 agents to work in an
    active backup pair. This requires a number of changes to the agent.
    Each agent will have the same configuration enabling them to treat
    inbound and outbound traffic.<br>
    ii. Transparent load balancing - HA proxy does not support this<br>
    iii. Having the agents rewrite the destination MAC address of the
    default GW (the l3 agent). This solves outbound traffic but inbound
    is problematic<br>
    iv. Running l3 agents on each host could ensure that the traffic
    generated on those hosts has floating IP's. This would require us to
    change the implementation of the l3 agents to only build firewall
    rules for devices on the HOST. <br>
    <br>
    None of the above deal with the firewall rules. This is something
    that can be addressed in a similar way to the DHCP agent with the L3
    agents specifically indicating which routers it will support (this
    is already implemented when namespaces are not supported)<br>
    <br>
    Thanks<span><font color="#888888"><br>
    Gary</font></span><div><br>
    <br>
    <blockquote type="cite">
      <pre>mark
_______________________________________________
OpenStack-dev mailing list
<a href="mailto:OpenStack-dev@lists.openstack.org" target="_blank">OpenStack-dev@lists.openstack.org</a>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev</a>
</pre>
    </blockquote>
    <br>
  </div></div>

<br>_______________________________________________<br>
OpenStack-dev mailing list<br>
<a href="mailto:OpenStack-dev@lists.openstack.org" target="_blank">OpenStack-dev@lists.openstack.org</a><br>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev</a><br>
<br></blockquote></div></div><span class="HOEnZb"><font color="#888888"><br><br clear="all"><div><br></div>-- <br>Vinay Bannai<br>Email: <a href="mailto:vbannai@gmail.com" target="_blank">vbannai@gmail.com</a><br>Google Voice: <a href="tel:415%20938%207576" value="+14159387576" target="_blank">415 938 7576</a><br>

<br>
</font></span></div>
<br>_______________________________________________<br>
OpenStack-dev mailing list<br>
<a href="mailto:OpenStack-dev@lists.openstack.org">OpenStack-dev@lists.openstack.org</a><br>
<a href="http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev" target="_blank">http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-dev</a><br>
<br></blockquote></div><br></div>