<div dir="ltr"><div>List, <br></div><div><br></div><div>We are having an old cloud setup with OpenStack  Ussuri usng Debian OS, (Qemu KVM ).  I know its very old and we can't upgrade to to new versions right now. <br></div><div><br></div><div>The  Deployment is as follows.<br></div><div><br></div><div>A.    3 Controller in (cum compute nodes . VMs are running on controllers too..) in HA mode. <br></div><div><br></div><div>B.   6 separate Compute nodes</div><div><br></div><div>C.    3 separate Storage node with Ceph RBD <br></div><div><br></div><div>Question is <br></div><div><br></div><div>1.  In case of any Sudden Hardware failure of one  or more controller node OR Compute node  OR Storage Node  what will be the immediate redundant  recovery setup need to be employed ?</div><div><br></div><div>2.  In case H/W failure our  recovery need to as soon as possible. For example less than30 Minutes after the first failure occurs. <br></div><div><br></div><div>3.  Is there setup options like a hot standby or similar setups or what  we need to employ ?</div><div><br></div><div>4. To meet all   RTO (< 30 Minutes down time ) and RPO(from the exact point of crash all applications and data must be consistent) .  <br></div><div><br></div><div>5. Please share  your thoughts for reliable crash/fault resistance configuration options in DC. <br></div><div><br></div><div><br></div><div>We  have   a remote DR setup right now in a remote location. Also I would like to know if there is a recommended way to make the remote DR site Automatically up and run  ? OR How to automate the service from DR site  to  meet exact RTO and RPO </div><div><br></div><div>Any thoughts most welcom.</div><div><br></div><div>Regards,<br></div><div>Krish<br></div></div>