<div dir="ltr"><div style>Hi All,</div><div style><br></div><div style>We are trying to find a solution for stuck/errored resizes in nova.</div><div style><u><b><br></b></u></div><div style><u><b>Problem:</b></u></div><div>
<span style="font-family:Calibri,sans-serif;font-size:14px">Admins should be able to </span><span style="font-family:Calibri,sans-serif;font-size:14px">fix resizes regardless of what state or step in the process, the instance is in.</span></div>
<div><span style="font-family:Calibri,sans-serif;font-size:14px"><br></span></div><div><span style="font-family:arial,sans-serif;font-size:13px">A resize can be reverted or confirmed only after it's finished. It depends on the instance's vm_state and task_state and the migration status.</span></div>
<div><div><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div><span style="font-family:arial,sans-serif;font-size:13px">There are some scenarios in which the migration is stuck or goes to error. For instance, when the rsync process dies midway due to deployments or the compute node restarts. In such cases, admins can try to recover the migration and confirm it or revert the migration to get the original instance up and running.</span></div>
<div style><u><b><br></b></u></div><div style><u><b>Current Process:</b></u></div><div style><span style="font-size:13px;font-family:arial,sans-serif">The admins are forced to update the db and mark the migration as finished, so that they can either confirm or revert the resize. They are spending</span><span style="font-family:Calibri,sans-serif;font-size:14px"> a lot of time in getting nova db into the desired state.</span></div>
<div style><br></div><div style><u><b>Proposed Solution:</b></u></div></div><div style><ol style><li style><span style="font-size:13px;font-family:arial,sans-serif">Add a new API </span><span style="font-size:13px;font-family:arial,sans-serif">that would set the vm_state, task_state and migrations status such that the migration can be reverted or confirmed.</span> Or w<span style="font-size:13px;font-family:arial,sans-serif">e can also extend an existing API like reset-state to take in a flag like "--error-with-failed-</span><span style="font-size:13px;font-family:arial,sans-serif">migration". </span><span style="font-family:arial,sans-serif;font-size:13px">This does not expose any vulnerabilities of exposing a liberal API that would allow admins to update db field with free-form values. But it's very restrictive in terms of setting the right values to mark the migration as finished.</span></li>
<li>Allow admins to revert or confirm a migration regardless of the instance and migration states.<span style="font-family:arial,sans-serif;font-size:13px"> </span></li></ol></div><div style><span style="font-family:arial,sans-serif;font-size:13px">Let us know your thoughts/suggestions on this.</span></div>
<div style><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div style><span style="font-family:arial,sans-serif;font-size:13px">--</span></div><div style><span style="font-family:arial,sans-serif;font-size:13px">Thanks,</span></div>
<div style><span style="font-family:arial,sans-serif;font-size:13px">Kaushik</span></div></div>