Bonjour,
J'aimerais vous faire un retour d'expérience sur la création d'une
architecture cloud pour un site LAMP à fort pic de trafic en
périodes de fêtes.
L'architecture est grandement améliorable, c'est un POC. Toutes
les remarques seront le bienvenu.
J'ai réalisé ce travail sur AWS, mais d'ici peu de temps je pense
pouvoir également le faire sur OpenStack. Aujourd'hui il manque
principalement les services Load-balancers et base de donnée as a
service (Trove).
Lors de l'intégration d'un client web sur Amazon Web Service, j'ai
imaginé une architecture "Environment as a Service", où la
création d'un environnement complet (préprod / test / dev) se
déploie aussi rapidement qu'une ressource.
Je suis parti des paramètres suivants (vous pouvez remplacer AWS
par CloudWatt / Numergy ou autre ;) :
- AWS fournit des ressources facturées à l'heure,
- AWS fournit une API pour faire des snapshots de serveurs et de
bases de donnée,
- AWS fournit un outil de déploiement automatisé nommé AWS
CloudFormation,
- Le maintient des environnements de test ou validation coûte
cher, ne valide pas grand chose puisqu'il y a souvent des
différences de versions applicatives et/ou d'architecture,
- Nous utilisons ces environnements souvent sur des périodes
définies, le reste du temps les serveurs tournent inutilement.
D'où une certaine prise de conscience (peut-être que cela n'est
applicable qu'au web) :
Nous n'avons besoin que d'un seul environnement persistant : la
production. Lors de certaines périodes définies (parfois
régulières) nous avons besoin de copies de l'architecture de
production, avec l'applicatif et les données dans une version
définie (celle de la prod, celle de dev, ou autre).
Techniquement, c'est réalisable. Avec tous les outils cloud dont
nous disposons aujourd'hui, notamment AWS CloudFormation(1) ou
OpenStack Heat(2), nous pouvons dupliquer une architecture
complète assez facilement.
La copie d'un environnement de production apporte tout de même son
lot de problèmes :
- Les logs : ils ne doivent pas disparaître lorsqu'un
environnement (ou stack) est supprimé,
- Les datas : la production a sûrement fait évoluer ses datas
depuis le dernier backup, il n'est pas possible de se baser
uniquement sur le backup de la veille pour créer un nouvel
environnement iso-prod.
- La configuration : elle est différente sur une pré-prod. Le
endpoint de la base de donnée change obligatoirement par exemple,
- Les backups : si je veux sauvegarder mon environnement avant de
le supprimer, il me faut un endroit pour stocker des archives,
tous les serveurs de l'environnement étant supprimés.
- Les tâches planifiées : si je copie la prod je vais copier des
crons éventuels...
- La sécurité : les données de production, dont les informations
privées, se retrouvent accessibles.
Je n'ai eu d'autre choix que de créer un serveur externe aux
environnements, appelé « orchestrateur » (voir schéma en pièce
jointe) regroupant plusieurs rôles :
- Les logs : il fait office de rsyslog centralisé,
- Les datas : au lancement de la stack, les fronts apache
téléchargent le dernier backup, puis font un rsync dans un dossier
spécial de l'orchestrateur contenant la dernière version de
l'application. C'est aussi ce process utilisé pour l'auto-scaling.
Faire un rsync sans charger le dernier backup est beaucoup trop
long pour ce client (plein de petits fichiers). NFS (ou
équivalent) est proscrit, ce serveur n'est volontairement pas
redondé et constituerait un spof,
- La configuration : à terme l'orchestrateur sera un master
puppet/chef. Pour le moment c'est des sed horribles qui
reconfigurent les endpoints, users et pass,
- Les backups : un script de backup cible l'environnement et
sauvegarde sur un bucket S3,
- Les tâches planifiées : Les environnements ne lancent pas de
tâche, seul l'orchestrateur fait office de job scheduler. Il n'y a
donc pas de copie de tâches planifiées,
- La sécurité : ce n'est pas encore traité, mais l'anonymisation
des données est réalisable.
Avec cette architecture, en lançant un simple template dans AWS
CloudFormation, un nouvel environnement se crée en provisionnant
des fronts depuis une AMI standard et un backup de l'application.
La base de donnée est crée depuis le dernier snapshot de la base
de production. Tout le reste, supervision, load-balancer, DNS,
auto-scaling, est crée à la volée via AWS CloudFormation.
Copier sa production à la demande, c'est faisable. La
cerise sur le gâteau, c'est qu'en transférant les backups sur une
autre zone (ou un autre fournisseur cloud compatible OpenStack
Heat(2)), le plan de reprise d'activité est inclus.
(1)
http://aws.amazon.com/fr/cloudformation/
(2)
https://wiki.openstack.org/Heat