Hyper-V Replica est une des grosses nouveautés disponible dans Hyper-V édition Windows Server 2012. Cette fonctionnalité est destinée à vous aider dans la mise en oeuvre d'un plan de reprise d'activité grâce à la réplication de machines virtuelles sur un environnement de secours. Au programme : une exploration dans le détail d'Hyper-V Replica, le tout avec un maximum de démonstrations et de bonne humeur !!
Hyper-V Replica : Plan de Reprise d'Activité avec Windows Server 2012
1. Donnez votre avis !
Depuis votre smartphone, sur :
http://notes.mstechdays.fr
De nombreux lots à gagner toutes les heures !!!
Claviers, souris et jeux Microsoft…
Merci de nous aider à améliorer les TechDays
http://notes.mstechdays.fr
2. Hyper-V Replica
Plan de Reprise d'Activité
avec Windows Server 2012
(SER301)
Fabrice Meillon | Architecte Datacenter
Stanislas Quastana | Architecte Infrastructure
http://aka.ms/fabricem | http://aka.ms/stanislas
Microsoft France
Entreprise / IT / Serveurs / Réseaux / Sécurité
3. • Introduction à Hyper-V Replica
• Configuration d’Hyper-V Replica
• Bascule et tests de PRA
• Architecture
• Réplication & Resynchronisation
• Dimensionnement / Bonnes pratiques
• Synthèse
Agenda
6. • RPO (Recovery Point Objective)
– Durée maximum d'enregistrement des données qu'il est
acceptable de perdre (=Perte de données maximum
admissible) lors d'une interruption majeure de service.
– Quantifier le RPO = définir les objectifs de sauvegarde
(implique de connaître la volumétrie et les fenêtres de
sauvegarde)
Un peu de vocabulaire (1/2)
7. • RTO (Recovery Time Objective)
– Durée maximale d’interruption acceptable pendant lequel
une ressource informatique (serveur, réseau, application)
peut ne pas être opérationnelle suite à une interruption
majeure de service.
– Objectif défini à l’avance en fonction des besoins de
l’entreprise
– Plus la ressource est critique plus le RTO est faible
• RTO très très faible = (Géo)Cluster = €€
Un peu de vocabulaire (2/2)
9. RPO versus RTO
Temps
Très inspiré du schéma de Wikipedia : http://fr.wikipedia.org/wiki/Fichier:RTO_RPO.gif
Sauvegarde
ou copie
RPO
RTO
Incident
Service
dégradé
Service opérationnelService opérationnel
10. • Copie des fichiers (configuration, virtual
disks..)
• Sauvegardes
• Réplication synchrone -> Geocluster
• Réplication asynchrone -> Hyper-V Replica
Machines virtuelles et PRA – quelles options ?
12. • Réplication asynchrone en continu
– Recovery Point Objective (RPO) : 5 minutes
• Le réplica d’une machine virtuelle est en attente
(Warm Standby Mode) sur le serveur de Replica
– Recovery Time Objective (RTO) : 10 à 30 minutes
• Possibilité d’avoir plusieurs clichés instantanés
– Restauration applicative cohérente (grâce à VSS)
• Resynchronisation de la VM primaire avec le réplica
Capacité de réplication d’Hyper-V Replica
13. Scénarios de déploiement et d’utilisation
d’Hyper-V Replica
• Réplication entre 2 centres de données
• Réplication entre une TPE/PME et un
hébergeur
17. 1. Configuration du serveur Hyper-V Replica ou
du cluster Hyper-V Replica
2. Configuration du pare-feu
3. Configuration de la réplication d’une
machine virtuelle
Etapes de configuration
19. Règles de pare-feu
Message affiché lors de l’activation d’un serveur en
temps que serveur Hyper-V Replica
Par défaut les 2 règles de
pare-feu associées à Hyper-
V Replica sont désactivées
21. • Rôle Replica Broker
– Permet de répliquer les VM clusterisées
– Suit le déplacement des réplicas au sein du cluster
– Redirige le trafic vers le nœud hébergeant le réplica
• Configuration de Hyper-V Replica Broker
– Se fait depuis la console “Failover Cluster Manager”
– Ne peut pas se faire depuis le gestionnaire Hyper-V ou Virtual
Machine Manager 2012 SP1
– S’applique à tous les hôtes Hyper-V au sein d’un cluster
Hyper-V Replica Broker (Cluster)
26. Scénarios de Reprise d’Activité avec Hyper-V
Replica
• Tester un Plan de Reprise d’Activité
• Mettre un site en maintenance
• Anticiper un désastre imminent
• Gérer un désastre soudain
Bascule (Failover) planifiée
Aucune donnée perdue
Mais indisponibilité du service
Réplication inverse efficace
1- Arrêter la VM primaire
2- Envoyer le dernier log
3- Basculer sur la VM Replica
4- Réplication inverse
27. Initialisé depuis le serveur de Réplica
1- Sélectionner le cliché approprié
2- Une nouvelle VM est créée, basée sur le replica
3- Création d’un nouveau fichier VHD
4- Ce VHD est un enfant du cliché sélectionné
5- La VM et le VHD sont supprimés une fois le test terminé
Utilisation :
Pour faire des tests basiques (validation de la réplication)
Pour former le personnel et/ou tester le plan de reprise
Test Failover
28. • Pas d’indisponibilité – test non disruptif
– Création d’une nouvelle VM
• Test possible sur n’importe quel point de
récupération
• Réseau isolé préconfiguré
Test Failover – à retenir
29. Bascule planifiée
1. Démarrer la bascule depuis le primaire
2. Eteindre le primaire
3. Envoyer le dernier Delta
4. Basculer vers Replica
5. Inverser la réplication
Utilisation :
Tester le basculement avant un sinistre ou lors d’une opération de maintenance
Pas de perte de données mais une indisponibilité de la VM
Bascule du sens de réplication automatique
30. Bascule non planifiée
Utilisation :
Le site primaire est indisponible (attaque virale, panne de courant, désastre
naturel)
Assurer la continuité métier en cas de pannes matériels
1. Démarrer une bascule depuis le Replica Serveur
2. Sélectionner le Snapshot & Failover cible
3. Vérifier le bon fonctionnement de la VM
4. Réaliser les opérations de reconfiguration
34. • Résilience aux pannes
– Reprise automatique
– Resynchronisation
• Gestion native du déplacement des machines
virtuelles
– Aucune intervention de l’administrateur requise
– Live Migration, Storage Migration et Quick Migration
– Au sein d’un cluster ou entre cluster
Résilience de la réplication
35. Replication State donne l’état en cours de la réplication
• Pending Initial Replication
• Replication Enabled
• Prepared for planned failover
• Failover Complete
• Replication Paused
• Replication Error
• Resynchronization required
• Resynchronizing
• Resynchronize Suspended
Etat de réplication (Replication State)
36. • Replication Health donne un état global de
santé de la réplication dans le temps
Santé de la réplication (Replication Health)
37. Normal
<= 20% des cycles de réplication manqués
Dernière synchronisation il y a moins d’une heure
Latence moyenne de réplication < 5minutes
Warning
> 20 % des cycles de réplication manqués
Plus d’une heure écoulée depuis le dernier réplica envoyé ou reçu
Si la réplication initiale ne s’est pas terminée
Si le Failover a été initié mais pas la réplication inverse
Si la réplication de la VM primaire est en pause
Critical
> 50 % des cycles de réplication manqués
Si la réplication est en pause dans les deux directions
Replication Health
40. Replica Health - Critique
Reprendre la réplication
(Resume Replication)
1. Sur le serveur Replica
2. Sur le serveur Primaire
41. Replication Health – cycles de réplication
1 heure= 12 cycles de réplication
12 heures = 144 cycles de réplication
Cycles de
réplication
Succès Echecs % Succès Replication
Health
12 10 2 80 Normal
144 116 28 80 Normal
288 231 57 80 Normal
2016 1613 403 80 Normal
24 heures = 288 cycles de réplication
1 semaine = 2016 cycles de réplication
44. • Utilisée quand le processus normal de réplication est
interrompu
– Problème sur les change tracking sur le serveur primaire
– Problème sur la réplication lié aux journaux de tracking
– Problèmes de liaison avec les fichiers VHD
– Voyage dans le temps sur le primaire ou serveur de réplica (restauré
depuis une sauvegarde par exemple)
– Réplication inverse après un processus de Failover
– Resynchronisation en ligne si la VM existe déjà sur le primaire
• Nécessite plus de 6 heures de réplication initiale
• Checksum entre la primaire et son réplica
Hyper-V Replica Resynchronisation
50. • Question : « Quelle bande passante pour
Hyper-V Replica ? »
• Réponse : « ça dépend de vos besoins »
Pas de réponse miracle, il faudra dimensionner
avant de répliquer sur votre WAN.
Dimensionner « les tuyaux »
51. 1. Installer un serveur Hyper-V Replica sur le LAN
2. Configurer les réplicas des machines critiques
du Plan de Reprise d’Activité
3. Relever les compteurs (volume de données
répliqué) 1 fois par jour pendant 1 à 2 semaines
4. Diviser le volume répliqué par la durée de la
période de mesure
Comment calculer ses besoins ?
53. • Impacts sur le serveur primaire
– Espace de stockage : Proportionnel aux écritures dans la VM
– Stockage IOPS environ 1.5 fois écriture IOPS
• Impacts sur le serveur Hyper-V Replica
– Espace de stockage: proportionnel aux écritures
• Chaque point de récupération~10% de la taille du VHD
– Stockage IOPS: 0.6 fois IOPS écriture pour recevoir et convertir
• 3-5 fois IOPS écriture pour recevoir, appliquer, fusionner pour
chaque point de récupération additionnel
• Mémoire ~50Mo par VHD en réplication
• CPU <3%
Impacts sur le serveur
54. • Mettre le fichier de pagination sur un disque VHD séparé et l’exclure de la
réplication
• Si la machine fonctionne sous Windows Server 2012, alors configurer les
fonctionnalités à la demande
• Avant de configurer et déclencher la réplication initiale, utiliser la fonction
de déplacement de stockage pour avoir une arborescence « plus
propre »
• Vérifier régulièrement l’état de la réplication
• Tester le failover
• En cas d’utilisation de l’authentification par certificat, s’assurer de la
disponibilité et mise à jour des listes de révocation de certificats (CRL)
• Utiliser de la QoS pour maitriser l’usage de la bande passante WAN
Quelques bonnes pratiques
55.
56. • Exemple de QoS basée sur le sous-réseau de destination
New-NetQosPolicy “Replication Traffic to
10.0.0.0/8” –DestinationAddress 10.0.0.0/8 –
MinBandwidthWeightAction 40
• Exemple de QoS basée sur le port TCP de destination
New-NetQosPolicy “Replication Traffic to
8080” –DestinationPort 8080 –
ThrottleRateActionBytesPerSecond 100000
Contrôle de la consommation réseau par QoS
58. Nettoyer la structure des dossiers
1. Planifier la réplication initiale
2. Migration du stockage pour
tous les fichiers de la VM
3. Démarrer la réplication initiale
59. • Feature and performance optimization of Hyper-V
Replica (HVR) in Windows Server 2012
http://support.microsoft.com/kb/2767928
– HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindows
NTCurrentVersionVirtualizationReplication
• DisableCertRevocationCheck
• MaximumActiveTransfers
• ApplyVHDLimit
• ApplyVMLimit
• ApplyChangeReplicaDiskThrottle
Optimisation
61. • Solution pour PRA (actif / actif) pour machines
virtuelles native à Windows Server 2012.
– Pas de coûts additionnels
– Architecture de stockage du(des) serveur(s) de réplica
indépendante de l’architecture source
– Réplication par le réseau en IP
Hyper-V Replica en résumé
62.
63. • Blog de Fabrice
– http://aka.ms/fabricem
• Blog de Stanislas
– http://aka.ms/stanislas
• Télécharger Windows Server 2012
– http://aka.ms/jeveuxWindows2012
Ressources utiles
64. Formez-vous en ligne
Retrouvez nos évènements
Faites-vous accompagner
gratuitement
Essayer gratuitement nos
solutions IT
Retrouver nos experts
Microsoft
Pros de l’ITDéveloppeurs
www.microsoftvirtualacademy.comhttp://aka.ms/generation-app
http://aka.ms/evenements-
developpeurs
http://aka.ms/itcamps-france
Les accélérateurs
Windows Azure, Windows Phone,
Windows 8
http://aka.ms/telechargements
La Dev’Team sur MSDN
http://aka.ms/devteam
L’IT Team sur TechNet
http://aka.ms/itteam