La sauvegarde des données

Voici une courte explication pour aider à la compréhension de la sauvegarde des données. Certaines références telles Wikipédia et autres sont utilisées pour simplifier la création du document.

Définition primaire
La sauvegarde de données (backup en anglais) est l’opération qui consiste à dupliquer et à mettre de côté, idéalement en sécurité, les données contenues dans un système informatique.

Simplement, la sauvegarde est l’enregistrement des données dans un autres système, solution ou support permettant d’enregistrer et retrouver (pourvoir restaurer les données) l’information dans un délai raisonnable pour l’organisation. Sur ce, la sauvegarde enregistre des données, mais pas nécessairement dans un but d’archivage. Ce dernier demande un autre processus ainsi qu’une autre solution en lien éventuellement avec la sauvegarde.

La méthode, l’approche ainsi que la solution doivent être en lien avec les besoins d’affaires que ceux-ci soient reliés à des fins légales, historiques ou même purement statistiques, dans certains cas.

Critères de choix

La sauvegarde doit minimalement tenir compte des points suivants :

• les besoins d’affaires
• les enjeux de l’organisation et du marché dans lequel elle se trouve
• le cadre normatif ainsi que la classification des données et des actifs
• les types de données (transactions, documents, textes, images…)
• la quantité de données
• la capacité de stockage
• la vitesse de sauvegarde
• la fiabilité du support
• la facilité à restaurer les données
• le cout de l’ensemble

Lorsque vous calculerez le cout de votre système de sauvegarde, incluez toujours :

• le cout de la solution (infrastructure, logiciels, maintenance…)
• le cout des supports utilisés
• le cout de la sortie de la sauvegarde sur un autre site (transport physique)

Enfin pour les grands systèmes de sauvegarde, il faut tenir compte des critères physiques tels que le volume physique des supports de stockage, le poids, la sensibilité à la température, à l’humidité, à la poussière, à la lumière (ex.: une cassette au soleil).

Méthodes de sauvegarde

Complète
La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi “full backup”) ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non.

Lors d’une sauvegarde complète, tous les fichiers sont sauvegardés, indépendamment de la version ou des changements effectués avec les données. Cette méthode est aussi la plus fiable, mais elle est longue et très couteuse en termes d’espace disque, ce qui empêche de l’utiliser en pratique pour toutes les sauvegardes à effectuer.

Non complète alors…
Afin de gagner en rapidité et en temps de sauvegarde, il existe d’autres méthodes qui procèdent seulement à la sauvegarde des données modifiées et/ou ajoutées entre deux sauvegardes totales, dont une des plus communes, la sauvegarde incrémentale ou incrémentielle.

La restauration d’un disque avec ces méthodes s’avère plus longue et plus fastidieuse puisqu’en plus de la restauration de la sauvegarde différentielle ou des sauvegardes incrémentielles, on doit également restaurer la dernière sauvegarde complète.

Il est important, mais de savoir que dans une sauvegarde complète de base, les fichiers supprimés entretemps soient également restaurés. Ceci implique une saine gestion de ce type de sauvegarde sachant qu’elle possède bien des données qui ne seront jamais utilisées.

Sauvegarde incrémentale ou incrémentielle
Cette technique permet de sauvegarder les fichiers par comparaison. Seuls les nouveaux fichiers et ceux qui ont été modifiés depuis la dernière sauvegarde seront copiés. L’avantage de cette méthode incrémentale est double : réduction du volume de données sauvegardées et temps de sauvegardes raccourcis).

Cette méthode donc consiste à sauvegarder les fichiers créés ou modifiés depuis la dernière sauvegarde quel que soit son type (complet, différentiel ou incrémentiel).

Techniques complémentaires
La sauvegarde de données peut être réalisée en utilisant des techniques plus ou moins sophistiquées. La méthode la plus simple est de parcourir les répertoires et les fichiers d’un poste de travail ou d’un serveur, mais on se trouve vite limité par le nombre de fichiers et par le volume de données, qui ont un impact direct sur le temps de sauvegarde.

Cette approche possède également l’inconvénient de faire un grand nombre de dédoublements des données ce qui peut représenter un pourcentage important des données conservées. Pour limiter ou contourner les plusieurs limitations, plusieurs approches sont envisageables:

• compression des données sauvegardées
• technique de snapshot (ex.: dans un SAN – prise d’image instantanée d’un disque)
• sauvegarde en mode bloc
• technique de réduplication pour limiter les doublons
• une combinaison de ces différentes techniques

Présentation simpliste et de haut niveau, mais je crois que celle-ci pourra illuminer les plus novices carce sujet peut rapidement devenir très complexe.

Leave a Reply

%d bloggers like this: