Technique

Comment réaliser des sauvegardes fiables ?

Malo Paletou
· 9 min de lecture
Envoyer par email

Notre mission chez Datashelter est d'offrir une solution simple et accessible pour sauvegarder vos serveurs Linux en quelques clics. Nous avons déjà automatisé la sauvegarde de plusieurs milliers de serveurs pour le compte de nos clients (TPE/PME, startups, infogérants) et avons ainsi identifié des schémas récurrents dans les entreprises ne disposant pas encore de sauvegardes fiables.

Cet article vise donc à vous donner les clés et les meilleures pratiques basées sur notre expérience afin de vous permettre de définir, améliorer ou remplacer vos plans de sauvegarde. Allons-y pour les 6 règles d'or pour des sauvegardes de données fiables et résilientes !

Vos sauvegardes doivent être chiffrées

La première règle est que toutes vos sauvegardes doivent être chiffrées. Certes l'implémentation du chiffrement n'est pas toujours aisée mais vous devez retenir que les données que vous sauvegardez contiennent généralement les données personnelles de vos utilisateurs (bonjour RGPD !), ou des données stratégiques/business que vous ne souhaitez en aucun cas voir partir dans la nature. Vos sauvegardes sont aussi vos données, elles doivent donc être chiffrées de bout-en-bout.

Dans un monde idéal, ce chiffrement s'effectue à deux niveaux: lors du transit d'une part, et lors de leur stockage « au repos » d'autre part.

Transit des données

Le chiffrement des données en transit est le plus simple à mettre en œuvre. En effet, il suffit de faire transiter vos données à l'aide d'un protocole supportant le chiffrement TLS ou AES. C'est le cas notamment de HTTPS, FTPS, SSH ou bien votre tunnel VPN IPsec ou OpenVPN.

De cette manière, les données de sauvegarde ne transitent jamais en clair sur votre réseau (qu'il soit public ou privé).

Stockage des sauvegardes

Le chiffrement de vos sauvegardes au repos se fait par des algorithmes de chiffrement symétriques tels que AES-256. Une clé de chiffrement est utilisée pour garantir l'inaccessibilité de vos sauvegardes à tout individu n'ayant pas connaissance de la clé.

Dans l'idéal, ce chiffrement doit avoir lieu directement sur le serveur en charge de réaliser vos sauvegardes, ceci afin de garantir un chiffrement de bout-en-bout.

La clé de chiffrement, maître de la confidentialité de vos données, doit être stockée dans un coffre-fort de mot de passe ou dans un Key Management System (KMS) comme proposé par de nombreux fournisseurs cloud.

Protection contre les ransomware

Nous ne pouvions pas faire un article lié à la sauvegarde de données sans aborder le sujet des ransomwares. Bien que la protection apportée par la sauvegarde de données couvre un champ d'action plus large que la "simple" protection contre les ransomware, ce type d'attaque est celle qui terrorise le plus les chefs d'entreprise.

De manière générale, vous retrouvez les trois fonctionnalités suivantes lorsque vous vous documentez sur les moyens de protection contre ces attaques: versionning, immuabilité et air-gapped.

Versionning

D'abord le versionning. Cela fait référence au fait de gérer différentes version d'un même fichier. Typiquement, supposons un fichier "fichiera.txt" sur mon support de stockage. Que va-t-il se passer si nous écrivons un nouveau fichier portant le même nom ?

Sur un système qui ne supporte pas le versionning, cela va écraser le fichier précédent. Tandis que sur un système supportant le versionning, cela va créer une nouvelle version du fichier (qui sera lu par défaut quand je lirai fichiera.txt) mais garder la version précédente du fichier sur le disque. Vous pourrez donc récupérer une version antérieure à l'aide de son numéro de version. Cela peut s'avérer utile pour répondre aux attaques du type ransomware

Cette fonctionnalité est donc essentielle pour la sauvegarde de données. La majorité des logiciels de sauvegarde l'implémentent nativement ou l'utilisent indirectement lorsque vous y connectez votre stockage objet par exemple.

Immuabilité

La notion d'immuabilité d'une donnée permet d'aller encore plus loin mais reste intrinsèquement liée au versionning. En effet il existe deux manières d'altérer une donnée: la supprimer ou la réécrire.

Dans le cas de la réécriture d'un fichier, on conserve la version précédente comme expliqué dans la section Versionning. Et pour la suppression d'un fichier, on peut simplement bloquer cette possibilité à l'utilisateur.

Ainsi, le caractère immuable repose généralement sur des fonctionnalités de versionning, à laquelle on retire la possibilité de supprimer les versions d'un objet. Sur les systèmes de stockage objet (type s3), il existe des fonctionnalités d'object locking permettant de répondre facilement à cette problématique.

Il faut garder en tête que l'immuabilité pure est à double tranchant: étant donné que vous ne pouvez pas supprimer ou réécrire une donnée, le volume de stockage nécessaire à vos sauvegardes ne pourra qu'augmenter.

Air-gapped

Une copie de données est dite "air-gapped" lorsqu'elle repose sur un support de stockage déconnecté du réseau. L'objectif est d'immuniser cette copie de données contre une majorité d'attaques en la déconnectant complètement du système d'information.

Le principal inconvénient de cette méthode est qu'elle impose la déconnexion du support de stockage après chaque sauvegarde, ce qui peut s'avérer être une procédure lourde et complexe pour de nombreuses organisations.

Chez Datashelter, nous avons fait le choix d'une segmentation logicielle. C'est-à-dire que nous avons implémenté une architecture logicielle rendant l'altération des sauvegardes impossible. Et ce, même lorsque les identifiants utilisés pour la sauvegarde se font voler.

D'un point de vue plus global, Datashelter a été construit en mettant l'accent sur la sécurité. C'est pourquoi je vous recommande vivement la lecture de notre article dédié à la protection de vos sauvegardes pour en savoir plus.

Une sauvegarde n'est pas qu'une simple copie de vos données

Nous arrivons maintenant sur un aspect majeur de la sauvegarde de données: il ne s'agit en aucun cas d'une simple copie de vos données. Pour être plus précis, il faut comprendre la différence entre sauvegarde et synchronisation de données.

Vous ne pouvez pas considérer la synchronisation de vos données vers un NAS ou un autre support de stockage comme une sauvegarde. Prenons l'exemple d'une attaque par ransomware. Le ransomware va chiffrer vos données aussi rapidement que possible afin de les garder en otage et vous demander de payer une rançon ensuite.

Le schéma le plus courant que l'on retrouve chez les TPE s'étant protégées en achetant un NAS est de synchroniser chaque nuit leurs données de production vers ce dernier. Dès ce moment là, leurs sauvegardes s'exposent à deux risques critiques:

  1. leur organisation n'est pas protégée contre une attaque par ransomware
  2. ils n'ont souvent pas conscience de cette vulnérabilité

En effet, cette configuration ne vous laisse que quelques heures pour réagir entre le début de l'attaque et le lancement de la synchronisation suivante. Au delà, vos données saines se retrouveront écrasées par les données chiffrées, ne vous laissant pas d'autre choix que de payer la rançon pour récupérer vos données et sauver votre entreprise.

A l'inverse de la synchronisation, une sauvegarde est indépendante de l'état des données stockées sur la source. Si la source est corrompue, cela n'impacte pas les sauvegardes antérieures. Il vous suffit donc de restaurer votre dernière sauvegarde pour repartir sur des données saines !

Vous ne pouvez pas accepter que votre production ainsi que vos sauvegardes soient simultanément touchées en cas d’attaque

Ayez au moins une sauvegarde externalisée

Vous avez peut-être déjà entendu parler de la règle 3-2-1 qui préconise d'avoir :

  • Au moins 3 copies de vos données,
  • Sur 2 stockage différents (disques dur, bandes),
  • Avec 1 copie hors-site

Il s'agit en théorie de la politique idéale en matière de gestion de vos sauvegardes. Cependant sa mise en place n'est pas toujours aisée, tant du point de vue technique qu'économique, notamment pour les petites structures n'ayant pas les moyens d'investir dans du matériel coûteux.

Il est trop courant que ce constat paralyse votre processus de décision, vous incitant à repousser le sujet de la sauvegarde de données à plus tard. C'est exactement pourquoi nous pensons que vous devez faire preuve de pragmatisme lors de l'établissement de votre plan de sauvegarde, en le dimensionnant selon vos besoins et votre budget.

Comme beaucoup de sujets, la loi de Pareto s'applique. Plus de 80% des résultats (si ce n'est plus) sont rendus par 20% des efforts (si ce n'est moins). Ainsi une solution de sauvegarde externalisée comme Datashelter vous permettra en moins de 5 minutes d'avoir:

  • Au moins 2 copies de vos données
  • Sur 2 stockage différents
  • Avec 1 copie hors-site

Cette stratégie simple à mettre en œuvre vous permet de couvrir l'immense majorité du risque de perte de données, tout en vous demandant peu d'effort et un investissement limité (notre offre commence à 9€/mois pour 1 To de données).
Vous aurez ensuite la possibilité de compléter cette stratégie par une troisième copie que vous conserverez sur votre réseau local afin de restaurer plus rapidement qu'en vous basant sur la sauvegarde externalisée.

Testez régulièrement vos sauvegardes

La cinquième règle d'or vous évitera de vous retrouver au pied du mur lorsqu'un incident majeur touchera votre organisation.

Imaginez que vous soyez la cible d'une attaque rendant vos données de production inexploitables et vous imposant de récupérer ces données depuis votre dernière sauvegarde. Que se passerait-il si vous vous rendiez compte que le processus de sauvegarde était bloqué depuis 6 mois suite à une erreur ?

Notifications par email

Il existe des moyens de prévenir ce genre de situations comme la notification par email. C'est-à-dire recevoir un email lorsqu'une sauvegarde ne se passe pas comme prévu. Malgré tout, la complexité se présente lorsque vous cherchez à vous assurer de recevoir une notification en cas d'incident. En effet, si votre logiciel de sauvegarde a la responsabilité d'envoyer cette notification, comment pouvez-vous être sûr qu'un bug ne va pas aussi les impacter ?

La solution à ce problème du serpent qui se mord la queue est de transférer la responsabilité de la notification à un système externe. C'est notamment de cette manière que Datashelter notifie ses clients d'un incident de sauvegarde. Le logiciel de sauvegarde (snaper) s'occupe exclusivement de réaliser les sauvegardes, tandis que le système de notification va simplement constater les sauvegardes produites et envoyer une notification lorsque certaines conditions sont respectées: sauvegarde absente, changement importants entre deux sauvegardes, etc...

Pourquoi vérifier régulièrement vos sauvegardes ?

Ceci étant dit, la notification par email est un filet de sécurité mais ne remplace pas le besoin de tester vos sauvegardes régulièrement (tous les trimestres ou semestres). Intégrer le test de vos sauvegardes dans vos routines vous permet d'éviter bon nombre de situations douloureuses telles que:

  • suite à une mise à jour système, mes sauvegardes ne se faisaient plus et je n'ai reçu aucune alerte. Ma dernière sauvegarde valide date d’il y a 6 mois… (erreur lors de la sauvegarde)
  • je sauvegardais quotidiennement un dataset de dizaines de millions de fichiers, mais le logiciel de sauvegarde m'affiche que cela va prendre 3 mois pour restaurer autant de fichiers (non-parallélisation du processus de restauration)
  • je sauvegardais le répertoire /var/lib/mysql mais une fois restauré, ma base de données refuse de démarrer et m'indique que certain indexes sont corrompus (sauvegarde de données non structurées)

Nous savons que tester régulièrement vos sauvegardes peut s'avérer être une opération lourde sur laquelle nous avons tendance à procrastiner. Pour y palier, vous pouvez vous simplifier la tâche et vous libérer de la charge mentale en rédigeant une check-list. C'est-à-dire effectuer un test de restauration une première fois, en prenant le soin de noter chacune des étapes (et remarques éventuelles) dans une note que vous pourrez reprendre pour les restaurations futures.

Rédiger une procédure vous permettra de gagner en fiabilité lors de vos tests de restauration de sauvegarde. En effet, cette procédure va vous permettre de suivre consciencieusement les étapes une à une, vous permettant d'être plus efficace et en étant sûr de ne rien oublier.

Établir un Plan de Reprise d'Activité

C'est ainsi que nous en venons au sujet du Plan de Reprise d'Activité (PRA). Il peut prendre la forme d'un simple document Word qui détaille les différentes étapes, points d'attention et implications de chacun des intervenants (si vous n'êtes pas seul en charge du SI).

Ce document vous sert de référence pour répondre à un incident, comme le ferait un pilote d'avion de ligne. Balayer chacun des points individuellement vous permet d'être sûr de ne rien oublier tout en minimisant les sollicitations de votre capacité de raisonnement, qui peut être limitée lorsque la tension est à son paroxysme.

Plutôt qu'un document ajoutant de la lourdeur administrative à votre entreprise, le PRA permet de structurer et vous offre une vraie sérénité quant à la réponse aux crises IT auxquelles vous serez confronté.

Plan raisonnable économiquement et humainement

Notre dernière règle d'or fait une nouvelle fois appel au pragmatisme. Le plus gros freins à l'adoption d'un processus de sauvegarde fiable et résilient se trouve soit dans son coût de mise en œuvre, soit dans sa faisabilité technique.

Plus précisément, nous pensons que les zones de flou pouvant exister sur ces deux aspects expliquent que 80% des structures avouent ne pas disposer de sauvegardes fiables. Passer à l'action nécessite d'avoir un plan clair et précis. Vous devez donc avoir un vision claire du coût de votre solution de sauvegarde ainsi que de son processus d'installation.

C'est de ce constat simple qu'est né Datashelter. Notre vision est que le monde de la sauvegarde doit évoluer, pour proposer des solutions compréhensibles et transparentes à leurs clients afin d'adresser le besoin des petites et moyennes structures.

Pour cela, nous avons construit une solution complète (du logiciel au stockage des sauvegardes) vous permettant de bénéficier de notre expertise en terme de sauvegarde de données en quelques clics. Toutes nos fonctionnalités et conseils sont inclus dans une offre unique facturée sur la quantité de stockage et le nombre de serveurs à sauvegarder.

La sauvegarde de données est votre premier rempart contre les cyber-attaques. Quelles qu'en soient leur nature, seules des sauvegardes fiables et résilientes vous permettront de vous redresser si le pire scénario se produisait.