Découvrez ce qu’est un test SMART et quand le faire sur un serveur NAS
Actuellement, les serveurs NAS ont la possibilité d’installer des disques durs pour stocker des informations, mais aussi des disques SSD (soit au format 2.5 » avec interface SATA3 et même au format M.2 avec interface SATA3 ou NVMe). Connaître l’état des disques à tout moment est essentiel, et pas seulement leur température actuelle. L’exécution régulière de tests SMART est essentielle pour détecter les erreurs de disque potentielles avant qu’il ne soit trop tard. Aujourd’hui, dans RedesZone, nous allons parler de la façon d’effectuer des tests SMART sur un serveur, et aussi quand nous devons les faire.
Les disques durs et les disques SSD sont une partie essentielle d’un serveur NAS. Dans le disque dur, nous stockerons les informations, normalement redondantes en utilisant différents niveaux de RAID tels que RAID 1, RAID 5 qui est l’un des plus utilisés, et aussi RAID 6 et même RAID 10. De plus, nous utiliserons également le SSD comme cache SSD pour accélérer la lecture et l’écriture de données extrêmement aléatoires, à la fois du réseau vers le NAS (cache d’écriture), ainsi que du NAS vers l’équipement connecté (cache de lecture), bien sûr, ces SSD seront également configurés avec différents niveaux RAID pour protéger l’intégrité des informations en cas de panne physique d’un ou plusieurs SSD. Cependant, les pools de stockage pourraient également être configurés avec des disques SSD uniquement, dans le but de stocker des informations auxquelles nous avons accès presque en continu ici. Par exemple, si vous utilisez des machines virtuelles sur votre serveur NAS,
Au fil du temps, les disques durs mécaniques et les SSD sont sujets aux pannes, si nous ne sommes pas attentifs, nous pouvons avoir peur et perdre un ou plusieurs disques en peu de temps. Pour cette raison, il existe des tests SMART qui nous permettront d’obtenir des informations très précieuses sur l’état des disques, et nous pourrons les remplacer avant qu’ils ne tombent en panne.
Ce n’est pas exclusif aux serveurs NAS, un PC ou un ordinateur portable peut également en profiter. Tout équipement qui intègre un disque dur ou un SSD, nous pouvons effectuer un test SMART pour vérifier la santé du disque, s’il y a un secteur endommagé dans lequel nous ne pouvons pas écrire, ou s’il y a un autre type de problème, afin de anticiper une défaillance matérielle du disque lui-même.
Qu’est-ce que SMART et pourquoi est-ce si important ?
La technologie SMART signifie Self Monitoring Analysis and Reporting Technology ou traduit par « Self-Monitoring Analysis and Reporting Technology ». Le but de la technologie SMART est de vérifier les disques durs et les SSD pour détecter à l’avance d’éventuelles défaillances de ceux-ci, afin d’anticiper une éventuelle défaillance matérielle, et de remplacer le disque avant d’avoir une perte de données irrécupérable.
Une détection précoce des pannes de disque peut permettre à l’utilisateur de faire une copie de sauvegarde de son contenu, ou de remplacer le disque par un autre si nous avons un serveur NAS avec un niveau RAID qui le permet sans perdre de données. De cette façon, nous évitons une perte de données irrécupérable. Il faut rappeler qu’un RAID n’est pas une sauvegarde, il faut faire des copies de sauvegarde suivant le système 3-2-1, faire 3 sauvegardes, sur 2 supports différents, et que 1 copie est hors ligne.
Si nous voulons utiliser cette technologie SMART, deux conditions doivent être remplies :
- Que le BIOS / UEFI de l’ordinateur est activé cette option.
- Que le système d’exploitation prend en charge cette fonctionnalité (actuellement tous les systèmes d’exploitation le prennent en charge).
- Le disque dur ou le SSD lui-même est compatible avec celui-ci.
Actuellement, cette option est activée par défaut sur les ordinateurs et, en règle générale, les disques durs la prennent également en charge. Parmi les paramètres les plus importants qu’il contrôle, nous avons :
- Température du disque.
- Vitesse de lecture des données.
- Compteur de secteurs réaffectés : ce sont ceux qui ont échoué, et selon le nombre, cela peut être un symptôme que l’unité peut planter à tout moment.
- Utilisation du code de correction d’erreurs (ECC) et comptage d’erreurs.
Quant aux valeurs des attributs SMART, elles vont du nombre 1 à 253, dans lequel 1 serait la pire valeur. En ce sens, les valeurs normales sont comprises entre 100 et 200. Par conséquent, en effectuant des tests SMART sur nos disques durs et SSD, nous pouvons obtenir de nombreuses informations sur leur santé.
Comment afficher l’état de santé d’un disque sous Windows
Avant de nous plonger dans la façon de voir l’état SMART sur un serveur NAS QNAP, nous allons vous apprendre à voir la santé des disques avec le système d’exploitation Windows, vous pouvez également le vérifier si vous utilisez un serveur Windows. Il nous fournit des informations importantes et grâce à lui nous pouvons prendre les mesures appropriées :
- Ne rien faire si l’état est bon.
- Faites une sauvegarde et remplacez le disque dur si l’état est mauvais.
Pour effectuer cette tâche, nous avons besoin d’un logiciel qui nous montre les informations sur l’état de nos disques. Dans ce cas, nous allons commencer à utiliser Crystal Disk Info que vous pouvez télécharger ici . Nous avons opté pour l’édition ZIP standard qui ne nécessite pas d’installation. Si nous avons un disque dur en bon état, il nous affichera ces informations :
Cela signifie que ce disque dur particulier fonctionne bien et ne nécessite aucune attention particulière. L’état de santé est bon et est en bleu. Cependant, lorsque ces résultats apparaissent, les problèmes commencent :
Lorsque l’état est «à risque», nous devrions commencer à nous inquiéter, il est temps de commencer à penser à faire une copie de sauvegarde de toutes les données et de procéder au changement de disque dur. Lorsqu’il est en rouge, la situation est généralement critique et vous ne pourrez peut-être pas éviter la perte de données.
Comment effectuer un test SMART sur mon serveur NAS
Dans notre laboratoire de test, nous avons un serveur NAS QNAP TS-1277, qui dispose d’un total de 8 baies de disque 3,5 «, 4 baies de disque ou SSD 2,5» et deux emplacements M.2 SATA3. Pour voir l’état des disques, nous devons aller dans » Stockage et snapshots «, et sur le côté gauche nous irons dans » Stockage / Disques / VJBOD «. Une fois ici, nous sélectionnerons le disque et cliquerons sur « État du disque », ce qui suit apparaîtra :
Dans « État du disque », nous pouvons voir le modèle de disque dur ou SSD, la capacité, la température, le temps de mise sous tension et d’autres informations. Les informations importantes se trouvent dans la section «Informations SMART», où nous pouvons voir chacun des paramètres que cette fonction importante est capable de mesurer. QNAP nous permet d’effectuer un test rapide ou un test complet à tout moment, il suffit d’aller dans la section «Test» et de sélectionner l’une des deux options.
La chose la plus intéressante se trouve dans la section «Configuration», et c’est là que nous pouvons configurer l’avertissement de température élevée, et nous pouvons également programmer les tests SMART rapides et complets quand nous le voulons. C’est indispensable pour réaliser un test SMART de manière proactive, pour anticiper d’éventuelles pannes d’un disque dur ou SSD.
Dans le cas des SSD, nous aurons également des informations SMART, en plus, nous pouvons voir une estimation de la durée de vie du SSD, et bien sûr nous pouvons voir la température, les paramètres SMART avancés, effectuer un test rapide et complet à la demande , et même programmer des tests SMART pour qu’ils s’exécutent automatiquement.
Dans la section «Paramètres globaux», nous pouvons avoir d’autres options très intéressantes liées à SMART. La première est que nous pouvons activer une migration prédictive SMART pour migrer toutes les données avant que l’un des disques ne tombe en panne, et nous pouvons avoir une perte de données, cela peut être fait sur les disques durs et les SSD. Grâce à cette fonctionnalité, le système d’exploitation anticipera automatiquement une éventuelle panne de disque avant qu’elle ne se produise.
Une autre option est le temps d’interrogation SMART, pour interroger le disque de temps en temps pour les erreurs SMART. Un point important est qu’une vérification trop fréquente pourrait dégrader légèrement les performances des disques, il serait donc conseillé de le faire toutes les heures car c’est le maximum autorisé par QNAP.
Si nous utilisons un système d’exploitation comme XigmaNAS qui est spécifiquement orienté vers les serveurs NAS, nous aurons également beaucoup d’informations SMART pour visualiser et prendre une décision. Si nous cliquons sur « Diagnostics / Information / SMART » nous pouvons voir l’état actuel de SMART de tous les disques que nous avons, en plus, avec chaque attribut il marquera une certaine valeur, et aussi une description de ce que chacun de ces attributs moyens.
En bas, nous pouvons voir l’enregistrement des différents tests SMART effectués, à la fois courts (rapides) et étendus (complets), dans la capture d’écran suivante, vous pouvez voir comment il y a une erreur de lecture, le bloc logique affecté (LBA) et aussi la durée de vie du disque dur.
Si nous regardons l’état d’un autre des disques, nous pouvons voir comment ce même test s’est terminé sans erreur, que le temps d’utilisation est nettement inférieur, et que nous n’avons pas d’erreurs LBA. C’est-à-dire que le disque précédent est un peu «touché» et il conviendrait de le remplacer au plus vite, cependant, ce disque sans erreurs convient parfaitement.
Bien entendu, le SMART du système d’exploitation XigmaNAS peut également être configuré pour effectuer ces tests à la demande ou programmés quand on veut.
À quelle fréquence devriez-vous passer un test SMART
Il est très important de programmer le système d’exploitation du serveur NAS pour effectuer périodiquement des tests SMART rapides, ainsi que de programmer des tests SMART complets sur les différents disques que nous avons sur le serveur. Lors de l’exécution de tests SMART sur un NAS, nous devons prendre une série de considérations :
- Il est conseillé de ne pas faire de copies de sauvegarde pour le moment.
- Essayez de laisser le serveur avec peu ou pas de charge de travail.
Un test SMART rapide peut prendre moins de 2 minutes pour effectuer, pendant ce temps, les performances de lecture et d’écriture des disques où nous le faisons peuvent être affectées. Dans le cas de tests SMART complets, ils peuvent prendre des heures à effectuer, par conséquent, il est conseillé d’effectuer cette tâche à l’aube où il n’y aura normalement pas trop d’activité, mais rappelez-vous de ne pas effectuer de sauvegardes à ce moment précis car les performances seront être inférieur.
En fonction de l’utilisation du serveur NAS, et s’il est toujours allumé ou non, il sera conseillé de programmer les tests SMART plus espacés dans le temps ou plus régulièrement. Par exemple, un test SMART rapide une fois par semaine pourrait être un bon début, car nous détecterons les principales pannes pouvant se trouver dans le disque. Un test SMART complet doit être effectué une fois par mois, idéalement tôt le matin ou le week-end lorsque personne ne travaille avec le NAS. Puisque nous pouvons le programmer pour qu’il s’exécute automatiquement, nous n’aurons pas à être présents pendant son exécution, mais nous devrons être attentifs lorsqu’il sera terminé en cas d’erreur.