Comment détecter et résoudre les problèmes de RAM ?

aurelie MAES
16 septembre 2016 à 11h50
0
|clubic||fin|
Publi-edito


Un seul bit vous manque et tout est dépeuplé. L'erreur mémoire est un problème courant et la plupart du temps sans conséquences majeures. Mais dans le cas de traitements lourds et intensif, elle peut s'avérer dangereuse.


Par Denis Montillet - Tech Page One

Votre mémoire n'y échappera probablement pas. Quelques que soit la marque ou le type de module installé sur votre ordinateur, presque toutes les mémoires vives présentent d'infimes défauts. Les fabricants auront beau dépenser 10 % à 15 % du coût de fabrication pour effectuer des tests poussés et essayer de repérer ces erreurs, les barrettes DIMM (Dual Inline Memory Module) seront toujours soumises à un risque de faille dû à la chaleur ou simplement au vieillissement des composants. Environ un tiers des ordinateurs subissent une erreur réparable par an (« DRAM errors in the wild: a large-scale field study »). Pour un usage bureautique standard, cela n'aura généralement pas d'impact sur l'utilisation des applications. Dans le monde du calcul intensif (finance, recherche médicale, ingénierie...) en revanche, où l'intégrité des données est clé, ce simple bit de mémoire défaillant peut mettre à mal tout le système.



Détecter, isoler et signaler

C'est pourquoi certains serveurs et stations de travail intègrent une technologie ECC (Error Correcting Code), qui va détecter et corriger les erreurs en amont. Mais les dernières générations de workstations proposent un niveau de protection supplémentaire avec la Reliable Memory Technology (RTM). Afin de réduire les risques Cette dernière va permettre de mettre en quarantaine les bits de mémoires corrompus afin qu'ils ne soient plus utilisés par le système d'exploitation et d'éviter ainsi les plantages ultérieurs.

Autre avantage, la RMT va enregistrer le nombre d'erreurs constatées sur un même module. Lorsqu'une erreur corrigible survient, le module est alors beaucoup plus susceptible de subir une nouvelle erreur similaire dans le mois suivant. Au septième incident, un rapport est donc automatiquement généré et adressé à l'administrateur du système, qui pourra procéder à un remplacement du composant avant que le problème ne s'aggrave. Une surveillance qui, outre le fait d'améliorer la fiabilité des machines, permet d'alléger le travail des équipes IT qui ne perdent plus à diagnostiquer, tester et réparer une barrette de RAM défectueuse.



Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Les actualités récentes les plus commentées

Coronavirus : Bill Gates va faire construire des usines pour fabriquer les 7 vaccins les plus prometteurs
Comment fonctionne la nouvelle attestation de déplacement sur smartphone ?
PS5 : Sony dévoile la manette DualSense
En pleine pandémie de COVID-19, Trump menace de ne plus financer l'OMS
Disney+ : pas de 4K ni d'Ultra-HD au lancement pour le concurrent de Netflix
Quatre ans après leur sortie, les Samsung Galaxy S7 ne seront plus mis à jour
Blue Origin pousse ses employés à développer une fusée touristique malgré le coronavirus
COVID-19 : Lamborghini aussi se met à produire du matériel médical
Yamaha présente trois amplificateurs rétro et des enceintes pour les audiophiles
Firefox 75 est de sortie et refont la barre de recherche
scroll top