Faulty réguliers sur raid 5 mdadm

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : Faulty réguliers sur raid 5 mdadm

bodji

Vous pouvez pas test :O

Bonjour à tous !

Voilà, j'ai monté un petit serveur pour un ami qui voulait avoir pas mal de stockage sur son LAN.
On est parti sur 4 disques Seagate Green 2To 5900t/m en raid 5.

Il y a deux semaines, après avoir fraîchement installé Debian (squeeze), je crée la grappe, formate le md0 en ext3,
et je la partage avec samba. Tout marchait comme sur des roulettes mais en l'espace de quelques jours j'ai eu deux disques (différents)
qui se sont mis en faulty,

Après l'erreur le disque est plus visible par debian. Après un reboot il remonte comme il faut, je le rajoute donc à la grappe, et le raid se resynchronise comme il faut.

Pas d'erreurs SMART sur les deux disques qui se sont mis en caraffe.

Voici un extrait du syslog juste au moment de l'erreur :

Code :

Aug 22 20:13:55 serveur kernel: [22720.900079] sd 1:0:0:0: [sdb] Unhandled error code
Aug 22 20:13:55 serveur kernel: [22720.900080] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Aug 22 20:13:55 serveur kernel: [22720.900083] sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 00 00 00 49 00 00 08 00
Aug 22 20:13:55 serveur kernel: [22720.900088] end_request: I/O error, dev sdb, sector 73
Aug 22 20:13:55 serveur kernel: [22720.900099] end_request: I/O error, dev sdb, sector 73
Aug 22 20:13:55 serveur kernel: [22720.900109] raid5: Disk failure on sdb1, disabling device.
Aug 22 20:13:55 serveur kernel: [22720.900133] sd 1:0:0:0: [sdb] Unhandled error code
Aug 22 20:13:55 serveur kernel: [22720.900135] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Aug 22 20:13:55 serveur kernel: [22720.900137] sd 1:0:0:0: [sdb] CDB: Read(10): 28 00 c4 52 be 47 00 00 08 00
Aug 22 20:13:55 serveur kernel: [22720.900142] end_request: I/O error, dev sdb, sector 3293756999
Aug 22 20:13:55 serveur kernel: [22720.981090] disk 1, o:0, dev:sdb1
Aug 22 20:13:55 serveur mdadm[1371]: Fail event detected on md device /dev/md0, component device /dev/sdb1
Aug 22 20:57:41 serveur kernel: [ 1.707618] sd 1:0:0:0: [sdb] 3907029168 512-byte logical blocks: (2.00 TB/1.81 TiB)
Aug 22 20:57:41 serveur kernel: [ 1.707656] sd 1:0:0:0: [sdb] Write Protect is off
Aug 22 20:57:41 serveur kernel: [ 1.707658] sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
Aug 22 20:57:41 serveur kernel: [ 1.707673] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Aug 22 20:57:41 serveur kernel: [ 1.707786] sdb:
Aug 22 20:57:41 serveur kernel: [ 1.735501] sdb1
Aug 22 20:57:41 serveur kernel: [ 1.735684] sd 1:0:0:0: [sdb] Attached SCSI disk
Aug 22 20:57:41 serveur kernel: [ 3.105713] md: bind<sdb1>
Aug 22 20:57:41 serveur kernel: [ 3.106445] md: kicking non-fresh sdb1 from array!
Aug 22 20:57:41 serveur kernel: [ 3.106450] md: unbind<sdb1>
Aug 22 20:57:41 serveur kernel: [ 3.116044] md: export_rdev(sdb1)
Aug 22 20:57:41 serveur kernel: [ 3.382822] md: bind<sdb1>
Aug 22 20:57:41 serveur kernel: [ 3.383799] raid5: device sdb1 operational as raid disk 1
Aug 22 20:57:41 serveur kernel: [ 3.384215] disk 1, o:1, dev:sdb1
Aug 22 20:57:41 serveur kernel: [ 3.384575] md: unbind<sdb1>
Aug 22 20:57:41 serveur kernel: [ 3.396037] md: export_rdev(sdb1)
Aug 22 20:58:58 serveur kernel: [ 87.109363] md: bind<sdb1>
Aug 22 20:58:59 serveur kernel: [ 87.384099] disk 1, o:1, dev:sdb1
Aug 22 21:22:28 serveur kernel: [ 1496.716736] disk 1, o:1, dev:sdb1

Ça a l'air d'être une erreur de lecture sur un secteur.

Cela peut venir d'ou a votre avis ? Vu que c'est un deuxième disque et, pas le même que la première fois, je me suis dit que ça pouvait peut-être plus venir d'autre chose, mais quoi ?

Merci de vos éclaircissements !!
Bonne soirée à vous.

Publicité

bodji

Vous pouvez pas test :O

Infos complémentaires :

Niveau température, tout semble normal :

Code :

~# hddtemp /dev/sd[a-d]
/dev/sda: ST2000DL003-9VT166: 40°C
/dev/sdb: ST2000DL003-9VT166: 40°C
/dev/sdc: ST2000DL003-9VT166: 44°C
/dev/sdd: ST2000DL003-9VT166: 41°C

Etat SMART des 4 disques :
http://pastebin.com/vxyabVrs

fighting_falcon

conf hard de ton serveur (cm/proc/controleurs avec à chaque fois marque/modèle) ?

Message édité par fighting_falcon le 23-08-2011 à 20:02:35

---------------
[mon feed]

bodji

Vous pouvez pas test :O

Carte mère : ASUS M4A78LT-M-LX
Processeur : AMD Athlon II X2 215
Contrôleur sata : AMD SB710

Par le plus grand des hasards, j'ai mis des cables sata non coudés et j'ai l'impression qu'ils forcent un peu quand on ferme le panneau latéral, ça pourrait pas venir de çà ?

Après je vois qu'un problème de carte mère. Donc soit SAV, soit achat d'une carte PCI avec ports Sata.

fighting_falcon

effectivement, un câblage un peu branlant n'est pas trop recommandé ...
tes câbles sont de bonne qualité ?

donc si je comprends bien, tu utilises les ports sata de ta carte mère directement

faudrait s'assurer que y'ait pas de bugs dans le pilote correspondant aussi ...

---------------
[mon feed]

FORUM HardWare.fr

Linux et OS Alternatifs

Installation

Faulty réguliers sur raid 5 mdadm

Sujets relatifs
[ubuntu] pb sur controluer sata & Raid :( Need help !!	[debian] gestion RAID5 avec mdadm
Probleme Freenas et Raid 1	Problème avec mon nouveau matériel (RAID 1) et Ubuntu
Raid is dead ? (raid 5 debian)	info disque RAID
Mdadm RAID 5 + LVM2 Redimentionnement	Débit en lecture catastrophique en Raid 0
installer debian sur un raid materiel
Plus de sujets relatifs à : Faulty réguliers sur raid 5 mdadm

Page générée en 0.051 secondes