bodji Vous pouvez pas test :O | Bonjour à tous !
Voilà, j'ai monté un petit serveur pour un ami qui voulait avoir pas mal de stockage sur son LAN.
On est parti sur 4 disques Seagate Green 2To 5900t/m en raid 5.
Il y a deux semaines, après avoir fraîchement installé Debian (squeeze), je crée la grappe, formate le md0 en ext3, et je la partage avec samba. Tout marchait comme sur des roulettes mais en l'espace de quelques jours j'ai eu deux disques (différents)
qui se sont mis en faulty, Après l'erreur le disque est plus visible par debian. Après un reboot il remonte comme il faut, je le rajoute donc à la grappe, et le raid se resynchronise comme il faut.
Pas d'erreurs SMART sur les deux disques qui se sont mis en caraffe.
Voici un extrait du syslog juste au moment de l'erreur :
Code :
- Aug 22 20:13:55 serveur kernel: [22720.900079] sd 1:0:0:0: [sdb] Unhandled error code
- Aug 22 20:13:55 serveur kernel: [22720.900080] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
- Aug 22 20:13:55 serveur kernel: [22720.900083] sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 00 00 00 49 00 00 08 00
- Aug 22 20:13:55 serveur kernel: [22720.900088] end_request: I/O error, dev sdb, sector 73
- Aug 22 20:13:55 serveur kernel: [22720.900099] end_request: I/O error, dev sdb, sector 73
- Aug 22 20:13:55 serveur kernel: [22720.900109] raid5: Disk failure on sdb1, disabling device.
- Aug 22 20:13:55 serveur kernel: [22720.900133] sd 1:0:0:0: [sdb] Unhandled error code
- Aug 22 20:13:55 serveur kernel: [22720.900135] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
- Aug 22 20:13:55 serveur kernel: [22720.900137] sd 1:0:0:0: [sdb] CDB: Read(10): 28 00 c4 52 be 47 00 00 08 00
- Aug 22 20:13:55 serveur kernel: [22720.900142] end_request: I/O error, dev sdb, sector 3293756999
- Aug 22 20:13:55 serveur kernel: [22720.981090] disk 1, o:0, dev:sdb1
- Aug 22 20:13:55 serveur mdadm[1371]: Fail event detected on md device /dev/md0, component device /dev/sdb1
- Aug 22 20:57:41 serveur kernel: [ 1.707618] sd 1:0:0:0: [sdb] 3907029168 512-byte logical blocks: (2.00 TB/1.81 TiB)
- Aug 22 20:57:41 serveur kernel: [ 1.707656] sd 1:0:0:0: [sdb] Write Protect is off
- Aug 22 20:57:41 serveur kernel: [ 1.707658] sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
- Aug 22 20:57:41 serveur kernel: [ 1.707673] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
- Aug 22 20:57:41 serveur kernel: [ 1.707786] sdb:
- Aug 22 20:57:41 serveur kernel: [ 1.735501] sdb1
- Aug 22 20:57:41 serveur kernel: [ 1.735684] sd 1:0:0:0: [sdb] Attached SCSI disk
- Aug 22 20:57:41 serveur kernel: [ 3.105713] md: bind<sdb1>
- Aug 22 20:57:41 serveur kernel: [ 3.106445] md: kicking non-fresh sdb1 from array!
- Aug 22 20:57:41 serveur kernel: [ 3.106450] md: unbind<sdb1>
- Aug 22 20:57:41 serveur kernel: [ 3.116044] md: export_rdev(sdb1)
- Aug 22 20:57:41 serveur kernel: [ 3.382822] md: bind<sdb1>
- Aug 22 20:57:41 serveur kernel: [ 3.383799] raid5: device sdb1 operational as raid disk 1
- Aug 22 20:57:41 serveur kernel: [ 3.384215] disk 1, o:1, dev:sdb1
- Aug 22 20:57:41 serveur kernel: [ 3.384575] md: unbind<sdb1>
- Aug 22 20:57:41 serveur kernel: [ 3.396037] md: export_rdev(sdb1)
- Aug 22 20:58:58 serveur kernel: [ 87.109363] md: bind<sdb1>
- Aug 22 20:58:59 serveur kernel: [ 87.384099] disk 1, o:1, dev:sdb1
- Aug 22 21:22:28 serveur kernel: [ 1496.716736] disk 1, o:1, dev:sdb1
|
Ça a l'air d'être une erreur de lecture sur un secteur. Cela peut venir d'ou a votre avis ? Vu que c'est un deuxième disque et, pas le même que la première fois, je me suis dit que ça pouvait peut-être plus venir d'autre chose, mais quoi ?
Merci de vos éclaircissements !!
Bonne soirée à vous. |