A napokban a clusterből az egyik gép elkezdte az alábbi hibákat írni:
Nov 20 11:00:03 pve000 kernel: ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Nov 20 11:00:03 pve000 kernel: ata4.00: BMDMA stat 0x26
Nov 20 11:00:03 pve000 kernel: ata4.00: failed command: READ DMA EXT
Nov 20 11:00:03 pve000 kernel: ata4.00: cmd 25/00:f8:08:12:00/00:01:00:00:00/e0 tag 0 dma 258048 in
res 51/84:57:a9:13:00/84:00:00:00:00/e0 Emask 0x30 (host bus error)
Nov 20 11:00:03 pve000 kernel: ata4.00: status: { DRDY ERR }
Nov 20 11:00:03 pve000 kernel: ata4.00: error: { ICRC ABRT }
Nov 20 11:00:03 pve000 kernel: ata4: soft resetting link
Nov 20 11:00:03 pve000 kernel: ata4.00: configured for UDMA/133
Nov 20 11:00:03 pve000 kernel: sd 3:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
Nov 20 11:00:03 pve000 kernel: sd 3:0:0:0: [sdb] tag#0 Sense Key : Aborted Command [current]
Nov 20 11:00:03 pve000 kernel: sd 3:0:0:0: [sdb] tag#0 Add. Sense: Scsi parity error
Nov 20 11:00:03 pve000 kernel: sd 3:0:0:0: [sdb] tag#0 CDB: Read(10) 28 00 00 00 12 08 00 01 f8 00
Nov 20 11:00:03 pve000 kernel: I/O error, dev sdb, sector 4616 op 0x0:(READ) flags 0x80700 phys_seg 59 prio class 0
Nov 20 11:00:03 pve000 kernel: ata4: EH complete
Ez azért nem jelent semmi jót, azt hittem a disk hiba, aztán kábel hiba, míg végül eljutottam odáig, hogy ez valószínű alaplap hiba. Nem kimondottan kavart fel a dolog, általában régi hw-t használok szervernek, ez is egy kidobott, majdnem 20 éves gép. 3000 forint hozzá egy alaplap, vettem is egyet gyorsan, de gondoltam mielőtt kidobom, ránézek. Azonnal feltűnt, hogy a South Bridge mellett az egyik elektrolit kondenzátor púpos. Ezt pedig már az arcade gépek óta tudom, hogy nem jelent semmi jót, meg a south bridge amúgy is I/O-val foglalkozik, szóval duplán kezdett gyanús lenni a dolog.
Gondoltam ennyi effort még belefér, úgy sincs nagyon mit vesztenem, a megfelelő eszközök meg rendelkezésre állnak, kicserélem gyorsan.
A csere után pont olyan mintha semmi se történt volna, az alaplap alján barnult meg egy kicsit a lakk, de legközelebb lehet azt is kimaszkolom ha ilyet tervezek.
A gyors teszt után megszűnt a hiba, tényleg kár lett volna kidobni egy alaplapot ezért a 200 forintos alkatrészért.