avem cluster Kafka cu RHEL 7.6, toate Kafka sunt mașini VM
pe una dintre mașinile Kafka, am observat că discul sdb a devenit doar pentru citire (când sda este discul OS)
montură | grep sdb
/dev/sdb pe /var/data/kafka_DB tip ext4 (ro,noatime,data=ordered)
din punctul meu de vedere, este puțin ciudat că DISK VMDK a devenit doar pentru citire (pentru că nu este un disc mecanic)
de la red-hat găsesc următoarele
https://access.redhat.com/solutions/1273213
https://access.redhat.com/solutions/35329
dar nu sunt sigur dacă sugestiile de mai sus de la redhat sunt răspunsul pentru care discul a devenit doar pentru citire
alte pareri?
din jurnalele kernelului putem vedea:
[1642397.157193] sd 0:0:2:0: [sdb] FAILED Rezultat: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157200] sd 0:0:2:0: [sdb] CDB: Scriere(10) 2a 00 12 c0 01 00 00 00 08 00
[1642397.157214] blk_update_request: eroare I/O, dev sdb, sector 314573056
[1642397.157242] Eroare I/O tampon pe dev sdb, bloc logic 39321632, scriere a paginii asincrone pierdute
[1642397.157806] sd 0:0:2:0: [sdb] FAILED Rezultat: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157808] sd 0:0:2:0: [sdb] CDB: Read(10) 28 00 12 c4 03 58 00 00 08 00
[1642397.157810] blk_update_request: eroare I/O, dev sdb, sector 314835800
[1642397.157843] sd 0:0:2:0: [sdb] FAILED Rezultat: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157845] sd 0:0:2:0: [sdb] CDB: Read(10) 28 00 12 c4 0b a0 00 00 08 00
[1642397.157847] blk_update_request: eroare I/O, dev sdb, sector 314837920
[1642578.412306] sd 0:0:2:0: [sdb] sarcina anulată pe gazda 0, ffff8c147c189880
[1642924.513605] sd 0:0:2:0: [sdb] sarcina anulată pe gazda 0, ffff8c16a4f01880
[1643034.935334] JBD2: S-au detectat erori IO în timpul spălării datelor fișierului pe sdb-8
[1643035.002651] Eroare EXT4-fs (dispozitiv sdb): __ext4_new_inode:989: comm pool-6-thread-1: nu s-a putut introduce inodul 8126474: alocat dublu?
[1643036.753397] Se anulează jurnalul pe dispozitivul sdb-8.
[1643036.754490] Eroare EXT4-fs (dispozitiv sdb): ext4_journal_check_start:56: Jurnal avortat detectat
[1643036.754496] EXT4-fs (sdb): Remontarea sistemului de fișiere numai în citire
[1643226.599854] sd 0:0:2:0: [sdb] sarcina anulată pe gazda 0, ffff8c14a4bd3800
[1694249.598258] EXT4-fs (sdb): număr de erori de la ultimul fsck: 17
[1694249.598269] EXT4-fs (sdb): eroare inițială la momentul 1629844995: ext4_find_entry:1312: inode 656236
[1694249.598273] EXT4-fs (sdb): ultima eroare la momentul 1630003886: ext4_journal_check_start:56
[1780756.527074] EXT4-fs (sdb): număr de erori de la ultimul fsck: 17
[1780756.527086] EXT4-fs (sdb): eroare inițială la momentul 1629844995: ext4_find_entry:1312: inode 656236
[1780756.527088] EXT4-fs (sdb): ultima eroare la momentul 1630003886: ext4_journal_check_start:56
ceea ce credem că trebuie să facem este să actualizăm /sys/bloc/
nume de bază /dev/sdb/device/timeout
de exemplu, valoarea implicită este 180
și ne gândim să setăm o nouă valoare de actualizare ca
echo 3600 > /sys/block/`basename /dev/sda`/device/timeout
vrem să știm dacă suntem pe direcția bună cu soluția de mai sus?