Puncte:1

montura iscsid ruptă după recuperare

drapel kr
dna

ma joc cu Deschide-iSCSI și a dat peste niște necazuri. Când legătura de rețea dintre inițiatorul meu și țintă eșuează, iscsid va recupera conexiunea, ceea ce este bun. Dar montura mea este ruptă și cedează Eroare I/O pana este remontata.

Există o soluție curată pentru a remonta automat lun-ul? Ceva de genul un cârlig la recuperare post sau o setare de configurare pe care cumva am ratat-o? Încerc să evit un script de sondare sau ceva de genul :)

jurnal iscsid
14 ianuarie 08:03:45 localhost iscsid[1415]: iscsid: Kernel-ul a raportat eroare de conexiune iSCSI 1:0 (1022 - ISCSI_ERR_NOP_TIMEDOUT: Un NOP a expirat) stare (3)
14 ianuarie 08:04:22 localhost iscsid[1415]: iscsid: conectarea la 10.0.2.100:9999 a eșuat (nicio rută către gazdă)
[...]
14 ianuarie 08:38:43 localhost iscsid[1415]: iscsid: conectarea la 10.0.2.100:9999 a eșuat (nicio rută către gazdă)
14 ianuarie 08:38:47 localhost iscsid[1415]: iscsid: connection1:0 este operațională după recuperare (195 încercări)
14 ianuarie 08:39:52 localhost iscsid[1415]: iscsid: Kernel-ul a raportat o eroare de conexiune iSCSI 1:0 (1020 - ISCSI_ERR_TCP_CONN_CLOSE: conexiune TCP închisă) stare (3)
14 ianuarie 08:40:11 localhost iscsid[1415]: iscsid: connection1:0 este operațională după recuperare (2 încercări)
fstab
UUID=cf3d20cd-a8cd-4a9a-acbf-1c61289a37bb /data xfs defaults,_netdev,x-systemd.requires=iscsid.service 0 0
Puncte:0
drapel ng

Pe scurt, nu, nu există o soluție magic curată. Cea mai curată recuperare este repornirea.

Problema este că atunci când conexiunea este întreruptă pentru mai mult decât iscsid replacement_timeout, sistemul de fișiere începe să primească erori I/O. Cu excepția cazului în care aveți o aplicație foarte specială, de obicei nu există nicio revenire de la o eroare I/O. Face tot felul de ravagii cu serviciile. Aproape întotdeauna este mai bine să reporniți decât să încercați să înțelegeți cum au încetat să funcționeze toate programele.

Acestea fiind spuse, ceea ce poți face este să împingi asta replacement_timeout în măsura în care vă simțiți confortabil. Veți găsi referințe pe web la aplicații precum bazele de date care recomandă o oră de expirare (3600 de secunde) sau chiar mai mult. Acest lucru împinge problema în ceva de genul unui suport NFS blocat. Dacă trebuie să proiectați un sistem care să elimine întreruperile în care un om trebuie să intervină pentru a-l remedia, un timeout mult mai lung este un lucru bun. Sistemul se blochează până când linkul revine.

Puteți seta valoarea implicită pentru întregul sistem în /etc/iscsi/iscsid.conf. Editați această linie:

node.session.timeo.replacement_timeout = 120

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.