Pe scurt, nu, nu există o soluție magic curată. Cea mai curată recuperare este repornirea.
Problema este că atunci când conexiunea este întreruptă pentru mai mult decât iscsid replacement_timeout
, sistemul de fișiere începe să primească erori I/O. Cu excepția cazului în care aveți o aplicație foarte specială, de obicei nu există nicio revenire de la o eroare I/O. Face tot felul de ravagii cu serviciile. Aproape întotdeauna este mai bine să reporniți decât să încercați să înțelegeți cum au încetat să funcționeze toate programele.
Acestea fiind spuse, ceea ce poți face este să împingi asta replacement_timeout
în măsura în care vă simțiți confortabil. Veți găsi referințe pe web la aplicații precum bazele de date care recomandă o oră de expirare (3600 de secunde) sau chiar mai mult. Acest lucru împinge problema în ceva de genul unui suport NFS blocat. Dacă trebuie să proiectați un sistem care să elimine întreruperile în care un om trebuie să intervină pentru a-l remedia, un timeout mult mai lung este un lucru bun. Sistemul se blochează până când linkul revine.
Puteți seta valoarea implicită pentru întregul sistem în /etc/iscsi/iscsid.conf
. Editați această linie:
node.session.timeo.replacement_timeout = 120