Mă ocup de un cluster de servere care rulează Ubuntu 20.04. Fiecare are unitățile lor exportate prin NFS către alte servere. Sunt ext4
sisteme de fișiere.
De asemenea, avem o matrice de discuri (adică un SAN) care a fost formatat ca un ocfs2
(Sistem de fișiere Oracle Cluster). Acesta este montat de servere pentru a oferi spațiu suplimentar pe disc.
Totul pare bine... Cu excepția unuia sau a două programe. Aceste programe generează rezultate pe o eroare standard și într-un fișier. Dacă aceste două ieșiri sunt trimise către ocfs2
sistem de fișiere, uneori apar farfurii. Sunt caractere non-ASCII... ca și cum părți din memorie ar fi fost scrise direct în eroare standard și/sau în fișierul de ieșire. Uneori, văd multe ^@
caractere, care este caracterul NULL (cod ASCII 0
). Este diferit de fiecare dată și nu consecvent. Uneori, execuția unui program funcționează, dar uneori nu funcționează cu aceeași intrare.
Dacă aceste programe ies pe unitățile NFS, atunci această problemă nu se întâmplă niciodată. Am făcut asta acum de sute de ori și nu s-a întâmplat o dată.
Până acum, am „rezolvat” această problemă prin scoaterea programelor pe unitățile NFS și apoi copierea ieșirilor pentru stocare pe termen lung. Dar, mă deranjează că nu prea știu cauza. În calitate de administrator de sistem, cred că ceea ce mă îngrijorează este dacă ocfs2
unitatea a fost configurată greșit cumva. Când copiez fișiere în ocfs2
conduceți și testați md5sum
după aceea, totul se verifică.
(Ar putea fi o eroare în programe și am raportat această problemă dezvoltatorului său. Dar acum observăm că se întâmplă cu două programe. Și nu se întâmplă niciodată cu unitățile NFS.)
Dacă cineva are sugestii cu privire la ceea ce ar trebui să verific sau să iau în considerare, vă rog să-mi spuneți. Sunt complet nedumerit... Multumesc anticipat!