Verificarea transferurilor de fișiere într-o rețea:
Aveți un server de fișiere MS și doi clienți (astfel încât posibila stocare în cache locală la client să nu vă împiedice rezultatele).
Pe computerul client #1, generați fișiere (cu conținut aleatoriu?) și salvați-le pe server. În același timp, calculați o sumă de control (să spunem md5sum?) pentru fiecare fișier de testare și poate adăugați sumele, rând după rând, la un „fișier index de transfer al sumei” de pe același server.
Pe mașina client #2, încărcați fișierele unul câte unul de pe server și calculați suma de control. De fapt, puteți rula un instrument de sumă de verificare, cum ar fi md5sum, pe fiecare fișier dintr-o partajare de rețea mapată (de la mașina client #2). Și comparați sumele de control cu ceea ce a produs mașina sursă.
Aceasta este doar o idee de bază. Va trebui să faceți niște scripturi pentru a automatiza verificările și a le lăsa să ruleze peste un weekend sau cam asa ceva. Și poate dacă bitrot-ul nu are loc imediat și are loc pe unitățile de disc, poate că acest tip de verificare rapidă nu va găsi nimic.
Dacă aveți un anumit exemplu / incident de corupție a datelor, există vreo modalitate de a pune mâna pe fișierul original și pe fișierul corupt, care ar fi trebuit să fie identice? Ce format sunt acele fișiere? Este acesta un fișier text care poate fi citit de mașină (cum ar fi XML) sau ceva binar? Poate că s-ar putea compara conținutul, pentru a vedea exact cum arată corupția. Natura corupției ar putea oferi alte indicii despre de unde ar putea veni aceasta.
În afară de clasicul „dif” care funcționează pe text ASCII, îmi amintesc există instrumente special pentru compararea binară.
De asemenea, serverul de stocare execută copii de rezervă? Detaliile depind de schema de backup, dar ideea este că, dacă o copie de rezervă veche pe partea de server conține un fișier sănătos și fișierul curent de pe server este rupt, probabil că problema dvs. este restrânsă. Și pentru a extrapola acest subiect de backup, dacă configurația are o problemă cu coruperea datelor și nu are o schemă de backup anti-glonț, de ce motiv mai trebuie organizația dvs. pentru a lucra la asta?
Chiar dacă nu mai aveți fișierul original sănătos: dacă fișierul corupt este în cele din urmă respins de un software care îl analizează, ar fi minunat să obțineți un jurnal de depanare mai detaliat, să vedeți unde se oprește analizatorul, unde fișierul nu mai este „bine format” - dar înțeleg că în software-ul cu sursă închisă care lucrează pe un format de fișier închis, de obicei, nu aveți această oportunitate.
Oamenii spun că acesta este exact scopul hardware-ului de stocare al întreprinderii care menține „metadatele de integritate” de-a lungul „lanțului de semnal” - adică versiunile moderne de SCSI și tehnologiile de interconectare derivate (FC, SAS) și clasa corespunzătoare de rugina rotativă, nu sunt sigur. dacă există SSD-uri cu această capacitate. Mai degrabă, oferind anumite indicații, vă sugerez Întrebați Google despre integritatea datelor în Linux. Sunt șanse ca exact asta să te fi mușcat, la nivel hardware.Cât de multe știți despre subsistemul dvs. de stocare de bază pe server?
Și, deși aceasta este o șansă mică: dacă în general aveți o problemă la deschidere vechi fișiere: software-ul aplicației care lucrează cu fișierele este actualizat? Ar putea fi acesta un caz în care o actualizare a aplicației rup compatibilitatea cu datele vechi? Dacă nu aveți copii de siguranță ale întregului fișier, ați putea aranja să obțineți doar o sumă de control notă undeva, împreună cu numele și dimensiunea fișierului și o marca temporală, pentru a vedea dacă fișierul preluat 6 luni mai târziu este același sau diferit?
Salvat printr-o „procedură obositoare de încărcare manuală” - exact ce este asta?
Un algoritm de recuperare care funcționează la fișierul spart?
Sau doar preluarea fișierului original sănătos dintr-o copie de rezervă veche corespunzătoare?
Oricare dintre cazuri conține un potențial de a afla mai multe despre natura problemei: fie veți putea compara fișierul rupt cu un fișier original bun, fie poate afla ce face procesul de „recuperare” de fapt asupra fișierului „corupt”. .