Context: Folosesc cu succes rsync pentru a crea copii de rezervă zilnice incrementale și de la distanță folosind indicatorul --link-dest „referenceBackup”, astfel încât, atunci când creez noua copie de rezervă, se creează doar o nouă referință la un fișier existent și nemodificat.
problemă: Unele directoare conțin multe fișiere mici (sute de mii), și chiar și optimizarea --link-dest nu este... „optimă”. Cele mai multe dintre aceste „fișiere mici” pot fi fișiere sursă, ieșiri mici „*.o” compilate, ... o creare a unei noi referințe enode pentru fiecare dintre multele sute de mii de fișiere care consumă resurse ale sistemului de fișiere. De exemplu, pentru un director de referință de 20 de gigaocteți cu peste 250.000 de fișiere, backup-ul incremental utilizează aproximativ 100 Mb (0,05%) de spațiu suplimentar (chiar și atunci când sunt modificați doar 40 de kiloocteți de date).
Întrebare: Știu sigur că directoarele și subarborele directoarelor complete vor conține întotdeauna în mare parte aceleași „sute de mii” de fișiere mici (poate cu doar 10 sau 20 de modificări) și mă întreb doar dacă există o strategie de backup de optimizare mai bună într-un astfel de scenariu ( în comparație cu --link-dest ...). Adică, aș dori să creez doar o „diferență” a directorului existent într-un nou backup incremental, încercând să creez chiar și o nouă referință la enod pentru 99% din fișierele existente. Este acolo un fel de suprapunere a sistemului de fișiere (cum ar fi docker) aplicație sau model?