Fac parte dintr-o mică echipă de cercetare în fizică (10-15 persoane) care a achiziționat recent un server de stocare și voi fi responsabil de configurarea acestuia. Ca atare, trebuia să mă gândesc la cea mai bună modalitate de a organiza datele pe care le vom genera.
Când am căutat cel mai bun mod de a face acest lucru, am dat peste git lfs. Folosim deja GitLab (versiunea cloud) pentru a controla versiunile codurilor noastre și pentru a le partaja cu ușurință între noi. Deci, ar avea sens să se creeze un depozit de „date” în care majoritatea fișierelor vor fi binare, stocate și urmărite prin lfs.Cu toate acestea, se pare că va încărca fișierele pe serverul GitLab, înfrângând întregul scop al unui computer de stocare (de asemenea, ar trebui să cumpărăm spațiu de stocare de la ele).
Soluția pare să fie ca noi să implementăm ediția comunitară a GitLab pe serverul nostru de stocare. Acum vin întrebările mele:
- Este singura cale? În mod ideal, aș dori să pot spune lui GitLab că fișierele noastre sunt stocate în altă parte, iar git repo doar să sublinieze că „în altă parte” este serverul nostru de stocare?
- Dacă trebuie să implementez CE-ul GitLab, cât de greu este să întrețin un astfel de server? Scenariul meu ideal este o întreținere zero, adică o configurare o dată și, atâta timp cât nimeni nu actualizează sistemul de operare, acesta nu ar trebui să se rupă (vezi comentariul de mai jos).
- În cazul în care se sparg, datele vor fi stocate într-un mod pe care cineva le poate prelua cu ușurință, adică nu vor fi compactate într-un blob binar unde aveți nevoie de serverul care rulează pentru a le recupera. În mod ideal, ar trebui să pot citi chiar și datele din interiorul serverului cu serviciul în funcțiune, deoarece este posibil să facem niște analize de date în interiorul acestui computer.
Comentariu despre punctul 2: Știu că faptul că nu efectuați actualizări regulate poate lăsa găuri de securitate. Cu toate acestea, datele stocate nu conțin informații sensibile. Nu ne ocupăm de informații personale, iar scurgerile sau pierderea datelor ar avea doar consecințe minore. Pe de altă parte, sunt post-doc și poate fi nevoie să părăsesc grupul în orice moment în favoarea unui post permanent. Deoarece grupul se concentrează pe cercetarea fizicii, alți oameni care vin după plecarea mea s-ar putea să nu aibă abilitățile necesare pentru întreținerea serverului. Astfel, necesitatea unui sistem de gestionare a datelor care necesită întreținere mică sau deloc.