Puncte:1

Folosind git lfs pentru a gestiona datele pe serverul de stocare

drapel cn

Fac parte dintr-o mică echipă de cercetare în fizică (10-15 persoane) care a achiziționat recent un server de stocare și voi fi responsabil de configurarea acestuia. Ca atare, trebuia să mă gândesc la cea mai bună modalitate de a organiza datele pe care le vom genera.

Când am căutat cel mai bun mod de a face acest lucru, am dat peste git lfs. Folosim deja GitLab (versiunea cloud) pentru a controla versiunile codurilor noastre și pentru a le partaja cu ușurință între noi. Deci, ar avea sens să se creeze un depozit de „date” în care majoritatea fișierelor vor fi binare, stocate și urmărite prin lfs.Cu toate acestea, se pare că va încărca fișierele pe serverul GitLab, înfrângând întregul scop al unui computer de stocare (de asemenea, ar trebui să cumpărăm spațiu de stocare de la ele).

Soluția pare să fie ca noi să implementăm ediția comunitară a GitLab pe serverul nostru de stocare. Acum vin întrebările mele:

  1. Este singura cale? În mod ideal, aș dori să pot spune lui GitLab că fișierele noastre sunt stocate în altă parte, iar git repo doar să sublinieze că „în altă parte” este serverul nostru de stocare?
  2. Dacă trebuie să implementez CE-ul GitLab, cât de greu este să întrețin un astfel de server? Scenariul meu ideal este o întreținere zero, adică o configurare o dată și, atâta timp cât nimeni nu actualizează sistemul de operare, acesta nu ar trebui să se rupă (vezi comentariul de mai jos).
  3. În cazul în care se sparg, datele vor fi stocate într-un mod pe care cineva le poate prelua cu ușurință, adică nu vor fi compactate într-un blob binar unde aveți nevoie de serverul care rulează pentru a le recupera. În mod ideal, ar trebui să pot citi chiar și datele din interiorul serverului cu serviciul în funcțiune, deoarece este posibil să facem niște analize de date în interiorul acestui computer.

Comentariu despre punctul 2: Știu că faptul că nu efectuați actualizări regulate poate lăsa găuri de securitate. Cu toate acestea, datele stocate nu conțin informații sensibile. Nu ne ocupăm de informații personale, iar scurgerile sau pierderea datelor ar avea doar consecințe minore. Pe de altă parte, sunt post-doc și poate fi nevoie să părăsesc grupul în orice moment în favoarea unui post permanent. Deoarece grupul se concentrează pe cercetarea fizicii, alți oameni care vin după plecarea mea s-ar putea să nu aibă abilitățile necesare pentru întreținerea serverului. Astfel, necesitatea unui sistem de gestionare a datelor care necesită întreținere mică sau deloc.

Puncte:0
drapel jp

Aveți două opțiuni în mintea mea.

  1. Rulați comunitatea auto-găzduită Gitlab pe serverul dvs. de stocare și utilizați git-lfs pe acesta.
  2. Utilizați git-anexă.

Git-annex urmărește locațiile fișierelor în git, dar conținutul real al fișierului poate fi stocat într-o mare varietate de backend-uri, de exemplu; rsync, s3, bup. Unul dintre care ați putea configura pe serverul dvs. de stocare: https://git-annex.branchable.com/special_remotes/

Editați pentru a răspunde la întrebarea dvs. despre Gitlab CE Admin. Îl folosim pentru o echipă mică de dezvoltare de 10 persoane și aproximativ 100 de repoziții. Dacă nu utilizați integrarea continuă a Gitlab, administratorul ar trebui să fie foarte simplu.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.