Primul pas este să proiectați tabelul și coloanele pentru baza de date, să determinați cum vor fi stocate metadatele, să proiectați instrucțiunile de interogare și instrucțiunile de actualizare.
Apoi implementați declanșatoarele de stocare în cloud pentru a notifica un serviciu pe care îl scrieți pentru a procesa evenimente din stocare în cloud. Cloud Functions și Cloud Run sunt adesea folosite pentru a procesa evenimente. Ca parte a procesării evenimentului, codul dvs. va actualiza baza de date.
Ultimul pas după ce declanșatoarele funcționează corect, este să scanați întreaga găleată și să actualizați baza de date cu metadate pentru fiecare obiect Cloud Storage.
Întrebarea dvs. nu include detalii. Este mai bine să folosiți declarații numerice în loc de Am un număr mare de obiecte stocate într-un bucket GCP Cloud Storage. Pentru mine, asta înseamnă cel puțin zeci de milioane de obiecte. Întrebarea dvs. nu include informații despre cât de repede apar modificările în Cloud Storage sau interogările reale pe care trebuie să le efectuați.
Rețineți că Cloud Storage este un spațiu de nume plat. Conceptul de ierarhie (dosare/directoare) este emulat în software. Dacă stocați spațiul de nume în baza de date la fel ca cel stocat în Cloud Storage, atunci performanța ar putea să nu fie mai bună.
Am implementat tipul dvs. de design de mai multe ori pentru AWS, Google Cloud și Azure. Dacă nu doriți cu adevărat complexitatea unui sistem bazat pe evenimente, vă recomand să citiți din când în când găleata de stocare și să creați o foaie de calcul text simplă care poate fi procesată cu grep, awk etc.