Puncte:2

Eșecuri periodice Google App Engine

drapel in

Am observat recent că proiectul nostru Google App Engine se confruntă cu eșecuri periodic la fiecare 25 de ore și 10 minute (1510 minute) timp de trei zile consecutive fără niciun motiv aparent.

În timpul problemei, am văzut solicitări care au eșuat cu codul 499 (Client Closed Request) după o durată foarte lungă de solicitare (10s). Cererile durează în mod normal câteva sute de milisecunde sau ocazional 2-3 secunde, dar niciodată aproape de 10 secunde. La momentul respectiv, nu am observat nicio creștere a traficului și nu avem niciun job de fundal care rulează. CPU și memoria au fost toate în regulă până la începutul problemei, apoi CPU a crescut oarecum (de exemplu, de la aproximativ 10% la 60%) și chiar a declanșat o extindere temporară de la 3 la 5 gazde.

Proiectul este un Python Fast API imagine implementat într-un mediu flexibil, min 3, max 12 gazde la momentul respectiv.

Exemplu de erori din jurnalele

Momentul acestor eșecuri a fost interesant, deoarece s-au întâmplat la aproape exact 25 de ore și 10 minute una de cealaltă. Am avut câteva implementări în aceste zile în diferite momente, nu există nicio corelare cu timpul de funcționare a serverului.

Marcajele orare de mai jos sunt în UTC:

2021-11-17 17:43
2021-11-18 18:53
2021-11-19 20:03

A văzut cineva ceva similar pe Google App Engine sau poate cu imaginea Fast API menționată?

Puncte:0
drapel us

Însă 499 cod de stare HTTP indică faptul că clientul a închis cererea. Un posibil motiv pentru aceasta este că clientul dvs. a fost deconectat la intervalele de timp pe care le specificați.

Vă recomand să verificați dacă instanțele dvs. flexibile App Engine erau sănătoase în acele momente, inspectând jurnalele Cloud Logging și în special controale de sănătate, de asemenea, utilizați tabloul de bord App Engine pentru a vedea dacă instanțele au fost accelerate cu o utilizare ridicată a CPU sau RAM. Dar această problemă pare să fie în partea clientului, așa că ar putea merita să verificați și starea de unde ați emis cererea.

De asemenea, împărtășesc această documentație privind depanarea erorilor de servire flexibilă a App Engine, care cred că vă pot fi utile.

robert avatar
drapel in
Multumesc pentru raspuns. 499 nu este cauza, ci efectul secundar. Clienții s-au deconectat pe măsură ce cererile au expirat, deoarece brusc răspunsurile nu au fost trimise înapoi. Acele GET 499 pe care le vedeți provin din controale de sănătate și, de asemenea, expirau. Am investigat Cloud Logging și toate valorile posibile în GCP și nu am putut găsi absolut nicio corelație. Singura corelație a fost cu sincronizarea, că s-a întâmplat la exact 1510 minute distanță de 3 zile la rând, ca pe un program.
robert avatar
drapel in
Am ajuns, de asemenea, într-un punct mort cu Google Issue Tracker, mi-au sugerat să depunem un caz de asistență, pe care ar putea fi nevoie să-l facem în cele din urmă dacă nu găsim altceva.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.