Am un cluster cu 4 noduri în AWS, care 2 noduri sunt deconectate în mod continuu și uneori repornește funcționează și uneori trebuie să repornesc toate nodurile din cluster pentru a le recupera pe toate.
[ec2-user@ip-172-31-7-235 ~]$ docker node ls
ID HOSTNAME STARE DISPONIBILITATE MANAGER STARE VERSIUNE DE MOTOR
xhei85m3mjp6wikz81phl01sx * ip-172-31-7-235.us-west-2.compute.internal Ready Active Leader 20.10.4
a63wole6vosq1t5s25wib8ggu ip-172-31-36-138.us-west-2.compute.internal Down Active 19.03.13-ce
guw26oul1i2fb60f5shud8xif ip-172-31-47-112.us-west-2.compute.internal Gata Activ Accesibil 19.03.13-ce
ex996ixxqo3s0mcig1zfzankg ip-172-31-47-251.us-west-2.compute.internal Gata Activ 19.03.13-ce
Și rezultatul comenzii inspect:
[ec2-user@ip-172-31-7-235 ~]$ docker node inspectați ip-172-31-36-138.us-west-2.compute.internal
[
{
„ID”: „a63wole6vosq1t5s25wib8ggu”,
„Versiune”: {
„Index”: 212444
},
„CreatedAt”: „2021-02-10T13:25:54.271879167Z”,
„UpdatedAt”: „2021-07-23T07:36:17.078000983Z”,
„Specificație”: {
„Etichete”: {},
„Rol”: „lucrător”,
„Disponibilitate”: „activ”
},
"Descriere": {
„Nume gazdă”: „ip-172-31-36-138.us-west-2.compute.internal”,
„Platformă”: {
„Arhitectură”: „x86_64”,
„OS”: „linux”
},
„Resurse”: {
„NanoCPU”: 2000000000,
„MemoryBytes”: 8362287104
},
"Motor": {
„EngineVersion”: „19.03.13-ce”,
„Pluginuri”: [
{
„Tip”: „Înregistrare”,
„Nume”: „awslogs”
},
{
„Tip”: „Înregistrare”,
„Nume”: „fluentd”
},
{
„Tip”: „Înregistrare”,
„Nume”: „gcplogs”
},
{
„Tip”: „Înregistrare”,
„Nume”: „gelf”
},
{
„Tip”: „Înregistrare”,
„Nume”: „jurnal”
},
{
„Tip”: „Înregistrare”,
„Nume”: „fișier-json”
},
{
„Tip”: „Înregistrare”,
„Nume”: „local”
},
{
„Tip”: „Înregistrare”,
„Nume”: „loggenterie”
},
{
„Tip”: „Înregistrare”,
„Nume”: „splunk”
},
{
„Tip”: „Înregistrare”,
„Nume”: „syslog”
},
{
„Tip”: „Rețea”,
„Nume”: „punte”
},
{
„Tip”: „Rețea”,
„Nume”: „gazdă”
},
{
„Tip”: „Rețea”,
„Nume”: „ipvlan”
},
{
„Tip”: „Rețea”,
„Nume”: „macvlan”
},
{
„Tip”: „Rețea”,
„Nume”: „null”
},
{
„Tip”: „Rețea”,
„Nume”: „suprapunere”
},
{
„Tip”: „Volum”,
„Nume”: „local”
}
]
},
„TLSIinfo”: {
"TrustRoot": "-----BEGIN CERTIFICATE-----\nMIIBajCCARCgAwIBAgIUCi5JL30BEEaYOmlbrp9A+Rivul0wCgYIKoZIzj0EAwIw\nEzERMA8GA1UEAxMIc3dhcm0tY2EwHhcNMjEwMjEwMTMwMjAwWhcNNDEwMjA1MTMw\nMjAwWjATMREwDwYDVQQDEwhzd2FybS1jYTBZMBMGByqGSM49AgEGCCqGSM49AwEH\nA0IABFqgXKora10w8BODSxg9O4N9UveYhsitjwz+pHSi/6BB0j7YBu+4RADv4ZjK\nitIYTCLZZKbOx9saQ2YeB8sBxFajQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNVHRMB\nAf8EBTADAQH/MB0GA1UdDgQWBBTETORYsVN1OwUTjtYJHSJtGx55QzAKBggqhkjO\nPQQDAgNIADBFAiEA7qNRnsq0LUFenYODEah4Rku1YYpHBCHIid4W4Hy7MVcCICQF\n9BTfuQsAp5uQ72ycyWQfyQziFzbG+Sb/zQ8NzCRf\ n-----CERTIFICAT FINAL-----\n",
„CertIssuerSubject”: „MBMxETAPBgNVBAMTCHN3YXJtLWNh”,
„CertIssuerPublicKey”: „MFkwEwYHKoZIzj0CAQYIKoZIzj0DAQcDQgAEWqBcqitrXTDwE4NLGD07g31S95iGyK2PDP6kdKL/oEHSPtgG77hEAO/hmMqlkDh=hmMqlkDwh=hmMqlkd000000000000000
}
},
"Stare": {
„State”: „jos”,
„Message”: „eșecul bătăilor inimii pentru nodul în stare „necunoscut””,
„Addr”: „172.31.36.138”
}
}
]
Vă rugăm să sugerați cum să urmăriți înapoi și să remediați această problemă?
Problema revine chiar și după înlocuirea cu un nou nod.