Puncte:1

Server

traceroute: uneori routerele nu răspund și utilizatorul vede expirări

ico

27.08.2023, 08:58

Sunt administrator al unei rețele mici și investighez o problemă de care se plâng utilizatorii mei. Rădăcina plângerilor lor este traceroute: uneori, routerele de-a lungul căii pur și simplu nu răspund la traceroute sondele și utilizatorii văd timeout-uri (cele *s în locul RTT).

Rețeaua constă din câteva routere Linux conectate prin Ethernet/wireless. Routere Linux 99% inactiv, utilizare a legăturii 20 Mbit/s, 2000 pachete/s. Wireless este solid. PING pentru toate routerele de-a lungul căii este de 10 ms, cu unele variații, desigur. Flood PING către oricare dintre acele gazde rulează minute în șir fără nicio pierdere de pachete (și mă refer la 0 pachete pierdute). Descărcarea unor fișiere uriașe prin rețea: 10,2 MB/s în medie.

Exemplul corect traceroute arata asa:

# traceroute -nI 10.0.0.2
traceroute la 10.0.0.2 (10.0.0.2), maxim 30 de hopuri, pachete de 60 de octeți
 1 192.168.0.1 3.919 ms 3.866 ms 4.117 ms
 2 10.41.13.1 4.149 ms 6.714 ms 6.707 ms
 3 10.41.1.11 8.475 ms 8.468 ms 8.705 ms
 4 10.0.0.2 8.697 ms 9.428 ms 9.707 ms

The problematic traceroutearata asa:

# traceroute -nI 10.0.0.2
traceroute la 10.0.0.2 (10.0.0.2), maxim 30 de hopuri, pachete de 60 de octeți
 1 192.168.0.1 3.190 ms 3.140 ms 3.128 ms
 2 10.41.13.1 3.119 ms 3.113 ms *
 3 10.41.1.11 3.697 ms * 3.683 ms
 4 10.0.0.2 4.531 ms 4.524 ms 5.171 ms
# traceroute -nI 10.0.0.2
traceroute la 10.0.0.2 (10.0.0.2), maxim 30 de hopuri, pachete de 60 de octeți
 1 192.168.0.1 3.471 ms 3.405 ms 3.388 ms
 2 10.41.13.1 3.372 ms 3.359 ms 3.350 ms
 3 10.41.1.11 5.039 ms * *
 4 10.0.0.2 5.105 ms 5.484 ms 5.473 ms

Am investigat puțin cu tcpdump și a aflat că traceroute functioneaza astfel:

La început trimite o grămadă de solicitări ICMP cu TTL de 1, 2, 3, 4, 5, 6. Fiecare TTL este trimis de 3 ori. Adică 18 pachete :)
Asteapta ceva timp pentru toate raspunsurile (Timp depășit).
Când revin toate răspunsurile, afișați rezultatele.
..sau așteptați expirarea timpului și afișați rezultatele cu răspunsurile lipsă marcate cu asteriscuri.

Și cauza timeout-urilor este - routerele primesc toate cele 3 solicitări respective, dar uneori nu răspund, nu trimit ICMP Time Exceeded.

Bănuiesc că există unele setări care stabilesc acest comportament pe router. Și anume icmp_ratelimit, icmp_ratemask, icmp_msgs_per_sec și icmp_msgs_burst. Toate descrise cumva la documentele kernel.org. Și aici este punctul în care am eșuat. Nu am venit cu valori ale acelor variabile pentru a face traceroute lucrează tot timpul.

Am încercat să setez asta pe toate routerele:

icmp_ratelimit setat la 0 (nu limita nimic)
icmp_msgs_per_sec setat la 10000 (ar trebui să fie suficient de mare)
icmp_msgs_burst setat la 5000 (destul de sus)

Nu m-a ajutat, văd același comportament, timeout-uri aleatorii. Nu m-am încurcat icmp_ratemask, pentru că nu înțeleg pe deplin cum să exclud Timp depășiteste de la limitare.

Deci, în sfârșit, întrebări:

Dacă sunteți familiarizat cu acest tip de traceroute probleme, cum ai rezolvat-o?
Dacă sunteți familiarizat cu setările kernelului menționate mai sus, care sunt valorile „suficient de bune”?
Care este modalitatea corectă de modificare icmp_ratemask a nu limita Timp depășit mesaje de făcut traceroute lucreaza fara probleme?
Și în plus - există încălcări de securitate la modificarea acestor setări (sau a altor setări asociate)? Nu vreau să fiu DoS-ul și nici să fiu o sursă de atac DDoS pentru nimeni.

0 + 0

linux

icmp

limitare de rata

traceroute

Brahim Gaabab

27.08.2023, 09:56

În linux traceroute, este posibil să folosiți sonde UDP în loc de ICMP (utilizați opțiunea `-U`). Vă poate ajuta să decideți dacă acest lucru are legătură cu setările ICMP.

Răspunde

John Hanley

27.08.2023, 10:20

Routerele nu sunt obligate să răspundă la ICMP.A vedea un * nu înseamnă nimic și ar trebui ignorat.

Răspunde

ico

27.08.2023, 11:54

UDP/TCP/ICMP traceroutes: Nu am fost clar despre acest lucru, îmi pare rău. Nu contează ce protocol folosesc pentru traceroute. Timeout-urile sunt văzute la trasarea de pe mașinile Windows (ICMP implicit) sau de la mașinile Linux (UDP implicit, ICMP opțional). Eu personal încerc să folosesc versiunea ICMP, deoarece TCP/UDP au alte probleme cu firewall-urile, ICMP este de obicei permis.

Răspunde

ico

27.08.2023, 12:00

John Hanley: Este adevărat. Dar încercați să îi explicați utilizatorului :) Oricum, văd aceste timeout-uri în rețeaua mea mai des decât pe internet. Și din moment ce sunt root pe acele routere, aș dori să le „forțez” să răspundă la traceroute.

Răspunde

John Hanley

27.08.2023, 18:52

Nu puteți forța routerele să răspundă la „bună ziua, ce mai faceți astăzi?” mesaje. Routerul ar putea fi prea ocupat pentru a-ți deranja mesajele. Răspunsul este opțional. Nu folosesc niciodată ping pentru a verifica conectivitatea la rețea sau pentru a depana problemele de rețea. ICMP este un protocol străvechi care are o valoare mică astăzi. ICMP este unul dintre primele elemente pe care le dezactivez pe sistemele mele.

Răspunde

Puncte:0

Server

DeemV

27.08.2023, 19:24

Ca parte a politicilor planului de control privind hopurile, sondele ICMP sunt în mare parte ignorate. Aș sugera o instanță dedicată pentru fumatul la pret dacă doriți să aveți date istorice mai detaliate, în ceea ce privește valorile și tendințele.

0 + 0

ico

28.08.2023, 19:38

Ei bine, folosesc icinga pentru a monitoriza rețeaua. Există, de asemenea, un daemon colectat pe fiecare mașină Linux, datele colectate pot fi văzute frumos cu grafana. Am creat, de asemenea, un daemon pentru a trimite ping la „gazde interregante” în rețea și pentru a reprezenta grafice (cum ar fi cacti sau smokeping). Deci cunosc starea rețelei. Dar utilizatorii mei nu - văd asteriscuri în traceroute și asta înseamnă o rețea cu probleme (pentru ei).. :(

Răspunde

SEF 777

întrebarea această in alte limbi:

EN: traceroute: sometimes routers don't respond and user sees timeouts

TH: traceroute: บางครั้งเราเตอร์ไม่ตอบสนองและผู้ใช้เห็นการหมดเวลา

RO: traceroute: uneori routerele nu răspund și utilizatorul vede expirări

RU: traceroute: иногда маршрутизаторы не отвечают, и пользователь видит тайм-ауты

VI: traceroute: sometimes routers don't respond and user sees timeouts

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.