Puncte:0

Rețea de stocare dedicată XCP-NG de 10 Gbit lentă (funcționează așa cum ar fi de 1 Gbit)

drapel cn

Am căutat o perioadă și nu găsesc răspuns sau chiar direcții pentru a aștepta înainte.

Asa de. Cluster XCP-NG de trei servere HP DL360p G8, NAS MSA 2060 iSCSI cu 12 unități SAS 10K, QNAP TS-1273U-RP, comutator Mikrotik CRS317. Rețeaua de stocare este în podul dedicat în mikrotik. Toate dispozitivele sunt conectate cu cabluri de cupru de 3 metri. Toate dispozitivele arată că legătura este 10G. Am configurat chiar și MTU la 9000 pentru toate dispozitivele. Fiecare server are card Ethernet cu două interfețe. Unul este folosit doar pentru rețeaua de stocare (eth1 pe toate cele trei servere). Subrețea diferită pentru rețeaua de stocare și rețea de management. Backend-ul rețelei Xen este openvswitch.

Cadrele Jumbo funcționează:

ping -M do -s 8972 -c 2 10.100.200.10 -- QNAP
PING 10.100.200.10 (10.100.200.10) 8972(9000) octeți de date.
8980 de octeți de la 10.100.200.10: icmp_seq=1 ttl=64 time=1.01 ms
8980 de octeți de la 10.100.200.10: icmp_seq=2 ttl=64 time=0,349 ms

--- 10.100.200.10 statistici ping ---
2 pachete transmise, 2 primite, 0% pierdere de pachete, timp 1001 ms
rtt min/avg/max/mdev = 0,349/0,682/1,015/0,333 ms

ping -M do -s 8972 -c 2 10.100.200.8 -- MSA 2060
PING 10.100.200.8 (10.100.200.8) 8972(9000) octeți de date.
8980 de octeți de la 10.100.200.8: icmp_seq=1 ttl=64 timp=9,83 ms
8980 de octeți de la 10.100.200.8: icmp_seq=2 ttl=64 time=0,215 ms

--- 10.100.200.8 statistici ping ---
2 pachete transmise, 2 primite, 0% pierdere de pachete, timp 1001 ms
rtt min/avg/max/mdev = 0,215/5,023/9,832/4,809 ms

Problemă: când copiez o mașină virtuală dintr-un spațiu de stocare (QNAP) în altul (MSA), viteza de scriere este de aproximativ 45 MB/s. Când copiez un fișier mare din QNAP (ex: instalare iso) pe servere de stocare locală, viteza este de aproximativ 100 MB/s și pe acel server htop arată un miez cu încărcare de 100%.

Este clar că rețeaua funcționează ca o rețea 1G.

Câteva informații despre hardware.

ethtool -i eth1
șofer: ixgbe
versiunea: 5.5.2
versiunea de firmware: 0x18b30001
expansion-rom-version:
info autobuz: 0000:07:00.1
suporturi-statistici: da
suporturi-test: da
suportă-eeprom-access: da
suportă-registru-dump: da
suportă-priv-flags: da

ethtool eth1
Setări pentru eth1:
        Porturi acceptate: [ FIBRE ]
        Moduri de legătură acceptate: 10000baseT/Full
        Utilizare acceptată a cadrului de pauză: simetric
        Suportă auto-negociere: Nu
        Moduri FEC acceptate: Nu sunt raportate
        Moduri de link anunțate: 10000baseT/Full
        Utilizarea cadrului de pauză anunțată: simetrică
        Auto-negociere anunțată: Nu
        Moduri FEC anunțate: Nu sunt raportate
        Viteza: 10000 Mb/s
        Duplex: complet
        Port: cupru cu atașare directă
        PHYAD: 0
        Transceiver: intern
        Auto-negociere: dezactivat
        Suporta Wake-on: d
        Trezire: d
        Nivelul curent al mesajului: 0x00000007 (7)
                               link sonda drv
        Link detectat: da

lspci | grep net
07:00.0 Controler Ethernet: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection (rev 01)
07:00.1 Controler Ethernet: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection (rev 01)

Apoi am rulat serverul iper3 pe această gazdă: iperf3 -s -4 Rezultate pe server gazdă:

[ ID] Lățimea de bandă de transfer pe interval
[ 5] 0,00-10,04 sec 0,00 octeți 0,00 biți/sec expeditor
[ 5] 0,00-10,04 sec 5,48 GBytes 4,69 Gbits/sec receptor
[ 7] 0,00-10,04 sec 0,00 octeți 0,00 biți/sec expeditor
[ 7] 0,00-10,04 sec 5,44 GBytes 4,66 Gbits/sec receptor
[SUM] 0,00-10,04 sec 0,00 octeți 0,00 biți/sec expeditor
[SUM] 0,00-10,04 sec 10,9 GBytes 9,35 Gbits/sec receptor

Și client pe o altă gazdă: iperf3 -c 10.100.200.20 -P 2 -t 10 -4 Rezultate pe gazda client:

[ ID] Interval Transfer Bandwidth Retr
[ 4] 0,00-10,00 sec 5,49 GBytes 4,72 Gbits/sec 112 expeditor
[ 4] 0,00-10,00 sec 5,48 GBytes 4,71 Gbits/sec receptor
[ 6] 0,00-10,00 sec 5,45 GBytes 4,68 Gbits/sec 178 expeditor
[ 6] 0,00-10,00 sec 5,44 GBytes 4,67 Gbits/sec receptor
[SUM] 0,00-10,00 sec 10,9 GBytes 9,40 Gbits/sec 290 expeditor
[SUM] 0,00-10,00 sec 10,9 GBytes 9,38 Gbits/sec receptor

Ce să testați în continuare sau cum să găsiți blocajele?

iperf3 arată că legătura funcționează cu o viteză de 10 Gbit sau interpretez incorect rezultatele?

Versiuni de software:

xe host-list params=versiunea-software
versiunea software (MRO): product_version: 8.2.0; text_versiunea_produs: 8.2; product_version_text_short: 8.2; platform_name: XCP; platform_version: 3.2.0; produs_brand: XCP-ng; build_number: release/stockholm/master/7; nume gazdă: localhost; data: 20-05-2021; dbv: 0,0,1; xapi: 1,20; xen: 4,13,1-9,11,1; Linux: 4.19.0+1; xencenter_min: 2,16; xencenter_max: 2,16; network_backend: openvswitch; db_schema: 5.602


versiunea software (MRO): product_version: 8.2.0; text_versiunea_produs: 8.2; product_version_text_short: 8.2; platform_name: XCP; platform_version: 3.2.0; produs_brand: XCP-ng; build_number: release/stockholm/master/7; nume gazdă: localhost; data: 20-05-2021; dbv: 0,0,1; xapi: 1,20; xen: 4,13,1-9,11,1; Linux: 4.19.0+1; xencenter_min: 2,16; xencenter_max: 2,16; network_backend: openvswitch; db_schema: 5.602


versiunea software (MRO): product_version: 8.2.0; text_versiunea_produs: 8.2; product_version_text_short: 8.2; platform_name: XCP; platform_version: 3.2.0; produs_brand: XCP-ng; build_number: release/stockholm/master/7; nume gazdă: localhost; data: 20-05-2021; dbv: 0,0,1; xapi: 1,20; xen: 4,13,1-9,11,1; Linux: 4.19.0+1; xencenter_min: 2,16; xencenter_max: 2,16; network_backend: openvswitch; db_schema: 5.602

Alte două servere au carduri HP 530FLR-SFP+:

    lspci | grep net
    03:00.0 Controler Ethernet: Broadcom Inc. și filiale NetXtreme II BCM57810 10 Gigabit Ethernet (rev. 10)
    03:00.1 Controler Ethernet: Broadcom Inc. și filiale NetXtreme II BCM57810 10 Gigabit Ethernet (rev. 10)

ethtool -i eth1
driver: bnx2x
versiunea: 1.714.24 storm 7.13.11.0
versiunea de firmware: bc 7.10.10
expansion-rom-version:
info autobuz: 0000:03:00.1
suporturi-statistici: da
suporturi-test: da
suportă-eeprom-access: da
suportă-registru-dump: da
suportă-priv-flags: da

ethtool eth1
Setări pentru eth1:
        Porturi acceptate: [ FIBRE ]
        Moduri de legătură acceptate: 1000baseT/Full
                                10000baseT/Full
        Utilizare acceptată a cadrului de pauză: Simetric Receive-only
        Suportă auto-negociere: Nu
        Moduri FEC acceptate: Nu sunt raportate
        Moduri de link anunțate: 10000baseT/Full
        Utilizarea cadrului de pauză anunțată: Nu
        Auto-negociere anunțată: Nu
        Moduri FEC anunțate: Nu sunt raportate
        Viteza: 10000 Mb/s
        Duplex: complet
        Port: cupru cu atașare directă
        PHYAD: 1
        Transceiver: intern
        Auto-negociere: dezactivat
        Suporta Wake-on: g
        Trezire: g
        Nivelul curent al mesajului: 0x00000000 (0)

        Link detectat: da

Editare 1: Test de stocare locală:

dmesg | grep sda
[ 13.093002] sd 0:1:0:0: [sda] 860051248 Blocuri logice de 512 octeți: (440 GB/410 GiB)
[ 13.093077] sd 0:1:0:0: [sda] Protecția la scriere este dezactivată
[ 13.093080] sd 0:1:0:0: [sda] Mode Sense: 73 00 00 08
[ 13.093232] sd 0:1:0:0: [sda] Cache de scriere: dezactivat, cache de citire: activat, nu acceptă DPO sau FUA
[ 13.112781] sda: sda1 sda2 sda3 sda4 sda5 sda6
[ 13.114348] sd 0:1:0:0: [sda] Disc SCSI atașat
[ 15.267456] EXT4-fs (sda1): montarea sistemului de fișiere ext3 folosind subsistemul ext4
[ 15.268750] EXT4-fs (sda1): sistem de fișiere montat cu modul de date ordonat. Opțiuni: (null)
[ 17.597243] EXT4-fs (sda1): remontat. Opțiuni: (null)
[ 18.991998] Adăugarea a 1048572k swap pe /dev/sda6. Prioritate:-2 extinderi:1 peste:1048572k
[ 19.279706] EXT4-fs (sda5): montarea sistemului de fișiere ext3 folosind subsistemul ext4
[ 19.281346] EXT4-fs (sda5): sistem de fișiere montat cu modul de date ordonat. Opțiuni: (null)

dd if=/dev/sda of=/dev/null bs=1024 count=1000000
1000000+0 înregistrări în
1000000+0 înregistrări scoase
1024000000 de octeți (1,0 GB) copiați, 11,1072 s, 92,2 MB/s

Acest lucru este ciudat, deoarece serverul are controler Smart Array P420i cu 2 GB cache, raid hardware10 de 6 unități SAS de 146 GB 15k. iLo arată că cu stocarea totul este ok. Pe un alt server rezultatele sunt similare 1024000000 de octeți (1,0 GB) copiați, 11,8031 s, 86,8 MB/s

Editare 2 (test de stocare partajată):
Qnap (SSD Raid10):

dd if=/run/sr-mount/23d45731-c005-8ad6-a596-bab2d12ec6b5/01ce9f2e-c5b1-4ba8-b783-d3a5c1ac54f0.vhd of=/dev/null bs=102000000
1000000+0 înregistrări în
1000000+0 înregistrări scoase
1024000000 de octeți (1,0 GB) copiați, 11,2902 s, 90,7 MB/s

MSA (raid HP MSA-DP+):

dd if=/dev/mapper/3600c0ff000647bc2259a2f6101000000 of=/dev/null bs=1024 count=1000000
1000000+0 înregistrări în
1000000+0 înregistrări scoase
1024000000 de octeți (1,0 GB) copiați, 11,3974 s, 89,8 MB/s

Nu mai mult de 1 rețea Gigabit... Deci, dacă transfer imagini VM între stocarea partajată, atunci stocarea locală nu este implicată. Openvswitch poate fi blocat?

Editare 3 (Mai multe teste de disc):
sda = Raid10 de 6 x 146GB 15k sas, sdb = un 146GB 15k SAS în raid0

dd if=/dev/sdb of=/dev/null bs=1024 count=1000000
1000000+0 înregistrări în
1000000+0 înregistrări scoase
1024000000 de octeți (1,0 GB) copiați, 16,5326 s, 61,9 MB/s
[14:35 xcp-ng-em ssh]# dd if=/dev/sdb of=/dev/null bs=512k count=1000
1000+0 înregistrări în
1000+0 înregistrări scoase
524288000 octeți (524 MB) copiați, 8,48061 s, 61,8 MB/s
[14:36 ​​xcp-ng-em ssh]# dd if=/dev/sdb of=/dev/null bs=512k count=10000
10000+0 înregistrări în
10000+0 înregistrări scoase
5242880000 de octeți (5,2 GB) copiați, 84,9631 s, 61,7 MB/s
[14:37 xcp-ng-em ssh]# dd if=/dev/sda of=/dev/null bs=512k count=10000
10000+0 înregistrări în
10000+0 înregistrări scoase
5242880000 octeți (5,2 GB) copiați, 7,03023 s, 746 MB/s
Martin avatar
drapel kz
da, testul iperf a arătat că viteza rețelei accesibilă este în jur de 10G. Următorul lucru pe care l-aș testa este performanța stocării: pe ambele servere, faceți un test de citire și un test de scriere. ```dd if=/dev/sda of=/dev/null bs=1024 count=1000000``` de exemplu pentru citire, echivalentul testului de scriere (citește din /dev/zero de exemplu)
drapel cn
`dd if=/dev/sda of=/dev/null bs=1024 count=1000000` `1000000+0 înregistrări în 1000000+0 înregistrări scoase 1024000000 de octeți (1,0 GB) copiați, 11,1072 s, 92,2 MB/s`
Martin avatar
drapel kz
Ți-ai găsit blocajul. Următorul lucru (ar putea fi puțin complicat) pe care l-aș testa este performanța unui singur disc. poate aveți un disc de rezervă conectat, care nu este configurat în interiorul raidului - dacă da, repetați acel test cu un singur disc! Dacă ratele de citire ale unui singur disc sunt mult mai mari, știți că raidcontroller-ul cauzează acele viteze mici...
Michael Hampton avatar
drapel cz
Eh? Citirile de 1K de pe disc par puțin nerealiste. Încercați o dimensiune de bloc mai sănătoasă.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.