Am un fișier jurnal ca mai jos:
12-02-2022 15:18:22 +0330 SOCK5.6699 00000 user144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 CONNECT 1:44.1.
12-02-2022 15:18:27 +0330 SOCK5.6699 00094 user156 32.99.193.2:51242 1.1.1.1:443 715 388 0 CONNECT 1.1.1.1:443
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40048 1.1.1.1:443 18105 29029 0 CONNECT 1.1:43.
12-02-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40070 1.1.1.1:443 674 26805 0 CONNECT 1.1.4.3.
12-02-2022 15:20:24 +0330 SOCK5.6699 00000 user143 112.199.63.119:60682 1.1.1.1:443 475 445 0 CONNECT 1.1.31:44.31.
12-02-2022 15:20:37 +0330 SOCK5.6699 00000 user105 191.184.66.98:40102 1.1.1.1:443 12913 18780 0 CONNECT 1.141.1:441.
12-02-2022 15:20:42 +0330 SOCK5.6699 00000 user143 112.199.63.119:60688 1.1.1.1:443 4530 34717 0 CONNECT 1.141.1:443.
12-02-2022 15:20:44 +0330 SOCK5.6699 00000 user127 212.167.145.49:2972 1.1.1.1:443 827 267 0 CONNECT 1.1.1.1:443.1.1
Scopul meu este să extrag două porțiuni din acest fișier jurnal:
- Nume de utilizator
- Adresa IP a sursei utilizatorului
mai jos este un eșantion al porțiunilor de date necesare.
12-02-2022 15:18:22 +0330 SOCK5.6699 00000 utilizator144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 CONECTARE 1.1.1.1:443
Așa că am scris un script Python pentru a extrage ambele elemente și a le stoca în liste separate și apoi le-am alăturat cu funcția zip.
import pprint
importa colecții
iplist=[]
pentru l în date:
ip_port=l[53:71]
iplist.append(ip_port.split(':')[0])
lista de utilizatori=[]
pentru tine in date:
utilizator=u[42:52]
userlist.append(user.replace(" ", ""))
a=listă(zip(iplist,listă utilizatori))
most_ip=colecții.Counter(a).most_common(5)
pprint.pprint(cel mai_ip)
Acest cod funcționează bine și reușesc să obțin IP-ul cel mai utilizat cu numele de utilizator corespunzător.
Trebuie sa mentionez si ca nu am folosit re modul, deoarece lista al doilea IP (IP-ul de destinație care este 1.1.1.1- de care nu-mi pasă)
Întrebare:
Există vreo altă modalitate (mai ordonată) decât modul în care am scris codul?