După mai multe căutări (mulțumesc pentru indicația din comentarii) am dat peste Schema Crypto-PAn (deseori scris fără cratima ca CryptoPAn), care a fost descris/dezvoltat tocmai în acest scop. Are o mână de implementări software în diferite limbi, dintre care câteva acceptă IPv6.
Proprietatea pe care o căutam se numește „prefix-preserving”, iar lucrarea care a introdus Crypto-PAn oferă o dovadă matematică că există o singură modalitate generală de a face acest lucru (cel puțin într-un mod în care valoarea pentru fiecare parte a prefixului depinde de tot ceea ce vine înaintea lui, spre deosebire de schema independentă pe care am propus-o).
Crypto-PAn implică utilizarea (repetată) a unei funcții pseudoaleatoare (PRF), care în implementarea de referință și majoritatea celorlalte este AES-128-ECB. Adresele IP pseudonimizate pot fi descifrate (când se cunoaște cheia secretă), chiar dacă pentru PRF se folosește o funcție hash, datorită modului în care funcționează algoritmul - cu alte cuvinte Crypto-PAn este o schemă de criptare indiferent de PRF.
Crypto-PAn se întâmplă, de asemenea, să păstreze formatul, astfel încât acest lucru face posibilă lucrarea cu adrese pseudonimizate la fel cum ați face cu originalele.
A fi determinist și a păstra prefixele și a opera pe un spațiu valoric mic vine cu dezavantajul că schema este neapărat slabă la analiza semantică. Este clar că, pentru a avea utilitatea dorită, există un compromis inevitabil în intimitate (pe care îl știam de la început). Cu alte cuvinte, este cel mai bun efort, dar este mai bine decât stocarea adreselor IP originale. Desigur, există tehnici suplimentare care ar putea sau ar trebui folosite pentru a ajuta la atenuarea riscului (de exemplu, rotația cheilor, ștergerea după un timp stabilit, partiționarea cu chei diferite). Evident, sper că celelalte practici ale mele de securitate împiedică expunerea datelor în primul rând.
Există un RFC IETF din 2020 care include un tabelul tehnicilor de anonimizare/pseudonimizare a adresei IP. În afară de Crypto-PAn, singurul care se încadrează atât în categoriile „pseudonimizare” cât și „prefixare prefix” este ceva numit „Top-Hash Subtree-Replicated Anonymization (TSA)”, care aparent este optimizat pentru viteză (probabil că nu este un lucru bun în acest context?), dar vine cu o notă care sugerează că ar putea avea prea multă memorie pentru adrese IPv6 și nu am reușit să găsesc nicio implementare.