Pentru a păstra informațiile, trebuie să măriți rezultatul.
Cantitatea maximă de informații pe care o putem păstra este toată.
Acest lucru poate fi realizat prin: de exemplu funcția de identitate. $h(m)=m$
Evident, acest lucru nu oferă deloc compresie.
Teoria informației ne învață că nu putem comprima datele generale, unele date sunt compresibile cu unele funcții, dar nicio funcție nu poate comprima toate datele.
Dacă sunteți în căutarea unei compresii cu pierderi, aceasta vă cere să decideți care informații sunt mai puțin importante, acest lucru este destul de bine înțeles în imagini, video și sunet, dar nu și pentru datele generale.
Pentru date generale, dacă nu vă interesează ce pierdeți, puteți trunchia mesajul și păstra unele informații, nu veți obține mai bine decât atât din motive de teoria informației. o ieșire hash de n biți nu poate avea mai mult de n biți de informații.
Dacă sperați să păstrați o mulțime de informații despre mesajele nealeatoare cu structură necunoscută, funcțiile hash criptografice sunt foarte bune. Aplicați, de exemplu, SHA3-256 unui mesaj compresibil arbitrar și probabil că veți ajunge foarte aproape de 256 de biți de informații.
Din păcate (din fericire) găsirea setului de posibile mesaje care produc un astfel de hash sau spunând ceva interesant despre ele este peste noi.