Cartea „standard” (Dwork & Roth, 2014) definește pierderea confidențialității după cum urmează (p. 18)
Cantitatea
$$
\mathcal{L}^{(\xi)}_{\mathcal{M}(x) || \mathcal{M}(y)} = \ln \left(
\frac{\Pr[\mathcal{M}(x) = \xi]}{\Pr[\mathcal{M}(y) = \xi]}
\dreapta)
$$
este important pentru noi; ne referim la el drept pierderea vieții private suportate prin observare $\xi$. [...] Ca întotdeauna, spațiul de probabilitate este peste monedele mecanismului $\mathcal{M}$.
Deci nu spune că este o variabilă aleatorie.
Din punctul meu de vedere, este doar o funcție cu valoare reală $\mathcal{L}: (\mathcal{M} \times x \times y \times \xi) \to \mathbb{R}$ deoarece emite log al raportului a două probabilități (numerele între 0 și 1).
„Spațiul de probabilitate este peste monede” este puțin confuz, dar cred că se referă aici la $\Pr[.]$ funcţii, din moment ce $\mathcal{M}$ sunt densități de probabilitate sau distribuții discrete.
Cu toate acestea, în multe locuri pe care le-am întâlnit variabila aleatoare a pierderii vieții private, de exemplu. Aici:
Abadi, M., Chu, A., Goodfellow, I., McMahan, H. B., Mironov, I., Talwar, K. și Zhang, L. (2016). Învățare profundă cu confidențialitate diferențială. Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security, 308â318. https://doi.org/10.1145/2976749.2978318
Pierderea confidențialității este o variabilă aleatorie dependentă de zgomotul aleatoriu adăugat algoritmului. [...] În schimb, calculăm momentele de log ale variabilei aleatoare de pierdere a confidențialității, care compun liniar. Folosim apoi momentele legate, împreună cu inegalitatea standard de Markov, pentru a obține limita de coadă, adică pierderea de intimitate în sensul de intimitate diferențială.
Sau aici:
http://www.gautamkamath.com/CS860notes/lec5.pdf
Definiţia 2. Fie $Y$ și $Z$ fie două variabile aleatoare. Variabila aleatorie privind pierderea confidențialității $\mathcal{L}_{Y||Z}$ este [...]
Întrebarea mea este: dacă pierderea confidențialității este o variabilă aleatorie, trebuie să aibă o distribuție de probabilitate corespunzătoare, adică să se integreze la 1. Dar acesta nu pare să fie cazul general al unui log de raport a două PDF-uri (Laplace, Gaussian). ) sau distribuții discrete (mecanism exponențial etc.). De asemenea, nu este menționat niciodată ca o condiție pentru pierderea confidențialității.
Deci: îmi scapa ceva sau este doar un nume înșelător (semantic greșit)?