Dat un set comandat $S$ de numere întregi pozitive (de ex. $S=\{503, 503, 520, 551...N\}$) Vreau să pot dezvălui rangul percentilei (de exemplu, 503 este în prima a 10-a percentila) pentru fiecare element al unui subset contigu de $S$ (adică. $\{s_i,s_{i+1},... s_k\} \;|\; i \ge 0, k \lt N$). Cu toate acestea, nu vreau să scurg informații care pot fi folosite pentru a deduce eficient $N$.
Folosind formula pentru calcularea unui rang percentil al unui punctaj dat din wikipedia:
$$P = \frac{\text{# valori sub scor } s - (0,5 \times \text{# de scoruri cu valoare }s)}{N}$$
Ar trebui să putem rezolva pentru $N$ cu două percentile $p_1$ și $p_2$ și numărul de scoruri dintre ele, $n$ folosind această formulă.
$$
N = \frac{n}{p_2-p_1}
$$
Ca o demonstrație, având în vedere un set de date generat aleatoriu de $N$ de $10,000$ si valori
$p_1=0,0751, p_2 = 0,0951 \text{ și } n=200$
$$N = \frac{200}{0,0951-0,0751}=10.000$$
Se poate face ceva pentru a menține cât mai multă precizie posibil, prevenind în același timp determinarea eficientă a? $N$ (ceva asemănător cu intimitate diferentiata)? Dacă acest lucru este posibil, presupun că va trebui să introduc ceva aleatoriu, totuși nu sunt sigur cum să formulez cât de mult va fi necesar.