Puncte:1

Despre unele teste în NIST SP 800-22 rev 1a și funcția erfc

drapel in

Învăț testul de aleatorie a documentației NIST SP 800-22 rev 1a.

https://csrc.nist.gov/publications/detail/sp/800-22/rev-1a/final

În timp ce citeam, au apărut câteva întrebări și le-am pus așa. Întrebările mele sunt:

  1. În testul de frecvență într-un bloc de 2.2, uitându-ne la (3) din 2.2.4, există o parte care se calculează după cum urmează. $$\chi^2(obs)=4M\sum_{i=1}^{N}(\pi_i - 1/2)^2$$ Nu inteleg de ce se inmulteste aici cu 4.

  2. În testul Runs din 2.3, valoarea p este calculată ca $$Valoarea P = erfc(\frac{|V_n(obs)-2n\pi(1-\pi)|}{2\sqrt{2n}\pi(1-\pi)}).$$ Care este valoarea numitorului aici? Știu că $2\pi(1-\pi)$ este media, dar nu știu de unde a venit numitorul.

  3. Există vreun motiv pentru a găsi valoarea p prin erf în loc de distribuția normală din (2)?

Mulțumesc.

Puncte:0
drapel ru
  1. Acest lucru este îngrijorător. Obisnuitul Pearson $\chi^2$ Test va fi $$M\sum_{i=1}^n\frac{\left(\pi_i-\frac12\right)^2}{\frac12}=2M\sum_{i=1}^n\left(\pi_i- \frac12\right)^2.$$ Mă voi gândi mai mult, dar ar putea merita să arunci acviferele la NIST.

  2. Ar trebui să fie abaterea standard. Pentru biți independenți, distribuiți identic, statistica de rulare ar trebui să fie distribuită binomial. Teorema limită centrală ne spune apoi că binomul poate fi aproximat cu distribuția normală. Rețineți totuși că semnul rădăcinii pătrate ar trebui să se extindă peste $\pi(1-\pi)$ factor.

  3. Funcția erf calculează distribuția normală cu două cozi. Ne interesează atât cazurile în care rulările sunt predominante (adică unde există multe perechi 00 și 11 consecutive), cât și cazurile în care sunt deficitare (adică unde există multe perechi 01 și 10). Ambele prezintă probleme cu distribuția, dar sunt explicate de cozi opuse.

pioneer avatar
drapel in
Multumesc pentru raspuns. Dar nu prea înțeleg al doilea răspuns. Dacă scriu expresia așa cum spui, $p-value$ nu ar trebui să fie $erfc(\frac{|V_n(obs)-n\pi|}{\sqrt{n\pi(1-\pi)}} )$?deoarece pentru CLT trebuie să construiesc expresia $\frac{V_n-np}{\sqrt{npq}}$.
Daniel S avatar
drapel ru
Statistica dvs. ar fi corectă pentru a testa numărul de 1s ($\pi$ este probabilitatea ca un 1 să iasă). Ei numără numărul de 01 și 10. Acestea apar cu probabilitatea $(1-\pi)\pi$ și $\pi(1-\pi)$, astfel încât avem un $\mathrm{Bin}(n-1,2\pi(1-\pi) )$ distributie. Privind mai profund, pare să existe o aproximare ciudată.Din fericire, acest document este în curs de revizuire, așa că poate exista șansa de a clarifica lucrurile în noua versiune.
pioneer avatar
drapel in
După cum ați menționat, este de înțeles că $V_n(obs)$~$Bin(n-1, 2\pi(1-\pi))$ este satisfăcut deoarece numără numărul de 10s și 01s. Cu toate acestea, deoarece chiar și un astfel de caz satisface expresia $P-valoare = erfc(\frac{|V_n(obs)-2n\pi(1-\pi)|}{\sqrt{n2\pi(1-\pi)( 1-2\pi(1-\pi))}}).$, expresia din document nu este satisfăcută. Este greșită expresia din document? (+De fapt, ar trebui să fie scris ca $n-1$ în loc de $n$, este bine să-l schimbi arbitrar?)
Daniel S avatar
drapel ru
Ezit să susțin incorectitudine, deoarece ar putea folosi o aproximare a variației de care nu sunt conștient. Rețineți că expresia dvs. erf necesită un $\sqrt 2$ în numitor. Eroarea de trecere de la $n-1$ la $n$ este neglijabilă pe măsură ce $n$ crește. Cred că merită să ridici aceasta și prima ta interogare cu NIST dacă expresiile încă apar în versiunea revizuită și voi încerca să o fac.
pioneer avatar
drapel in
Înțeleg. Data viitoare, sper ca NIST să revizuiască aceste fapte în mod corespunzător sau să publice un document cu suficiente explicații în acest sens. Vă mulțumesc foarte mult pentru răspunsul bun.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.