Zakaj stopnja značilnosti v višini 0,05?

6574 ogledov

Stopnjo značilnosti uporabljamo pri preverjanju domnev oz. hipotez. Najpogosteje uporabljamo stopnjo značilnosti v višini 0,05, poleg nje so v uporabi tudi stopnje v višini 0,10, 0,01 in 0,001. A zakaj je prav stopnja 0,05 tista, ki jo najpogosteje oz. že kar praviloma uporabimo in je pravzaprav postala sinonim za stopnjo značilnosti?

Pri preverjanju domnev oz. hipotez pravimo, da se je pri izvedbi statističnih analiz potrebno odločiti, kakšno stopnjo značilnosti bomo uporabili. Gre torej za subjektivno odločitev in bi pravzaprav lahko izbrali katero koli stopnjo, če bi za našo odločitev le imeli dovolj dober razlog. Lahko bi izbrali torej stopnjo značilnosti v višini npr. 0,02, 0,06, 0,11. A vseeno se običajno odločamo med najpogosteje uporabljenimi višinami stopnje značilnosti, kot rečeno 0,10, 0,05, 0,01 in 0,001. In največkrat se odločimo prav za stopnjo značilnosti v višini 0,05. Zakaj?

Ob tem vprašanju se poraja tudi vrsta drugih vprašanj. Zakaj je prav stopnja značilnosti v višini 0,05 tista, ki je sprejemljiva? Je to res dokazano najbolj sprejemljiva stopnja? Ali se pri višji stopnji značilnosti kaj nesprejemljivega zgodi z rezultati? Zakaj tega ne razložijo profesorji na predavanjih?

Pozor! Težava študenta Miha!

"Res ne vem, zakaj rezultati ne preverjajo mojih hipotez."

Odgovor na vsa ta vprašanja pa je pravzaprav čisto preprost. Stopnjo značilnosti v višini 0,05 je predlagal R. A. Fisher, osnovalec modernih statističnih metod in ena izmed najpomembnejših oseb v zgodovini statistične znanosti, ostali statistiki in raziskovalci pa so njegovo odločitev sprejeli. Danes se stopnja značilnosti v višini 0,05 uporablja torej zaradi tradicije.

Fisher je leta 1926 objavil svoje zelo pomembno delo The Arrangement of Field Experiments, v katerem je na ilustrativnem primeru pojasnil svojo logiko za izbor stopenj zaupanja. Menil je, da bo ta ilustrativni primer prikazal pomen testiranja pomembnosti. Razmišljal je tako … Koliko let bi moral kmetovalec beležiti svoj pridelek, da bi lahko prepričljivo dokazal razlike med leti? Če bi kmetovalec v svojih 20-letnih izkušnjah z nespremenjenim postopkom gnojenja zemlje lahko rekel, da je bila razlika v pridelku vedno manjša od 0,10, bi takšen rezultat dosegel tisto mejno točko, kjer bi rekli, da nastala razlika je pomembna.

Z grobo ocenjeno stopnjo značilnosti v višini 0,05 bi torej lahko trdili, da se pridelek kmetovalca med leti je statistično značilno razlikoval. Pri tem stopnja značilnosti v višini 0,05 pomeni 5 % možnost, da je ta trditev napačna. Ob tem Fisher razlaga, da v kolikor se nam verjetnost 1:20 (tj. stopnja značilnosti v višini 0,05) ne zdi dovolj visoka, lahko, če želimo, kot mejno verjetnost izberemo tudi 1:50 (tj. stopnja značilnosti v višini 0,02) ali 1:100 (tj. stopnja značilnosti v višini 0,001). Na osnovi tega ilustrativnega primera lahko rečemo, da se Fisher torej ni omejeval zgolj na uporabo stopnje značilnosti v višini 0,05. Ker je bil pragmatik, ga je veliko bolj zanimal praktičen vpliv oz. praktična pomembnost razlik v rezultatih kot pa uporaba enake višine stopnje značilnosti.

Pozor! Težava študenta Miha!

"Res ne vem, zakaj rezultati ne preverjajo mojih hipotez."

Fisher je razvil tudi veliko pomembnih statističnih tabel, ki so se in se še danes pogosto uporabljajo za testiranje stopnje značilnosti. Tudi v teh tabelah je izbral stopnji značilnosti v višini 0,05 in 0,01, čemur je nato sledil cel svet. Ob tem so drugi statistiki izpostavili, da izbrana stopnja značilnosti v višini 0,05 pove, kako pogosto se bomo v naših odločitvah zmotili (v primeru stopnje značilnosti v višini 0,05 se bomo torej v dvajsetih poizkusih zmotili enkrat).

Fisherjev vpliv je bil torej dovolj pomemben, da je danes stopnja značilnosti sinonim za stopnjo značilnosti v višini 0,05. Kljub temu, da se nekaterim statistikom in raziskovalcem ta višina stopnje značilnosti zdi previsoka, drugim prenizka, so vseeno sprejeli dogovor o uporabi stopnje značilnosti v višini 0,05 in le-to tudi sprejeli kot standard. Takšen dogovor je bil nujen tudi z vidika same metode, saj slednja le tako lahko korektno deluje, sicer bi lahko vsak posameznik (v krogu statistikov in raziskovalcev označen kot laik ali amater) vrednost stopnje značilnosti prilagajal potrebam svojih podatkov oz. svojih rezultatov, s tem pa bi vedno znova razvrednotil Fisherjevo metodo. Dogovor o standardni uporabi stopnje značilnosti v višini 0,05 torej tudi skrbi, da takšni stopnji značilnosti lahko zaupamo. Torej, če rezultati kažejo statistično značilno pomembne razlike pri stopnji značilnosti v višini 0,05, lahko zaupamo in verjamemo, da statistično značilne razlike res obstajajo.

Povzeto po: Lynn D. Torbeck: Statistical Solutions: On the Verge of Significance: Why 5%

Se ukvarjate s statistično analizo podatkov in potrebujete pomoč? V podjetju BenSTAT vam bomo svetovali in poskrbeli za kakovostno analizo vaših podatkov. Oglasite se: info@benstat.si!