Regresijska analiza

22764 ogledov

Regresijska analiza je statistična metoda, s katero preverjamo vpliv neodvisnih spremenljivk na odvisno spremenljivko. Poznamo več vrst regresijske analize, najenostavnejša in tudi najpogosteje uporabljena je linearna regresijska analiza.

Z regresijsko analizo (ang. Regression analysis) preverjamo, kakšen bi bil vpliv ene ali več spremenljivk na spremenljivko (npr. kako izobrazba vpliva na število ur branja knjig na teden), če nanjo ne bi vplivalo nič drugega. Kadar preverjamo vpliv ene spremenljivke, govorimo o enostavni regresijski analizi (ang. Simple regression), v primeru preverjanja vplivov več spremenljivk govorimo o večkratni/multipli regresijski analizi (ang. Multiple regression). Rezultat regresijske analize ni enak rezultatu korelacijske analize (ang. Correlation analysis), kar se v praksi pogosto enači. V osnovi je potrebno razlikovati, kdaj govorimo o vplivu (ki je enosmeren) in kdaj o povezanosti/korelaciji (ki je dvosmerna).

Vpliv in povezanost

Spremenljivke v regresijski analizi poimenujemo glede na njihovo vlogo v analizi. Govorimo o eni odvisni spremenljivki (ang. Dependent variable) in eni ali več neodvisnih spremenljivkah (ang. Independent variable). Odvisno spremenljivko označujemo z Y, neodvisne spremenljivke označujemo z X. Z vidika merske lestvice v regresijsko analizo lahko vključimo vse tipe spremenljivk, od nominalnih (ki sicer pred uporabo potrebujejo posebno obravnavo) do razmernostnih. Glede na merske lastnosti odvisne spremenljivke izberemo ustrezno vrsto regresijske analize (linearna, logistična, ordinalna…). Regresijski model zapišemo v obliki regresijske enačbe, in sicer:

Regresijska enačba

…kjer ε predstavlja člen napake modela in b regresijski koeficient.

V praksi se najpogosteje uporablja linearna regresijska analiza (ang. Linear regression). A predstavljanje njenih rezultatov je običajno zgolj osnovno – direktna obravnava končnega rezultata brez predhodnega preverjanja kakovosti regresijskega modela. Čeprav gre za bolj znano statistično metodo, opažamo splošno slabo poznavanje njenih številnih predpostavk (dovolj velik vzorec, linearni odnos, normalna porazdelitev ostankov, multikolinearnost, homoskedastičnost…) in nezavedanje dejstva, da v kolikor predpostavke niso izpolnjene predstavljamo nekakovostne (neveljavne, nezanesljive) rezultate. Če boste vaše hipoteze preverjali z regresijsko analizo brez pomoči strokovnjaka vsekakor priporočamo, da sledite pravilnemu procesu izvedbe analize v treh korakih:

  1. preverjanje predpostavk
  2. preverjanje smiselnosti modela
  3. interpretacija regresijskih koeficientov

Še preden začnete analizirati podatke vam priporočamo, da se seznanite z vsaj osnovno teorijo o regresijski analizi in še drugimi strokovnimi termini (regresijski koeficienti, determinacijski koeficient, delež pojasnjene variance…), ki jih na tem mestu nismo posebej obravnavali.

Se ukvarjate s statistično analizo podatkov in potrebujete pomoč pri regresijski analizi? Ne veste, kako preveriti predpostavke in smiselnost modela? V podjetju BenSTAT vam svetujemo in pomagamo do kakovostnih rezultatov regresijske analize. Oglasite se: info@benstat.si