Regresija u Excel-u je način da se automatizuje statistički proces poređenja nekoliko skupova informacija da se vidi kako promene nezavisnih varijabli utiču na promene u zavisnim varijablama. Ako ste ikada željeli pronaći korelaciju između dvije stvari, korištenje regresijske analize u Excelu je jedan od najboljih načina da to učinite.
Upute u ovom članku odnose se na Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Šta je značenje regresije?
Regresija je pristup statističkog modeliranja koji analitičari koriste za određivanje odnosa između više varijabli.
Regresiona analiza počinje sa jednom varijablom koju pokušavate analizirati i nezavisnim varijablama koje testirate da vidite da li utiču na tu jednu varijablu. Analiza se bavi promjenama nezavisnih varijabli i pokušava povezati te promjene s rezultirajućim promjenama u jednoj (zavisnoj) varijabli.
Ovo može zvučati kao napredna statistika, ali Excel čini ovu složenu analizu dostupnom svima.
Izvođenje linearne regresije u Excelu
Najjednostavniji oblik regresione analize je linearna regresija. Jednostavna linearna regresija gleda na odnos između samo dvije varijable.
Na primjer, sljedeća tabela prikazuje podatke koji sadrže broj kalorija koje je osoba pojela svaki dan i njihovu težinu tog dana.
Pošto ova tabela sadrži dvije kolone podataka, a jedna varijabla potencijalno može utjecati na drugu, možete pokrenuti regresijsku analizu ovih podataka koristeći Excel.
Omogućavanje dodatka za paket alata za analizu
Pre nego što budete mogli da koristite Excelovu funkciju regresijske analize, morate da omogućite dodatak Analysis ToolPak na ekranu sa opcijama programa Excel.
-
U Excel-u odaberite File meni i odaberite Opcije.
-
Odaberite Dodaci u lijevom navigacijskom meniju. Zatim provjerite je li Excel dodaci odabrano u polju Manage.
-
Konačno, odaberite dugme Idi.
-
U iskačućem prozoru dodataka. Omogućite Analysis ToolPack klikom na kvadratić ispred njega da dodate kvačicu i odaberete OK.
Sada kada je paket alata za analizu omogućen, spremni ste da počnete raditi regresionu analizu u Excel-u.
Kako izvesti jednostavnu linearnu regresiju u Excel-u
Koristeći tabelu sa težinom i kalorijama kao primjer, možete izvršiti analizu linearne regresije u Excelu na sljedeći način.
-
Izaberite meni Data. Zatim, u grupi Analysis, odaberite Analiza podataka.
-
U prozoru Analiza podataka, izaberite Regresija sa liste i kliknite OK.
-
Oseg unosa Y je opseg ćelija koji sadrži zavisnu varijablu. U ovom primjeru, to je težina. Input X Range je opseg ćelija koji sadrži nezavisnu varijablu. U ovom primjeru, to je stupac kalorija.
-
Odaberite Labels za ćelije zaglavlja, a zatim odaberite Novi radni list da pošaljete rezultate na novi radni list. Odaberite OK da Excel pokrene analizu i pošalje rezultate u novi list.
-
Proučite novi radni list. Izlaz analize ima niz vrijednosti koje morate razumjeti da biste interpretirali rezultate.
Svaki od ovih brojeva ima sljedeća značenja:
- Multiple R: koeficijent korelacije. 1 označava jaku korelaciju između dvije varijable, dok -1 znači da postoji jaka negativna veza. 0 znači da nema korelacije.
- R kvadrat: Koeficijent determinacije, koji pokazuje koliko bodova između dvije varijable pada na liniju regresije. Statistički, ovo je zbir kvadrata odstupanja od srednje vrijednosti.
- Prilagođeni R kvadrat: Statistička vrijednost nazvana R kvadrat koja je prilagođena broju nezavisnih varijabli koje ste odabrali.
- Standardna greška: Koliko su precizni rezultati regresione analize. Ako je ova greška mala onda su vaši rezultati regresije tačniji.
- Zapažanja: Broj zapažanja u vašem regresijskom modelu.
Preostale vrijednosti u regresijskom izlazu daju vam detalje o manjim komponentama u regresionoj analizi.
- df: Statistička vrijednost poznata kao stepeni slobode u vezi sa izvorima varijanse.
- SS: Zbroj kvadrata. Omjer preostalog zbroja kvadrata u odnosu na ukupni SS bi trebao biti manji ako većina vaših podataka odgovara liniji regresije.
- MS: Srednji kvadrat podataka o regresiji.
- F: F statistika (F-test) za nultu hipotezu. Ovo daje značaj regresijskog modela.
- Značaj F: Statistička vrijednost poznata kao P-vrijednost F.
Osim ako ne razumijete statistiku i izračunavanje regresijskih modela, vrijednosti na dnu sažetka neće imati puno značenja. Međutim, višestruki R i R kvadrat su dva najvažnija.
Kao što možete vidjeti, u ovom primjeru, kalorije imaju jaku korelaciju s ukupnom težinom.
Analiza višestruke linearne regresije u Excelu
Da izvršite istu linearnu regresiju ali sa više nezavisnih varijabli, odaberite cijeli raspon (više kolona i redova) za Input X Range.
Kada odaberete više nezavisnih varijabli, manje je vjerovatno da ćete pronaći tako jaku korelaciju jer postoji toliko mnogo varijabli.
Međutim, regresiona analiza u Excel-u može vam pomoći da pronađete korelacije sa jednom ili više onih varijabli za koje možda ne znate da postoje samo ručnim pregledom podataka.