Kako napraviti T test u Excelu

Sadržaj:

Kako napraviti T test u Excelu
Kako napraviti T test u Excelu
Anonim

T-test je način da se odluči da li postoje statistički značajne razlike između skupova podataka, koristeći Studentovu t-distribuciju. T-test u Excel-u je T-test sa dva uzorka koji upoređuje srednje vrijednosti dva uzorka. Ovaj članak objašnjava šta znači statistička značajnost i pokazuje kako napraviti T-test u Excelu.

Uputstva u ovom članku odnose se na Excel 2019, 2016, 2013, 2010, 2007; Excel za Microsoft 365 i Excel Online.

Image
Image

Šta je statistička značajnost?

Zamislite da želite znati koja će od dvije kockice dati bolji rezultat. Bacate prvu kockicu i dobijate 2; baciš drugu kockicu i dobiješ 6. Da li vam to govori da druga kocka obično daje veće rezultate? Ako ste odgovorili: “Naravno da ne”, onda već imate određeno razumijevanje statističke važnosti. Razumijete da je razlika nastala zbog nasumične promjene rezultata, svaki put kada se baci kocka. Budući da je uzorak bio vrlo mali (samo jedna rola) nije pokazao ništa značajno.

Sada zamislite da bacite svaku kockicu 6 puta:

  • Prva kocka baca 3, 6, 6, 4, 3, 3; Srednja vrijednost=4,17
  • Druga kocka baca 5, 6, 2, 5, 2, 4; Srednja vrijednost=4.00

Da li ovo sada dokazuje da prva kocka daje više bodova od druge? Vjerovatno ne. Mali uzorak s relativno malom razlikom između srednjih vrijednosti čini vjerovatnim da je razlika još uvijek posljedica slučajnih varijacija. Kako povećavamo broj bacanja kockica, postaje teško dati zdravorazumski odgovor na pitanje - da li je razlika između rezultata rezultat slučajne varijacije ili je vjerojatnije da će jedan dati više bodova od drugog?

Značajnost je vjerovatnoća da je uočena razlika između uzoraka posljedica slučajnih varijacija. Značajnost se često naziva alfa nivoom ili jednostavno 'α'. Nivo pouzdanosti, ili jednostavno 'c,' je vjerovatnoća da razlika između uzoraka nije posljedica slučajne varijacije; drugim riječima, da postoji razlika između osnovnih populacija. Prema tome: c=1 – α

Možemo postaviti 'α' na bilo koji nivo koji želimo, da bismo bili sigurni da smo dokazali značaj. Vrlo često se koristi α=5% (95% pouzdanosti), ali ako želimo biti stvarno sigurni da bilo kakve razlike nisu uzrokovane slučajnim varijacijama, možemo primijeniti viši nivo pouzdanosti, koristeći α=1% ili čak α=0,1 %.

Različiti statistički testovi se koriste za izračunavanje značaja u različitim situacijama. T-testovi se koriste da bi se utvrdilo da li su srednje vrijednosti dvije populacije različite, a F-testovi se koriste da bi se utvrdilo da li su varijanse različite.

Zašto testirati statističku značajnost?

Kada upoređujemo različite stvari, moramo koristiti testiranje značajnosti da utvrdimo da li je jedna bolja od druge. Ovo se odnosi na mnoga polja, na primjer:

  • U poslu ljudi moraju upoređivati različite proizvode i marketinške metode.
  • U sportu ljudi treba da upoređuju različite opreme, tehnike i takmičare.
  • U inženjerstvu, ljudi moraju upoređivati različite dizajne i postavke parametara.

Ako želite da testirate da li nešto radi bolje od nečeg drugog, u bilo kom polju, morate testirati statističku značajnost.

Šta je studentova T-distribucija?

A Studentova t-distribucija je slična normalnoj (ili Gausovoj) raspodjeli. Ovo su obje distribucije u obliku zvona sa većinom rezultata blizu srednje vrijednosti, ali su neki rijetki događaji prilično udaljeni od srednje vrijednosti u oba smjera, koji se nazivaju repovi distribucije.

Tačan oblik Studentove t-distribucije zavisi od veličine uzorka. Za uzorke veće od 30 to je vrlo slično normalnoj distribuciji. Kako se veličina uzorka smanjuje, repovi postaju sve veći, što predstavlja povećanu nesigurnost koja dolazi od zaključivanja na osnovu malog uzorka.

Kako napraviti T-test u Excel-u

Prije nego što možete primijeniti T-test da biste utvrdili postoji li statistički značajna razlika između srednjih vrijednosti dva uzorka, prvo morate izvršiti F-test. To je zato što se za T-test izvode različiti proračuni u zavisnosti od toga da li postoji značajna razlika između varijansi.

Biće vam potreban dodatak Paket alata za analizu omogućen da izvršite ovu analizu.

Provjera i učitavanje dodatka paketa alata za analizu

Da biste provjerili i aktivirali paket alata za analizu slijedite ove korake:

  1. Odaberite karticu FILE >odaberite Opcije.
  2. U dijalogu Opcije odaberite Add-Ins sa kartica na lijevoj strani.
  3. Na dnu prozora izaberite padajući meni Upravljanje, a zatim izaberite Excel dodaci. Odaberite Idi.

    Image
    Image
  4. Provjerite potvrdni okvir pored Paket alata za analizu, zatim odaberite OK.

  5. Paket alata za analizu je sada aktivan i spremni ste za primjenu F-testova i T-testova.

Izvođenje F-testa i T-testa u Excel-u

  1. Unesite dva skupa podataka u tabelu. U ovom slučaju razmatramo prodaju dva proizvoda u toku sedmice. Srednja dnevna vrijednost prodaje za svaki proizvod se također izračunava, zajedno sa njegovom standardnom devijacijom.

    Image
    Image
  2. Odaberite karticu Data > Analiza podataka

    Image
    Image
  3. Izaberite F-Test Two-Sample for Variances sa liste, a zatim odaberite OK.

    Image
    Image

    F-test je vrlo osjetljiv na nenormalnost. Stoga bi možda bilo sigurnije koristiti Welchov test, ali to je teže u Excelu.

  4. Izaberite opseg varijable 1 i opseg promenljive 2; postavite Alpha (0,05 daje 95% pouzdanosti); odaberite ćeliju za gornji lijevi ugao izlaza, s obzirom na to da će to popuniti 3 kolone i 10 redova. Odaberite OK.

    Image
    Image

    Za opseg varijable 1, uzorak sa najvećom standardnom devijacijom (ili varijansom) mora biti odabran.

  5. Pogledajte rezultate F-testa da biste utvrdili postoji li značajna razlika između varijansi. Rezultati daju tri važne vrijednosti:

    • F: Odnos između varijansi.
    • P(F<=f) one-tail: Vjerovatnoća da varijabla 1 zapravo nema veću varijansu od varijable 2. Ako je ovo veće od alfa, što je općenito 0,05, tada nema značajne razlike između varijansi.
    • F Kritičan jedan rep: Vrijednost F koja bi bila potrebna da se dobije P(F<=f)=α. Ako je ova vrijednost veća od F, to također ukazuje da nema značajne razlike između varijansi.

    P(F<=f) se takođe može izračunati korišćenjem funkcije FDIST sa F i stepenima slobode za svaki uzorak kao njegovim ulazima. Stepeni slobode su jednostavno broj zapažanja u uzorku minus jedan.

  6. Sada kada znate da li postoji razlika između varijansi možete odabrati odgovarajući T-test. Odaberite karticu Data > Analiza podataka, a zatim odaberite bilo t-test: dva uzorka uz pretpostavku jednakih varijacijaili t-test: dva uzorka uz pretpostavku nejednakih varijacija

    Image
    Image
  7. Bez obzira koju opciju ste odabrali u prethodnom koraku, prikazat će vam se isti okvir za dijalog za unos detalja analize. Za početak, odaberite raspone koji sadrže uzorke za Varijabla 1 Opseg i Varijabla 2 Opseg.

    Image
    Image
  8. Pod pretpostavkom da želite testirati da nema razlike između srednjih vrijednosti, postavite Hipoteziranu srednju razliku na nulu.
  9. Postavite nivo značajnosti Alpha (0,05 daje 95% pouzdanosti) i odaberite ćeliju za gornji lijevi ugao izlaza, s obzirom da će to popuniti 3 kolone i 14 redova. Odaberite OK.
  10. Pregledajte rezultate da odlučite postoji li značajna razlika između srednjih vrijednosti.

    Baš kao kod F-testa, ako je p-vrijednost, u ovom slučaju P(T<=t), veća od alfa, onda nema značajne razlike. Međutim, u ovom slučaju su date dvije p-vrijednosti, jedna za test s jednim repom, a druga za test s dva repa. U ovom slučaju, koristite vrijednost s dva repa jer bi bilo koja varijabla koja ima veću srednju vrijednost bila značajna razlika.

Preporučuje se: