T-test

Što je T-test?

T-test je vrsta inferencijalne statistike koja se koristi za utvrđivanje postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama može povezati. Najčešće se koristi kada će skupovi podataka, poput skupa podataka zabilježenih kao rezultat prebacivanja novčića 100 puta, uslijediti nakon normalne distribucije i možda će imati nepoznate varijance. T-test koristi se kao alat za testiranje hipoteza, koji omogućava testiranje pretpostavke primjenjive na populaciju.

T-testom se promatra t-statistika, vrijednosti t-distribucije i stupnjevi slobode kako bi se utvrdila vjerojatnost razlike između dva skupa podataka. Za provođenje testa s tri ili više varijabli, treba koristiti analizu varijance.

01:38

T-test

Objašnjenje T-testa

T-test u osnovi omogućuje nam usporedbu prosječnih vrijednosti dvaju skupa podataka i utvrđivanje jesu li potjecale iz iste populacije. U gornjim primjerima, ako bismo uzeli uzorak učenika iz razreda A i drugog uzorka učenika iz razreda B, ne bismo očekivali da oni imaju potpuno jednaku srednju vrijednost i standardnu devijaciju. Slično tome, uzorci uzeti iz kontrolne skupine sa placebom i uzorci iz skupine propisane lijekom trebali bi imati malo drugačiju srednju vrijednost i standardnu devijaciju.

Matematički, t-test uzima uzorak iz svakog od dva skupa i uspostavlja iskaz problema pretpostavljajući nultu hipotezu da su dva sredstva jednaka. Na temelju primjenjivih formula, određene vrijednosti se izračunavaju i uspoređuju sa standardnim vrijednostima, a pretpostavljena nulta hipoteza se prihvaća ili odbija u skladu s tim.

Ako nijedna hipoteza ispunjava uvjete, to znači da su očitanja podataka snažna i nisu slučajna. T-test je samo jedan od mnogih testova koji se koriste u tu svrhu. Statističari moraju dodatno koristiti testove osim t-testa za ispitivanje više varijabli i testova veće veličine uzorka. Za veliku veličinu uzorka, statističari koriste z-test. Ostale mogućnosti testiranja uključuju hi-kvadrat test i f-test.

Postoje tri vrste t-testova i kategoriziraju se kao ovisni i neovisni t-testovi.

Ključni odvodi

T-test je vrsta inferencijalne statistike koja se koristi za utvrđivanje postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama može povezati.
T-test jedan je od mnogih testova koji se koriste u svrhu ispitivanja hipoteza u statistici.
Izračunavanje t-testa zahtijeva tri ključne vrijednosti podataka. Uključuju razliku između srednjih vrijednosti iz svakog skupa podataka (zvanih srednja razlika), standardnog odstupanja svake skupine i broja vrijednosti podataka svake skupine.
Postoji nekoliko različitih vrsta t-testa koji se mogu izvesti ovisno o potrebnim podacima i vrsti analize.

Dvojni rezultati ispitivanja

Uzmite u obzir da proizvođač lijekova želi testirati novo izumljeni lijek. Slijedi standardni postupak pokušaja lijeka na jednoj skupini bolesnika i davanje placeba drugoj skupini, koji se naziva kontrolna skupina. Placebo dodijeljen kontrolnoj skupini je tvar bez namjeravane terapijske vrijednosti i služi kao mjerilo za mjerenje kako druga grupa, na koju je dana stvarni lijek, reagira.

Nakon pokusa s drogom, članovi kontrolne skupine s hranom placebom izvijestili su o povećanju prosječnog životnog vijeka od tri godine, dok članovi grupe kojoj je propisan novi lijek navode povećanje prosječne životne dobi za četiri godine. Trenutno promatranje može ukazivati na to da lijek doista djeluje jer su rezultati bolji za grupu koja koristi lijek. Međutim, također je moguće da opažanje može biti slučajno, posebno iznenađujuće. T-test je koristan za zaključak jesu li rezultati tačni i primjenjivi na cijelu populaciju.

U školi, 100 učenika u razredu A postiglo je prosjek 85%, sa standardnim odstupanjem od 3%. Još 100 učenika koji pripadaju razredu B postiglo je prosječno 87% sa standardnim odstupanjem od 4%. Iako je prosjek razreda B bolji od razreda A, možda nije ispravno skočiti na zaključak da je ukupna uspješnost učenika u razredu B bolja od one u razredu A. To je zato što, zajedno s znači, standardno odstupanje klase B je također veće od onog u klasi A. To ukazuje da su njihovi ekstremni postoci na nižim i višim stranama znatno rašireniji u usporedbi s onom iz klase A. T-testom može pomoći da se utvrdi koja je klasa bolje prošla.

Pretpostavke T-testa

Prva pretpostavka napravljena u vezi s t-testovima odnosi se na mjernu ljestvicu. Pretpostavka za t-test je da mjerna ljestvica primijenjena na prikupljene podatke slijedi kontinuiranu ili ordinalnu ljestvicu, poput rezultata za IQ test.
Druga pretpostavka je jednostavnog slučajnog uzorka da se podaci prikupljaju od reprezentativnog nasumično odabranog dijela ukupne populacije.
Treća pretpostavka su podaci, kada se crtaju, rezultira normalnom distribucijom, zvonastom krivuljom raspodjele.
Četvrta pretpostavka je da je razumno velika veličina uzorka. Veća veličina uzorka znači da bi se distribucija rezultata trebala približiti normalnoj krivulji u obliku zvona.
Konačna pretpostavka je homogenost varijance. Homogena ili jednaka varijanca postoji kada su standardna odstupanja uzoraka približno jednaka.

Proračun T-testova

Izračunavanje t-testa zahtijeva tri ključne vrijednosti podataka. Uključuju razliku između srednjih vrijednosti iz svakog skupa podataka (zvanih srednja razlika), standardnog odstupanja svake skupine i broja vrijednosti podataka svake skupine.

Rezultat t-testa daje t-vrijednost. Ova izračunata t-vrijednost tada se uspoređuje s vrijednošću dobivenom iz tablice kritičnih vrijednosti (koja se naziva T-razdioba tablice). Ova usporedba pomaže da se utvrdi kolika je vjerojatnost da se razlika između sredstava dogodila slučajno ili imaju li skupovi podataka stvarno svojstvene razlike. T-test postavlja pitanje je li razlika između skupina stvarna razlika u studiji ili je vjerovatno besmislena statistička razlika.

T-distribucijske tablice

T-distribucijska tablica dostupna je u formatima s jednim repom i s dva repa. Prva se koristi za procjenu slučajeva koji imaju fiksnu vrijednost ili raspon s jasnim smjerom (pozitivnim ili negativnim). Na primjer, kolika je vjerojatnost da izlazna vrijednost ostane ispod -3 ili dobije više od sedam prilikom kotrljanja para kockica? Potonji se koristi za analizu ograničenja raspona, poput postavljanja pitanja da li koordinate padaju između -2 i +2.

Izračuni se mogu izvoditi sa standardnim softverskim programima koji podržavaju potrebne statističke funkcije, poput onih koje se nalaze u MS Excel-u.

T-vrijednosti i stupnjevi slobode

T-test daje dvije vrijednosti kao svoj izlaz: t-vrijednost i stupanj slobode. T-vrijednost je omjer razlike između srednje vrijednosti dva skupa uzoraka i razlike koja postoji unutar skupa uzoraka. Iako je brojčana vrijednost (razlika između srednje vrijednosti dva skupa uzoraka) jednostavno izračunati, nazivnik (razlika koja postoji unutar skupa uzoraka) može postati malo kompliciran ovisno o vrsti vrijednosti podataka. Naziv omjer je mjerenje disperzije ili varijabilnosti. Veće vrijednosti t-vrijednosti, koja se naziva i t-ocjena, ukazuju na postojanje velike razlike između dva skupa uzoraka. Što je manja t-vrijednost, to je sličnost između dva skupa uzoraka.

Veliki t-rezultat ukazuje na to da su grupe različite.
Mali t-rezultat ukazuje na to da su grupe slične.

Stupnjevi slobode odnose se na vrijednosti studije koja ima slobodu variranja i bitna je za procjenu važnosti i valjanosti nulte hipoteze. Izračunavanje ovih vrijednosti obično ovisi o broju zapisa podataka koji su dostupni u setu uzorka.

Korelirani (ili upareni) T-test

Korelirani t-test izvodi se kad se uzorci obično sastoje od parnih parova sličnih jedinica ili kada postoje slučajevi ponovljenih mjera. Na primjer, mogu postojati slučajevi da se isti pacijenti opetovano testiraju - prije i nakon primanja određenog liječenja. U takvim se slučajevima svaki pacijent koristi kao kontrolni uzorak protiv sebe.

Ova se metoda također primjenjuje u slučajevima kada su uzorci na neki način povezani ili imaju odgovarajuće karakteristike, poput usporedne analize koja uključuje djecu, roditelje ili braću i sestre. Korelirani ili upareni t-testovi ovise o vrsti, jer uključuju slučajeve kada su dva skupa uzoraka međusobno povezana.

Formula za računanje t-vrijednosti i stupnjeva slobode za upareni t-test je:

Srednja vrijednost 1 i srednja vrijednost 2 su prosječne vrijednosti svakog skupa uzoraka, dok var1 i var2 predstavljaju varijancu svakog uzorka.

Preostale dvije vrste pripadaju neovisnim t-testovima. Uzorci ove vrste odabrani su neovisno jedan o drugom - to jest, skupovi podataka u dvije skupine ne odnose se na iste vrijednosti. Uključuju slučajeve poput skupine od 100 pacijenata koji su podijeljeni u dva skupa od 50 pacijenata. Jedna od skupina postaje kontrolna skupina i dobiva joj placebo, dok druga skupina prima propisani tretman. To čini dvije neovisne skupine uzoraka koje nisu spojene jedna s drugom.

T-test s jednakom varijancom (ili sjedinjen)

T-test jednake varijance koristi se kada je broj uzoraka u svakoj skupini isti ili je varijanca dvaju skupa podataka slična. Za izračunavanje t-vrijednosti i stupnjeva slobode za t-test jednake varijance koristi se sljedeća formula:

T-vrijednost = srednja vrijednost 1-srednja vrijednost 2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 drugdje: srednja vrijednost1 i srednja vrijednost = prosječne vrijednosti uzoraka skupa1 i var2 = varijanca svakog od ogledni skupovin1 i n2 = Broj zapisa u svakom uzorku skupa \ start {poravnanje} & \ text {T-vrijednost} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ puta var1 ^ 2 + (n2 - 1) \ puta var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { gdje je:} \\ & mean1 \ tekst {i} mean2 = \ tekst {Prosječne vrijednosti svakog} \\ & \ tekst {skupa uzoraka} \\ & var1 \ text {i} var2 = \ text {Varijanca svakog od ogledni setovi} \\ & n1 \ tekst {i} n2 = \ tekst {Broj zapisa u svakom uzorku skupa} \\ \ kraj {poravnato} T-vrijednost = n1 + n2-2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 srednja1 − srednja2 gdje je: srednja vrijednost1 i srednja vrijednost 2 = prosječne vrijednosti uzorkovanih skupina1 i var2 = varijanca svakog skupa uzorakan1 i n2 = broj zapisa u svakom uzorku set

Stupnjevi slobode = n1 + n2−2 drugdje: n1 i n2 = broj zapisa u svakom uzorku skupa \ početak {poravnanje} & \ text {stupnjevi slobode} = n1 + n2 - 2 \\ & \ textbf {gdje:} \\ & n1 \ text {i} n2 = \ text {Broj zapisa u svakom uzorku skupa} \\ \ kraj {poravnano} Stupnjevi slobode = n1 + n2-2 u drugom mjestu: n1 i n2 = Broj zapisa u svakom uzorku skupa

T-test neravnomjerne varijance

T-test nejednake varijance koristi se kada je broj uzoraka u svakoj grupi različit, a varijanca dvaju skupa podataka je također različita. Ovaj se test naziva i Welchov t-test. Za izračunavanje t-vrijednosti i stupnjeva slobode za t-test neravnomjerne varijance koristi se sljedeća formula:

T-vrijednost = prosjek1 - srednja2var12n1 + var22n2gdje: srednja vrijednost1 i vrijednost2 = Prosječne vrijednosti uzorka skupa1 i var2 = Varijanca svakog skupa uzorakan1 i n2 = Broj zapisa u svakom skupu uzoraka \ početak {usklađeno} & \ tekst {T-vrijednost} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {gdje:} \ \ & mean1 \ text {and} mean2 = \ text {Prosječne vrijednosti svakog} \\ & \ tekst {skupa uzoraka} \\ & var1 \ text {i} var2 = \ text {Varijanca svakog uzorka skupa} \ \ & n1 \ tekst {i} n2 = \ tekst {Broj zapisa u svakom uzorku skupa} \\ \ kraj {poravnano} T-vrijednost = n1var12 + n2var22 srednja1-srednja2 gdje su: srednja vrijednost1 i srednja vrijednost = prosječne vrijednosti od svih uzoraka skupa1 i var2 = Varijanca svakog skupa uzoraka n1 i n2 = Broj zapisa u svakom skupu uzoraka

Stupnjevi slobode = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 drugdje: var1 i var2 = Varijanca svakog od skupa uzorakan1 i n2 = Broj zapisa u svakom skupu uzoraka \ početak {poravnato } & \ text {Stupnjevi slobode} = \ frac {\ lijevo (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ desno) ^ 2} {\ frac {\ lijevo ( \ frac {var1 ^ 2} {n1} \ desno) ^ 2} {n1 - 1} + \ frac {\ lijevo (\ frac {var2 ^ 2} {n2} \ desno) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {and} var2 = \ text {Varijanca svakog uzorka skupa} \\ & n1 \ text {i} n2 = \ text {Broj zapisa u svakom uzorku skupa } \\ \ kraj {usklađeno} Stupnjevi slobode = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 gdje su: var1 i var2 = Varijanca svakog od skupa uzoraka n1 i n2 = Broj zapisa u svakom skupu uzoraka

Određivanje ispravnog T-testa za upotrebu

Sljedeća shema tijeka može se koristiti za određivanje koji se t-test treba koristiti na temelju karakteristika skupa uzoraka. Ključne stavke koje treba uzeti u obzir uključuju jesu li uzorci zapisa slični, broj zapisa podataka u svakom skupu uzoraka i varijanca svakog skupa uzoraka.

Primjer nejednake varijance T-testa

Pretpostavimo da provodimo dijagonalno mjerenje slika primljenih u umjetničkoj galeriji. Jedna skupina uzoraka uključuje 10 slika, dok druga sadrži 20 slika. Skupovi podataka s odgovarajućim srednjim i vrijednostima varijance su kako slijedi:

	Skup 1	Skup 2
	19.7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23.3
	18.5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19.5	20, 6
	21.95	13.7
		23.2
		17.5
		20, 6
		18
		23, 9
		21.6
		24.3
		20.4
		23, 9
		13.3
značiti	19.4	21.6
varijacija	1.4	17.1

Iako je sredina skupa 2 veća od one iz skupa 1, ne možemo zaključiti da sve slike imaju prosječnu dužinu oko 21, 6 jedinica jer je varijanca skupa 2 značajno veća od skupa 1. Je li to slučajno ili postoje razlike zaista u ukupnoj populaciji svih slika dobivenih u umjetničkoj galeriji ">

Kako je broj zapisa podataka različit (n1 = 10 i n2 = 20), a varijanca je također različita, t-vrijednost i stupnjevi slobode izračunavaju se za gornji skup podataka koristeći formulu navedenu u T-testu neravnomjerne varijance. odjeljak.

Vrijednost t je -2.24787. Budući da se znak minus može zanemariti pri uspoređivanju dviju t-vrijednosti, izračunata vrijednost je 2, 24787.

Stupanj vrijednosti slobode iznosi 24, 38 i smanjuje se na 24, zahvaljujući definiciji formule koja zahtijeva zaokruživanje vrijednosti na najmanju moguću cijeli broj.

Kad god se pretpostavi normalna raspodjela, može se odrediti razina vjerojatnosti (alfa razina, razina značajnosti, p ) kao kriterij za prihvaćanje. U većini slučajeva može se pretpostaviti vrijednost od 5%.

Koristeći stupanj vrijednosti slobode kao 24 i 5-postotnu razinu značaja, pogled na tablicu raspodjele t-vrijednosti daje vrijednost od 2.064. Usporedba ove vrijednosti s izračunatom vrijednošću od 2, 224 pokazuje da je izračunata t-vrijednost veća od vrijednosti tablice na razini značajnosti od 5%. Stoga je sigurno odbaciti ništavnu hipotezu da nema razlike između sredstava. Skup stanovništva ima intrinzične razlike i nisu slučajno.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Kako djeluje analiza varijance (ANOVA) Analiza varijance (ANOVA) je alat za statističku analizu koji ukupnu varijabilnost koja se nalazi unutar skupa podataka odvaja u dvije komponente: slučajni i sustavni faktori. više Razumijevanje T Distribucija AT raspodjela je vrsta vjerojatne funkcije koja je prikladna za procjenu populacijskih parametara za male veličine uzorka ili nepoznate varijance. više Stupnjevi slobode Stupnjevi slobode odnose se na maksimalni broj logički neovisnih vrijednosti koje su vrijednosti u kojima se sloboda može mijenjati u uzorku podataka. više Kako djeluje zaostalo standardno odstupanje Zaostalo standardno odstupanje je statistički pojam koji se koristi za opisivanje razlike u standardnim odstupanjima promatranih vrijednosti u odnosu na predviđene vrijednosti, prikazane točkama u regresijskoj analizi. više Kako funkcionira statistika trga Chi-a Statistika hihija (χ2) je test koji mjeri usporedbu očekivanja sa stvarnim promatranim podacima (ili rezultatima modela). Podaci korišteni za izračunavanje statistike kvadratnih Chi moraju biti nasumični, sirovi, međusobno isključivi, izvedeni iz neovisnih varijabli i prikupljeni iz dovoljno velikog uzorka. više Kako se koristi Wilcoxon test Wilcoxon test, koji se odnosi ili na rang Sum test ili na potpisni rang test, je neparametrijski test koji uspoređuje dvije uparene skupine. više partnerskih veza

← Rekordno visok

Razumijevanje eksponencijalnog pomičnog prosjeka nasuprot jednostavnom pomičnom prosjeku →

Preporučeno

Ostavite Komentar