Glavni » poslovni lideri » Chi kvadrat (χ2) Statistička definicija

Chi kvadrat (χ2) Statistička definicija

poslovni lideri : Chi kvadrat (χ2) Statistička definicija
Što je statistika Chi kvadrat?

Chi kvadrat ( χ 2 ) statistika je test koji mjeri usporedbu očekivanja sa stvarnim promatranim podacima (ili rezultatima modela). Podaci korišteni za izračunavanje statistike kvadratnih Chi moraju biti nasumični, sirovi, međusobno isključivi, izvedeni iz neovisnih varijabli i prikupljeni iz dovoljno velikog uzorka. Primjerice, rezultati bacanja novčića 100 puta zadovoljavaju ove kriterije.

Chi kvadratni testovi često se koriste u ispitivanju hipoteza.

Formula za Chi Square je

χc2 = ∑ (Oi − Ei) 2Evdje: c = stupnjevi slobodeO = promatrana vrijednost (e) E = očekivana vrijednost (i) \ početak {poravnano} & \ chi ^ 2_c = \ zbroj \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {gdje:} \\ & c = \ tekst {stupnjevi slobode} \\ & O = \ tekst {promatrana vrijednost (i)} \\ & E ​​= \ tekst {očekivana vrijednost (s )}} \\ \ kraj {poravnano} χc2 = ∑Ei (Oi −Ei) 2 gdje je: c = stupanj slobodeO = promatrana vrijednost (i) E = očekivana vrijednost (i)

Što vam govori statistika Chi trga?

Postoje dvije glavne vrste chi kvadratnih testova: test neovisnosti koji postavlja pitanje odnosa, poput: "Postoji li veza između spola i SAT rezultata?"; i test dobre ispravnosti, koji postavlja pitanje poput "Ako se novčić baci 100 puta, hoće li se dignuti glave 50 puta, a repovi 50 puta?"

Za ove testove koriste se stupnjevi slobode da bi se utvrdilo može li se određena nulta hipoteza odbaciti na temelju ukupnog broja varijabli i uzoraka unutar eksperimenta.

Na primjer, kad se uzmu u obzir studenti i izbor predmeta, veličina uzorka od 30 ili 40 studenata vjerojatno nije dovoljno velika da stvori značajne podatke. Dobivanje istih ili sličnih rezultata studije pomoću veličine uzorka od 400 ili 500 učenika je validnije.

U drugom primjeru razmislite bacanje novčića 100 puta. Očekivani rezultat bacanja pravog kovanica 100 puta je da će se glave dizati 50 puta, a repovi doći 50 puta. Stvarni rezultat može biti da se glave dižu 45 puta, a repovi 55 puta. Statistika kvadratnih Chi pokazuje bilo kakve razlike između očekivanih i stvarnih rezultata.

Ključni odvodi

  • Chi kvadrat (χ 2 ) statistika je test koji mjeri usporedbu očekivanja sa stvarnim promatranim podacima.
  • Postoje dvije glavne vrste hi-kvadrat testova: test neovisnosti podataka i testovi ispravnosti uklapa u model.
  • Ovi testovi mogu se koristiti za utvrđivanje može li se određena nulta hipoteza odbaciti u ispitivanju hipoteza.

Primjer Chi testa kvadrat

Zamislite da je provedena slučajna anketa između 2.000 različitih glasača, i muškaraca i žena. Ljudi koji su odgovarali klasificirani su prema spolu i po tome jesu li republikanski, demokratski ili neovisni. Zamislite mrežu sa stupovima s natpisom republikanska, demokratska i neovisna, te dva reda s oznakom muškarac i žena. Pretpostavimo da su podaci od 2.000 ispitanika sljedeći:

RepublikanacDemokratasamostalanukupno
Muški400300100800
Žena5006001001200
ukupno9009002002000

Prvi korak za izračunavanje hi-kvadrat statistike je pronalazak očekivanih frekvencija. One se izračunavaju za svaku "ćeliju" u mreži. Budući da postoje dvije kategorije roda i tri kategorije političkog stajališta, postoji šest ukupno očekivanih učestalosti. Formula očekivane učestalosti je:

E (r, c) = n (r) × c (r) nigdje: r = red u pitanjec = stupac u pitanjun = odgovarajući ukupni \ početak {poravnano} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {gdje:} \\ & r = \ tekst {redak u pitanju} \\ & c = \ tekst {stupac u pitanju} \\ & n = \ tekst {odgovara ukupno } \\ \ kraj {poravnano} E (r, c) = nn (r) × c (r) gdje je: r = red u pitanjec = stupac u pitanjun = odgovarajući ukupan broj

U ovom primjeru, očekivane frekvencije su:

  • E (1, 1) = (900 x 800) / 2 000 = 360
  • E (1, 2) = (900 x 800) / 2 000 = 360
  • E (1, 3) = (200 x 800) / 2, 000 = 80
  • E (2, 1) = (900 x 1200) / 2, 000 = 540
  • E (2, 2) = (900 x 1, 200) / 2, 000 = 540
  • E (2, 3) = (200 x 1200) / 2 000 = 120

Dalje, ove se vrijednosti koriste za izračun statistike Chi u kvadraturi koristeći sljedeću formulu:

Chi-kvadrat = ∑ [O (r, c) -E (r, c)] 2E (r, c) gdje je: O (r, c) = promatrani podaci za određeni red i stupac \ početi {poravnati} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {gdje:} \\ & O (r, c) = \ tekst {promatrani podaci za dati red i stupac} \\ \ kraj {poravnanje} Chi-kvadrat = ∑E (r, c) [O (r, c) -E (r, c)] 2 gdje je: O (r, c) = promatrani podaci za zadani red i stupac

U ovom primjeru izraz za svaku promatranu vrijednost je:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • 0 (1, 3) = (100 - 80) 2/80 = 5
  • 0 (2, 1) = (500 - 540) 2/540 = 2, 96
  • 0 (2, 2) = (600 - 540) 2/540 = 6, 67
  • 0 (2, 3) = (100 - 120) 2/120 = 3, 33

Statistika Chi u kvadratu tada je jednaka zbroju tih vrijednosti, ili 32, 41. Zatim možemo pogledati tablicu statističkih podataka s kvadratom chi da vidimo, s obzirom na stupnjeve slobode u našoj postavi, je li rezultat statistički značajan ili ne.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Definicija Stupnjeva slobode Stupnjevi slobode odnose se na maksimalni broj logički neovisnih vrijednosti koje su vrijednosti u kojima se sloboda može mijenjati u uzorku podataka. više Definicija T-testa T-test je vrsta inferencijalne statistike koja se koristi za utvrđivanje postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama mogu povezati. više Što nam govori obratna korelacija Inverzna korelacija, poznata i kao negativna korelacija, je suprotan odnos dviju varijabli tako da se kreću u suprotnim smjerovima. više Kako djeluje zaostalo standardno odstupanje Zaostalo standardno odstupanje je statistički pojam koji se koristi za opisivanje razlike u standardnim odstupanjima promatranih vrijednosti u odnosu na predviđene vrijednosti, prikazane točkama u regresijskoj analizi. više Kako djeluje analiza varijance (ANOVA) Analiza varijance (ANOVA) je alat za statističku analizu koji ukupnu varijabilnost koja se nalazi unutar skupa podataka odvaja u dvije komponente: slučajni i sustavni faktori. više Korelacija Korelacija je statistička mjera kretanja dviju vrijednosnih papira u odnosu jedna na drugu. više partnerskih veza
Preporučeno
Ostavite Komentar