Distribucija uzorkovanja
Što je distribucija uzorkovanja?Distribucija uzorkovanja je raspodjela vjerojatnosti statistike dobivena velikim brojem uzoraka uzetih iz određene populacije. Distribucija uzorkovanja određene populacije jest raspodjela frekvencija niza različitih ishoda koji bi se mogli dogoditi za statistiku populacije.
Razumijevanje distribucije uzorkovanja
Mnogo podataka koje su prikupili i koristili akademici, statističari, istraživači, trgovci, analitičari itd. Zapravo su uzorci, a ne populacija. Uzorak je podskupina populacije. Na primjer, medicinski istraživač koji je želio usporediti prosječnu težinu svih beba rođenih u Sjevernoj Americi od 1995. do 2005. s onima rođenim u Južnoj Americi u istom vremenskom roku ne može u razumnom roku izvući podatke za cjelokupnu populaciju preko milijun porođaja koji su se dogodili tijekom deset godina. Umjesto toga, upotrijebit će samo težinu, recimo, 100 beba, na svakom kontinentu kako bi zaključio. Težina 200 korištenih beba je uzorak, a prosječna težina izračunata je vrijednost uzorka.
Pretpostavimo sada da umjesto uzimanja samo jednog uzorka od 100 uteža novorođenčadi sa svakog kontinenta, medicinski istraživač uzima ponavljane slučajne uzorke iz opće populacije i izračunava vrijednost uzorka za svaku skupinu uzoraka. Dakle, za Sjevernu Ameriku on izvlači podatke za 100 utega novorođenčadi zabilježenih u SAD-u, Kanadi i Meksiku na sljedeći način: četiri 100 uzoraka iz odabranih bolnica u SAD-u, pet 70 uzoraka iz Kanade i tri 150 zapisa iz Meksika, ukupno od 1200 težina novorođenih beba grupiranih u 12 skupina. On također prikuplja uzorke podataka o 100 rođenih utega iz svake od 12 zemalja Južne Amerike.
Svaki uzorak ima svoju prosječnu vrijednost uzorka, a raspodjela sredstava uzorka poznata je kao raspodjela uzorka.
Izračunana prosječna težina za svaki skup uzoraka je raspodjela uzorka srednje vrijednosti. Iz uzorka se ne može izračunati samo srednja vrijednost. Iz statističkih podataka mogu se izračunati ostale statistike, kao što su standardno odstupanje, varijanca, omjer i raspon. Standardno odstupanje i varijanca mjere varijabilnost raspodjele uzorka.
Broj promatranja u populaciji, broj opažanja u uzorku i postupak koji se koristi za izvlačenje skupa uzoraka određuju varijabilnost raspodjele uzorka. Standardno odstupanje raspodjele uzorka naziva se standardnom pogreškom. Dok je sredina raspodjele uzorka jednaka prosjeku populacije, standardna pogreška ovisi o standardnom odstupanju populacije, veličini populacije i veličini uzorka.
Znajući koliko su srednje vrijednosti svake skupine uzoraka razdvojene jedna od druge i od ukupne populacije, dat će podatak koliko je uzorak prosječan od prosjeka populacije. Standardna pogreška raspodjele uzorka smanjuje se kako se povećava veličina uzorka.
Posebna razmatranja
Populacija ili jedan uzorak skupa brojeva imat će normalnu raspodjelu. Međutim, budući da raspodjela uzorkovanja uključuje više skupova opažanja, neće nužno imati zvonasto zakrivljen oblik.
Slijedom našeg primjera, prosječna težina beba u Sjevernoj i Južnoj Americi ima normalnu raspodjelu, jer će neke bebe imati manje tjelesne težine (ispod srednje vrijednosti) ili prekomjerne težine (iznad srednje vrijednosti), a većina beba će pasti između (oko srednje vrijednosti) ). Ako je prosječna težina novorođenčadi u Sjevernoj Americi sedam kilograma, prosječna težina uzorka u svakom od 12 skupova promatranja uzoraka zabilježenih za Sjevernu Ameriku bit će blizu 7 kilograma.
Međutim, ako prikažete grafikon svake od prosjeka izračunatih u svakoj od 1.200 skupina uzoraka, rezultirajući oblik može rezultirati ujednačenom raspodjelom, ali teško je sa sigurnošću predvidjeti kakav će se stvarni oblik pokazati. Što više uzoraka istraživač koristi od populacije od preko milion težinskih podataka, to će više graf početi formirati normalnu distribuciju.
- Distribucija uzorkovanja je raspodjela vjerojatnosti statistike dobivena velikim brojem uzoraka uzetih iz određene populacije.
- Distribucija uzorkovanja određene populacije jest raspodjela frekvencija niza različitih ishoda koji bi se mogli dogoditi za statistiku populacije.
- Mnogo podataka koje su prikupili i koristili akademici, statističari, istraživači, trgovci i analitičari zapravo su uzorci, a ne populacija.