Glavni » algoritamsko trgovanje » Stratificirano slučajno uzorkovanje

Stratificirano slučajno uzorkovanje

algoritamsko trgovanje : Stratificirano slučajno uzorkovanje
Što je stratificirano slučajno uzorkovanje?

Stratificirano nasumično uzorkovanje metoda je uzorkovanja koja uključuje podjelu populacije u manje podskupine poznate kao slojevi. U stratificiranom nasumičnom uzorkovanju ili stratifikaciji, slojevi se formiraju na temelju zajedničkih atributa ili karakteristika članova kao što su dohodak ili obrazovanje.

Stratificirano slučajno uzorkovanje naziva se i proporcionalno slučajno uzorkovanje ili kvotno nasumično uzorkovanje.

[Važno: Stratificirano uzorkovanje koristi se za isticanje razlika među skupinama u populaciji, za razliku od jednostavnog slučajnog uzorkovanja, koje sve članove populacije tretira kao jednake, s jednakom vjerojatnoćom uzorkovanja.]

01:40

Stratificirano slučajno uzorkovanje

Kako djeluje stratificirano slučajno uzorkovanje

Kada dovrši analizu ili istraživanje grupe entiteta sa sličnim karakteristikama, istraživač može otkriti da je brojnost stanovništva prevelika da bi se moglo završiti istraživanje. Da uštedi vrijeme i novac, analitičar može uzeti izvediviji pristup odabirom male skupine iz populacije. Mala se skupina naziva veličinom uzorka, što je podskup stanovništva koji se koristi za predstavljanje čitave populacije. Uzorak se može odabrati iz populacije na više načina, od kojih je jedan stratificirani slučajni postupak uzorkovanja.

Stratificirano nasumično uzorkovanje uključuje podjelu čitave populacije u homogene skupine koje se zovu strata (množina za stratum). Izabrani su nasumični uzorci iz svakog sloja. Na primjer, razmislite o akademskom istraživaču koji bi želio znati broj studenata MBA u 2007. koji su dobili ponudu za posao u roku od tri mjeseca nakon diplome.

Uskoro će otkriti da je za tu godinu bilo gotovo 200 000 MBA diplomanata. Mogao bi odlučiti uzeti samo slučajni uzorak od 50 000 diplomanata i pokrenuti anketu. Što je još bolje, mogao je podijeliti populaciju na slojeve i uzeti slučajni uzorak iz slojeva. Da bi to učinio, stvorio bi skupine stanovništva na temelju spola, dobnog raspona, rase, zemlje državljanstva i podrijetla karijere. Nasumičan uzorak iz svakog sloja uzima se u broju proporcionalnom veličini sloja u odnosu na populaciju. Te podskupine slojeva se tada spajaju radi stvaranja slučajnog uzorka.

Ključni odvodi

  • Stratificirano slučajno uzorkovanje omogućava istraživačima da dobiju uzorak populacije koji najbolje predstavlja cjelokupnu populaciju koja se proučava.
  • Stratificirano nasumično uzorkovanje uključuje podjelu čitave populacije u homogene skupine koje se zovu slojevi.
  • Stratificirano slučajno uzorkovanje razlikuje se od jednostavnog slučajnog uzorkovanja koje uključuje slučajni odabir podataka iz cijele populacije, tako da je svaki mogući uzorak podjednako vjerovatno.

Primjer stratificiranog slučajnog uzorkovanja

Pretpostavimo da istraživački tim želi utvrditi ukupnu ocjenu studenata na sveučilištu u SAD-u. Istraživački tim ima poteškoće u prikupljanju podataka od svih 21 milijuna studenata; odlučuje uzeti slučajni uzorak stanovništva koristeći 4000 učenika.

Pretpostavite da tim razmatra atribute sudionika u uzorku i pita se postoje li razlike u GPA-ima i studentskim smjernicama. Pretpostavimo da se utvrdi da su 560 učenika engleske, 1135 matematičkih, 800 informatičkih, 1.090 tehničkih, a 415 matematičkih. Tim želi koristiti proporcionalni stratificirani slučajni uzorak gdje je sloj uzorka proporcionalan slučajnom uzorku u populaciji.

Pretpostavimo da tim istražuje demografiju studenata sveučilišta u SAD-u i pronalazi postotak onoga što studenti u 12% studenata engleskog jezika, 28% znanosti u znanosti, 24% znanosti u računalstvu, 21% znanosti u inženjerstvu, a 15% glavnih znanosti iz matematike. Tako se iz stratificiranog postupka slučajnog uzorkovanja stvara pet slojeva.

Tim tada mora potvrditi da je sloj populacije proporcionalan sloju u uzorku; međutim, zaključuju kako proporcije nisu jednake. Tim će tada morati ponovno uzorkovati 4.000 učenika iz populacije i nasumično odabrati 480 engleskog, 1.120, 960 informatičkih, 840 inženjerskih i 600 studenata matematike.

S tim, on ima proporcionalan stratificirani slučajni uzorak studenata, koji omogućava bolju zastupljenost studentskih fakulteta u SAD-u. Zatim istraživači mogu istaknuti određeni sloj, promatrati različite studije američkih studenata i primijetiti različite prosjeke bodova,

Jednostavni nasumični nasloni stratificirani slučajnim uzorcima

Jednostavni slučajni uzorci i slojeviti slučajni uzorci oba su statistička mjerna sredstva. Jednostavni slučajni uzorak koristi se za predstavljanje cijele populacije podataka. Stratificirani slučajni uzorak dijeli populaciju na manje grupe ili slojeve, na temelju zajedničkih karakteristika.

Jednostavni slučajni uzorak često se koristi kada je na raspolaganju vrlo malo podataka o populaciji podataka, kada populacija podataka ima previše previše razlika koje bi se podijelile u različite podskupove ili kada postoji samo jedna karakteristična karakteristika među populacijom podataka.

Na primjer, tvrtka koja se bavi slatkišima možda želi proučiti navike kupca svojih kupaca kako bi odredila budućnost svoje linije proizvoda. Ako ima 10 000 kupaca, on se može odlučiti za 100 takvih kupaca kao slučajni uzorak. Tada može primijeniti ono što nađe od tih 100 kupaca na ostatak baze. Za razliku od stratifikacije, uzorkovat će 100 članova nasumično, bez obzira na njihove pojedinačne karakteristike.

Proporcionalna i nesrazmjerna stratifikacija

Stratificirano slučajno uzorkovanje osigurava da je svaka podskupina određene populacije adekvatno zastupljena unutar čitave uzorke populacije u jednom istraživačkom istraživanju. Stratifikacija može biti proporcionalna ili nesrazmjerna. U proporcionalnoj stratifikovanoj metodi, veličina uzorka svakog sloja proporcionalna je veličini populacije sloja.

Na primjer, ako je istraživač želio uzorak od 50 000 maturanata koristeći dobni raspon, dobiva se proporcionalni stratificirani slučajni uzorak pomoću ove formule: (veličina uzorka / veličina populacije) x veličina sloja. Tablica u nastavku pretpostavlja broj stanovnika od 180 000 MBA diplomanata godišnje.

Dobna skupina


24-28


29-33


34-37


ukupno


Broj ljudi u stratumu


90.000


60.000


30.000


180.000


Veličina uzorka slojeva


25.000


16.667


8333


50.000


Veličina uzorka strata za diplomante MBA u dobnom rasponu od 24 do 28 godina izračunava se kao (50 000/180 000) x 90 000 = 25 000. Ista metoda koristi se i za ostale dobne skupine. Sada kada je poznata veličina uzorka, istraživač može izvesti jednostavno nasumično uzorkovanje u svakom sloju kako bi odabrao svoje sudionike u istraživanju. Drugim riječima, 25.000 maturanata iz dobne skupine od 24 do 28 godina odabirat će se nasumično iz cijele populacije, 16.667 maturanata iz starosnog raspona od 29 do 33 godine nasumično će biti odabrano iz populacije, i tako dalje.

U neproporcionalnom stratificiranom uzorku, veličina svakog sloja nije proporcionalna njegovoj veličini u populaciji. Istraživač može odlučiti uzorkovati 1/2 maturanata unutar dobne skupine od 34 do 37 godina i 1/3 maturanata unutar dobne skupine od 29 do 33 godine.

Važno je napomenuti da se jedna osoba ne može uklopiti u više slojeva. Svaki se subjekt mora uklopiti samo u jedan sloj. Preklapanje podskupina znači da će neki pojedinci imati veće šanse da budu odabrani za anketu, što u potpunosti negira koncept stratificiranog uzorkovanja kao vrste uzorkovanja vjerojatnosti.

[Važno: Upravitelji portfelja mogu koristiti stratificirano slučajno uzorkovanje za stvaranje portfelja preslikavanjem indeksa, poput indeksa obveznica.]

Prednosti stratificiranog slučajnog uzorkovanja

Glavna prednost stratificiranog slučajnog uzorkovanja jest ta što bilježi ključne karakteristike populacije u uzorku. Slično kao ponderirani prosjek, ova metoda uzorkovanja daje karakteristike u uzorku koje su proporcionalne ukupnoj populaciji. Stratificirano nasumično uzorkovanje dobro djeluje za populaciju s različitim atributima, ali inače je neučinkovito ako se ne mogu formirati podskupine.

Stratifikacija daje manju pogrešku u procjeni i veću preciznost od jednostavne metode slučajnog uzorkovanja. Što su veće razlike između slojeva, to je veći i precizniji dobitak.

Nedostaci stratificiranog slučajnog uzorkovanja

Nažalost, ova metoda istraživanja ne može se koristiti u svakoj studiji. Nedostatak metode je u tome što mora biti ispunjeno nekoliko uvjeta da bi se pravilno koristila. Istraživači moraju identificirati svakog člana populacije koja se proučava te ih klasificirati u jednu, i to samo jednu, potpopulaciju. Kao rezultat toga, stratificirano nasumično uzorkovanje je nepovoljno kada istraživači ne mogu pouzdano klasificirati svakog člana populacije u podskupinu. Nadalje, pronalaženje iscrpnog i konačnog popisa cijele populacije može biti izazovno.

Preklapanje može biti problem ako postoje predmeti koji spadaju u više podskupina. Kad se obavlja jednostavno nasumično uzorkovanje, vjerojatnije je da će biti izabrani oni koji su u više podskupina. Rezultat toga bi mogao biti pogrešno predstavljanje ili netočno odražavanje stanovništva.

Gornji primjeri olakšavaju: dodiplomski, diplomski, muški i ženski jasno su definirane skupine. U drugim situacijama, međutim, to može biti puno teže. Zamislite da uključuju karakteristike poput rase, etničke pripadnosti ili religije. Proces razvrstavanja postaje teži, što stratificirano slučajno uzorkovanje čini neučinkovitom i manje od idealne metode.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Uzorak Uzorak je manja, upravljana verzija veće grupe. Uzorci se koriste u statističkim ispitivanjima kad su veličine stanovništva prevelike. više Kako rade jednostavni slučajni uzorci Jednostavni slučajni uzorak je podskup statističke populacije u kojoj svaki član podskupine ima jednaku vjerojatnost odabira. Jednostavni slučajni uzorak zamišljen je kao nepristran predstavljanje grupe. više Reprezentativni uzorak često se koristi za ekstrapoliranje širih osjećaja Reprezentativni uzorak je podskup populacije koji odražava karakteristike čitave populacije. više Uvidi i isključenja sustavnog uzorkovanja Sustavno uzorkovanje metoda je vjerojatnosti uzorkovanja u kojoj se bira slučajni uzorak iz veće populacije. više Definicija uzorkovanja Uzorkovanje je postupak koji se koristi u statističkoj analizi u kojoj se skupina opažanja izvlači iz veće populacije. više Definicija T-testa T-test je vrsta inferencijalne statistike koja se koristi za utvrđivanje postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama mogu povezati. više partnerskih veza
Preporučeno
Ostavite Komentar