Glavni » algoritamsko trgovanje » Neparametrijska statistika

Neparametrijska statistika

algoritamsko trgovanje : Neparametrijska statistika
Što su neparametrijska statistika?

Neparametrijska statistika odnosi se na statističku metodu u kojoj se podaci ne trebaju prilagoditi normalnoj distribuciji. Neparametrijska statistika koristi podatke koji su često redovni, što znači da se ne oslanjaju na brojeve, već na rangiranje ili redoslijed vrsta. Na primjer, anketa koja prenosi preferencije potrošača u rasponu od nepodnošljivosti smatrat će se redovnim podacima.

Neparametrijska statistika uključuje neparametrijske opisne statistike, statističke modele, zaključke i statističke testove. Struktura modela neparametrijskih modela nije unaprijed određena , već je umjesto toga određena iz podataka. Izraz neparametrijski ne znači da takvim modelima u potpunosti nedostaju parametri, već da su broj i priroda parametara fleksibilni i nisu unaprijed određeni. Histogram je primjer neparametrijske procjene distribucije vjerojatnosti.

Razumijevanje neparametrijske statistike

U statističkim podacima, parametrijska statistika uključuje parametre kao što su srednja, srednja, standardna devijacija, varijanca itd. Ovaj oblik statistike koristi promatrane podatke za procjenu parametara distribucije. Pod parametrijskom statistikom pretpostavlja se da podaci odgovaraju normalnoj raspodjeli s nepoznatim parametrima μ (prosječna populacija) i σ 2 (varijanca populacije), koji se zatim procjenjuju korištenjem srednje vrijednosti uzorka i varijance uzorka.

Neparametrijska statistika ne pretpostavlja o veličini uzorka ili je li promatrani podaci kvantitativni.

Neparametrijska statistika ne pretpostavlja da su podaci dobiveni iz normalne distribucije. Umjesto toga, oblik distribucije procjenjuje se prema ovom obliku statističkog mjerenja. Iako postoji mnogo situacija u kojima se može pretpostaviti normalna distribucija, postoje i neki scenariji u kojima neće biti moguće odrediti hoće li se podaci normalno distribuirati.

Primjeri neparametrijske statistike

U prvom primjeru razmislite o istraživaču koji želi da procjena broja beba u Sjevernoj Americi rođenih smeđih očiju može odlučiti uzeti uzorak od 150 000 beba i pokrenuti analizu skupa podataka. Mjerenje koje dobivaju koristit će se za procjenu cjelokupne populacije beba sa smeđim očima rođenim sljedeće godine.

Za drugi primjer, razmislite o drugom istraživaču koji želi znati je li odlazak u krevet rano ili kasno povezan s time koliko često se neko razboli. Pod pretpostavkom da je uzorak odabran nasumično iz populacije, može se pretpostaviti da je raspodjela učestalosti bolesti u uzorku normalna. Međutim, za eksperiment koji mjeri otpornost ljudskog tijela na soj bakterija ne može se pretpostaviti da ima normalnu distribuciju.

To je zbog toga što slučajno odabrani podaci uzorka mogu biti otporni na soj. S druge strane, ako istraživač razmotri čimbenike kao što su genetska struktura i etnička pripadnost, možda će otkriti da veličina uzorka odabrana korištenjem ovih karakteristika možda nije otporna na soj. Dakle, ne može se pretpostaviti normalna raspodjela.

Ova je metoda korisna kada podaci nemaju jasnu numeričku interpretaciju i najbolje ih je koristiti s podacima koji imaju sortiranje. Na primjer, test za procjenu ličnosti može imati rang svojih mjernih podataka postavljenih na način da se izrazito ne slažu, ne slažu, ravnodušni, slažu i snažno se slažu. U ovom slučaju treba koristiti neparametrijske metode.

Posebna razmatranja

Neparametrijska statistika stekla je na uvidu zbog svoje jednostavnosti upotrebe. Kako se smanjuje potreba za parametrima, podaci postaju primjenjiviji na veće testove. Ova vrsta statistike može se koristiti bez srednje vrijednosti, veličine uzorka, standardnog odstupanja ili procjene bilo kojih drugih povezanih parametara kada nijedan od tih podataka nije dostupan.

Budući da neparametrijska statistika čini manje pretpostavki o uzorkovanim podacima, njegova primjena je šireg opsega od parametrijske statistike. U slučajevima kada je parametrijsko ispitivanje prikladnije, neparametrijske metode bit će manje učinkovite. To je zato što rezultati dobiveni iz neparametrijske statistike imaju niži stupanj pouzdanosti nego ako su rezultati dobiveni korištenjem parametrijske statistike.

Ključni odvodi

  • Neparametrijske statistike su jednostavne za korištenje, ali ne nude preciznu točnost ostalih statističkih modela.
  • Ova vrsta analize je najprikladnija za razmatranje redoslijeda nečega, čak i ako se numerički podaci promijene, rezultati će vjerojatno ostati isti.
Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Razumijevanje T raspodjele AT raspodjela je vrsta vjerojatne funkcije koja je prikladna za procjenu parametara populacije za male veličine uzorka ili nepoznate varijance. više Kako djeluje raspodjela uzorkovanja Distribucija uzorkovanja je raspodjela vjerojatnosti statistike dobivena velikim brojem uzoraka uzetih iz određene populacije. više Kako se koristi Wilcoxon test Wilcoxon test, koji se odnosi ili na rang Sum test ili na potpisni rang test, je neparametrijski test koji uspoređuje dvije uparene skupine. više Neparametrijska metoda Neparametrijska metoda odnosi se na vrstu statistike koja ne zahtijeva da podaci koji se analiziraju ispunjavaju određene pretpostavke ili parametre. više Definicija T-testa T-test je vrsta inferencijalne statistike koja se koristi za utvrđivanje postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama mogu povezati. više Interval pouzdanosti Interval pouzdanosti mjeri vjerojatnost da će parametar populacije pasti između dvije postavljene vrijednosti. više partnerskih veza
Preporučeno
Ostavite Komentar