Glavni » algoritamsko trgovanje » Ispitivanje hipoteza iz financija: koncept i primjeri

Ispitivanje hipoteza iz financija: koncept i primjeri

algoritamsko trgovanje : Ispitivanje hipoteza iz financija: koncept i primjeri

Vaš savjetnik za ulaganja predlaže plan mjesečnog ulaganja za dohodak koji svakog mjeseca obećava promjenjiv povrat. Uložit ćete u to samo ako vam je osigurano prosječno 180 USD mjesečnog primanja. Vaš savjetnik vam također kaže da je za proteklih 300 mjeseci shema imala povrat ulaganja s prosječnom vrijednošću od 190 USD i standardnim odstupanjem od 75 USD. Trebate li uložiti u ovu shemu? Ispitivanje hipoteza dolazi od pomoći takvom odlučivanju.

Ovaj članak pretpostavlja upoznavanje čitatelja s pojmovima normalne tablice raspodjele, formule, p-vrijednosti i srodnim osnovama statistike.

Što je testiranje hipoteza?

Hipoteza ili ispitivanje značajnosti je matematički model za ispitivanje tvrdnje, ideje ili hipoteze o parametru od interesa za određeni skup populacije, koristeći podatke izmjerene u uzorku skupa. Izračuni se provode na odabranim uzorcima kako bi se prikupili odlučniji podaci o karakteristikama čitave populacije, što omogućava sustavni način testiranja tvrdnji ili ideja o cijelom skupu podataka.

Evo jednostavnog primjera: Ravnateljica škole izvještava da učenici u njenoj školi prosječno postižu 7 od 10 ispita. Da bismo testirali ovu „hipotezu“, bilježimo ocjene od 30 učenika (uzorak) iz čitave studentske populacije škole (recimo 300) i izračunavamo sredinu tog uzorka. Zatim možemo usporediti (izračunatu) vrijednost uzorka s prosjekom (prijavljenom) populacije i pokušati potvrditi hipotezu.

Kao još jedan primjer, godišnji povrat određenog uzajamnog fonda je 8%. Pretpostavimo da uzajamni fond postoji već 20 godina. Uzimamo slučajni uzorak godišnjih prinosa uzajamnog fonda za, recimo, pet godina (uzorak) i izračunamo njegovu srednju vrijednost. Zatim uspoređujemo (izračunatu) vrijednost uzorka s prosjekom stanovništva (za koji se tvrdi) kako bismo potvrdili hipotezu.

Kriteriji za odlučivanje moraju se temeljiti na određenim parametrima skupova podataka.

Za testiranje hipoteza postoje različite metodologije, ali su uključena ista četiri osnovna koraka:

1. korak: definiranje hipoteze

Obično se prijavljena vrijednost (ili statistika potraživanja) navodi kao hipoteza i pretpostavlja se da je istinita. Za gornje primjere hipoteza će biti:

  • Primjer A: Učenici u školi prosječno daju 7 od 10 ispita.
  • Primjer B: Godišnji povrat uzajamnog fonda je 8% godišnje.

Ovaj navedeni opis predstavlja „ ništetnu hipotezu (H 0 ) “ i pretpostavlja se da je istinit - način na koji se okrivljenik u sudiji za porote smatra nedužnim dok se ne dokaže krivnja dokazima iznesenim na sudu. Slično tome, testiranje hipoteza započinje iznošenjem i pretpostavkom „nulte hipoteze“, a zatim postupak određuje je li pretpostavka vjerojatno istinita ili lažna.

Važno je napomenuti da testiramo ništavnu hipotezu jer postoji element sumnje u njezinu valjanost. Kakve god informacije protivne navedenoj nuli hipotezi zarobljene su u Alternativnoj hipotezi (H1). Za gornje primjere, alternativna hipoteza bit će:

  • Studenti dobivaju prosjek koji nije 7.
  • Godišnji povrat uzajamnog fonda nije jednak 8% godišnje.

Drugim riječima, alternativna hipoteza izravna je suprotnost nulotvornoj hipotezi.

Kao i na suđenju, porota pretpostavlja nevinost okrivljenika (nulta hipoteza). Tužitelj mora dokazati drugačije (alternativna hipoteza). Slično tome, istraživač mora dokazati da je nulta hipoteza ili istinita ili lažna. Ako tužitelj ne dokaže alternativnu hipotezu, porota mora pustiti okrivljenika (zasnivajući odluku na ništavoj hipotezi). Slično tome, ako istraživač ne uspije dokazati alternativnu hipotezu (ili jednostavno ne učini ništa), tada se nulta hipoteza pretpostavlja da je istinita.

2. korak: postavljanje kriterija

Kriteriji za odlučivanje moraju se temeljiti na određenim parametrima skupova podataka i tu dolazi do slike povezanosti s normalnom distribucijom.

Prema standardnom statističkom postulatu o raspodjeli uzorkovanja, „Za bilo koju veličinu uzorka n, raspodjela uzorka X̅ je normalna ako je populacija X iz koje se uzima uzorak normalno raspodijeljena.“ Dakle, vjerojatnost svih ostalih mogućih uzoraka znači da koji se može odabrati su obično distribuirani.

Na primjer, utvrdite je li prosječni dnevni prinos bilo koje dionice kotirane na XYZ berzi, oko Nove godine veći od 2%.

H 0 : Nulta hipoteza: prosjek = 2%

H 1 : Alternativna hipoteza: znači> 2% (to želimo dokazati)

Uzmi uzorak (recimo 50 dionica od ukupno 500) i izračunaj sredinu uzorka.

Za normalnu raspodjelu, 95% vrijednosti leži unutar dva standardna odstupanja prosječne vrijednosti stanovništva. Dakle, ova normalna pretpostavka raspodjele i središnjeg ograničenja za skup uzoraka omogućava nam da uspostavimo 5% kao razinu značajnosti. To ima smisla jer, pod ovom pretpostavkom, postoji manje od 5% vjerojatnosti (100-95) dobivanja odmetnika koji su iznad dva standardna odstupanja od prosjeka stanovništva. Ovisno o prirodi skupa podataka, druge razine značaja mogu se uzeti na 1%, 5% ili 10%. Za financijske proračune (uključujući financije ponašanja) 5% je općeprihvaćeno ograničenje. Ako nađemo bilo kakve proračune koji nadilaze uobičajena dva standardna odstupanja, tada imamo jak slučaj odmetnika koji odbacuju nultu hipotezu.

Grafički je prikazan na sljedeći način:

U gornjem primjeru, ako je srednja vrijednost uzorka mnogo veća od 2% (recimo 3, 5%), odbacujemo nultu hipotezu. Prihvaćena je alternativna hipoteza (prosjek> 2%), što potvrđuje da je prosječni dnevni povrat zaliha doista iznad 2%.

Međutim, ako vrijednost uzorka nije vjerovatno veća od 2% (i ostaje na, recimo, oko 2, 2%), tada NE MOŽEMO odbaciti ništavnu hipotezu. Izazov je kako odlučiti o takvim slučajevima iz neposredne blizine. Da bi se iz odabranih uzoraka i rezultata moglo zaključiti, treba odrediti razinu značajnosti koja omogućuje zaključak o nulti hipotezi. Alternativna hipoteza omogućava uspostavljanje razine značaja ili koncepta „kritične vrijednosti“ za odlučivanje o takvim slučajevima iz blizine.

Prema standardnoj definiciji udžbenika, „Kritična vrijednost je granična vrijednost koja definira granice izvan kojih se može dobiti manje od 5% uzorka ako je nulta hipoteza istinita. Sredstva uzorka dobivena izvan kritične vrijednosti rezultirat će odlukom da se odbaci nulta hipoteza. "U gornjem primjeru, ako smo kritičku vrijednost definirali kao 2, 1%, a izračunata srednja vrijednost iznosi 2, 2%, tada odbacujemo nultu hipotezu Kritična vrijednost uspostavlja jasno razgraničenje oko prihvaćanja ili odbacivanja.

3. korak: izračunajte statistiku

Ovaj korak uključuje izračunavanje potrebnih brojki (a), poznatih kao testna statistika (poput srednje vrijednosti, z-ocjena, p-vrijednost, itd.) Za odabrani uzorak. (Na njih ćemo doći u kasnijem odjeljku.)

4. korak: dohvatite zaključak

Pomoću izračunatih vrijednosti (e) odlučite o nultu hipotezu. Ako je vjerojatnost dobivanja uzorka prosjeka manja od 5%, zaključak je odbacivanje nulte hipoteze. U suprotnom, prihvatite i zadržite nultu hipotezu.

Vrste pogrešaka

Postoje četiri moguća ishoda u odlučivanju na temelju uzoraka, s obzirom na ispravnu primjenjivost na cjelokupnu populaciju:

Odluka o zadržavanju


Odluka o odbijanju


Odnosi se na cijelo stanovništvo


ispravan


Netočno

(Greška TIP 1 - a)


Ne odnosi se na cjelokupnu populaciju


Netočno

(Pogreška TIPA 2 - b)


ispravan


"Ispravni" slučajevi su oni u kojima su odluke donesene na uzorcima doista primjenjive na čitavu populaciju. Slučajevi grešaka nastaju kada čovjek odluči zadržati (ili odbaciti) nultu hipotezu na temelju uzoraka izračuna, ali ta se odluka ne odnosi na cjelokupnu populaciju. Ovi slučajevi čine pogreške tipa 1 (alfa) i tipa 2 (beta), kako je navedeno u gornjoj tablici.

Odabir ispravne kritične vrijednosti omogućava uklanjanje alfa pogrešaka tipa 1 ili ograničavanje na prihvatljiv raspon.

Alpha označava grešku na razini značajnosti i određuje je istraživač. Da bi se održala standardna 5-postotna značajnost ili razina pouzdanosti za proračun vjerojatnosti, zadržava se na 5%.

Prema primjenjivim mjerilima i definicijama odlučivanja:

  • "Ovaj (alfa) kriterij obično se postavlja na 0, 05 (a = 0, 05), a uspoređujemo razinu alfa s p-vrijednošću. Kad je vjerojatnost pogreške tipa I manja od 5% (p <0, 05), odlučujemo odbaciti nultu hipotezu; u suprotnom zadržavamo ništavnu hipotezu. "
  • Tehnički izraz koji se koristi za ovu vjerojatnost je p-vrijednost . Ona je definirana kao "vjerojatnost dobivanja uzorka rezultata s obzirom na to da je vrijednost navedena u nulti hipotezi tačna. P-vrijednost za dobivanje rezultata uzorka uspoređuje se s razinom značajnosti. "
  • Pogreška tipa II, ili beta greška, definira se kao "vjerojatnost pogrešnog zadržavanja nulte hipoteze, a zapravo nije primjenjiva na cjelokupnu populaciju."

Još nekoliko primjera pokazat će ovu i druge proračune.

Primjer 1

Postoji mjesečna investicijska shema koja obećava promjenjive mjesečne prinose. Ulagač će uložiti u njega samo ako mu je osigurano prosječno 180 USD mjesečnog prihoda. Ima uzorak od 300 mjeseci povrata, što prosječno iznosi 190 dolara i standardno odstupanje od 75 dolara. Treba li uložiti u ovu shemu ">

Postavimo problem. Ulagač će uložiti u shemu ako bude siguran da je željeni prosječni povrat u iznosu od 180 USD.

H 0 : Nulta hipoteza: srednja vrijednost = 180

H 1 : Alternativna hipoteza: srednje> 180

1. metoda: pristup kritične vrijednosti

Identificirajte kritičnu vrijednost X L za srednju vrijednost uzorka, koja je dovoljno velika da odbaci nultu hipotezu - tj. Odbacite nultu hipotezu ako uzorak znači> = kritična vrijednost X L

P (identificirajte alfa-grešku tipa I) = P (odbacite H 0 s obzirom da je H 0 istina),

To bi se postiglo kad srednja vrijednost uzorka prijeđe kritične granice.

= P (s obzirom da je H 0 istina) = alfa

Grafički se čini kako slijedi:

Uzimajući alfa = 0, 05 (tj. 5% -tna razina značajnosti), Z 0, 05 = 1, 645 (iz tablice Z ili tablice normalne distribucije)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Budući da je vrijednost uzorka (190) veća od kritične vrijednosti (187, 12), nulta hipoteza se odbacuje, a zaključak je da je prosječni mjesečni prinos doista veći od 180 USD, tako da investitor može razmotriti ulaganje u ovu shemu.

Druga metoda: Korištenje standardiziranih statistika ispitivanja

Može se koristiti i standardizirana vrijednost z.

Statistika testa, Z = (prosječna vrijednost uzorka - prosječna populacija) / (std-dev / sqrt (br. Uzoraka).

Zatim regija odbijanja postaje sljedeća:

Z = (190 - 180) / (75 / sqrt (300)) = 2.309

Naše područje odbacivanja na razini značajnosti od 5% je Z> Z 0, 05 = 1, 645.

Kako je Z = 2.309 veći od 1.645, nulta hipoteza može se odbaciti sličnim zaključkom spomenutim gore.

Metoda 3: Proračun vrijednosti P

Cilj nam je identificirati P (uzorak srednja> = 190, kada je srednja = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

Sljedeća tablica za zaključivanje izračuna vrijednosti p zaključuje da postoje potvrđeni dokazi da je prosječni mjesečni povrat veći od 180:

p-vrijednost


Zaključak


manje od 1%


Potvrđeni dokazi koji podržavaju alternativnu hipotezu


između 1% i 5%


Snažni dokazi koji podržavaju alternativnu hipotezu


između 5% i 10%


Slabi dokazi koji podržavaju alternativnu hipotezu


veće od 10%


Nema dokaza koji podržavaju alternativnu hipotezu


Primjer 2

Novi berzanski posrednik (XYZ) tvrdi da su njegove brokerske naknade niže od onih vaših trenutnih berzanskih posrednika (ABC). Podaci dostupni od nezavisne istraživačke tvrtke ukazuju na to da je prosjek i std-razvoj svih klijenata ABC brokera 18 USD odnosno 6 USD.

Uzima se uzorak od 100 klijenata ABC-a, a troškove posredovanja izračunavaju se s novim cijenama XYZ brokera. Ako je vrijednost uzorka 18, 75 USD, a std-dev isti (6 USD), može li se izvući zaključak o razlici u prosječnom brokerskom računu između ABC i XYZ brokera ">

H 0 : Nulta hipoteza: srednja vrijednost = 18

H 1 : Alternativna hipoteza: znači 18 (To je ono što želimo dokazati.)

Područje odbijanja: Z <= - Z 2.5 i Z> = Z 2.5 (pod pretpostavkom 5% -tne razine značaja, podijelite 2.5 na obje strane).

Z = (uzorak srednja - srednja) / (std-dev / sqrt (br. Uzoraka))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Ova izračunata vrijednost Z pada između dvije granice definirane s:

- Z 2, 5 = -1, 96 i Z 2, 5 = 1, 96.

Iz toga se zaključuje da nema dovoljno dokaza da bismo zaključili da li postoji razlika između cijena vašeg postojećeg brokera i novog brokera.

Alternativno, p-vrijednost = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12% što je veće od 0, 05 ili 5%, što dovodi do istog zaključka.

Grafički je prikazano sljedećim:

Bodovi kritike za metodu hipotetičkog ispitivanja:

  • Statistička metoda koja se temelji na pretpostavkama
  • Greška osjetljiva na detalje u pogledu alfa i beta pogrešaka
  • Tumačenje p-vrijednosti može biti dvosmisleno, što vodi do zbunjujućih rezultata

Donja linija

Ispitivanje hipoteza omogućava matematičkom modelu da potvrdi tvrdnju ili ideju s određenom razinom pouzdanosti. Međutim, kao i većina statističkih alata i modela, veže ga nekoliko ograničenja. Korištenje ovog modela za donošenje financijskih odluka trebalo bi sagledati kritički, imajući na umu sve ovisnosti. Alternativna metoda poput Bayesova zaključka također je vrijedna istraživanja za sličnu analizu.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.
Preporučeno
Ostavite Komentar