Glavni » algoritamsko trgovanje » Overfitting

Overfitting

algoritamsko trgovanje : Overfitting
Što je prekomjerno opremanje?

Prekomjerno uklapanje je pogreška modeliranja koja se javlja kada je funkcija previsoko uklopljena na ograničeni skup podataka. Prekompliciranje modela općenito ima oblik izrade pretjerano složenog modela za objašnjenje idiosinkrazije u ispitivanim podacima.

U stvarnosti, često proučavani podaci imaju određeni stupanj pogreške ili slučajne buke u sebi. Stoga, pokušaj da se model uskladi preblizu s pomalo netočnim podacima može zaraziti model značajnim pogreškama i umanjiti njegovu prediktivnu moć.

[Važno: Financijski profesionalci moraju uvijek biti svjesni opasnosti prekomjernog postavljanja modela koji se temelji na ograničenim podacima.]

Razumijevanje prekomjernog opremanja

Na primjer, čest problem je korištenje računalnih algoritama za pretraživanje opsežnih baza podataka povijesnih tržišnih podataka kako bi se pronašli obrasci. S obzirom na dovoljno proučavanja, često je moguće razviti složene teoreme za koje se čini da s bliskom točnošću predviđaju stvari poput povratka na burzi.

Međutim, ako se primjenjuju na podatke izvan uzorka, takvi se teoremi vjerojatno mogu pokazati da je samo prekomjerno uklapanje modela u ono što su u stvarnosti bili samo slučajni događaji. U svakom je slučaju važno testirati model na temelju podataka koji su izvan uzorka koji se koristi za njegovo razvijanje.

Ključni odvodi

  • Prekomjerno uklapanje je pogreška modeliranja koja se javlja kada je funkcija previsoko uklopljena na ograničeni skup podataka.
  • Financijski profesionalci moraju uvijek biti svjesni opasnosti prekomjernog postavljanja modela koji se temelji na ograničenim podacima.
Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Zašto je statistička značajnost važna Statistički značaj odnosi se na rezultat koji se vjerojatno neće pojaviti nasumično, već se može pripisati određenom uzroku. više Kako radi Smoothing Data Zaglađivanje podataka vrši se algoritmom za uklanjanje buke iz skupa podataka. To omogućuje da se ističu važni obrasci. Izglađivanje podataka može se koristiti za predviđanje trendova, poput onih koji se nalaze u cijenama vrijednosnih papira. više Uzorak Uzorak je manja, upravljiva verzija veće grupe. Uzorci se koriste u statističkim ispitivanjima kad su veličine stanovništva prevelike. više Heteroskedastičnost U statistici se heteroskedastičnost događa kada standardna odstupanja varijable, praćena kroz određeno vrijeme, nisu konstantna. više Čitanje u stratificirano slučajno uzorkovanje Stratificirano slučajno uzorkovanje metoda je uzorkovanja koja uključuje podjelu populacije u manje skupine poznate kao slojevi. više Kako rade jednostavni slučajni uzorci Jednostavni slučajni uzorak je podskup statističke populacije u kojoj svaki član podskupine ima jednaku vjerojatnost odabira. Jednostavni slučajni uzorak zamišljen je kao nepristran predstavljanje grupe. više partnerskih veza
Preporučeno
Ostavite Komentar