Glavni » algoritamsko trgovanje » Višestruka linearna regresija - MLR definicija

Višestruka linearna regresija - MLR definicija

algoritamsko trgovanje : Višestruka linearna regresija - MLR definicija
Što je višestruka linearna regresija - MLR?

Višestruka linearna regresija (MLR), također poznata i kao višestruka regresija, statistička je tehnika koja koristi nekoliko objašnjivih varijabli da predvidi ishod varijable odgovora. Cilj višestruke linearne regresije (MLR) je modelirati linearni odnos između eksplanatornih (neovisnih) varijabli i varijable odgovora (ovisne).

U suštini, višestruka regresija je proširenje obične regresije najmanjeg kvadrata (OLS) koja uključuje više od jedne objašnjavajuće varijable.

Formula za višestruku linearnu regresiju je

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵgdje, za i = n opažanja: yi = ovisna varijablaxi = ekspanzijske varijableβ0 = y-presretanje (konstantan termin) βp = koeficijenti nagiba za svaku objašnjenu varijabluϵ = pojam pogreške pogreške modela (poznata i kao zaostaci) \ begin {usklađeno} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {gdje, za} i = n \ textbf {opažanja:} \\ & y_i = \ tekst {ovisna varijabla} \\ & x_i = \ tekst {ekspanzijske varijable} \\ & \ beta_0 = \ tekst {y-presretanje (konstanta izraz)} \\ & \ beta_p = \ tekst {koeficijenti nagiba za svaku objašnjenu varijablu} \\ & \ epsilon = \ tekst {izraz greške modela (poznat i kao zaostaci)} \\ \ kraj {poravnanje} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵgdje, za i = n promatranja: yi = ovisna varijablaxi = ekspanzijske varijableβ0 = y-presretanje (stalni pojam) βp = Koeficijenti nagiba za svaku objašnjenu varijabluϵ = izraz pogreške modela (poznat i kao ostaci)

Objašnjenje višestruke linearne regresije

Jednostavna linearna regresija je funkcija koja omogućuje analitičaru ili statističaru da predvidi jednu varijablu na temelju informacija koje su poznate o drugoj varijabli. Linearna regresija može se upotrijebiti samo ako jedna ima dvije kontinuirane varijable - neovisnu i ovisnu varijablu. Neovisna varijabla je parametar koji se koristi za izračunavanje ovisne varijable ili ishoda. Model višestruke regresije proteže se na nekoliko objašnjivih varijabli.

Model višestruke regresije zasnovan je na sljedećim pretpostavkama:

  • Postoji linearni odnos između ovisnih varijabli i neovisnih varijabli.
  • Neovisne varijable nisu previše korelirane jedna s drugom.
  • y zapažanja biramo neovisno i nasumično iz populacije.
  • Ostaci bi se trebali normalno distribuirati sa srednjom vrijednosti 0 i varijancom σ.

Koeficijent određivanja (R-kvadrat) je statistička metrika koja se koristi za mjerenje kolike varijacije u ishodu može se objasniti odstupanjem u neovisnim varijablama. R2 se uvijek povećava jer se u MLR model dodaje više prediktora, iako prediktori možda nisu povezani s varijabli ishoda.

Sam R2 se stoga ne može upotrijebiti za identificiranje prediktora koji bi se trebali uključiti u model, a koji treba isključiti. R2 može biti između 0 i 1, pri čemu 0 znači da ishod ne može predvidjeti nijedna nezavisna varijabla, a 1 znači da se ishod može predvidjeti bez pogreške od neovisnih varijabli.

Kada se interpretiraju rezultati višestruke regresije, beta koeficijenti vrijede, a sve ostale varijable drže konstantnim ("sve ostale jednake"). Izlaz iz višestruke regresije može se prikazati vodoravno kao jednadžba ili vertikalno u obliku tablice.

Primjer korištenja višestruke linearne regresije

Na primjer, analitičar će možda htjeti znati kako kretanje tržišta utječe na cijenu Exxon Mobila (XOM). U ovom slučaju će njegova linearna jednadžba imati vrijednost indeksa S&P 500 kao neovisne varijable ili prediktora i cijenu XOM kao zavisne varijable.

U stvarnosti postoji više faktora koji predviđaju ishod nekog događaja. Kretanje cijena Exxon Mobila, primjerice, ovisi o nečemu samo od uspješnosti cjelokupnog tržišta. Ostali prediktori poput cijena nafte, kamatnih stopa i kretanja cijena naftnih budućnosti mogu utjecati na cijenu XOM-a i cijene dionica drugih naftnih kompanija. Da bismo razumjeli odnos u kojem su prisutne više od dvije varijable, koristi se višestruka linearna regresija.

Višestruka linearna regresija (MLR) koristi se za određivanje matematičkog odnosa između niza slučajnih varijabli. Drugim riječima, MLR ispituje povezanost više neovisnih varijabli s jednom ovisnom varijablom. Jednom kada je svaki neovisni čimbenik određen kako bi predvidio ovisnu varijablu, informacije o više varijabli mogu se upotrijebiti za stvaranje preciznog predviđanja o razini učinka koji imaju na varijablu ishoda. Model stvara odnos u obliku ravne linije (linearne) koja najbolje aproksimira sve pojedinačne podatkovne točke.

Pozivajući se na MLR jednadžbu gore, u našem primjeru:

  • y i = ovisna varijabla: cijena XOM
  • x i1 = kamatne stope
  • x i2 = cijena ulja
  • x i3 = vrijednost S&P 500 indeksa
  • x i4 = cijena budućnosti nafte
  • B 0 = y-presretanje u trenutku nula
  • B 1 = koeficijent regresije koji mjeri promjenu jedinice u zavisnoj varijabli kad se x i1 promijeni - promjena cijene XOM kada se promjene kamatnih stopa
  • B 2 = vrijednost koeficijenta koja mjeri jediničnu promjenu zavisne varijable kada x i2 promijeni - promjena cijene XOM kada se promjene cijena ulja

Procjene najmanje kvadrata, B 0, B 1, B 2 … B p, obično se izračunavaju statističkim softverom. U regresijski model može se uključiti što više varijabli u kojima se svaka nezavisna varijabla razlikuje brojem - 1, 2, 3, 4 ... p. Model višestruke regresije omogućuje analitičaru da predvidi ishod na temelju informacija pruženih na više eksplanatornih varijabli.

Ipak, model nije uvijek savršeno točan jer se svaka točka podataka može malo razlikovati od rezultata predviđenog modelom. Preostala vrijednost, E, što je razlika između stvarnog ishoda i predviđenog ishoda, uključena je u model da bi se uzele u obzir takve male varijacije.

Pod pretpostavkom da pokrećemo naš XOM model regresije cijena putem softvera za računanje, koji vraća ovaj izlaz:

Analitičar bi taj izlaz protumačio tako da ako se ostale varijable drže konstantnima, cijena XOM-a povećava se za 7, 8% ako cijena nafte na tržištima poraste za 1%. Model također pokazuje da će se cijena XOM-a smanjiti za 1, 5% nakon rasta kamatnih stopa od 1%. R2 ukazuje da se 86, 5% varijacija cijene dionica Exxon Mobila može objasniti promjenama kamatne stope, cijene nafte, budućnosti nafte i S&P 500 indeksom.

Ključni odvodi

  • Višestruka linearna regresija (MLR), također poznata i kao višestruka regresija, statistička je tehnika koja koristi nekoliko objašnjivih varijabli da predvidi ishod varijable odgovora.
  • Višestruka regresija produžetak je linearne (OLS) regresije koja koristi samo jednu objašnjavajuću varijablu.
  • MLR se široko koristi u ekonometriji i financijskim zaključcima.

Razlika između linearne i višestruke regresije

Linearna (OLS) regresija uspoređuje odgovor zavisne varijable s obzirom na promjenu neke objašnjavajuće varijable. Međutim, rijetko je da se ovisna varijabla objasni samo jednom varijablom. U ovom slučaju analitičar koristi višestruku regresiju, koja pokušava objasniti ovisnu varijablu pomoću više nezavisnih varijabli. Višestruke regresije mogu biti linearne i nelinearne.

Višestruke regresije temelje se na pretpostavci da postoji linearni odnos i između ovisne i od neovisne varijable. Također ne pretpostavlja nikakvu veliku povezanost između neovisnih varijabli.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Što regresija mjeri Regresija je statističko mjerenje kojim se pokušava utvrditi snaga odnosa između jedne ovisne varijable (koja se obično označava s Y) i niza drugih varijabli koje se mijenjaju (poznatih kao neovisne varijable). više Što je pojam pogreške "> Pojam pogreške definiran je kao varijabla u statističkom modelu, koja se stvara kada model ne predstavlja u potpunosti stvarni odnos između neovisnih i ovisnih varijabli. više Kako metoda najmanjih kvadrata najmanje funkcionira Metoda kvadrata je statistička tehnika za određivanje linije koja najbolje odgovara modelu, određena jednadžbom s određenim parametrima za promatrane podatke. Više Ekonometrija: Što to znači i kako se koristi Ekonometrija je primjena statističkih i matematičkih modela na ekonomske podaci za potrebe testiranja teorija, hipoteza i budućih trendova. više R-kvadrat R-kvadrat statistička je mjera koja predstavlja udio varijance za ovisnu varijablu koja je objasnjena neovisnom varijablom. više Kako djeluje koeficijent određivanja Koeficijent određivanja je mjera koja se koristi u statističkoj analizi kako bi se procijenilo koliko dobar model objašnjava i predviđa buduće ishode rtner Linkovi
Preporučeno
Ostavite Komentar