Glavni » algoritamsko trgovanje » Osnove regresije za poslovnu analizu

Osnove regresije za poslovnu analizu

algoritamsko trgovanje : Osnove regresije za poslovnu analizu

Ako ste se ikad zapitali kako se dva ili više podataka odnose međusobno (npr. Kako na BDP utječu promjene nezaposlenosti i inflacije) ili ako ste ikad imali šefa, zamolite vas da napravite prognozu ili analizirate predviđanja na temelju o odnosima između varijabli, tada bi učenje regresijske analize bilo vrijedno vašeg vremena.

U ovom ćete članku naučiti osnove jednostavne linearne regresije, koja se ponekad naziva i 'obični najmanje kvadrati' ili OLS regresija - alat koji se obično koristi u prognoziranju i financijskoj analizi. Započet ćemo učenjem osnovnih principa regresije, prvo učenje o kovarijanciji i korelaciji, a zatim idemo na izgradnju i interpretaciju regresijskog učinka. Popularni poslovni softver kao što je Microsoft Excel za vas može učiniti sve regresijske proračune i izlaze, ali svejedno je važno naučiti osnovne mehanike.

Varijable

U srcu regresijskog modela nalazi se odnos dviju različitih varijabli koje nazivamo ovisnim i neovisnim varijablama. Na primjer, pretpostavimo da želite predvidjeti prodaju za svoju tvrtku, a zaključili ste da prodaja vaše tvrtke raste i pada ovisno o promjenama u BDP-u.

Prodaja koju prognozirate bila bi ovisna varijabla, jer njihova vrijednost "ovisi" o vrijednosti BDP-a, a BDP bi bio neovisna varijabla. Tada biste trebali utvrditi snagu odnosa između ove dvije varijable kako biste predvidjeli prodaju. Ako se BDP povećava / smanjuje za 1%, koliko će se vaša prodaja povećavati ili smanjivati?

kovarijance

Cov (x, y) = ∑ (xn − xu) (yn-yu) N \ start {poravnano} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ kraj {poravnano} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Formula za izračun odnosa između dvije varijable naziva se kovarijancija. Ovaj izračun pokazuje smjer odnosa. Ako se jedna varijabla povećava, a druga se također povećava, kovarijacija bi bila pozitivna. Ako jedna varijabla ide prema gore, a druga ima tendenciju pada, tada bi kovarijancija bila negativna.

Stvarni broj koji dobivate iz izračunavanja teško je protumačiti jer nije standardiziran. Na primjer, kovarijacija pet može se protumačiti kao pozitivna veza, ali jačina veze može se reći samo da je jača nego ako je broj četiri ili slabiji nego ako je broj šest.

Koeficijent korelacije

Korelacija = ρxy = Covxysxsy \ početak {usklađeno} & Korelacija = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ kraj {usklađeno} Korelacija = ρxy = sx sy Covxy

Moramo standardizirati kovarijanciju kako bi nam omogućili bolju interpretaciju i korištenje u prognoziranju, a rezultat je izračuna korelacije. Korelacijski proračun jednostavno uzima kovarijans i dijeli je s proizvodom standardnog odstupanja dviju varijabli. Ovo će povezati povezanost između vrijednosti -1 i +1.

Povezanost +1 može se protumačiti tako da sugerira da se obje varijable savršeno pozitivno kreću jedna s drugom, a -1 podrazumijeva da su savršeno negativno povezane. U našem prethodnom primjeru, ako je korelacija +1, a BDP se poveća za 1%, tada bi prodaja povećala za 1%. Ako je korelacija -1, porast BDP-a od 1% rezultirao bi padom prodaje od 1% - upravo suprotno.

Jednadžba regresije

Sada kada znamo kako se izračunava relativni odnos dviju varijabli, možemo razviti regresijsku jednadžbu za predviđanje ili predviđanje varijable koju želimo. Ispod je formula za jednostavnu linearnu regresiju. "Y" je vrijednost koju pokušavamo predvidjeti, "b" je nagib regresijske crte, "x" je vrijednost naše neovisne vrijednosti, a "a" predstavlja y-presretanje. Jednadžba regresije jednostavno opisuje odnos između ovisne varijable (y) i neovisne varijable (x).

y = bx + a \ početak {poravnano} & y = bx + a \\ \ kraj {poravnano} y = bx + a

Presretanje, ili "a", je vrijednost y (ovisna varijabla) ako je vrijednost x (neovisna varijabla) jednaka nuli, pa se ponekad jednostavno naziva "konstanta". Dakle, da nije došlo do promjene BDP-a, vaša bi tvrtka ipak ostvarila određenu prodaju - ta vrijednost, kada je promjena BDP-a jednaka nuli, presretanje je. Pogledajte grafikon dolje kako biste vidjeli grafički prikaz jednadžbe regresije. Na ovom grafikonu nalazi se samo pet podatkovnih točaka predstavljenih s pet točaka na grafu. Linearna regresija pokušava procijeniti liniju koja najbolje odgovara podacima (linija koja najbolje odgovara) i jednadžba te linije rezultira u jednadžbi regresije.

Slika 1: Linija koja najbolje odgovara

Izvor: Investopedia

Regresije u Excelu

Sada kada razumijete neke od pozadina koja prelaze u regresijsku analizu, napravimo jednostavan primjer pomoću Excel-ovih regresijskih alata. Nadgradit ćemo se na prethodnom primjeru pokušaja prognoziranja prodaje za sljedeću godinu na temelju promjena u BDP-u. Sljedeća tablica navodi neke umjetne točke podataka, ali ti brojevi mogu biti lako dostupni u stvarnom životu.

GodinaProdajniBDP
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Samo bacivši pogled na stol, možete vidjeti da će postojati pozitivna povezanost između prodaje i BDP-a. Oboje imaju tendenciju da idu zajedno. Koristeći Excel, sve što trebate učiniti je kliknuti padajući izbornik Alati, odaberite Analiza podataka i odatle odaberite Regresija . Skočni prozor lako je ispuniti odatle; vaš Ulazni raspon Y je stupac "Prodaja", a vaš Ulazni raspon X je promjena u stupcu BDP-a; odaberite opseg izlaza za koji želite da se podaci prikažu na vašoj proračunskoj tablici i pritisnite OK. Trebali biste vidjeti nešto slično onome što je dato u donjoj tablici:

Koeficijenti regresijske statistike

Višestruki R0.8292243presijecati34, 58409

Trg R


0.687613BDP88, 15552
Prilagođen
Trg R


0.583484

-


-


Standardna pogreška51.021807-

-


zapažanja5

-


-


Tumačenje

Glavni ishodi zbog kojih biste trebali biti zabrinuti za jednostavnu linearnu regresiju su R-kvadrat, presretnuti (konstanta) i beta (b) koeficijent BDP-a. Broj R u kvadratu u ovom primjeru iznosi 68, 7% - to pokazuje koliko naš model predviđa ili predviđa buduću prodaju, sugerirajući da su objasnjive varijable u modelu predviđale 68, 7% varijacije ovisne varijable. Zatim imamo presretanje od 34, 58, što nam govori da bi, ako se predviđa promjena BDP-a jednaka nuli, naša prodaja iznosila oko 35 jedinica. I na kraju, beta ili korelacijski koeficijent BDP-a od 88, 15 govori da će se, ako se BDP poveća za 1%, prodaja vjerojatno povećati za oko 88 jedinica.

Donja linija

Pa kako biste koristili ovaj jednostavan model u svom poslu ">

Naravno, ovo je samo jednostavna regresija i postoje modeli koje možete izgraditi koristeći nekoliko neovisnih varijabli koje se zovu višestruke linearne regresije. Ali višestruke linearne regresije su složenije i imaju nekoliko pitanja o kojima će biti potreban još jedan članak za raspravu.

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.
Preporučeno
Ostavite Komentar