Glavni » poslovanje » Indukcija unatrag

Indukcija unatrag

poslovanje : Indukcija unatrag
Što je povratna indukcija?

Indukcija unatrag u teoriji igara je iterativni proces rasuđivanja unatrag u vremenu, od kraja problema ili situacije, radi rješavanja konačnih opsežnih oblika i sekvencijalnih igara, te zaključivanja niza optimalnih radnji.

Objašnjena unatrag indukcija

Povratna indukcija korištena je za rješavanje igara otkako su John von Neumann i Oskar Morgenstern uspostavili teoriju igara kao akademski predmet kada su 1944. objavili svoju knjigu „ Teorija igara i ekonomsko ponašanje“ .

U svakoj fazi igre unatrag indukcija određuje optimalnu strategiju igrača koji napravi posljednji potez u igri. Tada se određuje optimalna akcija sljedećeg igrača u pokretu, uzimajući zadnju radnju igrača kao zadanu. Taj se proces nastavlja unatrag sve dok se ne utvrdi najbolje djelovanje za svaki trenutak. Učinkovito, jedno je određivanje Nash-ove ravnoteže svakog podgame u originalnoj igri.

Međutim, rezultati zaključeni unatrag indukcijom često ne mogu predvidjeti stvarnu ljudsku igru. Eksperimentalne studije pokazale su da se "racionalno" ponašanje (kako je predviđeno teorijom igara) rijetko izlaže u stvarnom životu. Iracionalni igrači zapravo mogu dobiti veće plaće od predviđenih unazad indukcijom, kao što je prikazano u igri s centipedom.

U igri centipede dva igrača naizmjenično dobivaju priliku zauzeti veći udio u rastućem loncu novca ili proslijediti lopticu drugom igraču. Isplate su raspoređene tako da ako lonac pređe nečijem protivniku, a protivnik uzme poticaj u sljedećem krugu, jedan će primiti nešto manje nego ako bi ga uzeo u ovom krugu. Igra se zaključuje čim igrač preuzme ulog, s tim što igrač dobiva veći dio, a drugi igrač manji dio.

Primjer indukcije unatrag

Kao primjer, pretpostavimo da je igrač A na prvom mjestu i da mora odlučiti treba li „uzeti“ ili „proslijediti“ ulog, koji trenutno iznosi 2 USD. Ako uzme, tada A i B dobivaju po 1 $, ali ako A prođe, igrač B. odluku o primanju ili prolasku sada mora donijeti igrač B. Ako B uzme, dobit će 3 USD (tj. Prethodno ulog od $ 2 + 1 $) a A dobiva 0 USD. Ali ako B prođe, A sada odlučuje hoće li proći ili proći i tako dalje. Ako oba igrača uvijek odluče proći, na kraju igre dobijaju isplatu u iznosu od 100 USD.

Smisao igre je ako A i B surađuju i nastave prolaziti do kraja igre, svaki će dobiti maksimalnu isplatu u iznosu od 100 USD. Ali ako imaju nepovjerenje prema drugom igraču i očekuju da će ih "uzeti" u prvoj prilici, Nash-ova ravnoteža predviđa da će igrači preuzeti najmanji mogući zahtjev (u ovom slučaju $ 1).

Nash-ova ravnoteža u kojoj niti jedan igrač nema poticaja za odstupanjem od svoje odabrane strategije nakon razmatranja izbora protivnika sugerira da bi prvi igrač uzeo pot u prvom krugu igre. Međutim, u stvarnosti to čini relativno malo igrača. Kao rezultat toga, dobit je veća od one koja je predviđena analizom ravnoteže.

Rješavanje uzastopnih igara koristeći unatrag indukciju

Ispod je jednostavna sekvencijalna igra između dva igrača. Oznake s Playerom 1 i Playerom 2 unutar njih su setovi informacija za igrače, odnosno jedan, odnosno dva. Brojevi u zagradama na dnu stabla predstavljaju isplatu u svakoj točki. Igra je također sekvencijalna, pa igrač 1 donosi prvu odluku (lijevo ili desno), a igrač 2 donosi odluku nakon igrača 1 (gore ili dolje).

Slika 1

Povratna indukcija, kao i sva teorija igara, koristi pretpostavke racionalnosti i maksimizacije, što znači da će Player 2 u svakoj danoj situaciji maksimalno povećati svoju isplatu. U oba skupa podataka imamo dva izbora, četiri ukupno. Eliminiranjem izbora koje Player 2 neće odabrati, možemo suziti svoje stablo. Na ovaj način ćemo podebljati crte koje maksimaliziraju isplatu igrača na zadanom skupu informacija.

Slika 2

Nakon ovog smanjenja, Player 1 može povećati svoje otplate sada kada su poznati izbori igrača 2. Rezultat je ravnoteža pronađena povratnom indukcijom igrača 1 koji odabire "ispravno" i igrača 2 odabire "gore". Ispod je rješenje igre s podešenom ravnotežnom stazom.

Slika 3

Na primjer, moglo bi se lako postaviti igra slična gornjoj koristeći kompanije kao igrače. Ova igra može uključivati ​​scenarije puštanja proizvoda. Ako je Tvrtka 1 htjela izdati proizvod, što bi Društvo 2 moglo odgovoriti "> prognozirajući prodaju ovog novog proizvoda u različitim scenarijima, možemo postaviti igru ​​koja će predvidjeti kako se događaji mogu odvijati. Ispod je primjer kako se može modelirati takva igra.

Slika 4

Usporedba investicijskih računa Ime dobavljača Opis Otkrivanje oglašavača × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu.

Povezani uvjeti

Definicija igara Centipede Igra sa centipedom u teoriji igara uključuje dva igrača koji naizmjenično dobivaju priliku zauzeti veći udio u povećanju uloga novca. više Kako funkcionira teorija igara Teorija igara je okvir za modeliranje scenarija u kojima postoji sukob interesa među igračima. više Igra sa nulom-sumom Situacija u kojoj jedan dobitak jednak je gubitku druge, tako da neto promjena bogatstva ili koristi iznosi nulu. Igra bez nula može imati samo dva igrača ili milijune sudionika. više Nash Equilibrium Nash Equilibrium je koncept unutar teorije igara gdje je optimalni ishod igre tamo gdje nema poticaja za odstupanje od njihove početne strategije. više Putnička dilema Definicija Putnička dilema pokazuje paradoks racionalnosti - što nelogično donošenje odluka često donosi veću isplatu u teoriji igara. više Podudarna definicija Usklađivanje novčanica osnovni je primjer teorije igara koji pokazuje kako racionalni donositelji odluka nastoje maksimizirati svoje isplate. više partnerskih veza
Preporučeno
Ostavite Komentar