29. novembar 2010.
Od igranja šaha do „igranja“ raspoređivanja vojnih baza po svetu, od razmišljanja kojoj devojci u baru prići do analiziranja isplativosti ulaska na novo tržište, od odlučivanja na koju stranu šutirati prilikom izvođenja penala u fudbalu do razmatranja koncepata preživljavanja i produžetka vrste u evolutivnoj biologiji i ekologiji. Oblast (primenjene) matematike koja se koristi u društvenim naukama, uglavnom ekonomiji, ali i biologiji, informatici i filozofiji, nazvana teorija igara nas uči kako da pristupamo rešavanju svih ovih (a i mnogih drugih) problema.
Piše: Stevan Radanović
Najznačajniji momenat početka razvoja teorije igara verovatno predstavlja objavljivanje knjige “Teorija igara i ekonomskog ponašanja” 1944. godine. Iako se i pre toga nemali broj naučnika bavio rešavanjem određenih specijalnih slučajeva, Džon fon Nojman i Oskar Morgenštern, autori pomenute knjige, su se prvi upustili u sistematizovano formulisanje ove oblasti.
Džon fon Nojman
|
Treba napomenuti da izraz „teorija igara“ nije baš najsrećnije odabran. Oblast o kojoj je reč obuhvata daleko više od onoga što obično podrazumevamo kada govorimo o „igrama“, te bi precizniji naziv možda bio „teorija strategija“ budući da je reč o proučavanju strateških odluka koje donose racionalni igrači. Svako donošenje odluke, bilo da ona utiče na druge ljude ili da su na nju uticale akcije, ili čak očekivane akcije, drugih ljudi, predstavlja igranje neke igre.
To je veoma široka definicija iz koje sledi da mi veći deo života provodimo u kretanju kroz svojevrsno „more“ igara. Teorija igara nam na tom putovanju može poslužiti i kao kompas, i kao mapa, budući da se njome koristimo da bismo modelovali mnoge situacije iz realnog života, a zatim upotrebom analitičkih alata dolazimo do smera u kojem treba da se krećemo i situacija koje treba da izbegavamo. Na prvi pogled može da deluje kao da su ti alati previše jednostavni, ali upravo ta jednostavnost i njihova pristupačnost nam omogućavaju da njihovim rešavanjem steknemo određenu intuiciju o kompleksnim problemima sa kojima se susrećemo svakodnevno.
Elementi igre
U ovoj seriji članaka ćemo se pozabaviti primenom teorije igara na širok spektar raznovrsnih tema, te je potrebno prethodno spomenuti neke od osnovnih koncepata i elemenata svake igre, koji su verovatno bliski, makar intuitivno, svakom čitaocu. Igrač učestvuje u igri donoseći odluke. Strategija je skup odluka za svaku moguću situaciju u kojoj se igrač može naći tokom igre. Isplativost je dobitak ili gubitak koji se pripisuje igraču kada svi igrači odigraju poteze svojih respektivnih strategija. Napomenimo da isplativost predstavlja subjektivnu vrednost koju određenim ishodima igre pripisuje svaki igrač – ono što je jednom igraču izuzetno vredno, drugi može oceniti daleko niže na toj skali.
Kao primer nam može poslužiti kupovina u prodavnici, u kojoj su igrači prodavac i kupac. Pretpostavimo da prodavac nabavlja hleb po ceni od 40 dinara za komad i razmatra da li da ga prodaje za 50 ili 60 dinara (prodavac teoretski ima beskonačno mnogo mogućnosti kada bira cenu po kojoj će prodavati hleb, ali je primer odlučivanja za jednu od dve cene model realne situacije, ilustrativan i daleko jednostavniji). Dakle, strategije prodavca su: 1) cena hleba je 50 dinara, i 2) cena hleba je 60 dinara. Kupac u ovom slučaju ima na raspolaganju četiri strategije: 1) ne kupuje hleb, bilo da je cena 50 ili 60 dinara, 2) kupuje hleb, bilo da je cena 50 ili 60 dinara, 3) kupuje hleb ako je cena 50, ali ne kupuje ako je cena 60 dinara, i 4) kupuje hleb ako je cena 60, ali ne kupuje ako je cena 50 dinara.
Poslednja navedena kupčeva strategija deluje neracionalno, ali ona je u nekom drugom kontekstu sasvim prigodna – razmislite da li biste pre kupili dijamantski prsten (tj. ono što vam nude kao dijamantski prsten) za hiljadu ili sto hiljada dinara. Dalje, pretpostavimo da prodavac izabere da prodaje hleb po 50 dinara, a da kupac vrednuje hleb 55 dinara. U tom slučaju dolazi do kupovine – kupac dobija hleb u zamenu za 50 dinara. Pogledajmo isplativost za prodavca i kupca u ovom slučaju: prodavac je na dobitku 10 dinara, budući da je dobavljaču platio hleb 40, a prodao ga za 50 dinara, a kupac je na dobitku 5 dinara, budući da vrednuje hleb 55, a da ga je platio 50 dinara. Da je prodavac odlučio da prodaje hleb po 60 dinara, a da kupac i dalje vrednuje hleb 55 dinara, do kupovine ne bi došlo i obe strane bi imale isplativost 0 dinara.
Bitno je na ovom mestu osvrnuti se na dve stvari. Prvo, isplativost nije uvek vezana isključivo za novčanu vrednost, već može da sadrži i neke nematerijalne komponente, što ćemo razmotriti kasnije u tekstu. Drugo, u slučaju kada se kupovina odigrala, oba igrača su bila na dobitku (što je po pravilu slučaj u trgovini robama ili uslugama). Ovakve igre, gde dobitak jednog igrača ne znači automatski istovetni gubitak nekog drugog igrača, se nazivaju „igre sa promenljivom sumom“ (eng. non zero-sum games). Za razliku od njih postoje i „igre sa fiksnom sumom“ (eng. zero-sum games), gde dobitak jednog igrača predstavlja direktan gubitak za drugog. Primer je fudbalska utakmica – svaki gol za jedan tim predstavlja dobitak za taj tim i istovetan gubitak tima koji je primio gol.
Pređimo na primere nekoliko najjednostavnijih, a ujedno i najčešće korišćenih igara, gde ćemo se upoznati i sa vizuelnim načinima predstavljanja strategija i isplativosti.
Igra koordinacije
Pretpostavimo da su se Jovana i Jovan upoznali i oboje bi hteli da se opet vide, ali nisu razmenili brojeve telefona (niti su postali drugari na Fejsbuku), te nisu u mogućnosti da ugovore sastanak. Ipak, vikend se približava i oboje shvataju da bi se mogli sresti u gradu ako izađu na isto mesto. Oboje saznaju da će tog vikenda glavni događaji biti Markova žurka i koncert klasične muzike. Dakle, naši igrači, Jovana i Jovan, imaju dve strategije – otići na žurku, ili otići na koncert.
Što se tiče isplativosti tih strategija, i ovde prvi put susrećemo nematerijalne dobitke, pretpostavimo da bi se oboje radije našli nego mimoišli i da bi se oboje radije videli na Markovoj žurci. Uobičajen način predstavljanja ovakvih igara koje nazivamo statičke ili simultane (budući da oba igrača moraju da donesu odluku bez mogućnosti da saopšte ishod onom drugom) je putem matrice isplativosti koja prikazuje koji je očekivani dobitak (ili gubitak) svakog igrača u pojedinačnim mogućim ishodima. Igra ovakve strukture matrice isplativosti se naziva igra koordinacije.
Jovanine strategije su prikazane crvenom bojom, kao i njeni dobici u slučaju svih mogućih ishoda, dok je za Jovana korišćena plava boja. Dakle, ako i Jovan i Jovana odu na žurku, svako od njih je na dobitku u iznosu 2 (uvodimo pretpostavku da veća vrednost isplativosti znači veći dobitak) i brzo postaje očigledno da je to ishod igre koji oboje najviše žele i koji se nudi kao očigledno rešenje. Ipak, budući da se njih dvoje ne poznaju najbolje, moguće je da Jovan pomisli da bi Jovana možda pre izabrala koncert nego žurku, i obrnuto, jer ni Jovana ne zna Jovanove preference. Ta situacija, gde igračima nisu poznate isplativosti koje drugi igrači pripisuju određenim situacijama se može razrešiti jedino komunikacijom. Ako i Jovana i Jovan znaju da bi se oboje radije našli na žurci, verovatno će oboje i otići na žurku, budući da će oboje rezonovati da se drugi igrač ponaša racionalno i da će hteti da maksimizuje dobitak.
Matrica isplativosti za igru koordinacije |
Ishod gde su svi igrači odabrali svoje strategije i nijedan igrač ne može proći bolje tako što će jedini promeniti svoju strategiju se naziva Nešov ekvilibrijum (ili Nešova ravnoteža), po Džonu Nešu, matematičaru i dobitniku Nobelove nagrade za ekonomiju, čiji je život prikazan u filmu „Blistavi um“. U slučaju igre između Jovane i Jovana imamo dva Nešova ekvilibrijuma – prvi, kada oboje odlaze na žurku, i drugi, kada oboje odlaze na koncert, budući da kada fiksiramo bilo koji od ta dva događaja, ni Jovana, ni Jovan neće dobiti više tako što će jedini promeniti svoju strategiju. Naprotiv, oboje prolaze lošije. Ishod gde oboje odlaze na žurku je Pareto-optimalan (nazvan po Vilfredo Paretu, ekonomisti), jer maksimizuje ukupan dobitak oba igrača.
Izmenjena matrica isplativosti za igru koordinacije |
Za kraj analize ove igre primetimo nešto što će važiti i za naredne igre: tačna vrednost isplativosti za igrače nije od presudne važnosti – važni su odnosi među tim vrednostima, tj. šta igrači vole i u kom poretku. Vrednosti bismo mogli da promenimo tako da matrica isplativosti izgleda drugačije, ali bi kompletna analiza ostala ista.
Borba polova, Bah ili Stravinski
I dalje se družimo sa Jovanom i Jovanom – trenutno su u vezi i dogovorili su se da izađu, ali još uvek nisu precizirali gde. Jovana je predložila odlazak u operu, ali bi Jovan radije da idu na fudbalsku utakmicu. Nažalost, telefoni su u kvaru, pa ne mogu da kontaktiraju jedno drugo i da se dogovore, već moraju da pojedinačno odluče gde će otići. Pretpostavimo da im je opet najbitnije da odu zajedno i pogledajmo matricu isplativosti u ovom slučaju. Ovakva igra se naziva borba polova (eng. battle of the sexes), a ponegde i Bah ili Stravinski (eng. Bach or Stravinsky).
Matrica isplativosti za borbu polova |
Ispostavlja se da i ova igra ima dva Nešova ekvilibrijuma i, kao i u igri koordinacije, reč je o situacijama gde i Jovana i Jovan zajedno provedu veče, bilo da je reč o operi ili fudbalskoj utakmici. U tim situacijama nijedan igrač ne želi da sam promeni strategiju. Ono što razlikuje borbu polova od igre koordinacije je da u borbi polova ne postoji očigledno najbolji ishod.
Empajer stejt bilding, Njujork |
Za rešavanje igara u koje spada i borba polova, potrebna nam je određena fokusna tačka, koju obično zovemo Šelingova tačka, po Tomasu Šelingu, ekonomisti, koja predstavlja ishod koji se iz nekog razloga čini očiglednim. U slučaju Jovane i Jovana, Šelingova tačka može biti odlazak na fudbalsku utakmicu, ako su prethodni put bili u operi, i obrnuto, ako oboje imaju ideju da treba da „uzvrate uslugu“.
Tajms skver, Njujork |
Izuzetno zanimljiv primer koliko su ljudi dobri u identifikovanju Šelingovih tačaka se desio u šou Prajmtajm (Primetime) američke televizijske mreže ABC. Šest timova od po dve osobe su ostavljeni na nasumičnim mestima u Njujorku sa ciljem da se do kraja dana sastanu sa bar jednim od ostalih pet timova. Nisu se međusobno poznavali, niti su imali način da komuniciraju međusobno, ali su do kraja dana svi ispunili zadatak. Skoro svi timovi su za vreme sastanka instiktivno odabrali podne, dok su kao dva mesta nalaženja izabrani Tajms skver i Empajer stejt bilding.
Kukavica
Jovana i Jovan su se razišli. Jovana se sada zabavlja sa Marjanom, a Jovan sa Marijanom. Vikend je i oba novonastala para su pozvana kod Marka, Jovaninog i Jovanovog zajedničkog prijatelja, koji opet sprema žurku. I Jovana i Jovan bi veoma rado otišli na žurku, ali najgori mogući ishod koji mogu da zamisle je da celo veče provedu u istoj prostoriji sa svojim bivšim partnerom. Ovaj tip igre nosi ime kukavica (eng. chicken). Igra je ime dobila po scenama iz mnogih filmova (i, nažalost, realnog života) gde bi se dva vozača automobilima vozili jedan drugom u susret dok jedan ne bi skrenuo ili dok se ne bi sudarili.
Matrica isplativosti za igru kukavice |
U ovom slučaju oba igrača preferiraju ishod gde jedini odu (sa svojim novim partnerom) na Markovu žurku, zatim ishod gde niko ne ode kod Marka, pa situaciju gde drugi igrač provede veče na žurci, a kao najlošije rešenje, kao što je već spomenuto, oboje vide obostrani dolazak. Zanimljivo je da u ovom slučaju fer rešenje – da oboje izostanu sa žurke, nije i Nešov ekvilibrijum, budući da istog trenutka kada jedan igrač sazna da se drugi neće pojaviti, taj igrač ima veoma jak podsticaj da promeni strategiju i pojavi se na žurci, i obrnuto. I ovde je potrebno potražiti ili stvoriti Šelingovu tačku.
Zatvorenikova dilema
Zamislimo istu situaciju kao u igri kukavice, a jedino što ćemo promeniti je redosled isplativosti strategija. I Jovana i Jovan i dalje preferiraju ishod gde su jedini na žurci, zati situaciju gde niko ne ode kod Marka, ali ovde su njih dvoje toliko temperamentni da bi radije oboje bili na žurci nego da dopuste da sede kući dok je bivši partner kod Marka. Ovakva igra nosi naziv zatvorenikova dilema (eng. prisoner’s dilemma) po klasičnom primeru o dva osumnjičena lica koja je policija privela na ispitivanje.
Obojica su u zasebnim sobama i ne mogu da komuniciraju međusobno, a policija, budući da nema dovoljno dokaza da bi obojica bili osuđeni na maksimalne kazne, svakom obeća da će dobiti sniženje kazne ako prizna. U slučaju da obojica priznaju, obojica dobijaju po tri godine zatvora. U slučaju da obojica ćute, kazna je po jednu godinu, dok u slučaju da jedan prizna, a drugi ćuti, onaj koji je priznao biva pušten, dok onaj drugi dobija maksimalnu kaznu od pet godina. Obojici zatvorenika je bolje da priznaju bez obzira šta drugi uradi, tako da obojica bivaju zatvoreni na po tri godine, iako su mogli da se „provuku“ sa samo po jednom.
Matrica isplativosti za zatvorenikovu dilemu |
Zatvorenikova dilema predstavlja verovatno najpoznatiju igru iz teorije igara. Ne bez razloga, budući da se često javlja u realnom životu. Ono što je frustrirajuće je da igra ima Pareto-optimalnu strategiju, ali igrači nisu u stanju da sami od sebe dođu do tog ishoda, budući da on ne predstavlja i Nešov ekvilibrijum – i Jovana i Jovan bi opet promenili svoju odluku i otišli na Markovu žurku, kada bi znali da će biti jedini. Ono što razlikuje zatvorenikovu dilemu od igre kukavice je postojanje dominantne strategije za oba igrača u zatvorenikovoj dilemi. To je strategija koja je bolja bez obzira šta drugi igrač izabere. Jovana bira da ode na žurku zato što joj to nudi veću dobit, bilo da Jovan izabere da se pojavi ili ne, a budući da i on tako rezonuje, oboje se pojavljuju.
Male igre i veliki život
Učesnici Bečelor Ped programa |
Nedavno je ABC, već pomenuta televizijska mreža, u finalnoj epizodi svog rialiti šou programa Bečelor Ped (Bachelor Pad) stavila dvoje finalista u situaciju da igraju zatvorenikovu dilemu za glavnu premiju u igri. Ne bih da otkrivam šta se desilo već vas pozivam da se pretragom termina „bachelor pad finale keep or share“ na sajtu youtube.com sami uverite u ishod ove situacije. Takođe vas pozivam da razmislite koji je verovatno najveći propust ABC mreže u organizovanju ove zatvorenikove dileme i da pročitate i nastavak ovog članka u kojem će biti reči o tome zašto su kompanije za proizvodnju cigareta u SAD pozdravile potez države koji im je zabranio da se reklamiraju, zašto nije uvek loše da vas ucenjuju, koliko racionalno fudbaleri izvode penale, kao i o mnogim drugim životnim igrama.