Minimax - Hvad er det, definition og koncept

Indholdsfortegnelse:

Minimax - Hvad er det, definition og koncept
Minimax - Hvad er det, definition og koncept
Anonim

Minimaks, i spilteori, er en metode, der sigter mod at minimere det forventede tab. For at gøre dette antager spilleren, at hans modstanders beslutning vil være ugunstig. Det vil sige, at det værste scenarie forventes før modstanderens bevægelse.

For at sige det på en anden måde består minimax-metoden i, hvordan man tager den bedste beslutning, forudsat at den anden spiller vælger det værste tilfælde for dig.

Vi skal tage i betragtning, at denne metode er anvendelig i et to-personers spil (to spillere), og at det ikke er samarbejdsvilligt, men et nulsumsspil. Dette betyder, at hvad en spiller vinder, går tabt af den anden og omvendt. Derfor vil hver agent være interesseret i at maksimere sin egen nytte, selvom det skader den anden.

På dette tidspunkt skal vi også huske, at spilteori er en gren af ​​matematik og økonomi, der studerer valg, der optimerer den enkeltes situation, når omkostninger og fordele ikke er fastsat på forhånd, men afhænger af andres beslutninger.

Minimax-algoritme i et beslutningstræ

Vi kan se, hvordan minimax-metoden anvendes i et beslutningstræ med flere noder. Spillet starter i bunden og slutter med et resultat på det øverste niveau.

I bunden af ​​træet foretager modstanderen det første træk, så det værste resultat forventes. Så på det andet niveau er det op til spiller x, der vil forsøge at maksimere sin fortjeneste under hensyntagen til den beslutning, som modstanderen tidligere har taget.

På tredje niveau er det igen modstanderens tur og så videre. Vi viser et eksempel nedenfor.

Eksempel på Minimax-algoritme

I det følgende beslutningstræ viser vi resultaterne opnået af spiller x i hvert øjeblik af spillet. På basen, på første niveau, tager modstanderen beslutningen. Af den grund gives scenarierne, hvor spilleren kan tabe -10 eller vinde 5.

På det andet niveau er det op til spiller x, så han maksimerer sin fortjeneste. Mellem at tabe 10 eller vinde 1 vinder du 1. Ligeledes vil du vinde 7 mellem at vinde 5 eller 7.

Derefter er det modstanderens tur igen, så scenarierne vil blive givet, hvor spiller x har det dårligste resultat, -3 og 4, afhængigt af tilfældet. Endelig tager spiller x mellem at miste 3 eller vinde 4 den beslutning, der tillader sidstnævnte.

Vi skal tage i betragtning, at værdierne for hver knude afhænger af en hjælpefunktion.

For bedre at forstå træet, antag at beslutningen i bunden handler om distribution af produktet. Konkurrenten (modstanderen) kan outsource distributionen (se venstre side af træet). I så fald skal han f.eks. Vælge mellem forhandler A og B. Således vælger han førstnævnte, hvilket får spiller x til at miste 10 (Hvis han valgte B, ville spiller x vinde 12).

Men måske foretrækker modstanderen selv at distribuere sine varer ved at kunne leje motoriserede køretøjer eller købe en lastbil. Af begge scenarier skal du vælge den første, der er mindre smigrende for spiller x, fordi han vinder 5 og ikke 10.