Minimax - Hvad er det, definition og koncept

Minimaks, i spilteori, er en metode, der sigter mod at minimere det forventede tab. For at gøre dette antager spilleren, at hans modstanders beslutning vil være ugunstig. Det vil sige, at det værste scenarie forventes før modstanderens bevægelse.

For at sige det på en anden måde består minimax-metoden i, hvordan man tager den bedste beslutning, forudsat at den anden spiller vælger det værste tilfælde for dig.

Vi skal tage i betragtning, at denne metode er anvendelig i et to-personers spil (to spillere), og at det ikke er samarbejdsvilligt, men et nulsumsspil. Dette betyder, at hvad en spiller vinder, går tabt af den anden og omvendt. Derfor vil hver agent være interesseret i at maksimere sin egen nytte, selvom det skader den anden.

På dette tidspunkt skal vi også huske, at spilteori er en gren af ​​matematik og økonomi, der studerer valg, der optimerer den enkeltes situation, når omkostninger og fordele ikke er fastsat på forhånd, men afhænger af andres beslutninger.

Minimax-algoritme i et beslutningstræ

Vi kan se, hvordan minimax-metoden anvendes i et beslutningstræ med flere noder. Spillet starter i bunden og slutter med et resultat på det øverste niveau.

I bunden af ​​træet foretager modstanderen det første træk, så det værste resultat forventes. Så på det andet niveau er det op til spiller x, der vil forsøge at maksimere sin fortjeneste under hensyntagen til den beslutning, som modstanderen tidligere har taget.

På tredje niveau er det igen modstanderens tur og så videre. Vi viser et eksempel nedenfor.

Eksempel på Minimax-algoritme

I det følgende beslutningstræ viser vi resultaterne opnået af spiller x i hvert øjeblik af spillet. På basen, på første niveau, tager modstanderen beslutningen. Af den grund gives scenarierne, hvor spilleren kan tabe -10 eller vinde 5.

På det andet niveau er det op til spiller x, så han maksimerer sin fortjeneste. Mellem at tabe 10 eller vinde 1 vinder du 1. Ligeledes vil du vinde 7 mellem at vinde 5 eller 7.

Derefter er det modstanderens tur igen, så scenarierne vil blive givet, hvor spiller x har det dårligste resultat, -3 og 4, afhængigt af tilfældet. Endelig tager spiller x mellem at miste 3 eller vinde 4 den beslutning, der tillader sidstnævnte.

Vi skal tage i betragtning, at værdierne for hver knude afhænger af en hjælpefunktion.

For bedre at forstå træet, antag at beslutningen i bunden handler om distribution af produktet. Konkurrenten (modstanderen) kan outsource distributionen (se venstre side af træet). I så fald skal han f.eks. Vælge mellem forhandler A og B. Således vælger han førstnævnte, hvilket får spiller x til at miste 10 (Hvis han valgte B, ville spiller x vinde 12).

Men måske foretrækker modstanderen selv at distribuere sine varer ved at kunne leje motoriserede køretøjer eller købe en lastbil. Af begge scenarier skal du vælge den første, der er mindre smigrende for spiller x, fordi han vinder 5 og ikke 10.

Populære Indlæg

Hvad vil der ske med byen og dens job efter Brexit?

London, den vigtigste finansielle hovedstad i Den Europæiske Union, lider efter Brexit. En finansiel by, der konkurrerer med den tårnhøje finansielle by New York, er i fare, og med dens tusinder af arbejdere, der ser deres job i fare. Til de forskellige finansielle tjenester i byen kommer omkring 730.000 arbejdere hver dag på arbejde, inLæs mere…

Volkswagen vil kompensere de berørte køretøjer i USA

Efter opdagelsen for et par måneder siden, at Volkswagen brugte computersoftware, der var i stand til at forfalske resultaterne af forureningsbekæmpelsen, i øjeblikket i USA, køber Volkswagen tilbage eller reparerer de doktrerede biler til en værdi af næsten 15.000 millioner dollars, omkring 13.280 millioner af euro. Den tyske gruppe forfalskede kontrollen udført af de myndigheder, der har ansvaret for Læs mere…

Ølindekset og valutaprisprognosen

Prisindekser er en god guide til at kende købekraft og priser i et andet land end vores. Derudover er de især nyttige til at sammenligne værdien af ​​en valuta, så vi kan vide, om en valuta er overvurderet eller ikke sammenlignet med den nationale valuta. For tredje år i træk har GoEuro forberedtLæs mere…

Hvad laver Michael Burry nu? Vand

Dr. Michael Burry, en mand, der forudsagde sammenbruddet af boligboblen, og også erklærede realkreditmarkedet som et stort og uholdbart korthus. En person, der studerede medicin, men som trods sin begyndelse besluttede at vove sig ind i den gigantiske finansverden. For nogle er det en eminence, kendtLæs mere…