תגובה טובה ביותר
בתורת המשחקים, תגובה טובה ביותר היא אסטרטגיה אשר מובילה לתועלת הטובה ביותר עבור שחקן, בהינתן האסטרטגיות של השחקנים האחרים. תגובה טובה ביותר היא רעיון מרכזי בתורתו של ג'ון פורבס נאש העוסקת בשיווי משקל נאש.
הגדרה פורמלית
[עריכת קוד מקור | עריכה]משחק בן n שחקנים יסומן כאשר היא קבוצת האסטרטגיות של השחקן ה-, ו- היא פונקציה שמתאימה לכל בחירת אסטרטגיות של כל השחקנים את התועלת (נקרא גם תשלום, או רווח) שמפיק שחקן ה- ממנה.
נסמן את צירוף האסטרטגיות של כל השחקנים באות (ללא סימון שחקן): . נהוג לכתוב את צירוף האסטרטגיות מנקודת מבטו של שחקן כך: . כלומר, האסטרטגיה של שחקן ה- וכל האסטרטגיות של שאר השחקנים.
אסטרטגיה היא תגובה טובה ביותר ל - אם לכל אסטרטגיה אחרת של שחקן ה- מתקיים: . במקרים רבים יש תגובה טובה ביותר אחת ויחידה, ואז היא נקראת "התגובה הטובה ביותר".
דוגמה
[עריכת קוד מקור | עריכה]נסתכל על משחק בין שני שחקנים (באסטרטגיות טהורות). שחקן 1 יכול לבחור אסטרטגיה אחת מתוך הקבוצה ושחקן 2 יכול לבחור אסטרטגיה אחת מתוך הקבוצה . התועלות מתוארות בעזרת הטבלה הבאה. כל משבצת מגדירה את תוצאת הפונקציה כאשר הוא הצירוף הרלוונטי של השורה והטור ( לדוגמה). התועלת של שחקן 1 מופיע משמאל והתועלת של שחקן 2 מופיע מימין.
שחקן 2 בוחר באסטרטגיה | שחקן 2 בוחר באסטרטגיה | שחקן 2 בוחר באסטרטגיה | |
---|---|---|---|
שחקן 1 בוחר באסטרטגיה | 4, 4 | 3, 12 | 2, 1 |
שחקן 1 בוחר באסטרטגיה | 3, 1 | 1, 3 | 3, 2 |
שחקן 1 בוחר באסטרטגיה | 2, 3 | 4, 3 | 2, 0 |
נסתכל על נקודות מבטו של שחקן 1, בהינתן האסטרטגיה שבחר שחקן 2:
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירה של שחקן 1 באסטרטגיה תוביל לתועלת 4, בחירה באסטרטגיה תוביל לתועלת 1, ובחירה באסטרטגיה תוביל לתועלת 3. לכן התגובה הטובה ביותר במקרה זה תהיה אסטרטגיה .
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה על ידי שחקן 1 היא התגובה הטובה ביותר שתוביל לתועלת 12.
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה היא התגובה הטובה ביותר שתוביל לתועלת 2.
עתה, נסתכל על נקודת מבטו של שחקן 2, בהינתן האסטרטגיה של שחקן 1:
- אם שחקן 1 בחר לשחק את אסטרטגיה , בחירה של שחקן 2 באסטרטגיה תוביל לתועלת 4, בחירה באסטרטגיה תוביל לתועלת 3, ובחירה באסטרטגיה תוביל לתועלת 2. לכן התגובה הטובה ביותר במקרה זה תהיה אסטרטגיה .
- אם שחקן 1 בחר לשחק את אסטרטגיה , נשים לב שיש כאן שתי אסטרטגיות העונות להגדרה של התגובה הטובה ביותר. בחירת אסטרטגיה או על ידי שחקן 2 היא התגובה הטובה ביותר שתוביל לתועלת 3.
- אם שחקן 1 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה היא התגובה הטובה ביותר שתוביל לתועלת 4.
הערה: מצב בו שני השחקנים בוחרים אסטרטגיות כך שכל אחת היא תגובה טובה ביותר לשנייה נקרא שיווי משקל נאש. בדוגמה שלנו יש שיווי משקל נאש: .
דינמיקה של התגובה הטובה ביותר
[עריכת קוד מקור | עריכה]דינמיקה של התגובה הטובה ביותר היא תיאור של משחק סדרתי, בו כל שחקן משחק בתורו את התגובה הטובה ביותר בהתאם למצב המשחק הנוכחי. במשחק כזה כל שחקן עושה את הצעד הטוב ביותר עבורו בסיבוב הנוכחי, ללא התחשבות בעתיד המשחק. לכן, דינמיקה של התגובה הטובה ביותר לא תמיד תוביל למצב של שיווי משקל טהור, אפילו אם הוא קיים. במשחקי פוטנציאל דינמיקה של התגובה הטובה ביותר אכן תוביל לשיווי משקל נאש טהור.
דוגמה
[עריכת קוד מקור | עריכה]במשחק הבא קיים שיווי משקל נאש עבור בחירת האסטרטגיות , אך אם נתחיל את דינמיקת התגובה הטובה ביותר מאחד התאים , , , או כל שחקן בתורו ירצה לעבור לאסטרטגיה טובה יותר - כזו בה התועלת שלו היא 1 ולא -1. כך השחקנים "יסתובבו" במעגל, ולא יגיעו אף פעם ל - , שהיא נקודת שיווי משקל, ובעלת תועלות גבוהות יותר לשני השחקנים.
0, 0 | 1, 1- | 1-, 1 | |
0, 0 | 1-, 1 | 1, 1- | |
3, 3 | 0, 0 | 0, 0 |
אסטרטגיות מעורבות
[עריכת קוד מקור | עריכה]אסטרטגיה מעורבת היא התגובה הטובה ביותר כל אחת מהאסטרטגיות בתומך שלה (כלומר, האסטרטגיות שהסתברותן גדולה מ-0) היא התגובה הטובה ביותר.
זאת משום שאם קיימת בתומך אסטרטגיה טהורה שאיננה התגובה הטובה ביותר, נוכל ליצור אסטרטגיה מעורבת חדשה, שבה ההסתברות לקבלת היא 0, ולכל שאר האסטרטגיות בתומך נוסיף את חלקה הפורפורציונלי של . כך נקבל אסטרטגיה מעורבת שתועלתה גדולה יותר מזו המקורית.