לדלג לתוכן

תכנון ליניארי

ערך מומלץ
מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף תכנות לינארי)

בעיית תכנון ליניארי היא בעיית אופטימיזציה של ביטוי ליניארי תחת אילוצים ליניאריים. כלומר, בהינתן משתנים ומערכת של אי-שוויונות בין משוואה ליניארית על המשתנים לבין קבוע, יש למצוא את הערך המקסימלי או המינימלי שפונקציה ליניארית כלשהי יכולה לקבל. לבעיות אלו יש חשיבות גדולה במתמטיקה, במדעי המחשב ואף בתחומים כמו כלכלה וחקר ביצועים.

לבעיות אלו פותחו אלגוריתמים שונים כגון שיטת הסימפלקס, אשר רצים בסיבוכיות שונה ומתאימים לבעיות שונות, והן נתונות למחקר מתמיד.

וריאציה על הבעיה בעלת חשיבות מיוחדת היא תכנון ליניארי בשלמים – אותה בעיה בתוספת הדרישה שהמשתנים יקבלו ערכים שלמים. בעיה זאת היא NP-שלמה וגם היא נחקרה רבות.

לבעיות תכנון ליניארי יש שימושים רבים ומגוונים, למשל תכנון תקציב, ניתוב, תכנון דיאטה, הקצאת משאבים, תכנון תחבורה, מציאת אסטרטגיה אופטימלית ועוד. הן נחקרו לראשונה על ידי לאוניד קנטורוביץ' וצ'אלינג קופמאנס (שזכו על מחקרים אלה בפרס נובל לכלכלה) החל משנות השלושים והארבעים של המאה העשרים.

בעיית תכנון ליניארי מורכבת מאוסף משתנים , עליהם יש אילוצים ליניאריים. אילוץ ליניארי הוא אי-שוויון בין משוואה ליניארית על המשתנים לבין קבוע, כלומר או . ניתן גם לדרוש שוויון; אם תנאי הבעיה אינם מאפשרים זאת, ניתן לדרוש שוויון באמצעות שני האי-שוויונות האחרונים שביחד שקולים לו. בנוסף ישנה פונקציית מטרה שאותה יש למזער או למקסם.

לבעיה לא תמיד קיים פתרון (דוגמה פשוטה: התנאים הם ), וייתכן גם שפונקציית המטרה איננה חסומה (דוגמה פשוטה: התנאים הם , ויש למקסם את ). לפיכך, פתרון הבעיה יכול להיות אחת משלוש אפשרויות: אין פתרון כלל, אין פתרון חסום, יש לפחות פתרון אופטימלי אחד.

לדוגמה: נניח ש- כלומר ישנם שלושה משתנים, והאילוצים הם:

פתרון למערכת האילוצים הזאת הוא הצבה של ערכים מספריים למשתנים, כך שכל האילוצים מתקיימים. למשל וכן הם פתרונות למערכת. לעומת זאת, הוא לא פתרון, שכן הוא לא מקיים את אי השוויון הראשון: לא מתקיים .

בנוסף למערכת האי שוויונות, נניח שצריך למקסם את פונקציית המטרה . ניתן לראות שהצבת הפתרון הראשון שהצגנו נותנת , ואילו הצבת הפתרון השני נותנת . לכן, הפתרון השני נותן ערך גבוה יותר לפונקציית המטרה. ניתן להראות (בשיטות שידונו בהמשך הערך) שכל פתרון חוקי (כלומר פתרון שמקיים את כל האילוצים) אחר שנציב למשתנים יתן ערך קטן יותר מ-16, ועל כן הוא הפתרון האופטימלי.

כתיב מטרציוני

[עריכת קוד מקור | עריכה]

אם כל אי השוויונות נתונים באותו כיוון (כלומר בכולם או בכולם ), אז נוח להציג את הבעיה בעזרת מטריצות.

למשל, את הבעיה שהצגנו לעיל ניתן להציג בכתיב מטרציוני כך:

בכתיב זה, בעיית תכנון ליניארי כוללת וקטור באורך , מטריצה בגודל , וקטור בגודל , ווקטור בגודל , כך שהבעיה היא למקסם/למזער את תחת האילוצים או .

צורה קנונית

[עריכת קוד מקור | עריכה]

בעיית תכנון ליניארי תקרא בעיה ב"צורה קנונית" אם היא מקיימת את התכונות הבאות:[1]

  • כל התנאים הם מהצורה
  • כל המשתנים מקיימים גם
  • המטרה היא למקסם ביטוי ליניארי (ולא למזער אותו)

כל בעיית תכנון ליניארי ניתן להעביר לצורה קנונית:

  • אם התכונה הראשונה אינה מתקיימת, ניתן להפוך את ל .
  • אם התכונה השנייה אינה מתקיימת עבור משתנה , ניתן להחליף את המשתנה בביטוי כאשר דורשים .
  • אם התכונה השלישית אינה מתקיימת, ניתן להחליף את "למזער את " ב"למקסם את " (ווקטור הפתרון יהיה אותו וקטור).

סך הכול הגדלנו את כמות המשתנים והמשוואות פי 2 לכל היותר.

זוהי צורת הצגה נוספת של בעיית תכנון ליניארי שהיא בעלת חשיבות באלגוריתמים כגון שיטת הסימפלקס. בצורה זו מוסיפים משתני עזר (הנקראים משתני slack) כדי שתנאי הבעיה יהיו שוויונות או תנאי אי שליליות על המשתנים וגם פונקציית המטרה בנויה ממשתנה אחד בלבד.[2]

בכתיב מטריציוני, הבעיה מוצגת כמטריצת בלוקים באופן הבא:

כאשר הם המשתנים המקוריים, הם משתני ה slack, ו- הוא המשתנה שיש למקסם.

לדוגמה, אם הבעיה היא:

אז צורת ה-slack המתאימה היא:

הצגה גאומטרית

[עריכת קוד מקור | עריכה]
הצגה גאומטרית של תכנון ליניארי

ניתן לחשוב על הווקטורים באורך n כעל נקודות במרחב ה-n-ממדי. במקרה זה, כל אילוץ חוצה את המרחב לשני חצאי מרחבים, כך שהפתרונות החוקיים נמצאים באחד מהם. אוסף האילוצים יחדיו מתורגם לחיתוך של כל חצאי המרחבים הנוצרים באמצעות אוסף זה. הצורה גאומטרית המתקבלת נקראת פוליטופ (אנ').[3]

למשל, אם ישנם שני משתנים אז כל אילוץ יוצר חצי מישור ואם החיתוך של כל חצאי המישורים האלה חסום אז מתקבל מצולע קמור. במרחב n-ממדי כללי, כל אילוץ באוסף יוצר חצי מרחב והחיתוך של כל חצאי המרחבים האלה יוצר פאון קמור. משיקולי נוחות, נתייחס בהמשך ערך זה לצורות גאומטריות אלה כמצולע או פאון גם אם הן אינן חסומות ועל כן אינן מצולע/פאון במובן הרגיל. כך גם עושים בספרות המקצועית בנושא.[א][4]

קבוצת הפתרונות האופטימליים היא פוליטופ מממד קטן יותר (או שווה במקרה שהפונקציה קבועה), שנמצא בקצה הפוליטופ. למשל, אם הבעיה ניתנת להצגה כפאון, הרי שקבוצת הפתרונות האופטמיליים יכולה להיות קודקוד של הפאון, צלע של הפאון, או פאה שלו.

בתמונה משמאל ניתן לראות הצגה גאומטרית של בעיית תכנון ליניארי בשני משתנים. בעיה כזו אפשר להציג במרחב הדו-ממדי, כלומר במישור. שלושת הישרים הצבעוניים הם אילוצים ליניאריים, שמחייבים את הפתרונות להיות מתחתם. בנוסף אילוצי אי-שליליות על המשתנים גוררים שהם חייבים להיות ברביע הראשון. האזור שהם יכולים להיות בו מסומן בצבע כחול, וניתן לראות שהוא מחומש.

תכנון ליניארי בשלמים

[עריכת קוד מקור | עריכה]
בעיית תכנון ליניארי שפתרונותיה נמצאים בין הקווים הכחולים; הנקודות האדומות שעל גבי מערכת הצירים מסמנות את הפתרונות השלמים שקיימים לבעיה זו.

תכנון ליניארי בשלמים (ILP - Integer Linear Programming) מציין בעיה דומה לבעיית התכנון הליניארי, אלא שהמשתנים חייבים לקבל ערכים שלמים דווקא. בניגוד לבעיית תכנון ליניארי רגילה שלה יש פתרון פולינומי, בעיה זאת היא NP קשה. הצגתה כבעיית הכרעה (האם קיים פתרון שבו ערך פונקציית המטרה עולה על ערך מסוים) היא בעיה NP שלמה. ספירת הנקודות השלמות שמקיימות את התנאים היא בעיה P# שלמה.[5]

זוהי אחת מהבעיות שהופיעו במאמר המפורסם של ריצ'רד קארפ מ-1972, בו הוא הציג רשימה של 21 בעיות NP שלמות. למעשה, הבעיה אותה הציג קארפ חלשה הרבה יותר: המשתנים יכולים לקבל ערכים בוליאנים בלבד (0 או 1), ואין פונקציית מטרה למקסם – צריך לענות רק על השאלה האם קיים פתרון או לא. הוא הציג רדוקציה מבעיית הספיקות.[6]

כיוון שלא ידוע האם P=NP, לא ידוע האם יש אלגוריתם פולינומי לפתרון בעיית תכנון ליניארי בשלמים. עם זאת, קיימים היום אלגוריתמים שמאפשרים לפתור רבות מהבעיות בזמן סביר, ועל כן פעמים רבות רדוקציה פולינומית מבעיה מסוימת לבעיית תכנון ליניארי בשלמים מספיקה כדי למצוא לה פתרון משביע רצון. למעשה, את רוב הבעיות ה-NP שלמות ניתן להפוך לבעיות תכנון ליניארי בשלמים בקלות יחסית. משום כך יש לאלגוריתמים לפתרון תכנון ליניארי בשלמים חשיבות גדולה, הן תאורטית והן מעשית, והם מאפשרים לפתור בעיות סיפוק אילוצים רבות.

ניתן גם לדרוש שרק חלק מהמשתנים יהיו שלמים; בעיה כזאת נקראת "תכנון ליניארי מעורב" (MIP - Mixed Integer Programming) והיא קשה לפחות כמו תכנון ליניארי בשלמים, כי כל בעיית תכנון ליניארי בשלמים היא בפרט גם בעיית תכנון ליניארי מעורב.

תכנון ליניארי שלם

[עריכת קוד מקור | עריכה]

כאשר ידוע שלבעיית תכנון ליניארי יש פתרון אופטימלי שבו כל המשתנים שלמים, היא נקראת בעיית תכנון ליניארי שלמה. עם זאת, עדיין ייתכן שיהיו לה גם פתרונות אופטימליים לא שלמים, כי יכולים להיות הרבה פתרונות אופטימליים. זיהוי בעיה כזאת הוא חשוב, שכן במקרה זה אלגוריתם יעיל למציאת פתרון שלם יוכל לכלול פתרון הבעיה הרגילה (לאו דווקא בשלמים) וחילוץ הפתרונות השלמים מתוכה.

דוגמה לקריטריון כזה היא: בהינתן בעיה , אם המטריצה היא בעלת ערכים שלמים ויונימודולרית לחלוטין, כלומר הדטרמיננטה של כל תת-מטריצה של היא 0, 1, או 1-. בנוסף, כל הערכים של צריכים להיות שלמים.[7]

הקצאת משאבים

[עריכת קוד מקור | עריכה]

נניח שבמפעל מסוים רוצים לייצר שלושה מוצרים: מוצר 1, מוצר 2 ומוצר 3. לכל מוצר צריך כמות מסוימת של מים ושל חשמל כדי לייצר אותו. כמות המים והחשמל של המפעל מוגבלות. כמו כן לכל מוצר יש מחיר אחר בו אפשר למכור אותו. נניח שלמוצר ה-i צריך חשמל לקילו, מים לקילו, ומקבלים תמורתו שקלים לקילו. סה"כ יש למפעל חשמל ו- מים. אז ניתן לכתוב את המשוואות הבאות:

פתרון הבעיה ימצא את המספרים , מהם ניתן למצוא את הכמויות שנייצר מכל מוצר.

בעיית הזרמה

[עריכת קוד מקור | עריכה]

נאמר שבמדינה מסוימת יש 3 נמלים ו-2 תחנות כוח. בנמל מספר פורקים בכל יום ליטרים של נפט. תחנת כוח מספר זקוקה ל- ליטרים כדי לפעול. כמו כן בין נמל לתחנה יש כביש באורך (כאשר עלות ההובלה של ליטר נפט לקילומטר היא קבועה). יש למצוא איך להזרים נפט במינימום מחיר.

כדי לפתור את הבעיה נגדיר 6 משתנים:

כאשר משתנה פירושו "כמות הליטרים שמזרימים מנמל לתחנה ".

האילוצים הם:

שלושת האילוצים הראשונים הם על הנמלים - כל נמל יכול להוציא לכל היותר את כמות הנפט שיש לו. שני האילוצים שאחר כך הם אילוצים על התחנות - כל תחנה צריכה לקבל כמות מספקת של נפט. לאחר מכן יש אילוץ אי-שליליות (אי אפשר להעביר כמות שלילית של נפט). פונקציית המטרה היא העלות הכוללת של השינוע ויש למזער אותה.

ניתן לראות שאם מתקיים אז אין לבעיה פתרון. ואכן, אם בשלושת הנמלים יחד פורקים פחות נפט מהכמות שדרושה לתחנות, בוודאי אין אפשרות להזרים מספיק נפט.

בעיית כיסוי הקודקודים

[עריכת קוד מקור | עריכה]
דוגמה לבעיית כיסוי קודקודים

בעיית כיסוי הקודקודים היא: בהינתן גרף , יש למצוא קבוצת קודקודים קטנה ביותר , כך שלכל קשת המקיימת , לפחות אחד מהקודקודים נמצא ב-. זוהי בעיה NP קשה. נציג בעיית תכנון ליניארי בשלמים שפותרת אותה:

לכל קודקוד יהיה משתנה שאומר "הקודקוד ב-" אז המשוואות הן: לכל קשת , המשוואה תהיה (כלומר לפחות אחד מהקודקודים אכן ב-S). ובנוסף נדרוש לכל קודקוד v. (אין צורך לדרוש שכן זה בהכרח יתקיים בפתרון המינימלי, שהרי כל פתרון שבו יישאר כזה גם אם ). יש למזער את הסכום .

הפתרון של בעיה זו בשלמים יהיה פתרון לבעיית כיסוי הקודקודים. פתרון שאיננו בשלמים יתן לכל קודקוד משקל ממשי בין 0 ל-1, כך שסכום המשקלים לכל קשת הוא לפחות 1.

למשל, עבור הבעיה שבתמונה שמשמאל המשתנים הם והאילוצים הם בנוסף לאילוץ לכל i. פונקציית המטרה היא . הפתרון האופטימלי הוא כך שהתוכנית הליניארית שלמה במקרה זה, ומצאה כיסוי מינימלי - {1,2,4}. ניתן להראות גם שעבור גרף דו צדדי תמיד יהיה פתרון בשלמים, כיוון שהמטריצה יונימודולרית לחלוטין (כפי שתואר למעלה).[8]

לעומת זאת, דוגמה בה התכנית לא מוצאת פתרון בשלמים: נניח שנתון לנו גרף משולש, כלומר שלושה קודקודים עם כל הקשתות ביניהם. אזי התוכנית הליניארית שהצגנו תמצא את הפתרון , כלומר לא פתרון חוקי לבעיית כיסוי הקודקודים.

דוגמה לסודוקו

נדגים כיצד ניתן לפתור סודוקו באמצעות תכנון ליניארי בשלמים.[9]

לכל שורה , עמודה וספרה ניצור משתנה שאומר "במשבצת שנמצאת בשורה , עמודה נמצאת הספרה ". כל אחד משלושת הפרמטרים הללו הוא מקבל ערכים בין 1–9 (יש 9 שורות, 9 עמודות ו-9 ספרות בסודוקו) ולכן סך הכל יש משתנים. משתנה שווה ל-1 אם בשורה ועמודה נמצאת הספרה , אחרת שווה לאפס.

האילוצים הם:

  • לכל שורה ועמודה , יש בדיוק ספרה אחת שנמצאת במשבצת המתאימה, כלומר בדיוק אחד מהמשתנים מקבל את הערך 1. לכן האילוץ הוא .
  • לכל שורה , ולכל שתי עמודות שונות , לא ייתכן שאותה ספרה תתקבל בשתיהן (מאילוצי הסודוקו). לכן לכל ספרה מוסיפים את האילוץ (לא ייתכן ששני המשתנים מקבלים את הערך 1 בו זמנית). בדומה גם לכל עמודה ולכל שתי שורות שונות מוסיפים את האילוץ ולכל שתי משבצות שנמצאות באותו ריבוע 3x3, גם כן נוסיף את האילוץ .
דוגמאות לאילוצים שכאלה:
  • הרמזים ההתחלתיים נותנים גם הם אילוצים. למשל, בסודוקו שמשמאל בשורה 1, עמודה 1 נמצאת הספרה 5. אם כן המשתנה חייב לקבל את הערך 1, ואפשר להוסיף את האילוץ . באופן כללי אם ברמזים נתון שבמשבצת שבשורה ועמודה יש את הערך , אז אפשר להוסיף את האילוץ .
  • נוסף לכל אלה יש להוסיף את האילוץ לכל המשתנים.

כדי לפתור את הסודוקו, יש למצוא פתרון כלשהו בשלמים למערכת האילוצים. כלומר אין פונקציית מטרה (מבחינה פורמלית פונקציית המטרה היא הפונקציה הקבועה 0). מפתרון זה ניתן לקרוא את הפתרון. למשל בסודוקו שמשמאל נקבל שבפתרון המערכת מתקיים ואם כן המשבצת השלישית בשורה הראשונה מקבלת את הערך 4.

שימו לב: לא יכולנו להשתמש במשתנה כדי לקבל ישירות את הספרה שלו (למשל, שהמשתנה יקבל בפתרון את הערך 4). הסיבה היא שצריך להוסיף, למשל, אילוצי , ולא ניתן לעשות זאת באילוצי תכנון ליניארי.

הצורה הדואלית

[עריכת קוד מקור | עריכה]

עבור הבעיה קיימת הבעיה הדואלית כאשר הוא וקטור m ממדי ו- זוהי המטריצה המשוחלפת ל-. למעבר זה יש חשיבות תאורטית בהוכחות שונות, ובפרט בהוכחת הנכונות של אלגרותמים שונים.

בנוסף, ניתן למצוא גם קשר רעיוני בין הבעיות. למשל, נחזור לדוגמה הראשונה. המשוואות היו

הבעיה הדואלית היא:

ניתן לחשוב על בעיה זאת כבעיה הבאה: הוא משתנה שמייצג חשמל, ו- משתנה שמייצג מים. אז כל משוואה מתייחסת למוצר אחר, ומבקשת, תחת תנאי חשמל ומים, שהרווח יהיה לפחות מספר מסוים. למשל המשוואה הראשונה מתייחסת למוצר מספר 1, בו המשוואה הראשונה דורשת שנשקיע מספיק חשמל ומים כדי לקבל את הרווח . בדומה משוואות 2,3 מתייחסות למוצרים 2,3 בהתאמה. תחת תנאים אלה, יש למזער את העלות הכוללת של מים וחשמל.

הבעיה הדואלית לדוגמה השנייה כוללת את המשתנים , משתנה לכל קשת, כך שלכל קודקוד יש את המשוואה ויש למקסם את . כאשר המשתנים שלמים, הבעיה היא למצוא קבוצת קשתות מקסימלית כך שכל קודקוד נוגע בלכל היותר אחת מהן - בעיה הידועה כמציאת שידוך מקסימלי (לה יש פתרון פולינומי).

משפטי הדואליות

[עריכת קוד מקור | עריכה]

משפט הדואליות החלש קובע שאם הבעיה היא בצורה קנונית, אז הבעיה הדואלית מקיימת שלכל זוג פתרונות מתקיים , ובפרט גם לפתרונות האופטימליים. . משפט הדואליות החזק קובע שלפתרונות האופטימליים (אם הם קיימים - או שאחת הבעיות לא חסומה, ואז השנייה לא פיזיבלית).

משפט הדואליות החלש מאפשר למצוא תנאי עצירה לאלגוריתמים שונים: אם מריצים את האלגוריתם על הבעיה ועל הבעיה הדואלית לה במקביל, מקבלים חסמים מכל בעיה על השנייה: לכל שמוצאים, מהווה חסם עליון ל-, ולהפך.

ממשפט הדואליות החזק נובע משפט זרימה מקסימלית - חתך מינימלי[10], משפט קניג[11] ומשפט המינימקס.[12]

ההוכחה למשפט הדואליות החלש פשוטה למדי ודורשת מניפולציות על איברים בלבד:

מתקיים . כיוון ש- הוא פתרון, אז לכל מתקיים . כמו כן, כיוון ש- הוא פתרון, לכל מתקיים . נשלב את כל זאת כדי לקבל:

כרצוי.

את משפט הדואליות החזק ניתן להוכיח בעזרת הלמה של פרקס.[13]

בעיות כיסוי ואריזה

[עריכת קוד מקור | עריכה]

בעיה בצורה קנונית נקראת "בעיית אריזה" אם כל ערכי המטריצות והווקטורים הם בעלי ערכים אי שליליים. הסיבה לכינוי זה היא שאנחנו מנסים למקסם את מה שאנחנו מכניסים לערכים תוך מגבלה מלמעלה - כמו אדם שמנסה לארוז כמה שיותר לתוך נפח מוגבל.

בעיה בצורה הדואלית, , תקרא "בעיית כיסוי" אם היא מקיימת תכונה זו. הסיבה לכינוי זה היא שאנחנו מנסים למצוא ערכים קטנים ביותר שיעברו סף מסוים - מנסים לכסות את הערכים ב-.

לבעיות אלה חשיבות מיוחדת, בפרט בשלמים, ואלגוריתמים רבים פותחו במיוחד בשבילן.[14]

דוגמאות לבעיות אריזה הן בעיית תרמיל הגב, מציאת קבוצה בלתי תלויה מקסימלית, בעיית אריזת קבוצות (set packing) ובעיית אריזת הדליים (bin packing).

דוגמאות לבעיות כיסוי הן בעיית כיסוי קודקודים ובעיית כיסוי קבוצות.

אלגוריתמים

[עריכת קוד מקור | עריכה]

שיטת הסימפלקס

[עריכת קוד מקור | עריכה]
הדגמה ויזואלית לשיטת הסימפלקס. הולכים לאורך צלעות הפאון מקודקוד לקודקוד, עד לפתרון אופטימלי.

האלגוריתם הוותיק ביותר הוא אלגוריתם הסימפלקס. למעשה הוא לא אלגוריתם במובן הרגיל אלא משפחה של אלגוריתמים, שכן אחד הצעדים בו לא מוגדר וניתן לממש אותו בדרכים שונות. האלגוריתם הומצא בשנת 1947 על ידי ג'ורג' דנציג.[15]

האינטואיציה מאחורי השיטה מתקבלת מההצגה הגאומטרית לעיל. כאמור, מרחב הפתרונות הפיזיביליים הוא פוליטופ קמור. ניתן לראות שאם נעים על קו ישר, פונקציית המטרה הליניארית היא מונוטונית על הקו הזה. מכאן נובע שהערך המקסימלי יתקבל על אחד הקודקודים (אלא אם הפוליטופ לא חסום). שיטת הסימפלקס היא: מתחילים מקודקוד כלשהו, מסתכלים על הקודקודים שמחוברים אליו בצלע, בוחרים אחד מהם עליו פונקציית המטרה גדולה או שווה, ועוברים אליו (צעד המעבר נקרא pivot). לא עוברים אל קודקוד שכבר היינו בו. אם האלגוריתם מסתיים, זה כיוון שאין קודקודים יותר גדולים לעבור אליהם, וסיימנו בהצלחה. כיוון שמספר הקודקודים סופי, האלגוריתם יסתיים בזמן סופי.

זמן ריצת האלגוריתם: צעד pivot לוקח , לכן זמן הריצה הוא , כאשר הוא מספר הצעדים שנעשה. חסום על ידי מספר הקודקודים שעלול להיות אקסופננציאלי, לכן זמן הריצה עלול להיות אקספוננציאלי. עד היום לא ידועה שיטה פולינומית לממש את זמן הריצה (אך גם לא ידוע שאין שיטה כזאת), ויש חסם תחתון אקספוננציאלי על רבות מהשיטות.

שיטת האליפסואיד

[עריכת קוד מקור | עריכה]
איטרציה של שיטת האליפסואיד. עוברים מהאליפסה האדומה לאליפסה הירוקה, שמכילה גם היא את השטח הכחול.

השיטה נמצאה ב 1979 על ידי לאוניד חצ'יאן, והיוותה פריצת דרך תאורטית גדולה בכך שהוכיחה זמן ריצה פולינומי, אך איננה מעשית לערכי n שאינם קטנים מאוד. בשיטה מתחילים מאליפסואיד גדול מספיק כדי להכיל את הנקודה המינימלית, ואז בסדרת צעדים מקטינים את האלפיסואיד כך שהוא עדיין כולל אותה, עד שהאליפסואיד קטן מספיק.[16]

האלגוריתם רץ בסיבוכיות , כאשר הוא אורך הקלט - מספר הביטים שצריך כדי לתאר את כל הבעיה.

האלגוריתם של קרמרקר

[עריכת קוד מקור | עריכה]

אלגוריתם שנמצא על ידי המתמטיקאי ההודי נרמנדה קרמרקר בשנת 1984.[17] אף על פי שלא היה האלגוריתם הפולינומי הראשון, הוא היה האלגוריתם הפולינומי הראשון שרץ בזמן מעשי (אף על פי שבדרך כלל שיטת הסימפלקס עדיפה על קלטים אמיתיים).

האלגוריתם נקרא גם "שיטת הנקודה הפנימית" (interior point method) משום שהוא "מחפש" את הנקודה האופטימלית בפנים הפוליטופ, ולא על שפתו כמו שיטת הסימפלקס. זמן הריצה שלו הוא

האלגוריתם הנוכחי

[עריכת קוד מקור | עריכה]

נכון ל-2022, האלגוריתם הטוב ביותר הידוע רץ בסיבוכיות ,[18] כאשר הוא המעריך של ביצוע כפל מטריצות, כלומר כזה שניתן עבורו להכפיל מטריצות בסיבוכיות (נכון ל-2022, ידוע ), ו- הוא המעריך הדואלי של כפל מטריצות, כלומר המספר המקסימלי עבורו ניתן להכפיל מטריצות בגודלי בזמן (נכון ל-2022, ידוע ).

אלגוריתמים למציאת פתרון בשלמים

[עריכת קוד מקור | עריכה]

כאמור לעיל, הבעיה בשלמים היא NP קשה, לכן בהנחת , אין לה אלגוריתם פולינומי, אפילו אם לא מנסים למקסם פונקציית מטרה. לכן אלגוריתמים לפתרון תכנון ליניארי בשלמים עושים את אחד הדברים הבאים:

  • רצים במקרה הגרוע בזמן אקספוננציאלי (במטרה שעל קלטים סבירים יסיימו בזמן סביר).
  • מוצאים פתרון שלא מקיים את כל האילוצים (במטרה למצוא פתרון שיקיים כמה שיותר).
  • רצים רק על קלטים שמקיימים הנחות כלשהן.
  • דורשים הרצה פעם אחת של אלגוריתם בזמן אקספוננציאלי, שמאפשרת מציאת מידע איתו יהיה אפשר לפתור בעיות רבות בזמן פולינומי.
  • רצים במקרים בהם ברור שיש פתרון (למשל, לבעיות אריזה תמיד קיים פתרון ה-0. לבעיות כיסוי תמיד יש פתרון בו כל המשתנים מקבלים את הערך המקסימלי של הווקטור [ב]) ומנסים לקרב את פונקציית המטרה.

שימוש באלגוריתמים הרגילים

[עריכת קוד מקור | עריכה]

שימוש באלגוריתם של בעיית תכנון ליניארי רגילה יניב פתרון שאיננו דווקא בשלמים. במקרה זה יש כמה דרכים לקבל ממנו פתרון רגיל. אפשר למשל, לעגל את כל המשתנים אל הערך הקרוב ביותר. אפשר גם במקרה של המשתנים הם אינדיקטורים (מקבלים ערכים בין 0 ל-1), עבור משתנה שקיבל את הערך , להגריל לו את הערך 1 בהסתברות ו-0 בהסתברות . שיטות אלה יכולות להוביל לפתרונות שאינם מקיימים את כל האילוצים, או שאינם אופטימלים.

בבעיות אריזה, אם מעגלים את כל הערכים למטה, מקבלים פתרון חוקי (כי כל הערכים נשארו אי שליליים, ואי-הגדלה של כל המשתנים לא יכולה לסתור אילוץ). הוא עשוי להיות קטן מהפתרון האופטימלי, אך אם פונקציית המטרה היא , ניתן לדעת שעיגול כל הערכים למטה יקטין כל משתנה בלכל היותר 1, ולכן יקטין את פונקציית המטרה בלכל היותר . בדומה, עיגול למעלה של כל הערכים בבעיית כיסוי ימצא פתרון חוקי שפונקציית המטרה עליו עשויה להיות רחוקה ב- מהערך האופטימלי.

קיימים גם אלגוריתמים יותר מתוחכמים, למשל שיטת branch and cut, בה מוסיפים אילוצים נוספים כדי לכפות על המשתנים להיות שלמים, ובמידת הצורך מפצלים את הבעיה לכמה תתי בעיות, תוך "גדיעת" ענפים - לא נכנסים לתתי בעיות שאפשר לראות שלא יהיו טובות יותר מאחרות שניסינו כבר. שיטה זאת תמיד מוצאת את הפתרון האופטימלי וגם יעילה למדי על קלטים אמיתיים, אך זמן הריצה במקרה הגרוע הוא אקספוננציאלי.

את כל השיטות הללו ניתן להפעיל גם על חלק מהמשתנים במקרה שרק על חלקם יש דרישת שלמות.

בסיס גרייבר

[עריכת קוד מקור | עריכה]
ערך מורחב – בסיס גרייבר

בהינתן מטריצה A בשלמים, בסיס גרייבר מאפשר לבצע עליה עיבוד מוקדם (שזמנו אקספוננציאלי) כדי לקבל מידע, בעזרתו יהיה אפשר לפתור את הבעיה בזמן פולינומי לכל וקטורים שלמים . השיטה מבוססת על מציאת קבוצה סופית של איברים (שנקראת בסיס גרייבר), שמהם ניתן לחלץ פתרונות באמצעות אלגוריתם איטרטיבי.

אלגוריתם לנסטרה

[עריכת קוד מקור | עריכה]

אלגוריתם לנסטרה[19] מאפשר לפתור את הבעיה בזמן פולינומי כאשר מספר המשתנים קבוע. יותר בפירוט, אם ב-A יש שורות והמקדמים שלה חסומים על ידי , האלגוריתם מאפשר לפתור בזמן פולינומי ב-. האלגוריתם עובר על המשתנים בזה אחר זה ומוצא קטע לכל אחד מהם בו הוא חסום בעזרת גאומטריה של מספרים, ולאחר מכן עובר על כל האפשרויות. האלגוריתם הומצא על ידי הנדריק לנסטרה בשנת 1983. זמן הריצה המקורי היה , ומאז שופר כמה פעמים.

אלגוריתמים כלליים

[עריכת קוד מקור | עריכה]

ניתן להשתמש באלגוריתמים כלליים, שאינם מיוחדים דווקא לתכנון ליניארי. נסקור כמה מהם בקצרה:

  • backtracking (לבעיות אריזה): בהינתן משתנה , והצבות לערכים , נציב ב את הערכים מ-0 ומעלה בזה אחר זה, ולכל אחד מהם נפתור רקורסיבית עבור המשתנה הבא. מפסיקים כאשר אחד האילוצים נשבר. אם (ומצאנו הצבה שנותנת פתרון חוקי) זוכרים את ערך פונקציית המטרה, כדי להחזיר את הערך המינימלי. האלגוריתם מסתיים כאשר עוברים על כל הערכים עבור (ואז הפתרון מדויק, אך הזמן עלול להיות אקספוננציאלי) או כאשר עובר זמן שהוגדר מראש (ואז הוא לאו דווקא ימצא את הפתרון האופטימלי).
  • להתחיל עם פתרון כלשהו ולשפר אותו בעזרת אלגוריתמים כגון חיפוש מקומי או אופטימיזציית קן הנמלים.
  • שיטות שונות של למידת מכונה, למשל רשת עצבית מלאכותית.
לאוניד קנטורוביץ'

העיסוק בבעיה התפתח באופן נפרד במערב ובברית המועצות.

הראשון שעסק בבעיה היה לאוניד קנטורוביץ', שב 1939 ניסח את הבעיה הכללית וחקר דרכים לפתור אותה. הוא פרסם את מחקרו במאמר בשם "שיטות מתמטיות לארגון ותכנון של הייצור"[20] בו הוא נתן דוגמאות שונות ושיטות לפתרון.[21] הוא טען שתכנון ליניארי נצרך רק בכלכלה קומוניסטית, כיוון שבכלכלה קפיטליסטית בעלי ההון ידאגו להקצאת משאבים.[22] במהלך מלחמת העולם השנייה הוא ניסה לרתום את מחקריו למאמץ המלחמתי, אך זכה להתעלמות בברית המועצות.[23] מעט אחר כך, צ'אלינג קופמאנס עסק בארצות הברית באופן בלתי תלוי בבעיה. ב-1975 חלקו קנטורוביץ' וקופמאנס פרס נובל לכלכלה על מחקרם בנושא.[24]

ב-1946 חקר את הבעיה ג'ורג' דנציג, במסגרת עבודתו בחיל האוויר האמריקאי על בעיות לוגיסטיקה, כהכללה של שיטותיו של וסילי לאונטיף על מידול בעיות כלכליות באמצעות מטריצות.[25] הוא עבד על הבעיה עם קומפאנס, וב-1947 פיתח את שיטת הסימפלקס.[26] כמו כן, בשנת 1948 הציג דנציג את מחקרו בפני ג'ון פון נוימן. בתגובה, פון נוימן הציג לו את מחקרו על תורת המשחקים ואת הקשר שזיהה בין מחקר זה לבין הדואליות של תכנון ליניארי, ושיער את משפט הדואליות החזק. דנציג הוכיח את המשפט אך פרסם בתפוצה פנימית בלבד. הראשונים שפרסמו הוכחה פורמלית ברבים היו תלמידיו של פון נוימן - אלן טאקר, דייוויד גייל והרולד קון.[27]

במשך שנים לא היה ידוע האם יש לבעיה גם פתרון פולינומי. בעיה זאת נפתרה ב-1979 כאשר ליאוניד חצ'יאן מצא את שיטת האליפסואיד. התגלית היוותה סנסציה, וכונתה במערב "הספוטניק של 1979".[28] על אף פריצת הדרך התאורטית, האלגוריתם לא מעשי. עם זאת, בשנת 1984 מצא נרמנדה קרמרקר אלגוריתם פולינומי ומעשי שמכונה "שיטת נקודות הפנים".[17] הבעיה המשיכה להיות מוקד של מחקר פעיל, ובמהלך השנים הבאות זמן הריצה שופר שוב ושוב, למשל בשנת 1987 ובשנת 1989 על ידי פרווין פאידה.[29]

גם תכנון ליניארי בשלמים נחקר כבר על ידי דנציג, שנתן כדוגמה בעיית השמה של 70 משימות ל70 אנשים, תוך אילוצים שונים, בעיה שאיננה ניתנת לפתרון באמצעות כוח גס (בוודאי לא באמצעים של אז, וגם לא כיום), מאחר שלשם כך דרוש לבדוק 70 עצרת אפשרויות.[30] לאחר הוכחת משפט קוק לוין, התברר שישנן בעיות NP שלמות ושתכנון ליניארי היא בעיה כזאת, וב-1972 כלל אותה קארפ במאמרו בו הציג בעיות NP שלמות.[6] מאז נעשה מחקר רב בנושא, אך פתרון פולינומי לא נמצא.

מפאת חשיבותה המעשית של בעיית התכנון הליניארי, פותחו כלים רבים המאפשרים פתרון של הבעיה, עבור שפות שונות, גם באקדמיות, גם באופן מסחרי וגם באופן וולנטרי. תוכנה שמאפשרת פתרון מעשי של בעיות תכנות ליניארי נקראת LP solver. דוגמה ל-LP solver היא cvxpy, אשר נכתב עבור שפת פייתון בקוד פתוח.[31] נראה כדוגמה תוכנה שתפתור את הבעיה שניתנה בתחילת הערך:

import cvxpy
x1 = cvxpy.Variable(name="x1")
x2 = cvxpy.Variable(name="x2")
x3 = cvxpy.Variable(name="x3")
constraints = [
    3 * x1 - 2 * x2 + x3 <= 9,
    7 * x2 - 2 * x3 <= 6,
    -5 * x1 + 10 * x2 <= 5,
    x1 + x2 - x3 <= 9,
]
target = cvxpy.Maximize(2 * x1 + 3 * x2 + x3)
problem = cvxpy.Problem(target, constraints)
problem.solve()
print(f"x1={x1.value}, x2={x2.value}, x3={x3.value})

הרצת התוכנית מדפיסה את הפלט x1=3, x2=2, x3=4.

לקריאה נוספת

[עריכת קוד מקור | עריכה]

קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא תכנון ליניארי בוויקישיתוף
  1. ^ באנגלית הטרמינולוגיה לא אחידה; יש מקומות בהם קוראים לצורה שלא חייבת להיות חסומה polyhedron ולצורה שחייבת להיות חסומה polytope, ויש מקומות בהם זה הפוך.
  2. ^ נזכיר שבעיית כיסוי היא בצורה דואלית לקנונית, ופונקציית המטרה היא

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ Standard form for Linear Programs
  2. ^ Convex Optimization, עמוד 131
  3. ^ Linear Programming: Geometric Approach
  4. ^ Convex Optimization, עמוד 31
  5. ^ The Computational Complexity of Integer Programming with Alternations
  6. ^ 1 2 Richard Karp, reducibility among combinatoricial problems
  7. ^ Total unimodularity
  8. ^ Packing, Covering and Partitioning Problems with Strongly Unimodular Constraint Matrices
  9. ^ הדגמה של הפתרון
  10. ^ The Max-Flow Min-Cut Theorem
  11. ^ K¨onig’s Theorem
  12. ^ Duality and the Minimax theorem
  13. ^ Strong Duality
  14. ^ Nearly Linear-Time Packing and Covering LP Solvers
  15. ^ simplex method
  16. ^ The ellipsoid method
  17. ^ 1 2 Narendra Karmarkar, A New Polynomial-Time Algorithm for Linear Programming
  18. ^ Solving Empirical Risk Minimization in the Current Matrix Multiplication Time
  19. ^ Integer Programming with a Fixed Number of Variables
  20. ^ המאמר מתורגם לאנגלית
  21. ^ mathematical methods of organizing and planning production, עמוד 390
  22. ^ mathematical methods of organizing and planning production, עמוד 368
  23. ^ reminiscences about the origin of linear programming, עמוד 1
  24. ^ נימוקי הזכייה באתר פרס נובל
  25. ^ reminiscences about the origin of linear programming, עמוד 2
  26. ^ reminiscences about the origin of linear programming, עמוד 4
  27. ^ reminiscences about the origin of linear programming, עמוד 6
  28. ^ Eugene L. Lawler, The Great Mathematical Sputnik of 1979
  29. ^ Speeding-up linear programming using fast matrix multiplication, Pravin M. Vaidya
  30. ^ REMINISCENCES ABOUT THE ORIGINS OF LINEAR PROGRAMMING, עמוד 2
  31. ^ אתר הבית של cvxpy