טיוטה:לימוד מערכת מסווגת
לימוד מערכות מסווגות, או LCS, הם פרדיגמה של שיטות לימוד מכונה המבוססות על כללים משלבים: מרכיב גילוי (בדרך כלל למשל אלגוריתם גנטי) עם מרכיב למידה (ביצוע או למידה בפיקוח, למידת חיזוק, או למידה ללא השגחה). לימוד מערכות מסווגות מתבקשות לזהות מערכת של כללים תלויים עם קשר קולקטיבי לאחסן וליישם את הידע באופן מקטעין כדי לבצע תחזיות (דוגמנות התנהגות למשל, סיווג, כריית נתונים, רגרסיה, קירוב פונקציה, או אסטרטגיית משחק). גישה זו מאפשרת רווחי פתרונות מורכבים על ידי פירוק החלקים לקטנים ופשוטים. המושגים המייסדים מאחורי מערכות מסווגות למידה באים מניסיונות מודל מורכבות של מערכות מסתגלות, באמצעות כללים אלו ניתן ליצור מערכת קוגניטיבית מלאכותית (למשל בינה מלאכותית).
[עריכת קוד מקור | עריכה]הארכיטקטורה וצמתי מערכת למידה מסווגת יכולים להיות נתונים לשינוי. כדאי לחשוב על LCS כמכונה המורכבת ממספר רכיבי אינטראקציה. כל רכיב ניתן להוסיף או להסיר, או רכיבים הקיימים והשונים / החליפו כדי להתאימה לדרישות של תחום הבעיה הנתונה (כמו אובניים לבניין אלגוריתמי) או בכדי להפוך את האלגוריתם מספיק גמיש כדי לתפקד בתחומי בעיה שונים. כתוצאה מכך, הפרדיגמה LCS ניתן ליישם בגמישות תחומי בעיה רבים הנקראים למידת מכונה. על יחידת הזמן הגדולה בין הטמעות LCS הן כדלקמן: (1) אדריכלות מישיגן בסגנון לעומת האדריכלות בסגנון פיטסבורג, (2) חיזוק לימוד לעומת למידה בפיקוח, (3) למידה מצטברת לעומת למידה באצווה, (4) למידה מקוונת נגד לימוד מקוון, (5) כושר מבוסס כוח לעומת כושר מבוסס דיוק, (6) מיפוי פעולה מלאה לעומת מיפוי פעולה הטובה ביותר. חטיבות אלו אינן בהכרח סותרות זה את זה. לדוגמה, XCS,, הידוע ביותר כאלגוריתם LCS למידה הכי הטוב, הוא בסגנון מישיגן, נועד לחיזוק למידה וגם יכול לבצע למידה בפיקוח. למידה מצטברת שיכולה להיות באופן מקוון או לא מקוון, כושר מבוסס דיוק, ומבקש ליצור מיפוי פעולה מלא. אלמנטים של אלגוריתם LCS הגנרית צעד חכם סכמטי המדגים מחזור למידת מערכת מסווגתאת הלמידה הגנרית בסגנון מישיגן לביצוע למידה בפיקוח. יש לזכור כי LCS היא פרדיגמה עבור מכונה גנטית המבוססת למידה ולא מעשה מסוים, את הדברים הבאים מתארים היבטים מרכזיים של האלגוריתם LCS גנריות, מודרני (כלומר שלאחר XCS). לשם הפשטות הבה נתמקד באדריכלות בסגנון מישיגן עם למידה בפיקוח. ראה איורים מימין, את הצעדים שסדרו בסוג כזה של LCS גנריות.
[עריכת קוד מקור | עריכה]הסביבה היא מקור הנתונים שעליו LCS לומד. זה יכול להיות מחובר במערך הדרכה סופי (מאפיין של בעיית כריית נתונים, מיון, או רגרסיה), או זרם רציף מקוון של מקרי אימון חיים. למשל, כל אימון יכול להוות הנחה ולכלול מספר תכונות (המכונה גם תכונות, או משתנה בלתי תלוי), ואת עמדת קצה של עניין (המכונה גם בכיתה, פעולה, פנוטיפ, חיזוי, או משתנה תלוי). חלק מלמידת LCS יכול להיות כרוך בבחירת תכונה, ולכן לא כל התכונות של נתוני אימון צריכים להיות אינפורמטיבי. הסט של ערכי תכונה של מופע המכונה כמדינה. לשם הפשטות נניח תחום הבעיה למשל עם תכונות בוליאני / בינארית בכיתה בוליאני / בינארי. עבור מערכות בסגנון מישיגן, למשל אחד מהסביבה מאומנת על כל מחזור למידה (למשל למידה מצטברת). מערכות בסגנון פיטסבורג מסוגלת לבצע למידה באצווה, שם-כלל קובע מוערכים כל איטרציה על הרבה או כל נתוני האימון.
כלל / מסווג / אוכלוסייה
[עריכת קוד מקור | עריכה]כלל הוא יחסי תלות בהקשר בין ערכי מדינה ורמת החיזוי. חוקים בדרך כלל לבושים בצורה של {IF: אז} ביטוי, (למשל {אם 'מצב' ועל 'פעולה'}, או כמו דוגמה ספציפית יותר, {IF 'אדום' AND 'מתומן' ועל 'להפסיק לחתום'} ). מושג קריטי LCS ומכונת שלטון המבוסס על למידה כאחד, הוא כי שום פרט אינו כשלעצמו מודל, מאחר שהכלל הוא ישים רק כאשר מצבו הוא מרוצה. תחשוב כלל בתור "מודל מקומי" של מרחב הפתרון. כללים יכולים להיות מיוצגים בכמה דרכים שונות, כדי להתמודד עם סוגים שונים של נתונים (למשל בינארי, דיסקרטי מוערך, סודר, רציף מוערך). נתונים בינאריים בהתחשב LCS מסורתית חלה ייצוג כלל משולש (כללים למשל יכולים לכלול או 0, 1, או '#' עבור כל תכונה בנתונים). ה 'לא אכפת לי' הסמל ( '#' למשל) משמש ככרטיס פראי בתוך הכללים המאפשרים במצבו של הכלל, ועל המערכת כולה להכליל יחסים בין תכונות ונקודת סיום היעד בכדי לחזות. קחו למשל את הכלל הבא (# 1 ### 0 ~ 1) (תנאי למשל ~ פעולה). כלל זה יכול להתפרש: אם התכונה השנייה = 1 והתכונה השישית = 0 אזי חיזוי class = 1. הייתי אומר כי התכונות השניות ושישיות פורטו בכלל זה, בעוד האחרים היו כלולים. כלל זה, והתחזית המקבילה חלה רק למופע כאשר התנאי של הכלל הוא מרוצה בערכאה. או נקרא בשמו הנפוץ - התאמה. ב LCS בסגנון מישיגן, לכל כלל יש כושר משלו, כמו גם מספר פרמטרי הקשורים אליו שיכול לתאר את מספר העותקים של אותה הממלכה קיימת (כלומר, כמות מרובה), גיל הכלל, הדיוק שלה, או הדיוק של תחזיות השכר, סטטיסטיקת תאוריה או תאוריה חווייתית אחרת. הכלל עם יחד הפרמטרים שלו מכונה לעיתים קרובות בתור 'מסווג'. במערכות בסגנון מישיגן, מסווגות, נמצאים בתוך אוכלוסייה של מספר מרובים המוגדרים על ידי משתמש של מסווגים. בניגוד לרוב אלגוריתם חיפוש סטוכסטיים (למשל אלגוריתמים אבולוציוניים), אוכלוסיות LCS יכולה לצאת לדרך ריקה (כלומר אין צורך לאתחל אוכלוסייה כלל באופן אקראי). מסווגים במקום יושקו בתחילה לאוכלוסייה עם מנגנון כיסוי. בכל LCS, המודל המאומן הוא סט של כללים / מסווגים, ולא לכל כלל / מסווג יחיד. ב LCS בסגנון מישיגן, כולו מאומן (ובאופן אופציונאלי, דחוסה) אוכלוסייה מסווגת מהווה את מודל החיזוי.
[עריכת קוד מקור | עריכה]אחד המרכיבים הקריטיים ביותר המתרחש לעיתים קרובות הוא הזמן רב של LCS הוא בתהליך ההתאמה. הצעד הראשון במחזור למידת LCS לוקח מופע אימון יחיד מהסביבה ומעביר אותו [P] שם התאמה מתרחשת. בשלב שני, כל כלל [P] כעת בהשוואה למופע ההכשרה לראות אילו כללי משחק (למשל, האם רלוונטיים להיקשר למופע הנוכחי). בשלב שלישי, כל הכללים בהתאמה מועברים סט משחק [M]. כלל תואם את מופעה האימונים אם כל ערכי התכונה שצוינו במצב השלטון שקולה לערך התכונה המקבילה בערכאת האימון. לדוגמה, בהנחה למשל האימון הוא (001,001 ~ 0), כללים אלה יתאימו: (### 0 ## ~ 0), (00### 1 ~ 0), (# 01,001 ~ 1), ובלבד שכללים אלו לא יהיו (1 ##### ~ 0), (000 ## 1 ~ 0), (# 0 # 1 # 0 ~ 1). שים לב להתאמה, פעולת הסיום / שצוינה על ידי הכלל אינה נלקחת בחשבון. כתוצאה מכך, מערך המשחק עשוי להכיל מסווגים המציעים פעולות סותרות. בשלב הרביעי, מאז אנו מבצעים למידה בפיקוח, [ז] מחולק סט נכון [C] וסט שגוי [I]. כלל התאמה נכנס לסט הנכון אם היא מציעה את הפעולה הנכונה (מבוססת על הפעולה הידועה של המופע הכשר), אחר זה נכנס [I]. בלימוד LCS חיזוק, סט פעולה [A] היה להיווצר כאן במקום, מאז הפעולה הנכונה אינה ידועה.
