רשתות אינפו-עמומות
מראה
רשתות אינפו-עמומות (באנגלית: Information-Fuzzy Networks או IFN בקיצור) הוא אלגוריתם למידת מכונה חמדן עבור למידה מונחית. מבנה הנתונים המופק על ידי האלגוריתם מכונה רשת-עמומה ותהליך בנייתו דומה לתהליך בניית עץ החלטה. ברם, הרשת-העמומה היא גרף מכוון ולא עץ. הבדל נוסף בין האלגוריתם לבין עצי החלטה הוא השיטה שבה הוא משתמש עבור בחירת המאפיינים לקודקודי הרשת המופקת: IFN משתמש באינפורמציה הדדית מותנית (אנ') בעוד שעצי החלטה משתמשים במדדים אחרים כגון אנטרופיה או ג'יני.
יוצר האלגוריתם הוא פרופסור מרק לסט בשיתוף המנחה האקדמי שלו, פרופסור עודד מימון.
יכולות האלגוריתם
[עריכת קוד מקור | עריכה]- דיסקרטיזציה של מאפיינים רציפים
- בחירת מאפיינים
- בניית מודל עבור בעיות סיווג
- הערכת החוקים המיוצרים ודירוגם
- זיהוי תצפיות חריגות
תכונות האלגוריתם
[עריכת קוד מקור | עריכה]- בעצי החלטה, קודקודים עמוקים יותר משויכים לפחות תצפיות. כתוצאה מכך, ייתכן ומספר התצפיות יהיה נמוך מדי ולא יהיה מובהק סטטיסטית עבור הסקת מסקנות. האלגוריתם פותר באופן חלקי את הבעיה על ידי שימוש בכל תצפיות האימון בכל שכבה במודל.
- במודל המופק כל מאפיין יכול להופיע בשכבה אחת בלבד. כמו כן, כל שכבה מכילה מאפיין אחד בלבד. אין חובה להשתמש בכל המאפיינים של תצפיות האימון במודל.
- הגידול באינפורמציה ההדדית המותנית של משתנה המטרה לאחר בניית המודל שווה לסכום הגידולים באינפורמציה ההדדית המותנית בכל שכבות המודל.
- הקשתות המקשרות את הקודקודים הסופיים למשתנה המטרה ממושקלים. המשקלים הם האינפורמציה ההדדית המותנית בהינתן הקודקוד הסופי.
- האלגוריתם נוטה להפיק מודלים מצומצמים יותר, מדויקים פחות ויציבים יותר (רגישים פחות לשינויים בנתוני האימון) מאלה של C4.5 (על סמך השוואה של ביצועי האלגוריתמים על כמה מסדי נתונים נפוצים).
תמצית אלגוריתם הבנייה של רשת-עמומה
[עריכת קוד מקור | עריכה]קלט: נתוני אימון ומובהקות סטטיסטית מזערית להחלטה האם לפצל קודקוד (ברירת המחדל היא 0.1%).
- יצירת קודקוד השורש ושכבת המטרה.
- כל עוד מספר השכבות הנוכחי קטן ממספר השכבות המקסימלי וגם נותרו מאפיינים שטרם נוצרו עבורם שכבה וגם ניתן לשפר את ערך האינפורמציה ההדדית המשותפת באופן מובהק סטטיסטית:
- מציאת המאפיין המובהק סטטיסטית בעל האינפורמציה ההדדית המותנית הגבוהה ביותר. המובהקות הסטטיסטית נמדדת על ידי שימוש במבחן יחס הנראות.
- פיצול כל קודקוד בשכבה הקודמת על ידי המאפיין הנבחר, במידה והפיצול מובהק סטטיסטית עבור הקודקוד. במידה ופיצול הקודקוד לא מובהק, קישור הקודקוד (שמוגדר כעת כקודקוד סופי) לקודקודי המטרה.
- החזרת רשימת המשתנים שנבחרו לפיצול על ידי הרשת ואת הרשת עצמה.