T-SNE

t-distributed Stochastic Neighbor Embedding) t-SNE) הוא אלגוריתם בלמידה חישובית להורדת ממדים, שפותח על ידי לורנס ואן דר מאטן וג'פרי הינטון.

זוהי שיטה לא-ליניארית להורדת ממדים שמתאימה במיוחד להורדת מימד של מרחבים ממימד גבוה למרחבים מממד 2 או 3 (מפות). האלגוריתם ממדל כל אובייקט מהמרחב הרב-ממדי בעזרת נקודה דו־ממדית או תלת־ממדית כך שאובייקטים דומים ימודלו לנקודות קרובות זו לזו, ואובייקטים רחוקים ימודלו לנקודות רחוקות זו מזו.

אלגוריתם ה-t-SNE כולל שני שלבים עיקריים. בהתחלה האלגוריתם בונה התפלגות עבור כל זוג אובייקטים ממימד גבוה כך שלאובייקטים דומים יש הסתברות גבוהה להיבחר, בעוד שלאובייקטים לא דומים יש הסתברות נמוכה מאוד (אינפיניטסימלית) להיבחר. שנית, האלגוריתם מגדיר התפלגות באופן דומה עבור כל זוג נקודות במפה ממימד נמוך. לאחר מכן האלגוריתם מנסה להביא למינימום את דיברגנץ קולבק-ליבלר (Kullback–Leibler divergence) בין שתי ההתפלגויות, ביחס למיקומים של הנקודות על המפה. האלגוריתם המקורי משתמש במרחק אוקלידי כדי למצוא מרחק בין שני אובייקטים, אך ניתן להשתמש במטריקות אחרות לחישוב המרחק.

אלגוריתם t-SNE שימושי במגוון רחב של תחומים, כגון אבטחת מחשב אישי ברשת, ניתוח מוזיקלי, חקר הסרטן וביואינפורמטיקה.

פרטי האלגוריתם

בהינתן סט של $N$ אובייקטים ממימד גבוה, $\mathbf {x} _{1},\dots ,\mathbf {x} _{N}$ , האלגוריתם מחשב קודם את ההסתברויות $p_{ij}$ שהן פרופורציוניות לדמיון בין האובייקטים $\mathbf {x} _{i}$ ו $\mathbf {x} _{j}$ , באופן הבא:

$p_{j|i}={\frac {\exp(-\lVert \mathbf {x} _{i}-\mathbf {x} _{j}\rVert ^{2}/2\sigma _{i}^{2})}{\sum _{k\neq i}\exp(-\lVert \mathbf {x} _{i}-\mathbf {x} _{k}\rVert ^{2}/2\sigma _{i}^{2})}},$

$p_{ij}={\frac {p_{j|i}+p_{i|j}}{2N}}$

כאשר $\sigma _{i}$ נקבע כך שה-perplexity (מידת השוואה להתפלגויות) של ההתפלגויות שהוגדרו (Q,P) יהיה שווה ל-perplexity מסוים שנקבע מראש על ידי חיפוש בינארי.

מטרת ה-t-SNE היא ללמוד מפה $d$ -ממדית $\mathbf {y} _{1},\dots ,\mathbf {y} _{N}$ (עם $\mathbf {y} _{i}\in \mathbb {R} ^{d}$ ), שמשקפת את $p_{ij}$ בצורה כמה שיותר טובה. בשביל מטרה זו היא מודדת את $q_{ij}$ , הדמיון בין 2 נקודות במפה, $\mathbf {y} _{i}$ ו $\mathbf {y} _{j}$ , בצורה דומה לחישוב $p_{ij}$ :

$q_{ij}={\frac {(1+\lVert \mathbf {y} _{i}-\mathbf {y} _{j}\rVert ^{2})^{-1}}{\sum _{k\neq l}(1+\lVert \mathbf {y} _{k}-\mathbf {y} _{l}\rVert ^{2})^{-1}}}$

האלגוריתם משתמש בהתפלגות t כדי למדוד דמיון בין נקודות על המפה.

מיקום הנקודות $\mathbf {y} _{i}$ במפה נקבעות על ידי מינימיזציה של דיברגנץ קולבק-ליבלר של ההתפלגות Q מההתפלגות P, כלומר הבאה למינימום של: $KL(P||Q)=\sum _{i\neq j}p_{ij}\,\log {\frac {p_{ij}}{q_{ij}}}$

המינימיזציה של Kullback–Leibler divergence ביחס לנקודות $\mathbf {y} _{i}$ מתבצע באמצעות אופטימיזציית gradient descent.

התוצאה של האופטימיזציה היא מפה שמשקפת בצורה טובה את הדמיון בין קלטי המרחב הרב ממדי.

שימושים

הדמיית נתונים ממדיים גבוהים: T-SNE היא טכניקה פופולרית להצגה של נתונים עם יותר משלושה ממדים על ידי הפחתת הממדיות של הנתונים עד לשני ממדים או תלת־ממדיים, אותם ניתן לשרטט על גרף דו-ממדי או תלת-ממדי. זה יכול להיות שימושי לחקירת מבנה הנתונים ולמציאת דפוסים או אשכולות בתוכם.
למידת פיצ'רים: T-SNE יכול לשמש גם כטכניקת למידת פיצ'רים, כאשר המטרה היא ללמוד סט של פיצ'רים שניתן להשתמש בהן כדי לייצג את הנתונים במרחב בעל מימד נמוך יותר. לאחר מכן ניתן להשתמש בפיצ'רים אלו כקלט למודל למידת מכונה, מה שעלול להוביל לשיפור ביצועי המודל.
סיווג תמונה: ניתן להשתמש ב-T-SNE גם במשימות סיווג תמונות, כאשר המטרה היא להקצות תוויות לתמונות על סמך התוכן שלהן. על ידי הדמיית היחסים בין התמונות, ייתכן שניתן יהיה לזהות דפוסים או אשכולות התואמים לקטגוריות או אובייקטים שונים. זה יכול להיות שימושי לשיפור הביצועים של מודלים של למידת מכונה שהוכשרו לסיווג תמונות.
ניתוח טקסט: נעשה שימוש ב-T-SNE בתחום עיבוד השפה הטבעית כדי להציג את היחסים בין מילים או מסמכים שונים. לדוגמה, ניתן להשתמש ב-T-SNE כדי להמחיש מרחב הטמעת מילים במימד גבוה, שבו מילים דומות ממוקמות קרוב יותר זו לזו במרחב המופחת.
ניתוח גנים: T-SNE שימש גם בתחום הביואינפורמטיקה כדי להמחיש נתוני גנים. על ידי הפחתת הממדיות של הנתונים, T-SNE יכול לעזור לחוקרים לזהות דפוסים או אשכולות בתוך הנתונים ולהבין טוב יותר את הקשרים בין גנים שונים.

קישורים חיצוניים

מדיה וקבצים בנושא T-SNE בוויקישיתוף

אתר האינטרנט הרשמי של T-SNE (באנגלית)

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית • אוריינות AI • סוכן תבוני • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית (בישראל) • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית • בינה מלאכותית כללית (AGI)
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • יער אקראי • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • פונקציית אקטיבציה • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים (אנ') • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות • הזיות
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini • קלוד •‏ Perplexity •‏ SearchGPT •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה • מיקרוסופט קופיילוט
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית • השתלטות הבינה המלאכותית
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית