לדלג לתוכן

טיוטה:התפלגות מרצ'נקו-פסטור

מתוך ויקיפדיה, האנציקלופדיה החופשית
הערך נמצא בשלבי עבודה במסגרת מיזם "עבודות ויקידמיות". נא לא לערוך ערך זה עד להסרת התבנית. הערות לערך נא להוסיף בדף השיחה.
העבודה על הערך עתידה להסתיים בתאריך 1 אוקטובר 2024. ניתן להסיר את התבנית משחלפו שלושה שבועות מן התאריך הנקוב.
הערך נמצא בשלבי עבודה במסגרת מיזם "עבודות ויקידמיות". נא לא לערוך ערך זה עד להסרת התבנית. הערות לערך נא להוסיף בדף השיחה.
העבודה על הערך עתידה להסתיים בתאריך 1 אוקטובר 2024. ניתן להסיר את התבנית משחלפו שלושה שבועות מן התאריך הנקוב. שיחה


התפלגות מרצ'נקו פסטור
פונקציית צפיפות ההסתברות
מאפיינים
פרמטרים סטיית תקן ערכי המטריצה,
תומך כאשר:
פונקציית צפיפות הסתברות
(pdf)
תוחלת
שונות

התפלגות מרצ'נקו פסטור (אנ') היא פונקציית התפלגות מתחום המטריצות האקראיות. השימוש העיקרי בה הוא תיאור ההתנהגות האסימפטוטית של ערכים עצמיים של מטריצות, עבור כאלו שערכיהן ממשיים, בלתי תלויים ושווי התפלגות.

ההתפלגות (שלעתים נקראת גם חוק מרצ'נקו-פסטור) קרויה על שם צמד המתמטיקאים הסובייטים וולודימיר מרצ'נקו וליאוניד פסטור שהוכיחו אותה בשנת 1967.

הגדרות ותנאים לקיום המשפט

[עריכת קוד מקור | עריכה]

תהי מטריצה אקראית בגודל שערכיה בלתי תלויים ושווי התפלגות המקיימים ו- . בנוסף נניח כי כך ש- , ונסמן.

נסמן . נשים לב כי מטריצה חיובית ויהיו ערכיה העצמיים. כמו כן, נסמן ב- את פונקציית התפלגות הערכים העצמיים שלה (Empirical Spectral Measure) אשר אותה נרצה לאמוד, המוגדרת לכל קבוצה חלקית של על ידי: או באמצעות הניסוח השקול:


דוגמה: בכחול היסטוגרמת ערכים עצמיים של כאשר בגודל ובצהוב התפלגות מרצ'נקו פסטור עבור

ניסוח המשפט

[עריכת קוד מקור | עריכה]

כאשר תנאי המשפט מתקיימים, הפונקצייה מקיימת כאשר היא פונקצייה המוגדרת באופן הבא:

המקרה

[עריכת קוד מקור | עריכה]

במקרה זה מתקיים כי המטריצה היא בסבירות גבוהה הפיכה והפונקצייה מוגדרת על ידי:

המקרה

[עריכת קוד מקור | עריכה]
דוגמה: בכחול היסטוגרמת ערכים עצמיים של כאשר בגודל ובצהוב התפלגות מרצ'נקו פסטור עבור

במקרה זה למטריצה יש ערך עצמי 0 עם ריבוב התלוי בפרמטר . זה בא לידי ביטוי בפונקצייה בתור נקודת מסה בנקודה 0. השינוי ביחס למקרה מתקבל על ידי הוספה של של הביטוי כאשר זוהי פונקציית דלתא, כך שבמקרה זה הפונקצייה היא:

לעיתים מקובל לחבר את שני המקרים לביטוי אחד באופן הבא: מגדירים את הפונקצייה ובכך ניתן להחליף את המחובר הראשון עם הביטוי ובכך מקבלים ביטוי יחיד עבור שני המקרים.

מקרה פרטי:

[עריכת קוד מקור | עריכה]

במקרה זה מתקיים וכן:

עבור החלפת המשתנים מקבלים:

התפלגות זו נקראת גם "חוק רבע המעגל". ניתן לשים לב לדימיון הרב בין ביטוי זה להתפלגות חצי המעגל של ויגנר.

עבור המומנט ה- של ההתפלגות נתון על ידי:

מהצבה של ניתן לחשב כי תוחלת ההתפלגות היא . כעת על ידי ההצבה השונות שמתקבלת היא .

אחת הדרכים להוכחת המשפט עושה שימוש במומנטים של הפונקצייה. מכיוון שהתומך של קומפקטי היא נקבעת באופן בלעדי באמצעות המומנטים שלה. חישוב ישיר מראה כי

המשפט מוכח באמצעות שימוש בלמה של בורל-קנטלי, בכך שמוכיחים כי

וגם

טרנספורמציית סטילטייס

[עריכת קוד מקור | עריכה]

טרנספורמציית סטילטייס של ההתפלגות נתונה על ידי הפונקצייה:

עבור z מספר מרוכב בעל ערך מדומה אי-שלילי, וכאשר השורש הריבועי נלקח גם כן להיות בעל ערך מדומה אי-שלילי. פונקצייה זו היא פיתרון למשוואה הריבועית

טרנספורמציית סטילטייס משמשת גישה נוספת להוכחה של המשפט באופן הבא:

תחילה מראים כי הטרנספורמציה של מרוכזת סביב התוחלת שלה, כלומר אם נסמן את הטרנספורמציה שלה ב- אז מתקיים:

בנוסף, יש להראות כי פונקציה זו פותרת את המשווה:

כאשר עבור . לבסוף מראים יציבות של המשוואה האחרונה.

מודל spiked covariance

[עריכת קוד מקור | עריכה]
דוגמה: בכחול היסטוגרמת ערכים עצמיים של כאשר בגודל ובצהוב התפלגות מרצ'נקו פסטור עבור . בדוגמה זו במטריצה המקורית היו 3 ערכים עצמיים: 1,4,5. באופן צפוי רק 2 מהערכים העצמיים של המטריצה הרועשת נמצאים מחוץ לתומך, ואילו השלישי "נבלע" בתוך הרעש


ערכים מורחבים – מודל spiked covariance

דוגמה לשימוש בהתפלגות מרצ'נקו פסטור היא במודל spiked covariance. כאשר עובדים עם מטריצה שערכיה רועשים, ניתן לעיתים להניח כי הרעש מבוטא כמטריצה שערכיה הם שווי התפלגות ובלתי תלויים, ולכן ערכיה העצמיים מתפלגים לפי מרצ'נקו פסטור.

כעת מוסיפים למטריצת הרעש את המטריצה המקורית, מקבלים שערכיה העצמיים של המטריצה המקורית לא השתנו בהרבה, ולכן אם הם נמצאים מחוץ לתומך של מרצ'נקו פסטור ניתן יהיה לזהות אותם מבין הערכים העצמיים של המטריצה החדשה. בנוסף ניתן יהיה לשחזר בקירוב את הערך העצמי המקורי ואת הוקטור העצמי המתאים לו. דרך זו היא דוגמה הפחתת רעשים (אנ') בעזרת מרצ'נקו פסטור.

ניתן להעזר במרצ'נקו פסטור בשימוש ב-PCA. השימוש בהתפלגות עוזר למצוא את הרכיבים העיקריים שיעזרו לאפיין את הסיגנל המקורי, ולהפריד אותם מרכיבים אחרים שככל הנראה מאפיינים רעש. בדרך זו אפשר לחשוב על קצה התומך הימני של ההתפלגות בתור "סף" אשר קובע באילו ערכים עצמיים (או באופן שקול רכיבים עיקריים) נשתמש ובאילו לא.

מלבד הפחתת רעשים, השילוב בטכניקה זו עוזר גם בכיווץ, ובהבנה טובה יותר של המידע, והוא נפוץ במגוון תחומים, ביניהם: רפואה, גנומיקה וביואינפורמטיקה, ניתוח טכני, כיווץ תמונות וסרטונים, אסטרונומיה, ועוד.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]