בערך זה נעשה שימוש בסימנים מוסכמים מתחום המתמטיקה. להבהרת הסימנים ראו סימון מתמטי.
|
בסטטיסטיקה, משפט גאוס-מרקוב מספק את ההצדקה המתמטית לשימוש באומד הריבועים הפחותים במסגרת מודל של רגרסיה ליניארית. משפט זה קובע כי תחת הנחות המודל — שגיאות בעלות תוחלת אפס, שונות קבועה ובלתי מתואמות — האומד חסר ההטיה הליניארי הטוב ביותר הוא האומד של שיטת הריבועים הפחותים, במובן זה שהשונות שלו היא הנמוכה ביותר מבין שאר האומדים הליניאריים חסרי ההטיה. למשל אומד ג'יימס-שטיין הוא אומד מוטה ששונותו נמוכה יותר.
ידוע כי המתמטיקאי הגרמני קרל פרידריך גאוס עשה שימוש בשיטת הריבועים הפחותים כבר בשנת 1795, והיא פורסמה על ידו רק בשנת 1809. הוכחה למשפט זה סיפק גאוס בשנת 1823.[1] המתמטיקאי הרוסי אנדריי מרקוב פרסם בשנת 1912 ספר בו תיאר בפירוט ובדיוק רב יותר את השיטה ותיאר את ההוכחה שלה, ועל כן היא קרויה גם על שמו.[1]
נניח מודל מהצורה בכתיב וקטורי. כלומר, , ואז בכתיב מלא המודל הוא,
עבור .
הוא פרמטר קבוע לא ידוע שאותו מחפשים; הוא ערך קבוע ידוע; הוא משתנה מקרי המתאר את השגיאה או את ה"רעש", וכתוצאה מכך גם הוא משתנה מקרי.
אומד ליניארי לפרמטר הוא ליניארי במשתנים , כלומר הוא מהצורה,
כאשר המקדמים אינם יכולים להיות תלויים בפרמטר , אלא רק בערכים הנצפים (אך התלות של המקדמים בערכים הנצפים אינה בהכרח ליניארית).
אם הוא אומד כלשהו, ונסמן בהתאמה
טבעי לרצות אומד שממזער את סכום ריבועי השגיאות. כלומר, אומד כזה שממזער את הביטוי,
משפט גאוס-מרקוב: אם מתקיימים שלושת התנאים הבאים:
- עבור .
- עבור .
- עבור .
אז האומד שממזער את סכום ריבועי השגיאות הוא אומד הריבועים הפחותים הליניארי,
כאשר היא המטריצה המשוחלפת של .
יהי אומד ליניארי וחסר הטיה כלשהו. היות שאנו עוסקים באומדים חסרי הטיה, מזעור של סכום ריבועי השגיאות שקול למזעור השונות. אם כך נרצה להראות כי המטריצה היא מטריצה חיובית.
נכתוב לצורך הפשטות , עבור מטריצה מגודל , ונחשב,
אם כך, כדי שהאומד יהיה חסר הטיה, בהכרח מתקיים . מכך נובע,
כאשר המעבר בשורה השביעית הוא כי , והמעבר בשורה השמינית הוא כי .
לפיכך, היות ש- היא מטריצה חיובית, נובע כי אכן היא מטריצה חיובית, כנדרש.