לדלג לתוכן

התפלגות נורמלית

מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף התפלגות גאוסיאנית)
התפלגות נורמלית
פונקציית צפיפות ההסתברות
פונקציית ההסתברות המצטברת
מאפיינים
פרמטרים התוחלת, סטיית התקן.
תומך
פונקציית צפיפות הסתברות
(pdf)
פונקציית ההסתברות המצטברת
(cdf)
תוחלת
סטיית תקן
חציון
ערך שכיח
שונות
אנטרופיה
פונקציה יוצרת מומנטים
(mgf)
פונקציה אופיינית
צידוד
גבנוניות

התפלגות נורמלית היא התפלגות חשובה ביותר בסטטיסטיקה תאורטית וביישומיה בכל תחומי המדע. חשיבותה הרבה נובעת ממשפט הגבול המרכזי, לפיו הממוצע של משתנים בלתי תלויים בעלי אותה התפלגות, לאחר תקנון מתאים, מתכנס בהתפלגות אל ההתפלגות הנורמלית. לכן מופיעה התפלגות זו בכל מקום בו לוקחים ממוצע של משתנים רבים, כגון גובה ממוצע של אנשים באוכלוסייה, ממוצע טעויות מדידה מקריות במדידות חוזרות של אותו גודל, וכדומה. מדדים פסיכומטריים שונים, כגון מבחן מנת משכל, מתוכננים בכוונה תחילה להתפלג באופן נורמלי.

ההתפלגות הנורמלית הסטנדרטית (קרויה גם התפלגות Z) היא השימושית ביותר במשפחת ההתפלגויות הנורמליות. על ידי מתיחה (כלומר, הכפלה בקבוע) והזזה (הוספת קבוע) של משתנה מקרי בעל התפלגות נורמלית סטנדרטית, מתקבלת משפחה כללית יותר של התפלגויות, שכל אחת מהן היא התפלגות נורמלית. זוהי דוגמה למשפחה מעריכית של התפלגויות. בתוך המשפחה, אפשר לזהות התפלגות נורמלית מסוימת על-פי שני פרמטרים: התוחלת והשונות שלה. להתפלגות הנורמלית הסטנדרטית יש תוחלת 0, ושונותה 1.

ההתפלגות הנורמלית נקראת גם גאוסיאן על שמו של קרל פרידריך גאוס, וגם עקומת הפעמון, משום שהגרף של פונקציית הצפיפות שלה מזכיר בצורתו פעמון.

המתמטיקאי אברהם דה מואבר הציג את ההתפלגות הנורמלית לראשונה בשנת 1733 בספרו "תורת הסיכויים" ("The Doctrine of Chances") כקירוב להתפלגות הבינומית עבור מספר גדול של דגימות (מאמרו בעניין התגלה רק ב-1924). לפלס השתמש בעקומה הנורמלית לתאר "התפלגות של שגיאות" בשנת 1783. את ההתפלגות הנורמלית כפי שאנחנו מכירים כיום הציג קרל פרידריך גאוס בספרו משנת 1809 "תורת התנועה של הגופים השמימיים הנעים סביב השמש בחתכים חרוטיים"[1], שהכיל גם תרומות חשובות רבות אחרות למתמטיקה ואסטרונומיה. עבודתו של גאוס על ההתפלגות הנורמלית הניחה את הבסיס לפיתוח שיטות סטטיסטיות וממשיכה להיות בשימוש נרחב ונחקר כיום.

גאוס השתמש בהתפלגות הנורמלית לניתוח מידע אסטרונומי ב-1809[2]. המדען הבלגי אדולף קטלה הראה כי התפלגותם של משתנים רבים (כגון גובהו של אדם) היא נורמלית.

מאפיינים מתמטיים

[עריכת קוד מקור | עריכה]

פונקציית הצפיפות

[עריכת קוד מקור | עריכה]

פונקציית הצפיפות של התפלגות נורמלית בעלת תוחלת ושונות היא :

זוהי פונקציה סימטרית סביב התוחלת, ובעלת שתי נקודות פיתול במרחק סטיית תקן אחת מן הממוצע, כלומר בנקודות . את העובדה שמשתנה מקרי הוא בעל התפלגות כזו, מקובל לציין בסימון .

במקרה המיוחד של ההתפלגות הנורמלית הסטנדרטית , מתקבלת הפונקציה

פונקציית ההתפלגות המצטברת

[עריכת קוד מקור | עריכה]

פונקציית ההתפלגות המצטברת, או הסיכוי שמשתנה מקרי יקבל ערך קטן או שווה ל- נתון, שווה ל-


כדי לחשב את ערכי פונקציית ההתפלגות המצטברת בעלת פרמטרים כלשהם, די בידיעת ערכיה של פונקציית ההתפלגות המצטברת הסטנדרטית, משום שאם ניתן להגדיר משתנה מקרי חדש ולגביו יתקיים . לכן, מתקיים:

- מסמל את פונקציית ההתפלגות המצטברת של משתנה נורמלי סטנדרטי.

בשל תכונות הסימטריה של ההתפלגות הנורמלית, בדרך כלל לא נתונים ערכיה השליליים של ההתפלגות הסטנדרטית בטבלאות המשמשות למציאתה. כדי למצוא אותם משתמשים בזהות: .

הפונקציה איננה פונקציה אלמנטרית (כלומר, היא אינה מתקבלת מהרכבה סופית של פולינומים, פונקציית האקספוננט והפונקציות הטריגונומטריות, והפונקציות ההפוכות להם). משום כך, כמעט כל ספר העוסק במבחנים סטטיסטיים כולל גם טבלה המכילה את הערכים המקורבים להתפלגות הנורמלית הסטנדרטית, שחושבו בשיטות נומריות. הקירוב הבא שימושי למדי כאשר z גדול:

תכונות ההתפלגות

[עריכת קוד מקור | עריכה]
חלוקה של ההתפלגות הנורמלית לפי רבעונים, אחוזונים וסטיות תקן
  • ההתפלגות מתפרשת על פני כל הישר הממשי.
  • ההתפלגות היא סימטרית וחד-שיאית (יונימודלית).
  • התוחלת, החציון והשכיח מתלכדים בציר הסימטריה.
  • אם נתון משתנה מקרי ו- מספרים ממשיים, אזי: .
  • אם ו- משתנים מקריים, בלתי תלויים, אז סכומם מתפלג נורמלית עם הפרמטרים או .
  • אם X,Y משתנים נורמליים סטנדרטיים ובלתי תלויים, אז הצירופים הליניאריים בלתי-תלויים אם ורק אם וקטורי המקדמים מאונכים, כלומר .
  • פיזור ערכי ההתפלגות - החוק האמפירי: 68.26% מן הערכים נמצאים במרחק של לא יותר מציון תקן אחד מהממוצע (ציר הסימטריה). במרחק של עד שני ציוני תקן (z=2) נמצאים 95.44% מהערכים ובמרחק עד שלושה ציוני תקן נמצאים 99.74% מהערכים - רק ב-0.26% יהיה ציון התקן גבוה מ-3.
  • גרף ההתפלגות נודע גם בשם "גרף פעמון" או "פעמון גאוס", שכן כאשר הוא משורטט בתור גרף המציין את מספר הערכים בכל תחום, מקבלת העקומה צורה דמוית פעמון - גבוהה במרכזה ונמוכה בשני צדדיה. צורת הפעמון מוכתבת על ידי הממוצע וסטיית התקן של ההתפלגות.
אחוזי ההתפלגות הנורמלית מסביב לממוצע (ציר הסימטריה) לפי סטיות תקן

סימולציה של משתנים המתפלגים נורמלית

[עריכת קוד מקור | עריכה]

הצורך ליצור נתונים שהתפלגותם היא בקירוב התפלגות נורמלית עולה בתחומים רבים. בשפות תכנות רבות קיים מחולל פסבדו אקראי המייצר משתנים המתפלגים, בקירוב, התפלגות אחידה על הקטע , ולכן דרושה שיטה להפוך את המשתנה המקרי האחיד למשתנה המתפלג התפלגות נורמלית סטנדרטית. ישנן מספר דרכים לעשות זאת:

"לאורך כל הדוגמאות המובאות בפסקה זו יסמן משתנה מקרי המתפלג אחיד על קטע היחידה."
  • דרך אינטואיטיבית (אך לא יעילה) ליצור משתנה מקרי המתפלג נורמלית בקירוב היא על ידי שימוש במשפט הגבול המרכזי הקובע כי סכום של מספר גדול של משתנים מקריים אחידים שואף להתפלגות נורמלית. על מנת ליצור התפלגות נורמלית סטנדרטית יש לדאוג שתוחלת הסכום תהיה שווה לאפס וסטיית התקן לאחת. לכן, המשתנה המקרי

מתפלג בקירוב התפלגות נורמלית סטנדרטית, וככל שמספר המחוברים גדל, כך גדל הדיוק.
  • שיטה כללית יותר, ומדויקת מבחינה מתמטית מתקבלת על ידי הפיכת פונקציית ההסתברות המצטברת. באופן כללי, אם היא פונקציית ההסתברות המצטברת של התפלגות נתונה, אז מתפלג בהתפלגות זו. לכן,

מתפלג נורמלית, כאשר היא פונקציית השגיאה. על מנת להשתמש בשיטה זו יש לדעת לחשב את פונקציית השגיאה, שהיא אינה פונקציה אלמנטרית.
  • שיטה יעילה יותר שגם היא מדויקת מבחינה מתמטית נקראת טרנספורמציית בוקס-מולר. טרנספורמציה זו משתמשת בעובדה שהתפלגות כי בריבוע עם שתי דרגות חופש היא התפלגות מעריכית, וקיימת נוסחה מדויקת להפיכת משתנה מקרי אחיד למשתנה המתפלג מעריכית. טרנספורמציית בוקס-מולר לוקחת שני משתנים מקריים אחידים ומחזירה שני משתנים מקריים בלתי תלויים המתפלגים נורמלית על ידי הנוסחה

מבחני נורמליות

[עריכת קוד מקור | עריכה]

מבחני נורמליות מעריכים את הסבירות שאוסף נתונים {x1, …, xn} מגיע מהתפלגות נורמלית. בדרך כלל השערת האפס H0 היא שהתצפיות מתפלגות נורמלית עם ממוצע כלשהו μ ושונות σ2, מול ההשערה החלופית Ha שההתפלגות היא שרירותית. מבחנים רבים (מעל 40) הומצאו לבעיה זו, להלן הבולטים שבהם:

  • בדיקות חזותיות יותר מושכות מבחינה אינטואיטיבית, אבל בו בזמן הן סובייקטיביות מכיוון שנסמכות על שיפוט אנושי בלתי פורמלי על מנת לקבל או לדחות את השערת האפס.
    • תרשים צפיפות אמפירי - בדיקת ההיסטוגרמה או תרשים הצפיפות לראות האם התפלגות נראית נורמלית.
    • תרשים Q-Q של הערכים הממוינים של אוסף הנתונים כנגד הערכים הצפויים של השברונים המתאימים מההתפלגות הנורמלית הסטנדרטית. זהו תרשים של נקודות מהצורה (Φ−1(pk), x(k)) כאשר pk = (kα)/(n + 1 − 2α) ו-α הוא קבוע ההתאמה, שיכול לקבל כל ערך בין 0 ל-1. אם השערת האפס נכונה, נקודות התרשים אמורות להיות בערך על הקו הישר.
    • תרשים P-P דומה לתרשים ה-Q-Q אבל בשימוש נדיר הרבה יותר. בשיטה זו מייצגים בתרשים את הנקודות (Φ(z(k)), pk) כאשר . בשביל הנתונים המתפלגים נורמלית, תרשים זה אמור להיות בערך על הקו הליניארי שבין (0,0) ובין (1,1).
    • מבחן שפירו-ווילק משתמש בעובדה שלקו בתרשים Q-Q יש שיפוע σ. המבחן משווה את הערכת הריבועים הפחותים של השיפוע עם ערך השונות המדגמית, ודוחה את השערת האפס אם שני הערכים האלה שונים משמעותית.
  • מבחני מומנט
    • מבחן K-ריבועי של ד'אגוסטינו
    • מבחן ז'רקה- ברה.
  • מבחני פונקציית התפלגות אמפירית
    • מבחן ליליאפורס (אדפטציה של מבחן קולמוגורוב-סמירנוב).
    • מבחן אנדרסון-דרלינג

התפלגות רב-נורמלית

[עריכת קוד מקור | עריכה]
ערך מורחב – התפלגות רב-נורמלית

ההכללה הנכונה של התפלגות נורמלית לווקטור משתנים מקריים היא זאת: אומרים ש- מתפלג רב-נורמלית (או גאוסיאנית) אם כל צירוף ליניארי שלו מתפלג נורמלית (חד-ממדי), כלומר . זה קורה אם ורק אם הפונקציה האופיינית של המשתנה היא , כאשר היא מטריצת השונויות המשותפות. היות שהמטריצה הזו סימטרית, אפשר ללכסן אותה אורתוגונלית. המטריצה האלכסונית המתקבלת קובעת את סינגולריות המשתנה - אומרים שהוא רגולרי אם ורק אם אין ערכים עצמיים לא אפס, והיותו של המשתנה רגולרי שקולה לכך שיש לו פונקציית צפיפות (ביחס למידת לבג).

למשתנים מקריים רב-נורמליים מספר יישומים בתורת ההסתברות וסטטיסטיקה, כמו בקביעת התפלגות של ממוצע וסטיית תקן של מדגם נרחב של משתנים מקריים נורמליים.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ במקור בלטינית: Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientium
  2. ^ NORMAL DISTRIBUTION, אוניברסיטת ווסט וירג'יניה