לדלג לתוכן

מבחן M בריבוע

מתוך ויקיפדיה, האנציקלופדיה החופשית

מבחן M בריבוע (מבחן ) הוא וריאציה של מבחן כי בריבוע המתאימה להערכת עצמת הקשר בין שני משתנים איכותיים הנמדדים בסולם מדידה סודר. בניגוד למבחן חי בריבוע, מבחן זה לוקח בחשבון את העובדה שקיים סדר בין ערכי המשתנים. מבחן קוקראן-ארמיטאז' הוא מקרה פרטי של מבחן זה.

כשמשתנה נמדד בסולם סודר וערכיו מקודדים במספרים, אין משמעות לערכים המספריים האלה. לדוגמה, משתנה המתאר את המצב הסוציואקונומי של משפחה יכול לקבל את הערכים המילוליים "נמוך", "בינוני" או "גבוה", וניתן לקודד את הערכים המילוליים על ידי הערכים 1, 2, 3 או 4, 18, 21. על פי הגדרת סולם הסדר, כל שלושת הקידודים האלה שקולים.

עם זאת, ייתכן וניתן לקודד מחדש את הערכים של משתנה הסדר בערכים כמותיים. לדוגמה, המשתנה עשירוני שכר מקבל את הערכים 1 עד 10, וזהו משתנה סדר. אבל אפשר להחליף כל דרגה בסולם זה בשכר החציוני של העשירון, ובכך "לשדרג" אותו למשתנה כמותי. שדרוג זה יאפשר הפעלת שיטות סטטיסטיות המתאימות למשתנים כמותיים.

הגדרה פורמלית

[עריכת קוד מקור | עריכה]

יהיו יהיו ו- שני משתנים מקריים איכותיים הנמדדים בסולם סדר. נניח ללא הגבלת הכלליות כי המשתנה מקבל את הערכים וכי המשתנה מקבל את הערכים .

נתבונן במדגם בגודל מתוך אוכלוסייה כלשהי, ונסמן ב- את מספר הפרטים במדגם עבורם ו-. נאמר כי היא השכיחות של התצפיות במדגם עבורן ו-. הטבלה שבה יש שורות ו- עמודות, ובהצטלבות השורה ה- והעמודה ה- נמצא המספר נקראת לוח השכיחות של המשתנים ו-. לוח השכיחות הוא למעשה הנתונים שיש לנתח.

כן נסמן ב- את מספר הפרטים במדגם עבורם , וב- נסמן את מספר הפרטים במדגם עבורם . באופו דומה נסמן ב- את פרופורציית הפרטים במדגם עבורם , וב- נסמן את פרופורציית הפרטים במדגם עבורם . פרופרציית הפרטים במדגם עבורם ו- היא .

יהיו מספרים כלשהם. ערכים אלה נקראים ה-"ציונים" (scores) של ערכי המשתנה . באופן דומה, יהיו הציונים של ערגי המשתנה .

נגדיר: ו-.

באופן אנלוגי להגדרת מקדם המתאם של פירסון נגדיר

ויהי

הוא למעשה אמדן למקדם המתאם ההסתברותי בין שני משתנים מקריים כמותיים בדידים המקבלים את הערכים ו-.

תחת השערת האפס ההתפלגות האסימפטוטית של היא התפלגות עם דרגת חופש אחת. ידיעת ההתפלגות זו מאפשרת חישוב של ערך-p. נדחה את השערת האפס אם ערך זה קטן מרמת המובהקות שקבענו מראש.

הסבר אינטואיטיבי

[עריכת קוד מקור | עריכה]

כאשר מחליפים את ערכי סולם הסדר בציונים, המשתנה משודרג למשתנה כמותי. למשל, על פי סקר ההכנסות של הלשכה המרכזית לסטטיסטיקה לשנת[1]2011, השכר בעשירון השני באותה שנה נע בין 2248 שקלים ל-3633 שקלים. לכן ניתן להחליף את הערך האיכותי "עשירון שני" בערך כמותי, למשל ב-2940.5 - הממוצע של שני הקצוות. מספר השכירים בעשירון היה בערך 258900, ולכן יש לנו כעת 258900 תצפיות בהן הערך הכמותי של משתנה ההכנסה הוא 2940.5. לאחר שמבצעים את התהליך הזה לכל התצפיות עבור שני המשתנים, ניתן לחשב את מקדם המתאם בין הציונים שלהם.

קביעת ציוני המשתנים

[עריכת קוד מקור | עריכה]

ברור לחלוטין כי קביעת ערכי הציונים תשפיע על ערכו של . אגרסטי מדגיש כי יש לבחור את המיונים כך שישקפו את ההבדלים בין הערכים של המשתנים[2]. במקרה שהערכים של המשתנים מציינים טווח (למשל גיל 18 עד 25) ,אגרסטי ממליץ לקבוע את הציון באמצע הטווח (21.5 בדוגמה זו). אגרסטי טוען גם כי בדרך כלל בחירות שונות של ציונים יובילו בסופו של דבר לתוצאות דומות, אלא אם הנתונים מאוד לא מאוזנים, במובן שההתפלגות של הנתונים בקטגוריות רחוקה מהתפלגות אחידה. גראוברד וקורן[3] ממחישים את הבעייתיות שנובעת מקביעה שרירותית של ערכי הציונים. הם ממליצים "לקבוע ערכים סבירים כאשר הדבר אפשרי", ולתת ערכים שההפרשים ביניהם שווים כאשר הדבר לא אפשרי. כאפשרות נוספת, הם ממליצים לקבוע את הציון כדרגה הממוצעת של כל התצפיות בקטגוריה (כאשר הדרגה מוגדרת באופן דומה להגדרה במקדם המתאם של ספירמן או במבחן וילקוקסון). גילולה והברמן הציעו גישה המבוססת על ניתוח קנוני של לוח השכיחות[4] . ליאו גודמן, במאמר הסוקר את השיטות העיקריות לניתוח משתנים סודרים[5], מציג את מודל RC, שהפרמטרים שלו יכולים לשמש כציונים עבור ערכי המשתנים.

הדוגמה הבאה מבוססת על הדוגמה שהובאה במאמר של גראוברד וקורן שהוזכר קודם.

במחקר תצפיתי פרוספקטיבי, נלקח מדגם של כ-32000 נשים בשלבים המוקדמים של הריון. כל אישה ענתה על שאלון שתיאר את הרגלי שתיית האלכוהול שלה בשלושת החודשים הראשונים של ההריון, ועל סמך שאלונים אלה חושב ממוצע מנות האלכוהול ליום ("drinks") של כל אישה. נתונים אלה קובצו לקטגוריות שיצרו משתנה איכותי בסולם סדר. בסיום ההריון ולאחר הלידה, נרשם האם התינוק שנולד סובל ממום מולד.

הנתונים מוצגים בטבלה הבאה:

צריכת אלכוהול יומית
מום בלידה לא שתתה פחות ממנה אחת בין מנה אחת לשתיים שלוש מנות או יותר סך הכל
לא 17066 14464 788 163 32481
כן 48 38 5 2 93
סך הכל 17114 14502 793 165 32574


נבחן 3 אפשרויות למתן ציונים למשתנה צריכת האלכוהול היומית:

  • ציון ליניארי: הציונים יהיו המספרים 1 עד 4. זוהי גישה נאיבית, המניחה כי ההבדלים בין כל הערכים של משתנה זה שווים, וכך ה-"שדרוג" הוא למשתנה הנמדד בסולם רווח.
  • אמצע הטווח: לכל ערך לש המשתנה נבחר את הממצע בין הגבול התחתון של הערך והגבול העליון שלו. הציון של "לא שתתה" יהיה לכן 0, הציון של "פחות ממנה אחת" יהיה 0.5, שהוא הממוצע של 0 ו-1. באופן דומה הציון של "בין מנה אחת לשתיים יהיה 1.5. לקטגוריה העליונה "שלוש מנות או יותר" אין גבול עליון, ולכן ניאלץ לקבוע עבורה ציון שרירותי, למשל 5. שימו לב כי כאן המרווחים בין ציוני הערכים אינם שווים
  • דרגה ממוצעת: נדרג את ערכי המשתנה בדומה לדירוג שנעשה במבחן ספירמן, ונקבע את הדרגה הממוצעת כציון לערך האיכותי. לדוגמה, הדרגות של התצפיות בערך "לא שתתה" הן 1 עד 17114, ולכן הדרגה הממוצעת היא הממוצע של 1 ו-17114, כלומר 8557.5. באופן דומה, הדרגות של הערך "פחות ממנה אחת" הן 17115 עד 31616, ולכן הדרגה הממוצעת של ערך זה היא הממוצע של ו-31616, כלומר 24365.5.

מאחר שהמשתנה "מום בלידה" מקבל רק שני ערכים אפשריים, כל בחירה של זוג ציונים, שרירותית ככל שתהיה, תביא לאותה תוצאה. בדוגמה זו הציון העבור "לא" הוא 0 ועבור "כן" - 1.

בטבלה הבאה מוצגות שלוש מערכות הציונים שנבחרו, יחד עם הערך המחושב של סטטיסטי וערך ה-p :

שיטת הציון צריכת אלכוהול יומית
לא שתתה פחות ממנה אחת בין מנה אחת לשתיים שלוש מנות או יותר
ציון ליניארי 1 2 3 4 1.45 0.2283
אמצע הטווח 0 0.5 1.5 5 5.14 0.0234
דרגה ממוצעת 8557.5 24365.5 32013 32492 0.35 0.5537


דוגמה זו ממחישה את הרגישות של המבחן לבחירת ציוני הדרגות. הציונים הליניאריים של שתי הקטגוריות העליונות בסולם (בין מנה אחת לשתיים ושלוש או יותר) קרובים יחסית, וגם ציוני הדרגה הממוצעת. הם מבטאים הנחה מוסתרת כי אין הבדל משמעותי בין צריכה של עד 2 מנות וצריכה גבוהה יותר. ייתכן מאוד כי הנחה זו אינה סבירה, כיוון ששלוש מנות או יותר יכולות להיות 3 מנות, 54 מנות, ואף יותר מכך.

בהנחה כי בחרנו מראש רמת מובהקות (ובהתעלמות מבעיית ההשוואות המרובות), נדחה את ההשערה כי לא קיימת מגמת עליה בשיעור המומים המולדים בתינוקות ביחס לאמצע הטווח של קטגוריות צריכת האלכוהול, אך לא נוכל לדחות את ההשערות האחרות.

לקריאה נוספת

[עריכת קוד מקור | עריכה]


  • Agresti, Alan (2007). An introduction to categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 978-0-471-22618-5.
  • Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 0-471-36093-7.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ הלשכה המרכזית לסטטיסטיקה, לוח 27.- עשירונים של שכירים, לפי הכנסה חודשית ברוטו, מין, מספר שנות לימוד ומשלח יד, באתר הלשכה המרכזית לסטטיסטיקה
  2. ^ Agresti, Alan, 2.5.1, An Introduction to Categorical Data Analysis, 2nd edition, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 41, ISBN 978-0-471-22618-5
  3. ^ Graubard, B. I., & Korn, E. L., Choice of column scores for testing independence in ordered 2 x K contingency tables, Biometrics, 2 43, 1987, עמ' 471-476 doi: 10.2307/2531828
  4. ^ Gilula, Z., & Haberman, S. J., Canonical analysis of contingency tables by maximum likelihood, Journal of the American Statistical Association, 395 81, 1986, עמ' 780-788
  5. ^ Goodman, Leo A., The analysis of cross-classified data having ordered and/or unordered categories: association models, correlation models, and asymmetry models for contingency tables with or without missing entries, Annals Of Statistics, 1 13, 1985, עמ' 10-69