לדלג לתוכן

ניתוח שונות

מתוך ויקיפדיה, האנציקלופדיה החופשית
הבדל בין ממוצעי קבוצות

בסטטיסטיקה, ניתוח שונותאנגלית: Analysis of variance :ANOVA) הוא מושג המבטא אוסף של מודלים סטטיסטיים שפותחו על ידי הסטטיסטיקאי רונלד פישר. מטרת המודלים הללו לנתח את ההבדלים בין ממוצעים של קבוצות. ניתוח שונות חד-כיווני (One way ANOVA) מבוצע כשמדובר על משתנה בלתי תלוי אחד בלבד. ניתוח שונות דו כיווני (Two way ANOVA) מבוצע כשמדובר על שני משתנים בלתי תלויים. ניתוח שונות תלת כיווני (Three way ANOVA) מבוצע כשמדובר בשלושה משתנים בלתי תלויים וכן הלאה. המילה חד דו תלת וכו' מתייחסת למספר המשתנים הבלתי תלויים. כל ניתוח שונות נעשה על משתנה תלוי אחד בלבד.

מנהלת בית ספר רוצה לבחון אם קיימים הבדלים בשביעות הרצון של קבוצות שונות בבית הספר. תחילה, רוצה המנהלת לבחון אם קיימים הבדלים בין אימהות לאבות ברמת שביעות הרצון בבית הספר. במדגם שהיא עורכת נמצא שממוצע שביעות הרצון של האבות הוא 5.2 מתוך 7 ואילו זה של האימהות הוא 4.8. האם היא יכולה להסיק שאבות שבעי רצון יותר מאימהות? או שמא ההבדל בין הקבוצות הוא מקרי משום שמדובר במדגם? כדי לבחון אם ההבדל בין ממוצעים של שתי קבוצות מובהק סטטיסטית, יש לבצע מבחן t למדגמים בלתי תלויים או ניתוח שונות חד־כיווני.

כדי לבחון הבדל בין ממוצעי שביעות הרצון של שלוש קבוצות, או יותר, למשל ההבדל בין הורי כיתות א ב ו ג, לא ניתן לבצע מבחן t (המיועד לשתי קבוצות בלבד), וצריך לבצע ניתוח שונות חד כיווני.

כדי לבחון הבדל בין קבוצות המתייחס לשני משתנים בלתי תלויים (למשל מגדר ההורים וכיתת הילד) על משתנה תלוי אחד (למשל שביעות הרצון). יש לבצע ניתוח שונות דו-כיווני.

ניתוח שונות חד כיווני

[עריכת קוד מקור | עריכה]

ניתוח שונות חד כיווני הוא מבחן סטטיסטי המשווה אם הממוצעים של שתי קבוצות או יותר שונים זה מזה.[1] כאשר מדובר בשתי קבוצות בלבד נהוג לבצע מבחן t, אך ניתוח שונות חד כיווני ייתן תוצאה זהה. כשמדובר בניתוח שונות, סטטיסטי המבחן הוא ערך ה־F, כשעבור מצב בו יש שתי קבוצות בלבד .

הנחות המודל

[עריכת קוד מקור | עריכה]

נניח כי ישנן k קבוצות שונות שנרצה להשוות ביניהן. בכל קבוצה יש תצפיות, כך שהתצפית היא התצפית ה-j בקבוצה ה-i.

אזי המודל מניח כי התצפיות בקבוצה ה-i מתפלגות נורמלית סביב תוחלת השווה ל - , בסטיית תקן . בכתיב מקוצר: כלומר לכל קבוצה תוחלת שונה.

אפשר גם לפרק את הביטוי כך שנגדיר גורם של רעש המתפלג נורמלית סביב האפס, בסטיית תקן של , ונוסיף אותו לתוחלת הקבוצה. בכתיב מקוצר נאמר , כאשר .

השערות המבחן

[עריכת קוד מקור | עריכה]

עבור השערת האפס, לא נניח הבדל בין תוחלות הקבוצות.

כלומר:

ועבור השערת H1 אחרת מכך.

התפלגות הממוצעים היא:

ומכאן שהתפלגות ממוצע כלל הדגימות:

.

חלוקת סכום הריבועים

[עריכת קוד מקור | עריכה]

נגדיר את סכומי הריבועים הבאים: עבור כל קבוצה i:

ובהתאם נגדיר: (סכום הריבועים בתוך הקבוצות)

סכום הריבועים בין הקבוצות: וסה"כ סכומי הריבועים:

מפיתוח מתמטי נגיע לקשר

ערך מורחב – מבחן F

תחת השערת האפס, כאשר F זוהי התפלגות F.

מבחני Post Hoc - השוואות אנליטיות

[עריכת קוד מקור | עריכה]

אם מבחן ניתוח השונות מצביע על כך שהאוכלוסיות שונות זו מזו, עולה השאלה בין אילו זוגות של אוכלוסיות יש הבדל מובהק. בשאלה זו עוסקים מבחן LSD של פישר (אנ'), מבחן הטווח של טוקי (אנ') ומבחנים נוספים.

ניתוח שונות דו כיווני

[עריכת קוד מקור | עריכה]

ניתוח שונות דו כיווני מתאים למצב בו מערך המחקר כולל שני משתנים בלתי תלויים ומשתנה תלוי אחד.[2] כל אחד מהמשתנים הבלתי תלויים יכול לכלול שתי אפשרויות (בעגה המקצועית: ערכים או רמות) או יותר. המצב הפשוט ביותר הוא כזה שכל משתנה בלתי תלוי הוא בעל שני ערכים בלבד ודוגמה כזו מובאת למטה.

חוקרת רוצה לבחון את השאלה האם כוונת רכישה (משתנה תלוי) קשורה לאופן הפנייה לצרכנים (משתנה בלתי תלוי א) ולתפיסת עולמם (משתנה בלתי תלוי ב). היא העבירה ל-80 נחקרים תיאור של אותו מוצר בדיוק כשלמחצית הפניה בפרסומת הייתה בלשון יחיד ("אתה") ולמחצית היא הייתה בלשון רבים ("אתם"). בנוסף, היא בדקה האם הנחקר בעל תפיסת עולם אינדיבידואליסטית (מדגישה את צורכי העצמי) או קולקטיביסטית (מדגישה את צורכי הקהילה). לאחר קריאת הפרסומת, הנחקר התבקש לציין מה הסיכוי שהוא ירכוש את המוצר, על סולם שבין 1 (בטוח שלא) ועד 6 (בטוח שכן). סוג הניתוח הסטטיסטי המתאים במקרה זה הוא ניתוח שונות דו-כיווני. בטבלה מובאים ממוצעי הקבוצות במשתנה התלוי (הסיכוי לרכוש את המוצר) על פי שני המשתנים הבלתי תלויים.

סוג הפניה בפרסומת
בלשון יחיד בלשון רבים סך הכל
תפיסת עולם אינדוו' 4.40 3.08 3.74
קולקטי' 3.10 4.50 3.80
סך הכל 3.75 3.79

ניתוח שונות דו כיווני מאפשר לבדוק שלוש שאלות: לגבי כל אחד מהאפקטים העיקריים ולגבי האינטראקציה הזוגית

האם אופן הפניה לצרכן, קשור למשתנה התלוי (כוונת הרכישה)? במילים אחרות, האם ההבדל שהתקבל במדגם בממוצע הסיכוי לרכוש את המוצר בין נחקרים שפנו אליהם בלשון יחיד (3.75) לבין נחקרים שפנו אליהם בלשון רבים (3.79), הוא מובהק סטטיסטית. בפשטות, השאלה היא האם ניתן להכליל לאוכלוסייה את המסקנה כי פניה בפרסומת בלשון רבים (מעבר או בלי לקחת בחשבון את תפיסת העולם) מביאה לסיכוי גבוה יותר לרכוש את המוצר, מאשר פניה בלשון יחיד.

אפקט עיקרי (Main effect) למשתנה בלתי תלוי ב

[עריכת קוד מקור | עריכה]

האם המשתנה הבלתי תלוי (תפיסת העולם) קשור למשתנה התלוי (הסיכוי לרכוש את המוצר). במילים אחרות, האם ההבדל שהתקבל במדגם בסיכוי לרכוש את המוצר בין בעלי תפיסת עולם אינדיבידואליסטית (3.74) לבין בעלי תפיסת עולם קולקטיביסטית (3.80) הוא מובהק סטטיסטית. בפשטות, השאלה היא האם ניתן להכליל לאוכלוסייה את המסקנה כי המוכנות לרכוש את המוצר גבוהה יותר אצל בעלי תפיסת עולם קולקטיביסטית מאשר אצל בעלי תפיסת עולם אינדיבידואליסטית (וזאת מעבר לסוג הפנייה בפרסומת).

האם הקשר בין משתנה בלתי תלוי א (סוג הפניה בפרסומת) למשתנה התלוי (כוונות רכישה) תלוי בערך של משתנה בלתי תלוי ב (תפיסת העולם). במילים אחרות, האם ההבדל בכוונות הרכישה (המשתנה התלוי) בין נחקרים שקבלו את הפרסומת בלשון יחיד לבין נחקרים שקבלו את הפרסומת בלשון רבים (משתנה בלתי תלוי א) אצל בעלי תפיסת עולם קולקטיביסטית שונה (בכיוונו או בגודלו) מאשר אצל בעלי תפיסת עולם אינדיבידואליסטית.

לפי הטבלה הנתונים מראים כי במדגם יש אינטראקציה. דפוס האינטראקציה הוא כזה שההבדל בכוונות הרכישה בין פנייה בלשון יחיד לבין פניה בלשון רבים אצל אינדיבידואליסטים הפוך בכיוונו מזה שאצל הקולקטיביסטיים. בקרב האינדיבידואליסטים בממוצע הסיכוי לרכוש את המוצר גבוה יותר כשהפניה היא בלשון יחיד (4.40) מאשר בלשון רבים (3.08). ואילו אצל הקולקטיביסטיים בממוצע הסיכוי לרכוש את המוצר גבוה יותר כשהפניה היא בלשון רבים (4.50) מאשר בלשון יחיד (3.10). דפוס אינטראקציה זה קרוי אינטראקציה דיס-אורדינלית, בה האפקט העיקרי אינו מייצג את התמונה בתוך כל שורה או בכל טור.

ייתכנו דפוסים אחרים של אינטראקציה בהם אין היפוך. במצבים אלה יש משמעות לאפקט או לאפקטים העיקריים. בכל מקרה, גם כאן השאלה היא האם האינטראקציה מובהקת או היא תוצר של העובדה שמדובר במדגם ולמעשה ההבדלים הם מקריים ולכן לא ניתן להכליל את הדפוס לאוכלוסייה.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא ניתוח שונות בוויקישיתוף
  • ניתוח שונות, באתר MathWorld (באנגלית)
  • Why ANOVA, פרק ראשון מבין ארבעה בנושא ניתוח שונות במסגרת הפודקאסט ״סטטיסטיקה מרפאת״, 8 באפריל 2021

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ ש. אליס, שיטות מחקר במדעי החברה: ניתוח שונות חד-כיווני, רעננה ישראל: האוניברסיטה הפתוחה, 2021, עמ' יחידה 9
  2. ^ ש. אליס, שיטות מחקר במדעי החברה: ניתוח שונות דו-כיווני, רעננה, ישראל: האוניברסיטה הפתוחה, 2021, עמ' יחידה 10