לדלג לתוכן

סטטיסטיקה

מתוך ויקיפדיה, האנציקלופדיה החופשית
גרף התפלגות נורמלית

סטטיסטיקה היא תחום ידע הנוגע לאיסוף, עיבוד, ניתוח, והצגת מסקנות מנתונים כמותיים. בתחום שני ענפים מרכזיים: סטטיסטיקה תֵּאוּרִית, וסטטיסטיקה הֵיסֵקִית.

תחום הסטטיסטיקה בכללותו, ובפרט הסטטיסטיקה ההיסקית, נשענים על תורת ההסתברות ובמקרים רבים גם על הנחות פרקטיות. בשל הישענותה על הנחות פרקטיות, יש מחלוקת בין הסטטיסטיקאים לגבי סיווגה של הסטטיסטיקה כענף של המתמטיקה או כענף של מדעי הטבע והחברה.

המדעים הבולטים בהישענותם על הסטטיסטיקה הם פיזיקה סטטיסטית, כימיה סטטיסטית, חלק מתחומי הביולוגיה וחלק נכבד מתחומי הרפואה, מדעי החברה והמחקר הטכנולוגי.

היכולת להבין נתונים סטטיסטיים, נקראת אוריינות סטטיסטית.

במקרים רבים קשה לנתח את האיברים בקבוצה באופן פרטני בשל מספרם הרב, ואז אפשר להתייחס אל הנתונים כמכלול, ולנתחם ככאלה. כאשר מסתכלים על משתנה מסוים (למשל מידת גובה) והופעתו באוכלוסייה מסוימת (למשל ילדי כתה ג' בישראל), מתקבלת התפלגות של משתנה מקרי (הגובה). במקרים רבים ניתן לדגום מדגם שייצג את האוכלוסייה לצורך הסקה סטטיסטית.

הסטטיסטיקה מתחלקת לסטטיסטיקה תיאורית, שמטרתה תיאור של הנתונים על ידי אפיון ממדים שונים בהם, וסטטיסטיקה היסקית, שמטרתה הסקת מסקנות מהמדגם עליו נאספו הנתונים הסטטיסטיים לכל האוכלוסייה.

מדע או מתמטיקה?

[עריכת קוד מקור | עריכה]

הסטטיסטיקה לא מכילה כמעט כל ניסויים שהם כשלעצמה (למעט סימולציות מחשב כגון "שיטת מונטה קרלו"). אולם, היא מסיקה על יעילות שיטות המחקר שלה מהצלחת הניסויים להם היא מסייעת בתחומי מדע מגוונים. על כן הסטטיסטיקה יכולה להיחשב למדע.

הכללתה של הסטטיסטיקה בין ענפי המתמטיקה שנויה במחלוקת בין הסטטיסטיקאים. אי הכללת הסטטיסטיקה בין ענפי המתמטיקה נשענת על טיעונים פילוסופיים. הפילוסופים מציינים שיש שלוש דרכים לנתח נתונים ולהגיע למסקנות: לוגיקה, מטאפיזיקה והשכל הישר (Common sense). הטוענים שסטטיסטיקה אינה מתמטיקה גורסים כי מתמטיקה מכילה ניתוחים לוגיים בלבד ואילו הסטטיסטיקה, כמו המדעים, מכילה ניתוחים על פי השכל הישר לצד ניתוחים לוגיים.

לעומתם, אלה הטוענים שהסטטיסטיקה היא כן ענף במתמטיקה מביאים טיעונים מתחום הסוציולוגיה של המדע. הם טוענים שסטטיסטיקאים לומדים בעיקר מתמטיקה ושהפיתוחים המרכזיים בה נעשים בעיקר על ידי מתמטיקאים. מעבר לזאת, אנשים אלה טוענים שהצורך של הסטטיסטיקאים להישען על הנחות השכל הישר במקום על היסקים לוגיים הולך ונחלש עם התפתחות הסטטיסטיקה ובעיקר עם התפתחות הענף הסטטיסטי הקרוי סטטיסטיקה לא פרמטרית.

סטטיסטיקה תיאורית

[עריכת קוד מקור | עריכה]
ערך מורחב – סטטיסטיקה תיאורית

סטטיסטיקה תיאורית היא הענף הסטטיסטי העוסק בתיאור תמציתי ומייצג של מדגמי נתונים גדולים. בבעיה אופיינית מתחום זה יש לתאר את המאפיינים הבסיסיים של מדגם בן אלף ציונים במבחן בתנ"ך. במקום להציג את כולם, אפשר להציג היסטוגרמה. תיאור קצר אף יותר מתקבל אם מוסרים את מדדי האמצע והפיזור הנפוצים: הממוצע וסטיית התקן.

סטטיסטיקה היסקית

[עריכת קוד מקור | עריכה]
ערך מורחב – הסקה סטטיסטית

סטטיסטיקה היסקית עוסקת בניסיון להגיע למסקנות לגבי האוכלוסייה מתוך נתוני המדגם.

מודלים סטטיסטיים

מודלים סטטיסטיים הם שיטות מתמטיות המאפשרות לגזור מתוך נתוני המדגם נוסחה המאפשרת לנבא את ערכו של המשתנה התלוי בהינתן המשתנים הבלתי-תלויים. מספר המודלים הוא רב מאוד, ותלוי בסולם המדידה של כל אחד מהמשתנים, בקשרים אותם מעוניינים לחקור ובאופי הקשר המשוער בין המשתנים. המודל הפשוט ביותר, וזה הנמצא בשימוש הנרחב ביותר, הוא רגרסיה ליניארית (חד-ממדית) - מודל המאפשר ניבוי של משתנה רציף אחד מתוך משתנה רציף נוסף אחד.

מבחנים סטטיסטיים

מבחן הוא כלי מתמטי המאפשר לבחון הנחות מסוימות לגבי משתנה אחד או לגבי הקשר בין מספר משתנים. קיים מגוון רב של מבחנים, המותאמים לבדיקת הנחות שונות.

חישוב סטטיסטי

[עריכת קוד מקור | עריכה]

לגידול המהיר והמתמשך בכוח החישוב, שהתחיל במחצית השנייה של המאה ה-20, הייתה השפעה משמעותית על שימושי מדע הסטטיסטיקה. מודלים סטטיסטיים מוקדמים היו כמעט תמיד מהסוג של מודלים ליניאריים (כגון אלו המשמשים ברגרסיה קלאסית), אך מחשבים חזקים בשילוב עם אלגוריתמים נומריים מתאימים גרמו לעניין מוגבר במודלים לא ליניאריים (כגון רשתות עצביות), כמו גם יצירת סוגים חדשים, כגון מודלים ליניאריים מוכללים ומודלים רב-שכבתיים. כוח החישוב הגדל הוביל גם לפופולריות ההולכת והגדלה של שיטות אינטנסיביות חישובית המבוססות על דגימה חוזרת כגון מבחני פרמוטציות ו-Bootstrapping, ואילו טכניקות כמו דגימת גיבס הפכו את השימוש במודלים בייסיאנים ליותר מעשיים. למהפכת המחשב היו השלכות על עתיד הסטטיסטיקה, עם דגש חדש על סטטיסטיקה "ניסויית" ו"אמפירית". מספר רב של תוכנות סטטיסטיות (הן כלליות והן ייעודיות) זמינות כיום לשימוש.

דוגמאות ליישומים

[עריכת קוד מקור | עריכה]

קישורים חיצוניים

[עריכת קוד מקור | עריכה]