לדלג לתוכן

התפלגות קושי

מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף לורנציאן)
התפלגות קושי
פונקציית צפיפות ההסתברות
פונקציית ההסתברות המצטברת
מאפיינים
פרמטרים החציון, סקלה
תומך
פונקציית צפיפות הסתברות
(pdf)
פונקציית ההסתברות המצטברת
(cdf)
תוחלת לא מוגדרת
סטיית תקן לא מוגדרת
חציון
ערך שכיח
שונות לא מוגדרת
אנטרופיה
פונקציה יוצרת מומנטים
(mgf)
לא מוגדרת
פונקציה אופיינית
צידוד לא מוגדר
גבנוניות לא מוגדרת

התפלגות קוֹשִי (Cauchy), על שם המתמטיקאי הצרפתי אוגוסטן לואי קושי, היא התפלגות רציפה בעלת חשיבות במתמטיקה ובמספר תחומים בפיזיקה. בקרב פיזיקאים ההתפלגות מכונה לעיתים פילוג לורנץ (Lorentz), פילוג ברייט-ויגנר (Breit-Wigner) או לורנציאן.

התפלגות קושי מוגדרת כהתפלגות רציפה בעלת פונקציית צפיפות ההסתברות

כאשר הוא פרמטר מיקום, אשר קובע את החציון של ההתפלגות, ואילו הוא פרמטר סקלה, אשר קובע את רוחב ההתפלגות ובהתאם את גובה הערכים. בגבול שבו נקבל את פונקציית הדלתא של דיראק.

המקרה הפרטי של התפלגות קושי עם פרמטרים ו נקרא התפלגות קושי סטנדרטית, עם צפיפות התפלגות[1][2]

.

תכונה יוצאת דופן של התפלגות קושי היא שהתוחלת והשונות שלה אינם מוגדרים, כמו גם המומנטים מסדר גבוה יותר. לעומת זאת, החציון והשכיח מוגדרים ושניהם שווים .

סכום של משתנים מקריים המתפלגים קושי

[עריכת קוד מקור | עריכה]

אם הם משתנים מקריים בלתי-תלויים ושווי-התפלגות שנדגמו מהתפלגות קושי סטנדרטית, ממוצע המדגם שלהם מתפלג קושי סטנדרטית. בפרט, הממוצע אינו מתכנס לתוחלת, ואכן התפלגות קושי אינה מקיימת את חוק המספרים הגדולים. ההוכחה של תכונה זו אפשרית על ידי אינטגרציה של פונקציית צפיפות ההסתברות או על ידי שימוש בפונקציה האופיינית של התפלגות קושי הסטנדרטית:עבור סכום הדגימות מקבלים כלומר הוא משתנה מקרי בעל התפלגות קושי סטנדרטית.

באופן כללי יותר, אם הם משתנים בלתי-תלויים בעלי התפלגות קושי עם פרמטרי מיקום ופרמטרי סקלה ו הם מספרים ממשיים אזי מתפלג קושי עם פרמטר מיקום וסקאלה . כלומר חוק המספרים הגדולים אינו מתקיים עבור סכום משוקלל של משתני קושי בלתי תלויים.

פונקציה אופיינית

[עריכת קוד מקור | עריכה]

יהי משתנה מקרי המתפלג קושי. הפונקציה האופיינית של התפלגות קושי ניתנת על ידי

שאינו אלא טרנספורם פורייה של צפיפות ההסתברות. באופן דומה ניתן להביע את פונקציית צפיפות ההסתברות במונחי הפונקציה האופיינית על ידי טרנספורם פורייה ההפוך

.

המומנט ה-n של ההתפלגות מתקבל מהצבת בנגזרת ה-n של הפונקציה האופיינית. יש לשים לב כי הפונקציה האופיינית אינה גזירה בראשית הצירים. ואכן המומנטים של התפלגות קושי אינם מוגדרים פרט למומנט האפס.

דיברגנץ קולבק-לייבלר

[עריכת קוד מקור | עריכה]

ניתן להביא את דיברגנץ קולבק-לייבלר בין שתי התפלגויות קושי עם פרמטרים ו כנוסחה סגורה סימטרית:[3]

.

האנטרופיה הדיפרנציאלית של התפלגות קושי נתונה על ידי

הנגזרת של פונקציית השברונים של התפלגות קושי היא

.

ניתן להגדיר את האנטרופיה של התפלגות במונחים של פונקציית השברונים שלה.[4] באופן ספציפי

.

דגימה מהתפלגות קושי

[עריכת קוד מקור | עריכה]

אם עומדים מול קו ובועטים כדור לעבר הקו בזווית אקראית המתפלגת באופן אחיד בין 90- ל-90+ מעלות, ההתפלגות של הנקודה שבה פוגע הכדור בקו היא התפלגות קושי.

באופן פורמלי, תהי נקודה במישור x-y. נבחר קו העובר דרך הנקודה, כך שהזווית שלו ביחס לציר נבחרת באופן באופן אחיד (בין 90°- ל-90°+) באקראי. נקודת החיתוך של הישר עם ציר הוא מתפלגת קושי עם פרמטר מיקום ופרמטר סקאלה .

הגדרה זו נותנת דרך פשוטה לדגום מהתפלגות קושי סטנדרטית. תהי דגימה מהתפלגות אחידה רציפה מהקטע . אזי ניתן ליצור דגימה מהתפלגות קושי סטנדרטית על ידי

.

לחלופין, אם ו הם שני משתנים מקריים בלתי תלויים המתפלגים נורמלית עם תוחלת 0 ושונות 1 אז המנה מתפלגת התפלגות קושי סטנדרטית. ובאופן כללי, אם ל- סימטריה סיבובית במישור סביב ראשית הצירים, אזי המנה מתפלגת התפלגות קושי סטנדרטית.

פונקציית צפיפות התפלגות

[עריכת קוד מקור | עריכה]

פונקציית צפיפות ההסתברות של התפלגות קושי היא[5][6]

כאשר הוא פרמטר המיקום (והשכיח של ההתפלגות) ו הוא פרמטר הסקאלה. הוא רוחב חצי המקסימום (FWHM) של התפלגות קושי. אוגוסטן לואי קושי השתמש בפונקציית צפיפות כזו עם פרמטר קנה מידה אינפיניטסימלי, והגדיר את מה שמכונה כעת פונקציית דלתא של דיראק.

המקסימום של פונקציית הצפיפות של התפלגות קושי הוא ב- וערכו .

פונקציית התפלגות מצטברת

[עריכת קוד מקור | עריכה]

פונקציית ההתפלגות המצטברת של התפלגות קושי היא

ופונקציית השברונים (הפונקציה ההופכית לה) היא

.

הרבעון הראשון והשלישי הם , ומכאן הוא הטווח הבין-רבעוני של ההתפלגות.

הקשר להתפלגות t

[עריכת קוד מקור | עריכה]

התפלגות קושי סטנדרטית היא התפלגות t עם דרגת חופש אחת, כך שניתן לבנותה בכל שיטה שבה משתמשים לבניית התפלגות t.[7]

שיערוך פרמטרים

[עריכת קוד מקור | עריכה]

הממוצע והשונות של התפלגות קושי אינם מוגדרים. משום כך, בהינתן מדגם של התפלגות קושי, לא ניתן לשערך את הפרמטרים של ההתפלגות באמצעות ממוצע ושונות המדגם.[8] ואכן, ניתן לחשב את הממוצע של מדגם של n דוגמאות בלתי-תלויות ושוות-התפלגות מהתפלגות קושי כ

למרות שערכי הדגימות יתרכזו סביב , ממוצע המדגם לא יתכנס כאשר מגדילים את הערך של n. זאת מפני שההסתברות לדגימה עם ערך מוחלט גדול, הולכת וגדלה. למעשה, התפלגות ממוצע המדגם תהיה שווה להתפלגות התצפיות עצמן; כלומר, ממוצע המדגם של מדגם גדול אינו טוב יותר (או גרוע יותר) משערוך הערך של מכל תצפית בודדת במדגם. באופן דומה, חישוב שונות המדגם יביא לערכים שיגדלו ככל שיגדל מספר התצפיות.

זו הסיבה שיש צורך בשיטות אחרות לשיערוך פרמטר המיקום ופרמטר קנה המידה . שיטה פשוטה אחת היא לקחת את הערך החציוני של המדגם כאומד של , וחצי מהטווח הבין-רבעוני כאומד של . פותחו גם שיטות אחרות, מדויקות וחזקות יותר, שלעיתים נותנות תוצאות מדויקות בהרבה[9][10], למשל הממוצע המקוטע (אנ') של 24% הדגימות המרכזיות מהמדגם, מייצר אומד של מדויק יותר מחציון המדגם.[11]

ניתן להיעזר בשיטת הנראות המקסימלית כדי לאמוד את הפרמטרים ו . עם זאת, זה גישה זו מורכבת, מכיוון שהיא דורשת מציאת השורשים של פולינום מסדר גבוה, ושורשים מרובים ייצגו נקודות מקסימה מקומיות.[12] כמו כן, בעוד שמעריך הנראות המקסימלית יעיל אסימפטוטית, הוא אינו יעיל יחסית עבור מדגמים קטנים.[13][14] פונקציית הלוג-נראות עבור התפלגות קושי למדגם בגודל היא:

גזירה של פונקציית הנראות ביחס ל- ול- והשוואת הנגזרות לאפס נותנות את המשוואות הבאות:

כאשר נשים לב כי במשוואת הנגזרת ביחס ל- הביטוי

היא פונקציה מונוטונית של וכי הפתרון עבור חייב לקיים

.

הפתרון עבור דורש מציאת השורשים של פולינום מסדר .[12] הפתרון עבור דורש מציאת השורשים של פולינום מסדר . לכן בדרך כלל יהיה צורך להיעזר בשיטות נומריות. היתרון של שיערוך נראות מקסימלית הוא יעילות אסימפטוטית גבוהה יותר, שמתרגמת לשונות נמוכה יותר של האומד; הערכת באמצעות חציון המדגם היא רק כ-81% יעילה מבחינה אסימפטוטית ביחס אומדן לפי הסבירות המקסימלית.[11][15] ממוצע המדגם הקטוע המבוסס על 24% הדגימות המרכזיות יעיל אסימפטוטית בכ-88% יעיל ביחס למשערך הנראות המקסימלית של .[11]



קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא התפלגות קושי בוויקישיתוף

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ Riley, Ken F.; Hobson, Michael P.; Bence, Stephen J. (2006). Mathematical Methods for Physics and Engineering (3 ed.). Cambridge, UK: Cambridge University Press. pp. 1333. ISBN 978-0-511-16842-0.
  2. ^ Balakrishnan, N.; Nevrozov, V. B. (2003). A Primer on Statistical Distributions (1 ed.). Hoboken, New Jersey: John Wiley & Sons Inc. pp. 305. ISBN 0-471-42798-5.
  3. ^ Frederic, Chyzak; Nielsen, Frank (2019). "A closed-form formula for the Kullback-Leibler divergence between Cauchy distributions". arXiv:1905.10965 [cs.IT].
  4. ^ Vasicek, Oldrich (1976). "A Test for Normality Based on Sample Entropy". Journal of the Royal Statistical Society, Series B. 38 (1): 54–59. doi:10.1111/j.2517-6161.1976.tb01566.x.
  5. ^ N. L. Johnson; S. Kotz; N. Balakrishnan (1994). Continuous Univariate Distributions, Volume 1. New York: Wiley., Chapter 16.
  6. ^ Feller, William (1971). An Introduction to Probability Theory and Its Applications, Volume II (2 ed.). New York: John Wiley & Sons Inc. pp. 704. ISBN 978-0-471-25709-7.
  7. ^ Rui Li, Saralees Nadarajah, A review of Student’s t distribution and its generalizations, Empirical Economics 58, 2020-03-01, עמ' 1461–1490 doi: 10.1007/s00181-018-1570-0
  8. ^ "Illustration of instability of sample means". ארכיון מ-2017-03-24. נבדק ב-2014-11-22.
  9. ^ Cane, Gwenda J. (1974). "Linear Estimation of Parameters of the Cauchy Distribution Based on Sample Quantiles". Journal of the American Statistical Association. 69 (345): 243–245. doi:10.1080/01621459.1974.10480163. JSTOR 2285535.
  10. ^ Zhang, Jin (2010). "A Highly Efficient L-estimator for the Location Parameter of the Cauchy Distribution". Computational Statistics. 25 (1): 97–105. doi:10.1007/s00180-009-0163-y. S2CID 123586208.
  11. ^ 1 2 3 Bloch, Daniel (1966). "A note on the estimation of the location parameters of the Cauchy distribution". Journal of the American Statistical Association. 61 (316): 852–855. doi:10.1080/01621459.1966.10480912. JSTOR 2282794.
  12. ^ 1 2 Ferguson, Thomas S. (1978). "Maximum Likelihood Estimates of the Parameters of the Cauchy Distribution for Samples of Size 3 and 4". Journal of the American Statistical Association. 73 (361): 211–213. doi:10.1080/01621459.1978.10480031. JSTOR 2286549.
  13. ^ Cohen Freue, Gabriella V. (2007). "The Pitman estimator of the Cauchy location parameter" (PDF). Journal of Statistical Planning and Inference. 137 (6): 1901. doi:10.1016/j.jspi.2006.05.002. אורכב מ-המקור (PDF) ב-2011-08-16.
  14. ^ Wilcox, Rand (2012). Introduction to Robust Estimation & Hypothesis Testing. Elsevier.
  15. ^ Barnett, V. D. (1966). "Order Statistics Estimators of the Location of the Cauchy Distribution". Journal of the American Statistical Association. 61 (316): 1205–1218. doi:10.1080/01621459.1966.10482205. JSTOR 2283210.