מתוך ויקיפדיה, האנציקלופדיה החופשית
שברון (באנגלית : quantile ) הוא מונח בסטטיסטיקה , שמתייחס לנקודת חתך שמתחתיה נמצאה החלק ה-q (כאן
0
≤
q
≤
1
{\displaystyle 0\leq q\leq 1}
) מהאוכלוסייה.
יהי
X
∼
F
{\displaystyle X\sim F}
משתנה מקרי ממשי . נסמן את פונקציית ההתפלגות המצטברת
F
(
x
)
=
P
[
X
≤
x
]
{\displaystyle F(x)=P\left[X\leq x\right]}
כאשר P מסמן הסתברות . השברון ה-q של X עבור
0
≤
q
≤
1
{\displaystyle 0\leq q\leq 1}
הוא הערך
ξ
q
∈
R
{\displaystyle \xi _{q}\in \mathbb {R} }
כך שמתקיים
F
(
ξ
q
)
=
P
[
X
≤
ξ
q
]
=
q
{\displaystyle F(\xi _{q})=P\left[X\leq \xi _{q}\right]=q}
אם F פונקציה מונוטונית עולה ממש אזי
ξ
q
=
F
−
1
(
q
)
{\displaystyle \xi _{q}=F^{-1}(q)}
.
נניח שדגמנו
n
{\displaystyle n}
נתונים מהתפלגות כלשהי, לא ידועה. נסדרם בסדר עולה:
min
i
X
i
=
X
1
≤
X
2
≤
.
.
.
≤
X
n
−
1
≤
X
n
=
max
i
X
i
{\displaystyle \min _{i}X_{i}=X_{1}\leq X_{2}\leq ...\leq X_{n-1}\leq X_{n}=\max _{i}X_{i}}
ונצייד את הנתונים בהתפלגות אמפירית :
F
n
(
x
)
=
#
{
X
i
≤
x
}
n
{\displaystyle F_{n}(x)={\frac {\#\{X_{i}\leq x\}}{n}}}
השברון ה-q הוא המספר
ξ
q
{\displaystyle \xi _{q}}
ש-
q
n
{\displaystyle qn}
מהנתונים קטנים ממנו או שווים לו. הגדרה זו קצת בעייתית כי לא ברור ממנה איך להתייחס לשברון כאשר
q
n
∉
Z
{\displaystyle qn\notin \mathbb {Z} }
איננו שלם, וישנן מספר גישות לנושא. אחת הגיסות הנפוצות היא ממוצע משוקלל של שני הערכים הסמוכים למספר זה. נסמן
m
=
⌊
q
n
+
1
2
⌋
{\displaystyle m=\left\lfloor qn+{\frac {1}{2}}\right\rfloor }
ואז
ξ
q
=
X
m
⋅
(
m
+
1
−
(
q
n
+
1
2
)
)
+
X
m
+
1
(
q
n
+
1
2
−
m
)
{\displaystyle \xi _{q}=X_{m}\cdot \left(m+1-(qn+{\frac {1}{2}})\right)+X_{m+1}\left(qn+{\frac {1}{2}}-m\right)}
אנו רואים שכאשר
m
=
q
n
+
1
/
2
∈
Z
{\displaystyle m=qn+1/2\in \mathbb {Z} }
אזי
ξ
q
=
X
m
{\displaystyle \xi _{q}=X_{m}}
.
לדוגמה, החציון
q
=
1
2
{\displaystyle q={\frac {1}{2}}}
. עבור n אי-זוגי (
n
=
2
k
+
1
{\displaystyle n=2k+1}
), מתקיים
m
=
⌊
n
2
+
1
2
⌋
=
⌊
2
k
+
1
2
+
1
2
⌋
=
⌊
2
k
+
2
2
⌋
=
k
+
1
{\displaystyle m=\left\lfloor {\frac {n}{2}}+{\frac {1}{2}}\right\rfloor =\left\lfloor {\frac {2k+1}{2}}+{\frac {1}{2}}\right\rfloor =\left\lfloor {\frac {2k+2}{2}}\right\rfloor =k+1}
ואז
,
ξ
0.5
=
X
k
+
1
{\displaystyle ,\xi _{0.5}=X_{k+1}}
ועבור n זוגי (
n
=
2
k
{\displaystyle n=2k}
) נקבל
m
=
⌊
n
2
+
1
2
⌋
=
⌊
2
k
2
+
1
2
⌋
=
k
{\displaystyle m=\left\lfloor {\frac {n}{2}}+{\frac {1}{2}}\right\rfloor =\left\lfloor {\frac {2k}{2}}+{\frac {1}{2}}\right\rfloor =k}
ואז
ξ
0.5
=
X
k
⋅
(
k
+
1
−
(
k
+
1
2
)
)
+
X
k
+
1
(
k
+
1
2
−
k
)
=
X
k
+
X
k
+
1
2
{\displaystyle \xi _{0.5}=X_{k}\cdot \left(k+1-(k+{\frac {1}{2}})\right)+X_{k+1}\left(k+{\frac {1}{2}}-k\right)={\frac {X_{k}+X_{k+1}}{2}}}
מלבד החציון , שהוא השברון
q
=
1
/
2
{\displaystyle q=1/2}
, נפוצים בשימוש גם הרבעונים העליון
q
=
3
/
4
{\displaystyle q=3/4}
והתחתון
q
=
1
/
4
{\displaystyle q=1/4}
, עשירונים , אחוזונים ואלפיונים .