대학원생 리암의 블로그

Generalized Extreme Value Function 본문

대학원

Generalized Extreme Value Function

liam0222 2024. 11. 14. 20:34

 

Extreme value theory는 i.i.d.한 랜덤 변수들의 최댓값 분포를 탐구하는 이론이다. GEV 분포는 금융, 보험, 기후 모델링 등에서 극단적 사건을 예측하는 데 사용된다. 예를 들어, 금융에서는 자산 가격의 극단적인 변동성을 모델링하거나, 기후학에서는 극단적인 날씨 사건을 예측하는 데 사용된다.

 

극값 이론에서 최댓값 분포GEV (Generalized Extreme Value)라는 분포로 수렴시켜 활용한다.그리고 Choice라는 것은 여러 alternative 중에 utility를 비교해서 그 중 차이가 최대인 선택을 고른다는 점에서 GEV 분포를 적용시키기 매우 적합한 구조이다. 

극값 이론에서는 여러 개의 독립적이고 동일한 분포(i.i.d.)를 따르는 랜덤 변수들의 최댓값의 분포를 다룬다. 이는 Choice Model에서 Error term인 epsilon이 iid임과 align하고 있다. 

\[
M_n = \max(X_1, X_2, \dots, X_n)
\]

 \(M_n = \max(X_1, X_2, \dots, X_n)\)에서 \(M_n\)은 최댓값이다. 그리고 M_n이 b_n보다 클 확률은 아래와 같이 모델링 된다. 

\[
P(M_n > b_n) = 1 - F(b_n)^n
\]

 

 

\( F(b_n) = P(X \leq b_n) \)이다. 여기서 \( F(b_n) \)은 \( X \)가 \( b_n \)보다 작을 cumulative distribution이다. iid한 \( X \) (choice model의 epsilon)이 \( n \)개 있을 때 epsilon \( n \)개 모두가 \( b_n \)보다 작을 확률은 \( (F(b_n))^n \)이 되게 된다. 그걸 1에서 빼게 되면 적어도 하나는 \( b_n \)보다 크다는 말이 되고 이는 최대값이 \( b_n \)보다 클 확률이 된다.

극값 이론에서는 \( n \)이 커질 때, choice 모델에서는 alternative의 개수가 커질 때, \( M_n \)의 분포가 GEV 분포로 수렴한다. 예를 들어 \( F(b_n) \)이 \( 1 - \frac{1}{n} \)에 근사할 때, 최댓값 분포가 Gumbel 분포로 수렴하게 된다. 이처럼 \( F(b_n) \)을 어떻게 근사하는지에 따라서 여러 모델이 있는데 general하게 표현한 함수가 바로 Generalized Extreme Value function이다.


\[
F(x) = \exp \left( -\left( 1 + \xi \frac{x - \mu}{\sigma} \right)^{-\frac{1}{\xi}} \right)
\]

여기서:

- \(x\)는 관측된 값,
- \(\mu\)는 위치 파라미터,
- \(\sigma\)는 척도 파라미터,
- \(\xi\)는 형태 파라미터이다.


Gumbel 분포 (\(\xi = 0\)): \(\xi = 0\)일 때 GEV 분포는 Gumbel 분포로 변형된다. 이는 일반적인 최댓값 분포로, 극단적인 사건이 일정한 확률로 발생하는 경우에 적합하다. 예: 평범한 범위 내에서 발생하는 극단적인 최대값.

Fréchet 분포 (\(\xi > 0\)): \(\xi > 0\)일 때 GEV 분포는 Fréchet 분포로 변형된다. 이는 극단적인 사건이 자주 발생하는 경우를 모델링하는 데 사용된다. 예: 폭풍, 대홍수 등 자연 재해가 자주 발생하는 지역에서의 극단적인 사건.

Weibull 분포 (\(\xi < 0\)): \(\xi < 0\)일 때 GEV 분포는 Weibull 분포로 변형된다. 이는 극단적인 사건이 드물고, 그 값에 상한이 존재하는 경우를 나타낸다. 예: 일부 시스템에서 극단적인 고장이 드물고 상한이 존재하는 경우 (예: 극단적인 고온에 대한 내구성).