상위 질문
타임라인
채팅
관점
안정 분포
위키백과, 무료 백과사전
Remove ads
확률론에서 확률 분포는, 이 분포를 따르는 두 독립 확률 변수의 선형 결합이 위치 매개변수와 스케일 매개변수를 제외하고는 같은 분포를 가지면 안정(영어: stable)하다고 한다. 확률 변수는 그 분포가 안정적이면 안정적이라고 한다. 안정 분포군은 이를 처음 연구한 수학자 폴 피에르 레비의 이름을 따서 때때로 레비 알파-안정 분포(영어: Lévy alpha-stable distribution)라고도 불린다.[1][2]
이 군을 정의하는 네 가지 매개변수 중 대부분의 관심은 안정성 매개변수 에 집중되어 있다 (패널 참조). 안정 분포는 를 가지며, 상한은 정규 분포에 해당하고 은 코시 분포에 해당한다. 이 분포들은 일 때 분산이 정의되지 않고, 일 때 평균값이 정의되지 않는다.
안정 확률 분포의 중요성은 그것들이 독립적이고 동일하게 분포된(iid) 확률 변수들의 적절하게 정규화된 합에 대한 "끌개"이기 때문이다. 정규 분포는 안정 분포의 한 군을 정의한다. 고전적인 중심 극한 정리에 따르면, 각 변수가 유한 분산을 가지는 일련의 확률 변수들의 적절하게 정규화된 합은 변수의 수가 증가함에 따라 정규 분포에 수렴한다. 유한 분산 가정이 없으면 극한은 정규 분포가 아닌 안정 분포가 될 수 있다. 망델브로는 그러한 분포를 빌프레도 파레토의 이름을 따서 "안정 파레토 분포"라고 불렀다.[3][4][5] 특히 그는 로 양의 방향으로 최대의 왜곡을 보이는 분포를 "파레토-레비 분포"라고 불렀는데,[1] 이는 주식 및 상품 가격을 정규 분포보다 더 잘 설명한다고 보았다.[6]
Remove ads
정의
요약
관점
퇴화 분포가 아닌 분포는 다음 속성을 만족할 경우 안정 분포이다.
확률 변수 X의 독립적인 사본을 X1 및 X2라고 하자. 이때 임의의 상수 a > 0 및 b > 0에 대해 확률 변수 aX1 + bX2가 어떤 상수 c > 0 및 d에 대해 cX + d와 동일한 분포를 가질 때 X는 안정적(영어: stable)이라고 한다. d = 0일 때 이 속성이 성립하면 그 분포는 엄밀히 안정적이라고 한다.[7]
정규 분포, 코시 분포 및 레비 분포는 모두 위 속성을 가지므로, 이들은 안정 분포의 특별한 경우이다.
이러한 분포들은 위치 및 스케일 매개변수 μ와 c, 그리고 대략적으로 비대칭도와 집중도를 나타내는 두 가지 형태 매개변수 와 에 의해 매개화되는 4매개변수 연속 확률 분포 군을 형성한다 (그림 참조).
밀도 함수 를 가진 확률 분포의 특성 함수 는 의 푸리에 변환이다. 밀도 함수는 특성 함수의 역 푸리에 변환이다.[8]
일반 안정 분포의 확률 밀도 함수는 해석적으로 쓸 수 없지만, 일반 특성 함수는 해석적으로 표현할 수 있다. 확률 변수 X는 그 특성 함수가 다음과 같이 쓸 수 있을 때 안정적이라고 불린다.[7][9] 여기서 sgn(t)는 t의 부호함수이며 μ ∈ R는 이동 매개변수이고, 는 왜곡 매개변수라 불리며 비대칭도를 측정한다. 이 맥락에서 일반적인 비대칭도는 잘 정의되지 않음에 유의하라. 왜냐하면 인 경우 분포는 2차 또는 그 이상의 모멘트를 허용하지 않으며, 일반적인 비대칭도 정의는 3차 중심 모멘트이기 때문이다.
이것이 안정 분포를 제공하는 이유는 두 독립 확률 변수의 합에 대한 특성 함수가 해당 두 특성 함수의 곱과 같기 때문이다. 안정 분포에서 두 확률 변수를 더하면 와 는 같은 값을 갖지만, μ와 c는 다른 값을 가질 수 있는 결과를 얻는다.
모든 함수가 합법적인 확률 분포의 특성 함수는 아니지만(누적 분포 함수가 실수이고 감소하지 않고 0에서 1로 가는 분포), 매개변수가 범위 내에 있는 한 위에서 주어진 특성 함수는 합법적이다. 어떤 값 t에서의 특성 함수의 값은 -t에서의 값의 켤레 복소수이며, 이는 확률 분포 함수가 실수가 되도록 해야 한다.
가장 간단한 경우 일 때, 특성 함수는 단지 스트레치 지수 함수이다. 이 분포는 μ에 대해 대칭이며 (레비) 대칭 알파-안정 분포라고 불리며 종종 SαS로 축약된다.
이고 일 때, 분포는 [μ, ∞)에서 지지된다.
매개변수 c > 0은 분포의 폭을 측정하는 스케일 인자이고, 는 분포의 지수 또는 인덱스이며 분포의 점근적 거동을 지정한다.
매개변수화
안정 분포의 매개변수화는 고유하지 않다. 놀란[10]은 문헌에 나타난 11가지 매개변수화를 표로 만들고 변환 공식을 제시한다. 가장 일반적으로 사용되는 두 가지 매개변수화는 위에서 설명한 것(놀란의 "1")과 바로 아래에 설명된 것(놀란의 "0")이다.
위의 매개변수화는 이론적 작업에 사용하기 가장 쉽지만, 에서 매개변수에 대해 확률 밀도가 연속적이지 않다.[11] 수치적 작업에 더 적합한 연속적 매개변수화는 다음과 같다.[7] 여기서:
와 의 범위는 이전과 같고, γ (c와 같이)는 양수여야 하며, δ (μ와 같이)는 실수여야 한다.
어느 매개변수화에서든 확률 변수의 선형 변환을 통해 밀도가 인 확률 변수를 얻을 수 있다. 첫 번째 매개변수화에서는 새로운 변수를 다음과 같이 정의하여 수행된다.
두 번째 매개변수화의 경우 단순히 다음을 사용한다. 와 무관하게. 첫 번째 매개변수화에서 평균이 존재한다면 (즉, 일 때) μ와 같고, 두 번째 매개변수화에서 평균이 존재한다면 와 같다.
분포
따라서 안정 분포는 위의 네 가지 매개변수로 지정된다. 비퇴화 안정 분포는 매끄러운 (무한히 미분 가능한) 밀도 함수를 갖는다는 것을 보일 수 있다.[7] X의 밀도를 라고 하고 Y가 X의 독립적인 사본들의 합이라면: Y는 의 밀도를 가지며, 여기서
일 때 점근적 거동은 다음과 같이 설명된다.[7] 여기서 Γ는 감마 함수이다 (단, 이고 일 때, 꼬리는 μ의 왼쪽 또는 오른쪽으로 사라지지 않지만, 위 식은 0이다). 이 "두터운 꼬리" 거동은 모든 에 대해 안정 분포의 분산이 무한대가 되게 한다. 이 속성은 아래의 로그-로그 플롯에서 설명된다.
일 때, 분포는 가우시안이며 (아래 참조), 꼬리는 exp(−x2/4c2)/(2c√π).에 점근적이다.
Remove ads
속성
요약
관점
안정 분포는 고정된 값에 대해 합성곱에 대해 닫혀 있다. 합성곱은 푸리에 변환된 함수의 곱셈과 동일하므로, 동일한 를 가진 두 안정 특성 함수의 곱은 또 다른 그러한 특성 함수를 산출한다. 두 안정 특성 함수의 곱은 다음과 같이 주어진다.
Φ는 μ, c 또는 변수의 함수가 아니므로, 합성된 함수에 대한 이러한 매개변수는 다음과 같이 주어진다.
각 경우에 결과 매개변수가 안정 분포에 필요한 간격 내에 있음을 보일 수 있다.
Remove ads
일반화된 중심 극한 정리
일반화된 중심 극한 정리(GCLT)는 1920년부터 1937년까지 여러 수학자들(베른슈타인, 린데베르크, 레비, 펠러, 콜모고로프 등)의 노력이었다.[12] GCLT의 첫 번째 완전한 증명 (프랑스어)은 1937년 폴 레비에 의해 출판되었다.[13] GCLT의 완전한 증명의 영어 버전은 그네덴코와 콜모고로프의 1954년 저서 번역본에서 찾아볼 수 있다.[14]
GCLT의 진술은 다음과 같다.[10]
일반화된 중심 극한 정리—비퇴화 확률 변수 Z는 어떤 0 < α ≤ 2에 대해 α-안정적이다. 이 때 독립적이고 동일하게 분포된 확률 변수열 X1, X2, X3, ...와 상수 an > 0, bn ∈ ℝ이 존재하여
an (X1 + ... + Xn) − bn → Z.
여기서 →는 확률 변수 합의 수열이 분포로 수렴한다는 의미이다; 즉, 해당 분포들이 F의 모든 연속점에서 Fn(y) → F(y)를 만족한다.
다시 말해, 독립적이고 동일하게 분포된 확률 변수들의 합이 분포적으로 어떤 Z로 수렴한다면, Z는 안정 분포여야 한다.
특별한 경우
요약
관점


의 형태에 대한 일반적인 해석적 해는 존재하지 않는다. 그러나 특성 함수를 검사함으로써 초등 함수로 표현될 수 있는 세 가지 특별한 경우가 있다.[7][9][15]
- 일 때 분포는 분산 σ2 = 2c2와 평균 μ를 갖는 정규 분포로 축소되며, 왜곡 매개변수 는 영향을 미치지 않는다.
- 이고 일 때 분포는 스케일 매개변수 c와 이동 매개변수 μ를 갖는 코시 분포로 축소된다.
- 이고 일 때 분포는 스케일 매개변수 c와 이동 매개변수 μ를 갖는 레비 분포로 축소된다.
위의 세 가지 분포는 다음과 같은 방식으로 연결되어 있음을 주목하라: 표준 코시 확률 변수는 가우시안 확률 변수들의 혼합으로 볼 수 있으며 (모든 평균은 0), 분산은 표준 레비 분포에서 추출된다. 실제로 이는 더 일반적인 정리의 특별한 경우이다 (p. 59 참조[16]). 이 정리는 모든 대칭 알파-안정 분포를 이 방식으로 볼 수 있게 한다 (혼합 분포의 알파 매개변수는 혼합하는 분포의 알파 매개변수의 두 배와 같고, 혼합하는 분포의 베타 매개변수는 항상 1과 같다).
의 유리수 값에 대한 일반적인 안정 PDF의 닫힌 형식 표현은 마이어 G-함수로 사용할 수 있다.[17] 폭스 H-함수도 안정 확률 밀도 함수를 표현하는 데 사용할 수 있다. 간단한 유리수에 대해서는 닫힌 형식 표현이 종종 덜 복잡한 특수 함수로 표현된다. 특수 함수로 상당히 간단하게 표현되는 여러 닫힌 형식 표현이 있다. 아래 표에서 초등 함수로 표현 가능한 PDF는 E로 표시하고 특수 함수로 표현 가능한 PDF는 s로 표시한다.[16]
몇몇 특별한 경우는 특정 이름으로 알려져 있다.
- 이고 일 때, 이 분포는 란다우 분포 (L)이며, 물리학에서 이 이름으로 특정하게 사용된다.
- 이고 일 때 분포는 스케일 매개변수 c와 이동 매개변수 μ를 갖는 홀츠마크 분포로 축소된다.
또한, c가 0으로 접근하거나 α가 0으로 접근할 때 분포는 디랙 델타 함수 δ(x − μ)로 접근한다.
Remove ads
급수 표현
안정 분포는 더 간단한 적분의 실수 부분으로 다시 표현될 수 있다.[18]
두 번째 지수 함수를 테일러 급수로 표현하면 다음을 얻는다. 여기서 이다. 적분과 합의 순서를 바꾸고 적분을 수행하면 다음을 얻는다. 이것은 x ≠ μ일 때 유효하며 매개변수의 적절한 값에 대해 수렴한다. (x − μ에서 델타 함수를 산출하는 n = 0 항은 제거되었음에 유의하라.) 첫 번째 지수 함수를 급수로 표현하면 x − μ의 양의 거듭제곱으로 이루어진 또 다른 급수가 생성되는데, 이는 일반적으로 덜 유용하다.
단측 안정 분포의 경우 위 급수 전개는 수정되어야 하는데, 와 이기 때문이다. 합할 실수부가 없다. 대신 특성 함수의 적분은 음의 축에서 수행되어야 하며, 이는 다음을 산출한다.[19][20]
Remove ads
매개변수 추정
기존의 정규성 검정과 그에 따른 매개변수 추정 외에, McCulloch가 개발한 분위수를 이용한 일반적인 방법은 대칭 및 비대칭 안정 분포와 안정성 매개변수 모두에 적용된다.[21]
안정 변량의 시뮬레이션
역함수 나 CDF 자체에 대한 해석적 표현이 없으므로, 역변환 방법을 사용하여 안정 분포 변량을 생성할 수 없다.[11] 기각법과 같은 다른 표준 접근 방식은 지루한 계산을 필요로 할 것이다. Chambers, Mallows 및 Stuck (CMS)은[22] 특정 적분 공식이[23] 다음 알고리즘을 산출한다는 것을 알아차리고 우아하고 효율적인 해결책을 제안했다.[24]
- 에서 균일하게 분포된 확률 변수 와 평균 1인 독립 지수 확률 변수 를 생성한다;
- 일 때 다음을 계산한다:
- 일 때 다음을 계산한다: 여기서
이 알고리즘은 인 확률 변수를 생성한다. 자세한 증명은 다음을 참조하라.[25]
매개변수 , , 및 의 모든 허용 가능한 값에 대해 안정 확률 변수를 시뮬레이션하려면 다음 속성을 사용한다: 만약 이면 는 이다. (및 )일 때 CMS 방법은 가우시안 확률 변수를 생성하는 잘 알려진 박스-뮬러 변환으로 축소된다.[26] Bergström[27] 및 LePage[28] 급수 전개 적용을 포함하여 문헌에서 다른 접근 방식이 제안되었지만, CMS 방법은 가장 빠르고 정확한 것으로 간주된다.
Remove ads
응용
안정 분포는 2차 (그리고 아마 1차) 모멘트가 없는 확률 변수에 대한 중심 극한 정리의 일반화와 안정 군의 자기유사성으로 인해 이론과 실제 모두에서 중요하다. 정규성으로부터의 겉보기 이탈과 금융 데이터에 대한 자기유사성 모델 (즉, 연간 자산 가격 변화의 분포 형태가 구성 일별 또는 월별 가격 변화의 분포 형태와 유사해야 함)에 대한 요구가 브누아 망델브로가 면화 가격이 가 1.7인 알파-안정 분포를 따른다고 제안한 이유이다.[6] 레비 분포는 임계 현상 및 금융 데이터 분석에서 자주 발견된다.[9][29]
또한 분광학에서 준정적으로 압력 팽창된 스펙트럼 선에 대한 일반적인 표현으로도 발견된다.[18]
태양 플레어 대기 시간 이벤트 (플레어 이벤트 간 시간)의 레비 분포는 2001년 12월 CGRO BATSE 경X선 태양 플레어에 대해 시연되었다. 레비 통계적 특징 분석은 두 가지 다른 메모리 특징이 명백했음을 밝혀냈다; 하나는 태양 주기와 관련이 있었고, 다른 하나는 국지적 또는 국지적 태양 활동 영역 효과의 조합과 관련이 있는 것으로 보였다.[30]
Remove ads
기타 해석적 경우
해석적으로 표현 가능한 안정 분포의 여러 경우가 알려져 있다. 안정 분포를 로 표현할 때:
Remove ads
같이 보기
외부 링크
- Windows용 STABLE 프로그램은 John Nolan의 안정 웹페이지에서 구할 수 있다: http://www.robustanalysis.com/public/stable.html. 이 프로그램은 일반 안정 분포에 대한 밀도(pdf), 누적 분포 함수(cdf) 및 분위수를 계산하고, 안정 매개변수의 최대 우도 추정 및 데이터 세트 적합성을 평가하기 위한 일부 탐색적 데이터 분석 기술을 수행한다.
- C로 작성된 GNU 사이언티픽 라이브러리에는 가우시안 및 코시 분포 외에 왜곡 매개변수가 있는 레비 알파-안정 분포의 구현을 포함하는 randist 패키지가 있다.
- libstable은 안정 분포 pdf, cdf, 난수, 분위수 및 피팅 함수 (벤치마크 복제 패키지 및 R 패키지 포함)를 위한 C 구현이다.
- Diethelm Wuertz, Martin Maechler 및 Rmetrics 핵심 팀 구성원이 만든 R 패키지 'stabledist'. 안정 밀도, 확률, 분위수 및 난수를 계산한다.
- Python 구현은 SciPy 패키지의 scipy.stats.levy_stable에 있다.
- Julia는 StableDistributions.jl 패키지를 제공하며, 이는 안정 분포의 생성, 피팅, 확률 밀도, 누적 분포 함수, 특성 및 모멘트 생성 함수, 분위수 및 관련 함수, 합성곱 및 아핀 변환 방법을 포함한다. 이 패키지는 John P. Nolan에 의해 개선된 현대화된 알고리즘을 사용한다.[10]
Remove ads
각주
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
