상위 질문
타임라인
채팅
관점
양대수 그래프
위키백과, 무료 백과사전
Remove ads
과학 및 공학에서 양대수 그래프, 로그-로그 그래프(log-log graph) 또는 로그-로그 플롯(log-log plot)은 가로 및 세로 축 모두에 로그 눈금을 사용하는 2차원 수치 데이터 그래프이다. 멱함수— 형태의 관계—는 양대수 그래프에서 기울기에 해당하는 지수와 절편에 해당하는 계수를 가진 직선으로 나타난다. 따라서 이러한 그래프는 이러한 관계를 인식하고 매개변수를 추정하는 데 매우 유용하다. 로그에는 어떤 밑이든 사용할 수 있지만, 가장 일반적으로 밑 10(상용로그)이 사용된다.

각 축의 로그 눈금 표시와 로그 축(로그가 0인 곳)이 x와 y 자체의 값이 1인 곳임을 주목하라.

Remove ads
단항식과의 관계
단항 방정식 가 주어졌을 때, 방정식에 로그(임의의 밑)를 취하면 다음과 같다.
양대수 그래프를 사용하는 것에 해당하는 와 를 설정하면 다음 방정식이 나온다.
여기서 m = k는 선의 기울기(기울기)이고 b = log a는 (log y)-축의 절편이다. 이는 log x = 0인 곳을 의미하며, 로그를 역전하면 a는 x = 1에 해당하는 y 값이다.[1]
Remove ads
방정식
요약
관점
양대수 눈금에서 선의 방정식은 다음과 같다. 여기서 m은 기울기이고 b는 로그 플롯의 절편점이다.
양대수 그래프의 기울기
플롯의 기울기를 찾으려면 x-축에 두 점, 예를 들어 x1과 x2를 선택한다. 다음 방정식을 사용한다. 그리고 기울기 m은 다음 차이를 취하여 찾을 수 있다. 여기서 F1은 F(x1)의 약어이고 F2는 F(x2)의 약어이다. 오른쪽 그림은 이 공식을 보여준다. 그림의 예에서 기울기가 음수임을 주목하라. 이 공식은 로그의 다음 속성에서 볼 수 있듯이 음의 기울기를 제공한다.
양대수 그래프에서 함수 찾기
이제 위 절차를 역으로 하여 (가정된) 알려진 양대수 그래프를 사용하여 함수 F(x)의 형태를 찾는다. 함수 F를 찾기 위해, 위 그래프의 직선 위에 고정된 점 (x0, F0) (F0는 F(x0)의 약어)과 같은 그래프의 다른 임의의 점 (x1, F1)을 선택한다. 그러면 위 기울기 공식에서: 이는 다음으로 이어진다. 10log10(F1) = F1임을 주목하라. 따라서 로그를 역전하여 다음을 찾을 수 있다. 또는 이는 다음을 의미한다. 다시 말해, F는 양대수 그래프의 직선 기울기 m의 거듭제곱으로 x에 비례한다. 특히, 점 (x0, F0)과 (x1, F1)을 포함하는 양대수 그래프의 직선은 다음 함수를 가진다. 물론 역도 성립한다. 다음 형태의 모든 함수 는 양대수 그래프 표현으로 직선을 가지며, 이 선의 기울기는 m이다.
양대수 그래프의 직선 구간 아래 면적 찾기
양대수 그래프의 연속적인 직선 구간 아래 면적(또는 거의 직선인 선의 면적 추정)을 계산하려면 이전에 정의된 함수를 사용한다. 그리고 이를 적분한다. 이는 정적분(두 개의 정의된 끝점)에만 적용되므로 플롯 아래의 면적 A는 다음 형태를 취한다.
원래 방정식을 재배열하고 고정점 값을 대입하면 다음을 찾을 수 있다.
적분에 다시 대입하면 x0부터 x1까지의 A에 대해 다음을 찾을 수 있다.
따라서
m = −1일 때, 적분은 다음과 같다.
Remove ads
로그-로그 선형 회귀 모형
요약
관점
양대수 그래프는 (대략) 로그 정규 분포 또는 로그-로지스틱 오차를 가진 로그-로그 선형 회귀 모형을 시각화하는 데 자주 사용된다. 이러한 모형에서는 종속 변수와 독립 변수를 로그 변환한 후, 오차가 등분산적이 되도록 단순회귀분석 모형을 맞출 수 있다. 이 모형은 데이터가 지수적 성장 또는 감소를 보이고, 독립 변수 값이 증가함에 따라 오차가 계속 증가하는 경우(즉, 이분산적 오차)에 유용하다.
위에서 언급했듯이, 로그-로그 선형 모형에서 변수 간의 관계는 멱법칙으로 표현된다. 독립 변수의 단위 변화는 종속 변수의 일정한 백분율 변화를 초래한다. 이 모형은 다음과 같이 표현된다.
양변에 로그를 취하면 다음과 같다.
이는 와 의 로그에 대한 일차 방정식이며, 는 절편이고 는 기울기이다. 여기서 이고 이다.

그림 1은 이러한 모습이 어떤지 보여준다. 10,000개의 시뮬레이션된 점을 사용하여 생성된 두 개의 플롯을 제시한다. '로그-정규 노이즈를 포함하는 오목한 선'이라는 제목의 왼쪽 플롯은 관측된 데이터(y)를 독립 변수(x)에 대한 산점도로 표시한다. 빨간색 선은 '중앙값 선'을 나타내고, 파란색 선은 '평균 선'이다. 이 플롯은 변수 간의 멱법칙 관계를 오목한 선으로 표현한 데이터셋을 보여준다.
그림 1의 오른쪽 플롯인 '정규 노이즈를 포함하는 로그-로그 선형 선'에서 볼 수 있듯이, 두 변수가 로그 변환되면 관계는 선형이 된다. 이 플롯 또한 관측된 데이터를 독립 변수에 대한 산점도로 표시하지만, 두 축 모두 로그 눈금으로 변환된 후이다. 여기서는 평균 선과 중앙값 선이 모두 동일한 (빨간색) 선이다. 이러한 변환을 통해 단순회귀분석 모형을 맞출 수 있다 (이후 중앙값 선처럼 원래 눈금으로 다시 변환할 수 있다).

그림 1의 왼쪽 플롯에서 오른쪽 플롯으로의 변환은 또한 데이터의 노이즈 분포에 대한 로그 변환의 효과를 보여준다. 왼쪽 플롯에서 노이즈는 로그 정규 분포를 따르는 것으로 보이며, 이는 오른쪽으로 치우쳐 있어 다루기 어려울 수 있다. 오른쪽 플롯에서는 로그 변환 후 노이즈가 정규 분포를 따르는 것으로 보이며, 이는 추론하고 모델링하기 더 쉽다.
이러한 노이즈의 정규화는 그림 2에서 더 자세히 분석된다. 그림 2는 x축에서 크기가 28인 슬라이딩 윈도우에 걸쳐 계산된 세 가지 오차 측정값(평균 절대 오차 - MAE, 제곱근 평균 제곱 오차 - RMSE, 평균 절대 로그 오차 - MALE)의 선 플롯을 제시한다. y축은 오차를 나타내며, 독립 변수(x)에 대해 플롯된다. 각 오차 측정값은 다른 색상으로 표시되며, 해당 평활화된 선이 원래 선 위에 겹쳐져 있다 (이는 시뮬레이션된 데이터이므로 오차 추정치가 다소 불규칙하다). 이러한 오차 측정값은 다양한 x 값에 걸쳐 노이즈가 어떻게 변하는지 측정값을 제공한다.
로그-로그 선형 모형은 많은 현상이 멱법칙 행동을 보이는 경제학, 생물학, 물리학을 포함한 다양한 분야에서 널리 사용된다. 또한 로그 변환이 분산을 안정화하는 데 도움이 될 수 있으므로 이분산적 데이터를 다룰 때 회귀 분석에서 유용하다.
Remove ads
응용
요약
관점

이러한 그래프는 수치 데이터에서 매개변수 a와 b를 추정해야 할 때 유용하다. 이러한 사양은 경제학에서 자주 사용된다.
한 가지 예는 돈에 대한 수요가 다음 방정식으로 주어진다고 가정할 수 있는 재고 이론에 기반한 화폐 수요 함수의 추정이다. 여기서 M은 대중이 보유한 실질 돈의 양, R은 돈에 대한 대안적, 더 높은 수익을 내는 자산의 초과 수익률, Y는 대중의 실질소득, U는 로그정규 분포를 따른다고 가정하는 오차항, A는 추정될 척도 매개변수, b와 c는 추정될 탄력성 매개변수이다. 로그를 취하면 다음이 된다. 여기서 m = log M, a = log A, r = log R, y = log Y, u = log U이고 u는 정규 분포를 따른다. 이 방정식은 최소제곱법을 사용하여 추정할 수 있다.
또 다른 경제학적 예는 기업의 콥-더글러스 생산함수 추정이다. 이는 다음 방정식의 오른쪽 부분이다. 여기서 Q는 한 달 동안 생산할 수 있는 산출량, N은 한 달 동안 생산에 사용된 노동 시간, K는 한 달 동안 사용된 물리적 자본 시간, U는 로그정규 분포를 따른다고 가정하는 오차항, A, , 는 추정될 매개변수이다. 로그를 취하면 선형 회귀 방정식이 된다. 여기서 q = log Q, a = log A, n = log N, k = log K, u = log U이다.
로그-로그 회귀는 또한 자연 발생 프랙탈의 프랙탈 차원을 추정하는 데 사용될 수 있다.
그러나 로그-로그 눈금에서 데이터가 대략적인 선으로 나타나고 데이터가 멱법칙을 따른다고 결론 내리는 것은 항상 유효하지 않다.[2]
실제로 다른 많은 함수 형태가 로그-로그 눈금에서 대략 선형으로 나타나며, 로그 변환된 데이터에 대한 선형 회귀의 결정계수 (R2)를 사용하여 적합도를 단순히 평가하는 것은 선형 회귀 모형의 가우스 오차와 같은 가정이 충족되지 않을 수 있으므로 유효하지 않을 수 있다. 또한 로그-로그 형태의 적합도 테스트는 통계적 검정력이 낮을 수 있는데, 이는 이러한 테스트가 다른 실제 함수 형태가 있을 때 멱법칙을 기각할 가능성이 낮을 수 있기 때문이다. 단순 양대수 그래프가 가능한 멱법칙을 감지하는 데 유용할 수 있으며, 1890년대 빌프레도 파레토 시절로 거슬러 올라가 사용되어 왔지만, 멱법칙으로서의 유효성 검사는 더 정교한 통계가 필요하다.[2]
이러한 그래프는 제어 변수를 지수 함수에 따라 변경하여 데이터를 수집할 때도 매우 유용하다. 이 경우 제어 변수 x는 로그 눈금으로 표현하는 것이 더 자연스러워서 데이터 포인트가 낮은 쪽에서 압축되지 않고 균일하게 분포된다. 출력 변수 y는 선형으로 표현하여 반대수 그래프 (log x, y)를 생성하거나, 로그를 취하여 양대수 그래프 (log x, log y)를 생성할 수 있다.
보드 선도 (시스템의 주파수 응답 그래프) 또한 양대수 그래프이다.
화학 반응속도론에서는 반응 속도가 농도에 의존하는 일반적인 형태가 멱법칙 형태를 취하므로, 양대수 그래프는 실험에서 반응 매개변수를 추정하는 데 유용하다.
Remove ads
같이 보기
각주
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
