티스토리 뷰

www.edwith.org/linearalgebra4ai/lecture/24131/

 

[LECTURE] 정규방정식 : edwith

학습목표 이번 강의에서는 Least Squares Problem을 푸는 방법 중 하나인 정규방정식을 배워보도록 하겠습니다. 그리고 그 해를 유도하는 두 가지 방법을 살펴보는 시간을... - 커넥트재단

www.edwith.org

Another Derivation of Normal Equation

Normal Equation을 유도하는 방법으로 미분(Derivation)을 이용할 수 있습니다.

||bAx||를 최소화하는 x||bAx||2를 최소화하는 x와 같습니다.

 

잠깐 복습을 해보자면, ||y||(yTy)2 이고 ||y||2는 (yTy)입니다.

 

||bAx||2를 최소화하는 것은 (bAx)T(bAx)를 최소화하는 것과 동일합니다. (bAx)T(bAx)는 전개하면 bTbxTATbbTAx+xTATAx가 됩니다. 

 

그리고, 이를 x에 대하여 미분해보겠습니다. 우선, bTbxTATbbTAx+xTATAx를 4개의 항으로 쪼개고 각각 미분해보겠습니다.

 

1. bTb

항에 x가 없으므로 0이 됩니다.


2. xTATb

항에 x가 존재합니다. 그런데 해당 항을 벡터 x로 미분하려니 머리가 뜨거워지기 시작합니다.

 

해당 항을 미분하기 위하여 벡터를 포함하는 항을 해당 벡터로 미분하는 방법을 먼저 정리할 필요가 있습니다.

 

입력 값이 벡터 x인 함수 f(x)=aTx가 있습니다. 여기서, aT[32] 이고, x[x1x2] 라고 정의하겠습니다.

 

f(x)=3x1+2x2 입니다.

 

f(x)x1에 대해 편미분하면 3이 나옵니다. 

f(x)x2에 대해 편미분하면 2가 나옵니다. 

 

fx=[32]=a 가 됩니다.

그리고, 다시 한 번 생각해보면 f(x)=aTx=xTa입니다.

 

앞으로 인생을 살면서 f(x)=aTx=xTax로 미분한 결과는 a라고 생각하면 됩니다. 이를 본 글에서는 인생 벡터 미분 법칙이라고 부르겠습니다.

 

다시 돌아와서 xTATbx로 미분해보겠습니다. 보이시나요? xTATb를 보다보면 ATb가 수상스럽게 보입니다. 그렇습니다. f(x)=xTATb 라고 했을때, 이를 x로 미분한 결과는 인생 벡터 미분 법칙에 따라 ATb입니다.

 

3. bTAx

항에 x가 존재합니다. 그런데 해당 항을 벡터 x로 미분하려니 인생 벡터 미분 법칙을 적용할 생각에 머리가 차가워지기 시작합니다.

 

f(x)=bTAx 라고 했을때, f(x)=bTAx=xT(bTA)T=xTATb가 됩니다.

 

이를 x로 미분한 결과는 인생 벡터 미분 법칙에 따라 ATb입니다.

 

4. xTATAx

 

xTATAx를 미분하는 건 예상치 못한 시나리오입니다.

고등학교때 배운 미분 공식을 생각해봅시다.

 

y=fg 일때, y=fg+fg입니다. 이 공식을 통해 간단한 식 x2, x3을 미분해보겠습니다.

 

x2fg = xx 로 보겠습니다.

이를 위 공식을 이용하여 미분하면 1x+x1=2x가 됨을 확인할 수 있습니다.

 

x3fg = x2x 로 보겠습니다.

이를 위 공식을 이용하여 미분하면 2xx+x21가 됨을 확인할 수 있습니다.

 

이제 위 공식을 응용하여 xTATAxx로 미분해봅시다.

사실 위 공식과 100% 대응되어 미분이 되지는 않습니다. 이점에 유의해야 합니다.

 

먼저, xTATAxxTATAx의 곱이라고 나누어 생각하고ATAx 항에는 x가 있지만 이를 무시하고 a라는 벡터라고 생각해보겠습니다. 이때, xTATAx=xTax 로 미분하면 인생 벡터 미분 법칙에 의하여 a=ATAx가 나오게 됩니다. 이를 f라고 하겠습니다.

 

이번에는 위와 반대로 xTATAxxTATAx의 곱이라고 나누어 생각하고 xTATA 항에는 x가 있지만 이를 무시하고 aT라는 벡터라고 생각해보겠습니다. 이때, xTATAx=aTx=xTax 로 미분하면 인생 벡터 미분 법칙에 의하여 a=ATAx가 나오게 됩니다. 이를 g라고 하겠습니다.

 

xTATAx를 x로 미분한 결과는 f+g로 2ATAx와 같습니다. 

 

4가지 항에 대해 모두 미분해보았습니다. 이제 이를 부호에 맞게 다시 정리하면, bTbxTATbbTAx+xTATAx의 미분 결과는 ATbATb+2ATAx=2(ATb+ATAx) 가 됩니다.

 

 (bAx)T(bAx)를 최소화하는 x는  2(ATb+ATAx)=0일때의 x 와 동일합니다. (극소값일 때 최소값)

 

여기서, 양변을 2로 나누면, ATb+ATAx=0 는 ATAx=ATb가 됩니다.

 

미분을 통해 Normal Equation, ATAx=ATb를 유도해보았습니다.

 

행렬 및 벡터의 미분에 관한 공식을 공부하고 싶다면 Matrix Cookbook 책을 읽을 것을 권장드립니다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함