인공지능을 위한 선형대수 - CHAPTER 3.2 Least Squares와 그 기하학적 의미

티스토리 뷰

Math/Linear Algebra

인공지능을 위한 선형대수 - CHAPTER 3.2 Least Squares와 그 기하학적 의미

developer0hye 2020. 11. 5. 19:24

https://www.boostcourse.org/ai251/lecture/540328?isDesc=false

인공지능을 위한 선형대수

부스트코스 무료 강의

www.boostcourse.org

Geometric Interpretation of Least Squares

Least Squares는 $| | b - \hat{b} | |$ 를 최소화 할 수 있는 $\hat{x}$ 을 구하는 방법입니다. 여기서, $b$ 는 우리가 피팅하고자 하는 Ground Truth 벡터이고 $\hat{b}$ 는 우리의 모델 $A \hat{x}$ 로부터 예측되는 벡터입니다. $\hat{b}$ 는 죽었다 깨어나도 Col(A) 를 벗어날 수 없습니다. 위 그림을 바탕으로 $\hat{b}$ 를 Col A 상에서 요리 조리 움직여 봤을때, $| | b - \hat{b} | |$ 는 $b - \hat{b}$ 가 Col(A)에 수직할때 최솟값을 가진다는 것을 파악할 수 있습니다.

$b - \hat{b}$ 가 Col(A)에 수직하면, $b - \hat{b}$ 와 Col(A) 의 모든 벡터의 내적은 그 값이 0이 나와야 합니다. $A x$ 에서 어떤 $x$ 가 오든지간에 $A x$ 와 $| | b - \hat{b} | |$ 의 내적이 0 이라는 의미입니다.

Column의 사이즈가 n 인 행렬 $A$ 의 Column vectors 를 $a_{1}$ , $a_{2}$ , ... , $a_{n}$ 라고 하고, Column Vector $x$ 의 원소를 $x_{1}$ , $x_{2}$ , ... , $x_{n}$ 라고 정의하겠습니다.

그러면, $b - \hat{b}$ 와 Col(A)이 수직할때의 내적 값을 아래와 같이 표현할 수 있습니다.

$(b - \hat{b}) ⊥ A x \Rightarrow (b - \hat{b}) \cdot A x = 0$

여기서 $A x$ 를 $a_{1} x_{1} + a_{2} x_{2} + \dots + a_{n} x_{n}$ 으로 전개할 수 있습니다.

$(b - \hat{b}) \cdot (a_{1} x_{1} + a_{2} x_{2} + \dots + a_{n} x_{n}) = 0$

$(b - \hat{b}) \cdot a_{1} x_{1} = 0$

$(b - \hat{b}) \cdot a_{2} x_{2} = 0$

...

$(b - \hat{b}) \cdot a_{n} x_{n} = 0$

위식에서 $x_{1}$ , $x_{2}$ , ... , $x_{n}$ 가 어떤 값이든 $(b - \hat{b}) \cdot a_{k} x_{k} = 0$ 가 0이 돼야하므로 $x_{1}$ , $x_{2}$ , ... , $x_{n}$ 들은 식에서 소거해줍시다.

$(b - \hat{b}) \cdot a_{1} = 0$

$(b - \hat{b}) \cdot a_{2} = 0$

...

$(b - \hat{b}) \cdot a_{n} = 0$

여기서, 내적 연산(inner product 혹은 dot product)을 풀어쓰면

$a_{1}^{T} (b - \hat{b}) = 0$

$a_{2}^{T} (b - \hat{b}) = 0$

...

$a_{n}^{T} (b - \hat{b}) = 0$

가 됩니다. 그리고! $\hat{b}$ 을 $A \hat{x}$ 로 풀어쓰면~

$a_{1}^{T} (b - A \hat{x}) = 0$

$a_{2}^{T} (b - A \hat{x}) = 0$

$⋮$

$a_{n}^{T} (b - A \hat{x}) = 0$

라는 식들을 구해낼 수 있습니다.

그리고 위식은 아래와 같이 행렬과 벡터간의 곱으로 나타낼 수 있습니다.

$A^{T} (b - A \hat{x}) = 0$

여기서 0은 스칼라 0이 아닌 벡터입니다!

Normal Equation

$A^{T} (b - A \hat{x}) = 0$ 를 전개하면 다음의 수식이 성립합니다.

$A^{T} A \hat{x} = A^{T} b$

위 수식은 Normal Equation이라고 불립니다.

그리고, 위 수식은 새로운 Linear System으로 해석가능합니다. $C x = d$ , 여기서 $C$ 는 $A^{T} A$ 이고 $d$ 는 $A^{T} b$ 입니다.

만약 $C = A^{T} A$ 가 Invertible 하다면, Solution은 다음과 같이 계산될 수 있습니다.

$\hat{x} = (A^{T} A)^{- 1} A^{T} b$

$\hat{x}$ 이 Least Squares를 통해 구해지는 Solution입니다.

정리하면 Least Squares 방법은 $A x ≃ b$ 인 Linear System에 대하여 Solution $\hat{x}$ 를 구함에 있어, $b - A \hat{x}$ 가 Col( $A$ )에 수직이되는 Solution을 찾는 방법입니다.

'Math > Linear Algebra' 카테고리의 다른 글

인공지능을 위한 선형대수 - CHAPTER 3.4 Orthogonal Projection 1 (0)	2020.12.08
인공지능을 위한 선형대수 - CHAPTER 3.3 정규방정식 (0)	2020.11.14
인공지능을 위한 선형대수 - CHAPTER 3.1 Least Squares Problem 소개 (0)	2020.10.24
인공지능을 위한 선형대수 - CHAPTER 2.7 전사함수와 일대일 함수 (0)	2020.10.24
인공지능을 위한 선형대수 - CHAPTER 2.6 선형변환 with Neural Networks (0)	2020.10.22

지속 가능한 꾸준함 developer0hye 님의 블로그입니다.

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지속 가능한 꾸준함

티스토리 뷰