행렬 기초

이전 포스팅의 주제인 AdaLoRA 는 행렬에 대해 잘 알지 못하면 그 원리를 근본까지 이해하기 힘든 구성을 지니고 있다. 최종적으로 이해는 했지만 이를 정리해 두지 않으면 한달만 지나면 다 까먹을 것이기 때문에 기록해 둔다.

행렬
역행렬
전치행렬
대칭행렬
항등행렬(단위행렬)
대각행렬
직교행렬

및 행렬연산 특성에 관해서 설명한다.

$A B = [\begin{matrix} 80 \cdot 3 + 90 \cdot 3 + 60 \cdot 4 & 80 \cdot 1 + 90 \cdot 8 + 60 \cdot 8 \\ 75 \cdot 3 + 80 \cdot 3 + 90 \cdot 4 & 75 \cdot 1 + 80 \cdot 8 + 90 \cdot 8 \\ 90 \cdot 3 + 95 \cdot 3 + 65 \cdot 4 & 90 \cdot 1 + 95 \cdot 8 + 65 \cdot 8 \\ 99 \cdot 3 + 70 \cdot 3 + 70 \cdot 4 & 99 \cdot 1 + 70 \cdot 8 + 70 \cdot 8 \end{matrix}] = [\begin{matrix} 750 & 860 \\ 825 & 805 \\ 815 & 915 \\ 787 & 729 \end{matrix}]$

몇번 보다보면 계산법을 쉽게 찾을 수 있다. 앞 행렬에 해당하는 $A$ 의 행과, 뒷 행렬에 해당하는 $B$ 의 열과 곱하면 된다. 이 때 행, 열의 요소가 여러개일 때에는 각 곱 계산을 더한다.

참고로 행렬곱에서 교환법칙은 대부분 성립하지 않는다. (특수한 경우 성립하나, 일반적으로 성립 X)

$A B \neq B A$

2. 역행렬(inverse matrix)

역행렬(inverse matrix) 는 행렬 $A$ 가 있다고 할 때 $A^{- 1}$ 로 표기되며, 아래가 성립된다.

$A^{- 1} A = A A^{- 1} = I$

여기서 $I$ 는 '단위 행렬(unit matrix)' 혹은 '항등 행렬(identity matrix)' 이라고 불리며, 아래에서 설명하겠다.

역행렬은 항등행렬을 구하기 위해 사용된다.

3. 전치행렬(transposed matrix)

행렬 $A$ 의 전치행렬을 표기할 때 $A^{T}$ 혹은 $A^{⊤}$ 으로 표기된다.(나는 $A^{⊤}$ 표기를 선호한다.)
전치행렬은 행렬내의 원소를 대각선축을 기준으로 서로 위치를 바꾼것을 의미한다.

즉, $A$ 가 $m \times n$ 이라면 $A^{⊤}$ 은 $n \times m$ 이다.

전치행렬은 아래 특성이 성립된다.

$A^{⊤ ⊤} = A$

4. 대칭행렬(symmetric matrix)

행렬 $A$ 가 아래 조건을 만족한다면 대칭행렬 이라고 지칭한다.

$A = A^{T}$

따라서 $A_{i j} = A_{j i}$ 역시 성립한다.

또한 아래의 성질도 보유하고 있다. ( $n$ 차 정사각행렬 이라면)

$대칭행렬 = A A^{⊤} = A^{⊤} A$

예로, 아래는 대칭행렬이다.

$[\begin{matrix} 1 & 2 & 4 \\ 2 & 3 & 5 \\ 4 & 5 & 6 \end{matrix}]$

1, 3, 6 이 위치한 대각선축을 따라 전치해도 같은 행렬이 된다는 것을 알 수 있다.

5. 항등행렬(unit matrix)

항등행렬(단위행렬) 은 주대각선의 원소가 모두 1이며, 나머지 원소는 모두 0인 정사각 행렬을 의미한다.

$[\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix}]$

6. 대각행렬(main diagonal)

주대각선에 위치한 행렬을 제외한 모든 성분이 0인 정사각 행렬을 말한다.

$[\begin{matrix} 1 & 0 & 0 \\ 0 & 8 & 0 \\ 0 & 0 & 3 \end{matrix}]$

7. 직교행렬(orthogonal matrix)

직교행렬은 아래와 같은 특성을 지닌다.

$A^{⊤} = A^{- 1}$
$A^{⊤} A = A A^{⊤} = I$

위에서 역행렬과 원본행렬을 곱하면 항등행렬이 된다고 언급했었다. 하지만 직교행렬의 경우 역행렬과 전치행렬이 개념상 같으므로, 전치행렬과 행렬원본을 곱해도 항등행렬이 도출된다. 즉 아래와 같다.

$A^{⊤} A = A^{- 1} A$

아래의 예제를 살펴보자.

$A = [\begin{matrix} \cos (x) & \sin (x) \\ - \sin (x) & \cos (x) \end{matrix}]$

$A^{⊤} = [\begin{matrix} \cos (x) & - \sin (x) \\ \sin (x) & \cos (x) \end{matrix}]$

$A A^{⊤} = [\begin{matrix} \cos^{2} (x) + \sin^{2} (x) & - \cos (x) \sin (x) + \sin (x) \cos (x) \\ - \sin (x) \cos (x) + \cos (x) \sin (x) & \sin^{2} (x) + \cos^{2} (x) \end{matrix}] = [\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}] = I$

파이썬 예제 코드를 통해 위 예제의 출력값을 확인해 보자.

import numpy as np
import math

x = 3.141592

A = np.array([[math.cos(x),      math.sin(x)],
			  [math.sin(x) * -1, math.cos(x)]])

At = np.array([[math.cos(x),    math.sin(x) * -1],
              [math.sin(x),    math.cos(x)]])

print(np.dot(A, At))

$A A^{⊤} = [\begin{matrix} 1.00000000 e + 00 & - 4.32611126 e - 23 \\ - 4.32611126 e - 23 & 1.00000000 e + 00 \end{matrix}]$

프로그래밍 언어 특성상 부동소수점 오차 문제로 완벽히 0이 도출되진 않으나, 항등행렬을 띔을 알 수 있다.

저작자표시 비영리 변경금지

'Artificial Intelligence > Basic' 카테고리의 다른 글

Transformer 의 CrossAttention 차이점 (0)	2024.04.23
모델 훈련시 Epoch 와 Steps 의 차이 (0)	2024.03.05
batch_size 란? (0)	2024.03.05
인공지능에서 Parameter 란? (0)	2024.01.27
GAN의 최적 손실값 (1)	2023.06.19

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

행렬 기초

1. 행렬(matrix)

1-1. 행렬의 덧셈, 뺄셈

1-2. 행렬의 곱셈

2. 역행렬(inverse matrix)

3. 전치행렬(transposed matrix)

4. 대칭행렬(symmetric matrix)

5. 항등행렬(unit matrix)

6. 대각행렬(main diagonal)

7. 직교행렬(orthogonal matrix)

'Artificial Intelligence > Basic' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역