1. 정규직교집합, 정규직교기저
■ 어떤 공간의 부분집합을 \( S \)라고 하자. \( S \)가 영벡터가 아닌 벡터들로 이루어져 있고, 임의의 두 벡터 \( v, w \in S \)에 대해 \( v \neq w \)이면서 \( < v, w > = 0 \)이면 집합 \( S \) 내의 모든 벡터 쌍이 직교(orthogonal)한다는 것이다.
■ 이러한 조건을 만족하는 집합 \( S \)를 '직교집합'이라고 부른다.
■ 그리고 직교집합 \( S \)에 속하는 각 벡터의 크기가 1이면, \( S \)를 '정규직교집합'이라고 한다.
■ 즉, \( S = \left\{ v_1, v_2, \cdots, v_n \right\} \)이 정규직교집합이라면 \( v_i \)와 \( v_j \)의 내적이 (\( < v_i, v_j > = a_{ij} \)라고 했을 때, \( i = j \)이면 \( a_{ij} = 1 \)이고 \( i \neq j \)이면 \( a_{ij} = 0 \)이 성립한다.
- 정규직교에서 '정규'는 '크기가 1이다'. 즉, 자기 자신과의 내적값이 1이라는 의미이다.
- '직교'는 '수직 관계성을 갖고 있다'는 의미이다. 이는 서로 다른 원소와의 내적값이 0이라는 의미이다.
- 그러므로 정규직교집합에 속한 원소들은 자기 자신과의 내적값이 1이고, 서로 다른 원소와의 내적값은 0을 만족한다.
■ 정규직교집합 \( S \)가 어떤 부분 공간의 기저가 되면, 그 기저를 '정규직교기저'라고 한다.
■ '기저'란 공간을 생성하며 선형 독립인 집합을 의미한다. 이때 벡터 공간의 기저는 유일하지 않다. 다만, 각 공간의 일반적인 기저를 표준 기저 또는 표준 단위벡터라고 한다.
- 각 공간마다 다음과 같은 표준 기저들이 있다.
■ 표준 기저를 보면, 서로 '독립'이고, 자기 자신과의 내적값은 1이며 서로 다른 표준 기저와의 내적값은 0이 되는 것을 알 수 잇다. 그러므로 '표준 기저들로 이루어진 집합은 정규직교집합이 된다. 즉, 표준 기저를 정규직교기저로 볼 수 있다.
1.1 정규집합은 일차독립
■ 직교집합 \( S = \left\{ v_1, v_2, \cdots, v_n \right\} \)에 대해 다음이 성립한다.
- ① \( S \)는 일차독립이다.
- \( c_i \in \mathbb{R} \), \( i = 1, 2, \cdots, k \)가 존재할 때,
- \( c_1 v_1 + c_2 v_2 + \cdots + c_k v_k = 0 \)이라고 하자. 이 등식에서 양변에 \( v_i \), \( i = 1, 2, \cdots, k \)를 내적하면, 직교집합의 벡터들이므로
- \( i \neq j \)일 때, \( < v_i, v_j > = 0 \)이고 \( < 0, v_j > = 0 \)이므로 \( c_i < v_i, v_i > = c_i || v_i ||^2 = 0 \)이 성립한다.
- 이때 직교집합의 원소에는 영벡터가 존재하지 않으므로 \( v \neq 0 \), 모든 \( i = 1, 2, \cdots, k \)에 대해 \( c_i = 0 \)이 되어야 한다. 그러므로 \( S \)는 선형 독립이다.
- ② 임의의 벡터 \( v \in \text{span}(S) \)에 대해 \[
\mathbf{v} =
\dfrac{\langle \mathbf{v}, \mathbf{v}_1 \rangle}{\|\mathbf{v}_1\|^2} \mathbf{v}_1 +
\dfrac{\langle \mathbf{v}, \mathbf{v}_2 \rangle}{\|\mathbf{v}_2\|^2} \mathbf{v}_2 +
\cdots +
\dfrac{\langle \mathbf{v}, \mathbf{v}_k \rangle}{\|\mathbf{v}_k\|^2} \mathbf{v}_k
\]
- 이때 \( S \)가 정규직교집합이면 위의 식을 다음과 같이 나타낼 수 있다. \[
\mathbf{v} =
\langle \mathbf{v}, \mathbf{v}_1 \rangle \mathbf{v}_1 +
\langle \mathbf{v}, \mathbf{v}_2 \rangle \mathbf{v}_2 +
\cdots +
\langle \mathbf{v}, \mathbf{v}_k \rangle \mathbf{v}_k
\iff
[\mathbf{v}]_S =
\left(
\langle \mathbf{v}, \mathbf{v}_1 \rangle,
\langle \mathbf{v}, \mathbf{v}_2 \rangle,
\ldots,
\langle \mathbf{v}, \mathbf{v}_k \rangle
\right)^T
\]
- \( v \in \text{span} (S) \)에 대해 \( v = c_1 v_1 + c_2 v_2 + \cdots + c_k v_k \)를 만족하는 \( c_i \)가 존재한다. \( i = 1, 2, \cdots , k \)
- \( v \in \text{span} (S) \)에 대해 ( \( v \in \text{span} \left\{ v_1, v_2, \cdots, v_k \right\} \) ), \( v = c_1 v_1 + c_2 v_2 + \cdots + c_k v_k \)를 만족하는 \( c_i \in \mathbb{R} \), \( (i = 1, 2, \cdots, k) \)가 존재하며, \( S = \left\{ v_1, v_2, \cdots, v_k \right\} \)는 직교 벡터이므로
- \( < v, v_i > = c_i < v_i, v_i > \)이므로 \( c_i = \dfrac{< v, v_i>}{< v_i, v_i > } = \dfrac{< v, v_i >}{ || v_i ||^2 } \), \( (i = 1, 2, \cdots, k) \)가 된다.
- 그러므로 \( \mathbf{v} = c_1 \mathbf{v}_1 + c_2 \mathbf{v}_2 + \cdots + c_k \mathbf{v}_k
= \displaystyle\sum_{i=1}^k c_i \mathbf{v}_i
= \displaystyle\sum_{i=1}^k \dfrac{\langle \mathbf{v}, \mathbf{v}_i \rangle}{\|\mathbf{v}_i\|^2} \mathbf{v}_i
= \dfrac{\langle \mathbf{v}, \mathbf{v}_1 \rangle}{\|\mathbf{v}_1\|^2} \mathbf{v}_1
+ \dfrac{\langle \mathbf{v}, \mathbf{v}_2 \rangle}{\|\mathbf{v}_2\|^2} \mathbf{v}_2 + \cdots
+ \dfrac{\langle \mathbf{v}, \mathbf{v}_k \rangle}{\|\mathbf{v}_k\|^2} \mathbf{v}_k \)가 성립하는 것이다.
- 만약, \( S \)의 원소가 정규직교벡터이면 \( < v_i, v_i > = || v_i ||^2 = 1 \)이므로 \( v = < v, v_1 >v_1 + < v, v_2 >v_2 + \cdots + < v, v_k >v_k \)가 된다.
- 여기서 \( S = \left\{ v_1, v_2, \cdots, v_n \right\} \)가 정규직교벡터이므로 \( \left\{ v_1, v_2, \cdots, v_k \right\} \)는 선형 독립이며, 길이가 1이면서 서로 직각을 이루는 벡터들이다.
- 이들의 선형 결합으로 \( \mathbb{R}^k \)와 같은 \( k \)차원을 생성할 수 있다. 즉, 여기서 \( S \)의 원소들은 \( \mathbb{R}^k \)의 정규직교기저가 될 수 있다.
- 기저가 있으면, 이를 좌표로 나타낼 수 있다.
- \( S \)가 정규직교집합이라 \( v = < v, v_1 >v_1 + < v, v_2 >v_2 + \cdots + < v, v_k >v_k \)인 상황에서 \( < v, v_1 >, < v, v_2 >, \cdots, < v, v_k > \)같은 내적의 결과는 결국 스칼라이다.
- 따라서 \( v = < v, v_1 >v_1 + < v, v_2 >v_2 + \cdots + < v, v_k >v_k \)를 좌표 벡터 \( [v]_s = (< v, v_1 >, < v, v_2 >, \cdots, < v, v_k >)^T \)로 나타낼 수 있는 것이다.
■ 기저가 있으면, 이를 좌표로 나타낼 수 있다.
https://hyeon-jae.tistory.com/173
[개념] 벡터 공간
1. 벡터 공간(vector space)1.1 공간 (space)■ 집합 \( V \)의 임의의 원소 \( u, v \)와 임의의 스칼라 \( k \)에 대해, \( k \in \mathbb{R} \) 다음을 만족할 때, 집합(set) \( V \)를 공간(sapce) \( V \)라 한다. \( ① u
hyeon-jae.tistory.com
2. Gram-Schmidt 직교화
■ 벡터 공간 \( V \)의 기저 \( \left\{ v_1, v_2, \cdots, v_k \right\} \)가 서로 수직 관계를 가지고 있지 않아서, 이를 수직 관계를 갖는 다른 기저 \( \left\{ w_1, w_2, \cdots, w_k \right\} \)로 바꾸는 과정을 Gram-Schmidt 과정이라고 한다.
■ 즉, Gram-Schmidt 과정은 기저(선형 독립인 벡터)를 직교 기저 \( \left\{ w_1, w_2, \cdots, w_k \right\} \)로 바꾸는 방법이며, \( \left\{ w_1, w_2, \cdots, w_k \right\} \)를 정규직교기저로 바꾸고 싶다면 자기 자신의 크기로 나누면 된다.
■ 그람-슈미트 직교화의 아이디어는 정사영을 통해 직교 기저를 만드는 것이다.
- 예를 들어, \( \mathbb{R}^3 \)에서 기저 \( \left\{ v_1, v_2 \right\} \)가 \( \text{span} \left\{ v_1, v_2 \right\} = W \)라고 할 때,
- 여기에 \( w_3 \)를 추가된다면, \( w_3 \)는 \( w_1, w_2 \)에 직교해야 한다.
- 그러므로, 다음 그림과 같이 \( v_1, v_2 \)가 만드는 2차원 평면을 \( S \)라고 할 때, \( (S = \text{span} \left\{ v_1, v_2 \right\}) \), \( v_3 \)를 2차원 평면 \( S \)에 정사영한 것으로 볼 수 있다. 즉, \( v_3 \)을 \( w_1 \)과 \( w_2 \)에 정사영한 것들을 \( v_3 \)에서 빼줘야 한다.
■ 위와 같은 방법으로 진행했을 때, 기저를 직교 기저 \( \left\{ w_1, w_2, \cdots, w_k \right\} \)로 바꾸는 Gram-Schmidt 과정은 다음과 같다. \[ \begin{aligned}
w_1 &= v_1 \\
w_2 &= v_2 - \dfrac{v_2 \cdot w_1}{w_1 \cdot w_1} w_1 = v_2 - \text{proj}_{w_1} v_2 \\
w_3 &= v_3 - \dfrac{v_3 \cdot w_1}{w_1 \cdot w_1} w_1 - \dfrac{v_3 \cdot w_2}{w_2 \cdot w_2} w_2 = v_3 - \text{proj}_{w_1} v_3 - \text{proj}_{w_2} v_3 \\
&\vdots \\
w_k &= v_k - \dfrac{v_k \cdot w_1}{w_1 \cdot w_1} w_1 - \dfrac{v_k \cdot w_2}{w_2 \cdot w_2} w_2 - \cdots - \dfrac{v_k \cdot w_{k-1}}{w_{k-1} \cdot w_{k-1}} w_{k-1} = v_k - \sum_{i=1}^{k-1} \text{proj}_{w_i} v_k \end{aligned} \] ■ 직교 기저 \( \left\{ w_1, w_2, \cdots, w_k \right\} \)를 정규직교기저로 바꾸려면 다음과 같이 자기 자신의 크기로 나누면 된다.
\( \left\{ \dfrac{w_1}{\| w_1 \|}, \dfrac{w_2}{\| w_2 \|}, \cdots, \dfrac{w_k}{\| w_k \|} \right\} \)
■ 그람-슈미트 직교화에서 중요한 것은 위의 수식을 보면, 새로운 직교 기저는 원래 기저의 선형 결합으로 구성되는 것을 볼 수 있다.
- 내적값은 스칼라이므로, 예를 들어 \( w_1 = 1 \cdot v_1 \), \( w_2 = v_2 - c \cdot v_1, \cdots \)
■ 즉, '새로운 직교 기저는 원래 기저의 선형 결합으로 구성된다.'를 통해 원래 기저와 새로운 직교 기저가 만드는 공간이 동일하다는 것을 알 수 있다.
\( \text{span} \left\{ v_1 \right\} = \text{span} \left\{ w_1 \right\} \), \( \text{span} \left\{ v_1, v_2 \right\} = \text{span} \left\{ w_1, w_2 \right\} \), \( \cdots \), \( \text{span} \left\{ v_1, v_2, \cdots, v_k \right\} = \text{span} \left\{ w_1, w_2, \cdots, w_K \right\} \)
- 원래 기저는 어떤 공간 안에 있는 벡터일 것이고, 그람-슈미트 직교화를 통해 만들어진 직교 기저는 이 벡터에 단순히, 스칼라를 곱해서 더하고 뺀 것이므로 결국 같은 공간에 있다.
■ 이렇게 그람-슈미트 과정으로 얻어진 정규직교집합은 단순히 정규직교집합이 아니라
\( \text{span} \left\{ v_1 \right\} = \text{span} \left\{ w_1 \right\} \), \( \text{span} \left\{ v_1, v_2 \right\} = \text{span} \left\{ w_1, w_2 \right\} \), \( \cdots \), \( \text{span} \left\{ v_1, v_2, \cdots, v_k \right\} = \text{span} \left\{ w_1, w_2, \cdots, w_K \right\} \)를 만족해야 한다는 것이다.
- 예를 들어, 표준 기저는 정규직교기저이지만, 일반 기저에 그람-슈미트 직교화 과정을 통해 얻어진 정규직교기저와는 다르다.
3. 행렬의 QR 분해
■ 행렬의 QR 분해는 그람-슈미트 직교화를 통해 얻은 정규직교기저 벡터를 이용하여 행렬을 분해하는 것이다.
■ \( m \times n \) 행렬 \( A \)의 계수가 \( n \)이라면 ( 행렬 \( A \)가 열충족계수를 가진다면), 행렬 \( A \)의 열벡터는 선형 독립인 벡터이다. \( A \)의 열벡터가 열공간을 생성할 수 있다.
■ \( A \)의 열벡터를 \( A_{1}^C, A_{3}^C, \cdots, A_{n}^C \)이라 했을 때, 행렬 \( A \)가 열충족계수를 가지며, 열벡터들이 독립 관계를 가지므로 \( A_{1}^C, A_{3}^C, \cdots, A_{n}^C \)는 열공간의 기저라고 할 수 있다.
■ 이 열벡터들에 그람-슈미트 직교화를 적용해 얻은 직교기저를 정규직교기저로 만들었을 때, 이를 \( Q_1, Q_2, \cdots, Q_n \)이라고 하자.
■ 정규직교집합을 \( \beta = \left\{ Q_1, Q_2, \cdots, Q_n \right\} \)이라고 했을 때, 원래 기저와 원래 기저에 그람-슈미트 직교화를 적용한 기저는 같은 공간을 생성한다.
■ 그러므로 \( \beta \)의 원소(벡터)와 \( A \)의 열벡터는 같은 공간(여기서는 열공간)을 생성한다. 즉, \( B \)의 원소들은 행렬 \( A \)의 열공간의 정규직교기저로 볼 수 있다.
■ 열공간의 기저는 열공간의 정규직교기저의 선형 결합으로 표현할 수 있다.
■ 정규직교집합 \( \beta \)에 대해 임의의 벡터 \( \mathbf{v} \in \text{span}(B) \)는 \( \mathbf{v} = \langle \mathbf{v}, Q_1 \rangle Q_1 + \langle \mathbf{v}, Q_2 \rangle Q_2 + \cdots + \langle \mathbf{v}, Q_k \rangle Q_k \)가 성립한다.
■ 지금 상황에서는 \( A_i^{C} \in \text{span} (B) \)이므로 다음이 성립한다.
\( \begin{align*}
A_1^c &= \langle A_1^c, Q_1 \rangle Q_1 + \langle A_1^c, Q_2 \rangle Q_2 + \cdots + \langle A_1^c, Q_n \rangle Q_n \\
A_2^c &= \langle A_2^c, Q_1 \rangle Q_1 + \langle A_2^c, Q_2 \rangle Q_2 + \cdots + \langle A_2^c, Q_n \rangle Q_n \\
&\vdots \\
A_n^c &= \langle A_n^c, Q_1 \rangle Q_1 + \langle A_n^c, Q_2 \rangle Q_2 + \cdots + \langle A_n^c, Q_n \rangle Q_n
\end{align*} \)
■ 이때 \(A = ( A_{1}^C \mid A_{2}^C \mid \cdots \mid A_{n}^C ) \)이므로 \( A \)는 다음과 같이 나타낼 수 있다.
\( A = \begin{pmatrix} A_1^C | A_2^C | \cdots | A_n^C \end{pmatrix}
= \begin{pmatrix} Q_1 | Q_2 | \cdots | Q_n \end{pmatrix}
\begin{pmatrix}
\langle A_1^C, Q_1 \rangle & \langle A_2^C, Q_1 \rangle & \cdots & \langle A_n^C, Q_1 \rangle \\
\langle A_1^C, Q_2 \rangle & \langle A_2^C, Q_2 \rangle & \cdots & \langle A_n^C, Q_2 \rangle \\
\vdots & \vdots & \ddots & \vdots \\
\langle A_1^C, Q_n \rangle & \langle A_2^C, Q_n \rangle & \cdots & \langle A_n^C, Q_n \rangle
\end{pmatrix} \)
■ 여기서 \( < A_{1}^C, Q_2 > \)를 생각해보면, \( Q_2 \)는 다음과 같이 \( A_{1}^C \) 혹은 \( Q_1 \)과 직교인 상태이다.
그러므로 \( < A_{1}^C, Q_2 > \). 즉 \( A_{1}^C \)와 \( Q_2 \)의 내적 값은 0이 된다.
- 마찬가지 이유로 \( < A_{1}^C, Q_3 > \)에서도 \( A_{1}^C \)와 \( Q_3 \)가 수직 관계이므로 \( < A_{1}^C, Q_3 > = 0 \)
- \( < A_{2}^C, Q_3 > \)도 0이 된다.
- 정확하게는 \( W_1 = A_{1}^C, \quad
W_2 = A_{2}^C - \text{proj}_{W_1} A_{2}^C, \quad
W_3 = A_{3}^C - \text{proj}_{W_1} A_{3}^C - \text{proj}_{W_2} A_{3}^C \)이며,
- \( W_1, W_2 \)로 생성되는 부분 공간과 \( A_{1}^C, A_{2}^C \)로 생성되는 부분 공간은 동일하다. 왜냐하면, \( \text{span} \left\{ W_1, W_2 \right\} = \text{span} \left\{ A_{1}^C, A_{2}^C \right\} \)가 성립하기 때문이다.
- \( W_3 \)은 이미 만들어진 \( W_1, W_2 \) 두 벡터와 수직이 되도록 정의된다. \( < W_3, W_1 > = 0, \quad < W_3, W_2 > = 0 \)
- 즉, \( W_3 \)은 \( W_1 \)과 \( W_2 \)가 만드는 어떤 평면과 수직 관계를 갖는데, \( \text{span} \left\{ W_1, W_2 \right\} = \text{span} \left\{ A_{1}^C, A_{2}^C \right\} \)이므로
- \( W_3 \)은 \( A_{1}^C \)과 \( A_{2}^C \)가 만드는 어떤 평면과 수직 관계를 갖는다고 할 수 있다.
- 사실, 이 내용은 그람-슈미트 직교화 과정에서 projection 벡터를 빼기 때문에 성립한다.
- 위의 그림을 보면, 서로 직교하지 않는 \( A_{1}^C \)와 \( A_{2}^C \)가 직교하도록, \( A_{2}^C \)의 수평 성분을 \( A_{2}^C \)에서 빼서 \( A_{1}^C \)과 수평 성분을 뺀 \( A_{2}^C \)가 직교하도록 만든다.
- \( A_{2}^C \)의 수평 성분은 \( A_{2}^C \)가 \( W_1(= A_{1}^C) \)방향으로 갖고 있는 성분이며, 이것은 \( \text{proj}_{W_1} A_{2}^C \)이다.
- 즉, \( A_{2}^C - \text{proj}_{W_1} A_{2}^C \)를 통해 \( W_1(= A_{1}^C) \)과 평행한 (일부) 부분을 모두 제거하는 것이다.
- 다시 말해, \( A_{1}^C \)와 \( A_{2}^C \)가 만들어 내는 각도(= 내적)를 0으로 만들기 위해 \( A_{1}^C \)와 \( A_{2}^C \)가 평행하게 겹치는 부분만 빼줘서, 그 결과로 직교 성분만 남게 된다. 이 예에서는 그 직교 성분이 \( W_2 \)이다.
- 따라서 \( A_i^C \cdot Q_j \quad (i < j) \)에 대해 \( \langle A_i^C, Q_j \rangle = 0 \)이 성립한다.
■ \( \langle A_i^C, Q_j \rangle = 0, \quad (i < j) \)가 성립하므로, 위의 행렬 문제는 다음과 같이 나타낼 수 있다.
\( A = \begin{pmatrix} A_1^C \mid A_2^C \mid \cdots \mid A_n^C \end{pmatrix}
= \begin{pmatrix} Q_1 \mid Q_2 \mid \cdots \mid Q_n \end{pmatrix}
\begin{pmatrix}
\langle A_1^C, Q_1 \rangle & \langle A_2^C, Q_1 \rangle & \cdots & \langle A_n^C, Q_1 \rangle \\
0 & \langle A_2^C, Q_2 \rangle & \cdots & \langle A_n^C, Q_2 \rangle \\
\vdots & 0 & \ddots & \vdots \\
0 & 0 & \cdots & \langle A_n^C, Q_n \rangle
\end{pmatrix} \)
■ 이때, \( \langle A_i^C, Q_j \rangle > 0 \), \( (i = 1, 2, \cdots, n) \)이므로 모든 대각 원소 \( \langle A_1^C, Q_1 \rangle, \langle A_2^C, Q_2 \rangle, \dots, \langle A_n^C, Q_n \rangle \)은 양의 실수가 된다.
- 일반적으로 그람-슈미트 직교화 과정을 통해 \( A = QR \) 분해를 수행하면, \( R \)의 대각 원소는 해당 단계에서의 벡터 노름(길이)에 해당한다.
- 이때, 열벡터가 선형 독립이므로 벡터의 원소가 모두 0으로 구성된 열벡터는 존재하지 않는다. 그러므로 그 노름(길이)은 반드시 0보다 크다.
■ 이렇게 행렬 \( A \)를 열벡터 \( Q_i \)가 정규직교집합이 되는 행렬과 대각 성분이 모두 양의 실수인 상삼각행렬의 곱으로 분해하는 것을 행렬 \( A \)의 QR 분해라고 한다.
■ 여기서 행렬 \( Q \)는 정규직교기저로 구성되어 있기 때문에 직교행렬이 된다.
■ 그러므로 \( A \)가 정방행렬 \( n \times n \)이라면, \( Q^TQ = QQ^T = I \)를 만족하며, 직교행렬은 항상 가역행렬이므로 \( Q^{-1} = Q^T \)가 성립한다.
■ QR의 \( R \)행렬도 항상 가역이다. 삼각행렬이므로 행렬식 값 = \( R \)의 모든 대각 원소의 곱 \( \neq 0 \)이기 때문이다.
3.1 QR 분해의 응용
■ \( A \mathbf{x} = b \)에서 \( A \)가 가역이면, 해집합 \( \mathbf{x} = A^{-1}b \)으로 계산한다.
■ 여인자를 계산하는 수반 행렬 방법이나 가우스-조던 소거법을 이용해 \( 10000 \times 10000 \) 행렬의 역행렬을 구한다고 생각해 보자.
■ 역행렬 계산은 차원이 커질수록 시간 복잡도가 증가하고, 연산의 횟수가 증가하여 발생하는 작은 오차들이 누적되므로 계산의 (수치적) 안정성이 떨어진다.
■ QR 분해를 이용하면 역행렬을 계산하지 않거나, 간단한 역행렬 계산을 통해 \( \mathbf{x} \)를 구할 수 있다.
■ \( A = QR \)이라면 \( A \mathbf{x} = b \Rightarrow QR \mathbf{x} = b \Rightarrow R \mathbf{x} = Q^{-1}b \Leftrightarrow R \mathbf{x} = Q^Tb \)이므로
- \( y = Q^Tb \)로 놓고 \( y \)를 구한 후, \( R \mathbf{x} = y \)를 역 대입(= 후방 대입법(back substitution))하면 \( \mathbf{x} \)를 구할 수 있다.
- 또는, \( R \mathbf{x} = Q^Tb \)에서 \( R \)은 항상 가역이므로 \( \mathbf{x} = R^{-1}Q^Tb \)로 \( \mathbf{x} \)를 구할 수 있다. \( R \)은 대각선 아래 부분이 모두 0이다. 즉, 역행렬 계산을 비교적 간단하게 계산할 수 있다.
cf) LU 분해나 QR 분해는 차원이 큰 행렬의 역행렬 계산 시, 수치적 안정성과 더 빠르게 솔루션을 도출할 수 있다는 장점이 있다.
cf) QR 분해는 최악의 경우, \( Q \)가 모두 0이 아닌 숫자로 채워질 수 있는 반면, LU 분해의 \( L \)은 하삼각 행렬로 대각선 위의 원소들이 모두 0이므로 QR 분해가 LU 분해보다 메모리를 더 많이 사용하게 된다.
- 단, LU 분해는 행 교환이나 피벗을 만드는 과정이 있으므로 연산 속도는 LU 분해보다 QR 분해가 더 빠를 수 있다.
'선형대수' 카테고리의 다른 글
Solving Ax = 0: pivot variables, special solutions (0) | 2025.02.04 |
---|---|
최소제곱법 (0) | 2025.01.26 |
[개념] 행렬의 기본 공간과 차원 정리 (0) | 2025.01.22 |
Spaces of Vectors - (2) Column Space and Nullspace (0) | 2025.01.21 |
[개념] 벡터 공간 (0) | 2025.01.20 |