Linear Algebra - UNIT III - 09 Linear Transformation

lecture video

summary pdf


Linear transformations and their matrices

선형변환은 선형대수의 기하학적 접근이다.
이러한 접근법은 행렬이나 좌표계를 필요로 하지 않아 직관적이다.
하지만 계산을 함에 있어서는 결국엔 행렬과 좌표계를 필요로 한다.

Without coordinates

Example 1: Projection

투영은 \(R^2\)의 모든 벡터를 \(R^2\)의 또다른 벡터로 변환하는 선형변환 T로 나타낼 수 있다.

\[T:R^2 \rightarrow R^2\]

Orthogonal subspaces

무슨 규칙에 따라 투영된다는것일까?
이 매핑은 모든 벡터 v가 어떤 직선상의 T(v)로 투영된다는 것이다.

Definition of linear

투영은 선형변환이다.
다음 조건이 성립하면 변환 T는 선형적이라고 할 수 있다.

\[T(v+w)=T(v)+T(w)\]

and

\[T(cv)=cT(v)\]

모든 벡터 v,w와 모든 스칼라 c에 대해 동등하게,

\[T(cv+dw)=cT(v)+dT(w)\]

T(0)=0이라는 것은 의미있는 것이다. 그렇지 않으면 T(c0)=cT(0)이 성립하지 않았을 것이다.

Non-example 1: Shift the whole plane

\[T(v)=v+v_0\]

위 식은 평면의 모든 벡터에 고정 벡터 \(v_0\)를 더하는 것이다.
이는 선형변환이 아니다!

\[T(2v)=2v+v_0 \ne 2T(v)\]

Non-example 2: T(v) = ||v||

\[T(v)=||v||\]

위 식은 어떤 벡터의 길이를 취하는 것으로 선형변환이 아니다.

\[T(cv) \ne cT(v) \text{ if c } \lt 0\]

선형이 아닌 변환은 다루지 않을것이다.
이제부터 \(T\)는 선형변환만을 의미한다!

Example 2: Rotation by 45◦

\[T: R^2 \rightarrow R^2\]

이 변환은 입력 벡터 v를 통해 T(v)를 출력한다.

T(v)는 원점기준으로 v를 반시계방향으로 45도 회전한 모양이다.

The big picture

변환을 기하학적으로 보는 것은 한 점에만 집중하는 것이 아닌 큰 그림을 볼 수 있게 한다.

그러나 변환 너머에있는 것을 보기 위해선 행렬과 좌표계를 도입해야한다.


With coordinates(matrix!)

지금까지 다룬 모든 선형변환은 행렬으로 나타낼 수 있다.

선형변환은 행렬곱의 추상적인 묘사이다.

Example 3:

\[T(v)=Av\]

A가 주어졌을때, T(v)=Av라고 하자.

이는 선형변환이다.

\[A(v+w)=A(v)+A(w)\] \[A(cv)=cA(v)\]

Example 4:

\[A= \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}\]

\(T(v)=Av\)의 기하학적 모습은 무엇일까?

벡터의 y 성분의 부호가 뒤바뀐것이다!

Example 5

\[T: R^3 \rightarrow R^2\]

3차원 공간에서 2차원 공간으로 보내는 변형을 어떻게 찾을 수 있을까?

아무 2 by 3 행렬 A를 잡아서 \(T(v)=Av\)를 해보아라.

Describing T(v)

모든 벡터 v에 대해, T(v)를 결정하기 위해 T에 대해 얼마나 많은 정보가 필요한가?

\(T\)변환이 단일 벡터 \(v_1\)에 대해 어떤 작용을 하는지 안다면, 이를 이용해 임의의 상수 c에 대해 \(T(cv_1)\)를 계산할 수 있다.

만약 우리가 독립인 \(v_1,v_2\)에 대해 \(T(v_1),T(v_2)\)를 안다면 두 벡터가 span하는 공간 \(cv_1+dv_2\)로 변환될 것임을 알고있다.

\(R^n\)상의 모든 벡터에 대해 알고 싶다면, 기저인 \(v_1,v_2,...v_n\)에 대한 변환 \(T(v_1),T(v_2),...T(v_n)\) 에 대해 알면 된다.
이는 입력 공간의 어떤 v에 대해서도 기저의 선형결합으로 나타낼 수 있기 때문이다.

\[v=c_1v_1 + c_2v_2 + \cdots + c_nv_n\] \[T(v)=c_1T(v_1)+c_2T(v_2)+ \cdots + c_nT(v_n)\]

이것이 선형변환으로부터 행렬을 얻어내는 방법이다.

우리가 기저를 선택하면, 공간상의 모든 벡터 v는 기저 벡터의 유일한 선형결합 형태로 표현할 수 있다.

벡터들의 계수는 해당 기저에 대한 v의 좌표이다.

결국 좌표는 기저로부터오는 것이다.
기저는 공간상의 벡터의 좌표를 변환시킨다.
언제나 standard basis만을 사용할 수는 없다.
때때로 eigenvector를 기저로 사용하거나, 어떤 다른 기저를 사용하고 싶을 수도 있다.

The matrix of a linear transformation

선형결합 T에 대해, 그것을 표현하는 A를 어떻게 만들 수 있을까?

먼저 \(R^n\)의 벡터 v에서 \(R^m\)의 벡터 w로 변환한다고 해보자.
\(T(V)=Av\)인 행렬 A를 찾고싶다.

A의 첫번째 column은 \(T(v_1)=a_{11}w_1+a_{21}w_2+ \cdots + a_{1m}w_m\)의 계수 \(a_{11},a_{21},...,a_{1m}\) 로 구성된다.
\(T\)는 선형적이고 \(T(v_i)=Av_i\)가 각 벡터 \(v_i\)에 대해 기저이므로 input space의 모든 벡터 v에 대해 \(T(v)=Av\)이다.

투영행렬 n=m=2에 대해 T는 모든 평면상의 벡터를 직선위로 투영한다.
이 경우 input과 output에 동일한 기저를 사용하는것은 괜찮다.
\(v_1\)이 우리가 투영하고자 하는 직선이고, \(v_2\)가 \(v_1\)에 수직한 벡터일 때,

\[T(c_1v_1 + c_2v_2)=c_1v_1 + 0\]

그리고 이 투영은

\[A= \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} = \begin{bmatrix} c_1 \\ 0 \end{bmatrix}\]

를 의미한다.

만약 우리가 선택한 기저가 eigenvector로 이루어져 있다면?
그러면 행렬은 eigenvalue를 대각성분으로 하는 대각행렬 \(\Lambda\) 으로 변환시킬것이다.

기저의 선택이 얼마나 중요하냐면, 다음 45도 각도의 직선으로 투영하는 행렬을 살펴보아라.

만약 \(v_1=w_1=\begin{bmatrix} 1 \\ 0 \end{bmatrix}\), \(v_2=w_2=\begin{bmatrix} 0 \\ 1 \end{bmatrix}\) 를 선택하면, 우리는 다음 투영행렬을 얻는다.

\[P= =\frac{aa^T}{a^Ta} = \begin{bmatrix} 1/2 & 1/2 \\ 1/2 & 1/2 \end{bmatrix}\]

그림을 그려보면 이것이 맞다는 것을 확인할 수 있다.
그러나 직접 P를 계산하는 것은 eigenvector 기저로 계산하는것보다 어렵다.

Example 6

\[T=\frac{d}{dx}\]

T가 도함수를 얻는 변환이라고 하자.

\[T(c_1+c_2x+c_3x^2)=c_2+2c_3x \cdots (1)\]

input space는 2차 다항식 \(c_1+c_2x+c_3x^2\)의 3차원 공간이고, 기저 \(v_1=1, v_2=x,v_3=x^2\)를 가진다.
output space는 input space의 이차원 subspace이고, 기저 \(w_1=v_1=1,w_2=v_2=x\)를 가진다.

선형 변환인 것이다!

그렇기 때문에 우리는

\[A= \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 2 \end{bmatrix}\]

를 찾고 선형변환 (1)을 찾고, 행렬곱 (2)를 적을 수 있다.

\[T( \begin{bmatrix} c_1 \\ c_2 \\ c_3 \end{bmatrix} ) = A \begin{bmatrix} c_1 \\ c_2 \\ c_3 \end{bmatrix} = \begin{bmatrix} c_2 \\ 2c_3 \end{bmatrix} \cdots (2)\]

Conclusion

어떠한 선형변환 T에 대해서도 우리는 \(T(v)=Av\)를 만족하는 행렬 A를 찾을 수 있다.
만약 변환이 ivnertible하다면, 역변환 행렬\(A^{-1}\)이 존재한다.
두 변환의 의 곱 \(T_1,T_2\)은 두 행렬의 곱 \(A_2A_1\)과 같다.
이곳에서 행렬의 곱이 생겨난다.