线性变换及对应矩阵详解
线性变换及对应矩阵详解
线性变换是线性代数中的核心概念,它描述了向量空间中向量的变换规律。本文将详细介绍线性变换的基本概念、特殊矩阵(如投影矩阵、平移矩阵、旋转矩阵和三维转二维矩阵)、基向量的线性变换、坐标以及求导的矩阵表示。通过具体的数学公式和示例,帮助读者深入理解线性代数中的核心概念。
1. 线性变换
线性代数从线性变换开始,是线性代数的另外一个起点。很多物理学家并不关心坐标的值,而是关心从A坐标系到B坐标系的变化。他们希望知道如何去描述一个变化,而现在我们研究的就是通过矩阵来描述这一个线性变化。
每个线性变换都对应于一个矩阵,我们所学的零空间,行空间,行列式,特征值都来源于矩阵,但是在矩阵的背后就是线性变换的概念。
2. 特殊矩阵
2.1 投影矩阵
假设二维空间中有一个向量a,通过线性变换T(x)得到b,这种线性变换通常称为映射。
$$
T:a \in \mathbb{R}^2 \rightarrow b \in \mathbb{R}^2
$$
- 假设我们有一个向量v,投影线性变换T(x),向量v经过投影线性变换后形成向量p,T(x)就像一个函数一样
$$
p=T(v)
$$
- 线性变换的两个条件:
$$
T(v+w)=T(v)+T(w);T(cv)=cT(v);T(cv+dw)=cT(v)+dT(w)
$$
- 对于投影矩阵来说,是一个线性变换,向量k倍长,投影向量也k倍长,向量反向,投影向量也反向;
2.2 平移矩阵
- 平面平移
假设我们平面上有一个向量$v_0$,$2v_0$,需要平移$v$,分别得到$p_1, p_2$,不满足比例关系,故不是线性变换。
$$
p_1=v+v_0;p_2=2v+v_0;\Rightarrow p_2 \neq2p_1
$$
2.3 旋转矩阵
我们希望有任意一个向量v,逆时针旋转45°后得到向量p
$$
p=T(v)
$$
可以证明,当向量v翻倍的时候,向量p也翻倍,当向量取负号的时候,向量p也去负号。我们可以将通过旋转矩阵的线性变换将任何点集都进行旋转,比如将如下图形进行旋转。
这种线性变换就相当于任意向量左乘以矩阵A,是不是跟前面的$Ax=b$联系起来了,真神奇!!每一个不同的矩阵A相当于一种线性变换。
$$
T(x)=Ax;T(w+v)=A(w+v);T(cv)=cAv=cT(v)
$$
2.4 三维转二维矩阵
我们希望将一个三维x,y,z坐标系上的点a经过线性变换为x,y平面上的b,可以构造矩阵A如下:
$$
\begin{bmatrix}1\2\end{bmatrix}=\begin{bmatrix}1&0&0\0&1&0\end{bmatrix}\begin{bmatrix}1\2\3\end{bmatrix}\Rightarrow p=\begin{bmatrix}1&0&0\0&1&0\end{bmatrix}x
$$
3. 基向量的线性变换
3.1 代数形式
- 首先我们看看对于向量$a_1, a_2$进行线性变换来说
$$
p_1=T(a_1),p_2=T(a_2)
$$
那我们可以看到,这一个线性变换其实也是对整个$a$向量空间所有的变量进行变换,这样我们知道,任意向量a是可以用向量$a$的基向量表示的,假设基向量为$e_1, e_2$
$$
a_i=x_1e_1+x_2e_2\Rightarrow T(a_i)=T(x_1e_1+x_2e_2)=x_1T(e_1)+x_2T(e_1)
$$
由上述公式可以看出来,所谓的线性变换本质上是对基向量的变换。这样我们就可以在保留参数的情况下,通过改变基向量来得到同意的线性变换公式。找到统一的矩阵A。
用公式表示如下,假设v是由基向量组合而成
$$
v=c_1v_1+c_2v_2+\cdots+c_nv_n\Rightarrow p=T(v)=T(c_1v_1+c_2v_2+\cdots+c_nv_n)
$$
$$
p=T(c_1v_1+c_2v_2+\cdots+c_nv_n)=c_1T(v_1)+c_2T(v_2)+\cdots+c_nT(v_n)
$$
- 小结:
$$
p=c_1T(v_1)+c_2T(v_2)+\cdots+c_nT(v_n)
$$
- 用矩阵形式代替线性变换$\Rightarrow T(x)=Ax$
$$
p=c_1Av_1+c_2Av_2+\cdots+c_nAv_n
$$
3.2 矩阵形式
- 我们在给定输入V矩阵和输出W矩阵的情况下,如何找到线性变化矩阵A?
假设输入n个分别为$v_1, v_2, \cdots, v_n$个基向量,输出m个分别为$w_1, w_2, \cdots, w_m$个基向量,我们希望用矩阵A来表示线性变换;我们知道A的大小为m行n列,我们让$v_1$线性变换得到$w_1$
$$
T(v_1)=Av_1=a_{1}w_1+a_{2}w_2+\cdots+a_{m}w_m
$$
- 我们知道如果选取A的一行那么有n个,显然无法得到m个$w_i$,所以只能选择A的一列,所以整理上述公式可得:
$$
\begin{cases}
T(v_1)=Av_1=a_{11}w_1+a_{21}w_2+\cdots+a_{m1}w_m\
T(v_2)=Av_2=a_{12}w_1+a_{22}w_2+\cdots+a_{m2}w_m\
\vdots\
T(v_n)=Av_n=a_{1n}w_1+a_{2n}w_2+\cdots+a_{mn}w_m\
\end{cases}
$$
- 整理上述可得:
$$
\begin{bmatrix}
w_1&w_2&\cdots&w_m
\end{bmatrix}
\begin{bmatrix}
a_{11}&a_{12}&\cdots&a_{1n}\
a_{21}&a_{22}&\cdots&a_{2n}\
\vdots&\vdots&\cdots&\vdots\
a_{m1}&a_{m2}&\cdots&a_{mn}
\end{bmatrix}
=\begin{bmatrix}T(v_1)\T(v_2)\\vdots\T(v_n) \end{bmatrix}
$$
$$
\begin{bmatrix}
w_1&w_2&\cdots&w_m
\end{bmatrix}
\begin{bmatrix}
a_{11}&a_{12}&\cdots&a_{1n}\
a_{21}&a_{22}&\cdots&a_{2n}\
\vdots&\vdots&\cdots&\vdots\
a_{m1}&a_{m2}&\cdots&a_{mn}
\end{bmatrix}
\begin{bmatrix}
a_{11}&a_{12}&\cdots&a_{1n}\
a_{21}&a_{22}&\cdots&a_{2n}\
\vdots&\vdots&\cdots&\vdots\
a_{m1}&a_{m2}&\cdots&a_{mn}
\end{bmatrix}
\begin{bmatrix}v_1\v_2\\vdots\v_n\end{bmatrix}
$$
4. 坐标
我们知道坐标来源于向量基,将一个点A可以用如下表示,坐标建立在标准基上的。
$$
A=\begin{bmatrix} 1\2\3 \end{bmatrix}=1\begin{bmatrix} 1\0\0 \end{bmatrix}+2\begin{bmatrix} 0\1\0 \end{bmatrix}+3\begin{bmatrix} 0\0\1 \end{bmatrix}
$$
对于矩阵来说,我们可以选择一组特征向量来作为矩阵的标准基,通常我们用长度为1的标准正交特征向量作为基,这样就方便计算了。
5. 求导
假设我们需要用矩阵的方式求解导数:
$$
y=c_1+c_2x+c_3x^2;a=\begin{bmatrix}c_1\c_2\c_3\end{bmatrix};y'=c_2+2c_3x;b=\begin{bmatrix}c_2\2c_3\end{bmatrix}
$$
- 也就是说我们要把初始向量a,变成 b
$$
A\begin{bmatrix}c_1\c_2\c_3\end{bmatrix}=\begin{bmatrix}c_2\2c_3\end{bmatrix}
$$
- 可以得到矩阵A为如下:是不是很神奇,一个求导的非线性计算,居然在矩阵面前变成了线性变换,仅仅用矩阵乘法就行了。
$$
\begin{bmatrix} 0&1&0\ 0&0&2 \end{bmatrix}\begin{bmatrix}c_1\c_2\c_3\end{bmatrix}=\begin{bmatrix}c_2\2c_3\end{bmatrix}
$$