线性代数的本质:线性变换与矩阵
线性代数的本质:线性变换与矩阵
线性代数是现代数学的一个重要分支,广泛应用于物理学、工程学、计算机科学等领域。其中,线性变换与矩阵是线性代数的核心概念之一。本文将基于3Blue1Brown的视频内容,深入浅出地介绍线性变换的本质及其与矩阵的关系,帮助读者建立直观的几何理解。
线性变换(linear tranformation)
首先,什么是变换?变换实际就是函数(function)的一种,它接受输入,并输出结果。称之为变换则是在暗示从可视化的角度去看待它。
在线性代数中,我们往往输入一个向量,输出一个新的向量。如果一个变换接受一个向量,然后输出一个向量,我们就可以想象这个向量移动到新向量位置的过程。进一步地,我们可以想象整个平面的向量都做这个变换,移动到新的位置,这看起来就是整个平面在变形,变换给了我们扭曲空间的能力。
有非常多美妙而复杂的变换,而线性变换将变换限制为线性:
若一个变换具有以下两个性质,则说它是线性的:
- 所有直线在变换后还是直线
- 原点保持固定
描述线性变换——矩阵
现在的问题是,我们如何描述一个线性变换。也就是给出一定的描述或者操作,使得我们可以对所有向量这么做而得到变换后的新向量。
对于二维平面来说,我们实际上只需要知道基向量的新位置,其他向量都会随之而动。
这是由于线性变换本身的性质,而有一个重要的推论:一个向量如果是另两个向量的线性组合,则经过线性变换后,它仍然是它们相同的线性组合。
比如现在我们在原坐标系有个向量,这意味着这个向量可以如此表示:,现在我们知道,变换之后到了原来的位置,而到了原来的位置,那么我们就可以计算的变换后的位置是。
我们只需要记录下新的、的位置,我们就可以计算空间任意向量变换后到了哪里:对于任意的,我们通过来计算。也就是,我们只需要和这两个信息,就可以掌握这个线性变换。
通常我们将它们写在一起:,称之为矩阵(matrix)。**
**我们可以将它的两个列理解为两个特殊的向量——新的、的位置。
现在,如果你有一个2×2矩阵,和一个2维向量,而你想知道这个矩阵描述的线性变换对这个向量的作用,你只需要取出向量的两个坐标,分别数乘矩阵的两个列向量,然后相加即可。我们在书写时把矩阵放在这个向量的左边,就像函数(f(x))一样。
换成一般形式,就是:
这就是矩阵向量乘法
总结
线性变换是一种操纵空间的手段,它保持网格平行等距分布且原点位置不变。 而这种变换我们只需要用变换后基向量的坐标就可以描述清楚,这些基向量坐标构成的矩阵提供了一种描述线性变换的语言,矩阵乘法就是计算这种线性变换作用的一个手段。
线性变换复合
现在考虑我们要连续做两个线性变换,比如说先逆时针转90°(),再进行剪切变换( ) 。通过画图我们可以看出,最终到达,到达。也就是,我们可以用矩阵来表示这这整个过程的一次性变换,也就是复合变换:
。
也就是说,先后对一个向量作用前两个线性变换,和直接做这个复合变换,得到的结果是一样的,写成表达式就是:
逆时针旋转
剪切
那么我们把这个新矩阵称为那两个矩阵的积就是非常合理的了。
那我们如何不做图,仅通过两个矩阵,计算它们的复合矩阵呢?联系矩阵的意义是表征一个线性变换,它指示了新的基向量坐标,那么我们现在的任务其实就是找到两次变换后基向量的坐标。
以矩阵和为例,求。
先经过,到了的位置,再经过,就会到的位置,也就是,也就是复合矩阵的第一列就是,同理可以计算。
所以我们可以总结:
更一般的形式:
这就是矩阵乘法。
而从线性变换的角度看矩阵乘法,很多代数上的问题就会清晰很多。
比如矩阵乘法有交换律吗?也就是成立是否成立的问题。
是不成立的,我们可以轻易举出反例:
先旋转再剪切的结果和先剪切再旋转的结果是不同的,这直接画图就可以看出,而无需计算。
先旋转再剪切
先剪切再旋转
还有就是结合律的问题,也即是否成立。这个从矩阵乘法和线性变换的联系上看,就是非常显然正确的,因为等式左右都无非是在按一样的顺序先后做A、B、C三个线性变换,当然结果是相等的。