《线性代数的本质》学习笔记-什么是向量?

笔者言

回想本科读完已过数年,近日因考教师资格证重拾《线性代数》。回放视频中老师传授的知识,虽说温故而知新,但满眼仍是一套计算规则。虽能快速捡起不误刷题,但曾经的认知迷雾却始终无法抹去,无法理解为何如此规定,亦无法掌握其背后的精髓及与现实的联系。

遂搜得bilibili上由3blue1 Brown出品的视频《线性代数的本质》,如获至宝。

也许与作者产生了共鸣,常觉得目前授课形式仍重计算而轻理解,未能与人类和机器强合作的时代相融合;也许源自好奇心强烈驱使,奈何视频太快眼瘾过后转瞬即忘。于是突发奇想将视频转为文字,并对文字进行二次创作。从几何直观的视角重温《线性代数》,重新理解其背后的运算法则和逻辑,以此将其消化为自己明晰的认知。

这便是《线性代数的本质》学习笔记 系列的创作初衷。此中引用大量《线性代数的本质》视频中的观点,强烈建议读者有兴趣可点击链接直接学习。若此文有助于读者的理解,实乃吾之所幸。


00 序言

《线性代数》作为目前高等教育的基础科目之一,几乎每位大学生都有接触。我们在教室中学着各种计算规则(如矩阵乘法、行列式、叉积或者特征值等),但我们不得不承认,大多时候我们总能对矩阵的数值操作驾轻就熟,但却也止于计算了。我们其实并没有真正理解为什么矩阵乘法要如此定义,为什么叉积与行列式有所关联,特征值究竟代表了什么,更不要提其背后的几何直观了。而私以为,只有理解了几何直观后,我们或许才能说,我好像大概理解《线性代数》的本质了。

我们真的了解《线性代数》么? https://www.zhihu.com/video/1408468336673583104

实际上,《线性代数》可以从2个不同的视角进行理解:数值水平、几何水平,其中后者正是我们大学教育所遗漏的。此2者理解存在根本性差异,它们各有千秋,但却相互促进。

当你消化了这些内容,真正理解了几何直观和数值计算的关系,这门科目的细节和它在实际生活中的应用就会开始显得合情合理。平心而论,目前很多教授确实也在努力向学生传达几何直观思想。尤其在当今时代,我们已经有了计算机这样的工具辅助我们处理计算问题,我们确实应该把自己的角色定位在概念层面的理解。但现状却是在大部分课程中,学生们依然花了过多时间在数值计算。

对此,我们尝试将《线性代数》几何直观化,从向量的基础知识,由浅入深,直至发现组成线性代数本质的核心主题。


01 向量的3种视角理解

正式学习《线性代数》前,我们需要了解其最基础、最根源的组成元素——向量。下图所示藏着3种表示向量的办法,你或许在计算机、数学、物理课上遇到过。

向量究竟是什么?从物理、计算机和数学的视角各有解读:

① 物理视角:向量是空间中的箭头。物理视角认为,决定一个向量的2个要素是长度和所指的方向。只要以上2个特征相同,你可以自由移动一个向量而保持它不变(如位移、力、速度、加速度、动量等);

什么是向量?(物理专业视角)https://www.zhihu.com/video/1408490240684781568

② 计算机视角:向量是有序的数字列表。因为这就是计算机的语言,计算机不懂人类语言,只能用数字来表示状态、属性或行为,然后对这些信息进行处理。因为数字序列是人类语言的一种翻译,因此列表中每行数字的意义我们可以自行定义。

举个形象易懂的例子,若你正考虑买房,于是你记录了市场上不同在售房的属性。你重点关注了"地理位置"、"户型面积"和"总价"这3个因素,于是你记下了以下序列用于标识你看的不同房子:

考虑到文字不能用于运算,于是你定义"佛山市顺德区"是数字1,"佛山市禅城区"是数字2,"佛山市南海区"是数字3,此时你便将实际信息转化为了若干组数字列表:

于是你便完成了用"3维向量(即3行数字列表)"对房价进行了建模的动作。其实,“向量”只不过是"列表"的一个花哨的说法。之所以这个向量是3维的,是因为这个列表的长度是3,即每个列表由3个因素组成,只有3个因素完全相同才能说向量相等。

什么是向量?(计算机专视角)https://www.zhihu.com/video/1408491880040972289

③ 数学视角:数学家试图概括以上两种观点,将其统一为同1种字母符号和同1套运算法则,我们称之为向量。

其中向量符号定义为:有方向的字母,下面是一个小写字母,上面是一个向右的小箭头,如下图所示:

见符如见形,这些特定的符号既可指代物理视角中“空间中的箭头“,也可指代计算机视角中“有序的数字列表”。这种同一事物的不同描述方法,我们用数学语言“=“进行连接。即:

其中,当用数学语言表示“空间中的箭头“时,我们也可利用几何属性,将向量符号中的小写字母转化为箭头起始端和终止端的形式(如带箭头的OA)。

而向量的运算法则,数学家将计算机视角和物理视角的抽象为了同一套的运算规则,形成了属于向量的独特的加减乘数等运算规则,从而实现了两种视角的统一。其中,这套运算规则中最重要和基础的2个运算法则,是向量加法和向量的数乘:

i.向量加法:两个向量相加的规则

ii.向量数乘:数字与向量相乘的规则

综上是向量的3种不同视角的理解(如上图)。那么数学家是如何把物理视角和计算机视角统一的?这就是后文需要回答的问题。

02 理解“统一“二字

前面我们提到,“数学家试图概括物理视角和计算机视角的2个观点,将其统一为同1种字母符号和同1套运算法则”。因此我们首先需要解读一下,什么是“统一”?

“统一”不是说箭头、序列和符号是完全没有差别的,这是不可能的。就像我们无法认为一个速度矢量会是一个列表,一个买房模型的数字列表会是成了一个箭头。我们说到统一,它的前提一定是存在一个给定的对象。比如二维平面xy坐标系中对象有点、线、面等,物理运动中的对象有速度、加速度等,生活中的对象有财产、水位等。

于是,当我们在描述一个给定的对象时,我们发现这个对象既可以用有向箭头表示,也可以用一组定义了含义的数字序列表示,还可以用一个简单的数字符号表示。当对这个对象进行某种操作时候,我们发现既可以把它理解为有向箭头的某种运动,也可以理解为一组数字序列的变换、或者一组数字符号的某种加减乘除运算,他们可以抽象成并共用同一套数学规律。也即我可以随时在几个视角中进行切换,因为这些看待问题的视角是完全一一对应的。这便是”统一”。

考虑到几何是最直观可视化的办法,我们不防把3个视角都放到一个二维平面xy坐标系(并且指定参考点为O点)中进行比较。在几何中的最常见的状态有两个,一个是静止的位置状态,一个是运动的动作状态。我们不防从位置和运动2个维度理解向量3种表述方法的统一性。

03 向量在描述位置状态时的统一

好的,让我们从现实生活中最简单的问题进行抽象想象。首先是位置状态的想象。我们知道空间几何的最小单位就是点,点成线,线成面,面成体,因此我们把研究的对象拟定为最小单位:点,我们尝试从3个角度来理解第1个问题:我们如何描述xy坐标系中每个点的位置。如下图所示,即准确描述红点在哪里,黄点在哪里,绿点在哪里,并确保不论谁都能精确无误地找到。

i. 用物理视角-描述点的位置:因为物理视角认为“向量是空间中的箭头,决定向量的2个要素是长度和方向"。这时我们在xy坐标系中画1个箭头,这个箭头起点是原点,箭头终点是目标位置点,然后我们便测量出了这个箭头的准确且唯一的长度和方向。有了这个长度和方向,我们可以确信,只要按照这个方向和长度不论是谁都一定能找到准确的位置点。并且这个方法可以描述平面坐标系中所有的位置点,每个位置点都有一个与之对应的唯一的一个箭头。

ii. 用计算机视角-描述点的位置:因为计算机视角认为“向量是有序的数字列表,它是一种计算机语言,列表中每行数字的意义是由我们自行定义的”。于是我们在xy坐标系中右上角画了1个数字列表(如下图所示),并自定义该数字列表的意义,认为第1行的数字表示“从原点出发沿着x轴走x米远(向右走为正,向左走为负)”,第2行的数字表示“从原点出发沿着y轴走y米远(向上走为正,向下走为负)”。通过在平面系中进行测量,我们可以轻易得到x和y分别是多少。有了x和y,我们可以确信,只要沿着x轴走x个单位距离,再沿着y轴走y个单位距离,不论是谁都一定能找到准确的位置点。

值得一提的是,在同一个数字序列中,先执行第1行还是第2行对结果并无影响。如“先沿x轴走x个单位距离,再沿y轴走y个单位距离”、“先沿y轴走y个单位距离,再沿x轴走x轴个单位距离”,从呈现结果上是无差异的。

iii. 用数学视角-描述点的位置: 通过以上2个视角的分析,我们不难发现当我们描述同一个点的位置状态点时(如下图2所示),我们可以有3种不同的表示方法,其中序号①为物理视角的有向箭头,序号②为计算机视角的有序数字列表,需要③为数学视角的符号语言。

观察下图2我们进一步发现,当我们采用物理视角的有向箭头描述点的位置时,若将有向箭头分别沿着x轴和y轴做垂线,有向箭头在x轴和y轴的投影长度分别是 | x |和 | y |。是的,没错,绝对值中的x和y就是数字序列的代数值。于是,我们便建立起了图形和数列的联系。

不论是以上第几种描述方法,我们都可以发现,当点A的位置状态固定时,有唯一一个有向箭头、一个数字列表、一个数学符号与之对应。反之亦然,即任何一个给定的有向箭头、数字列表和数学符号,都有且只能确定唯一的位置状态点A。我们称,A点的位置与有向箭头、数字列表和数学符号是一一对应的。

至此我们便从位置状态理解了向量3种表述方法的统一性。

如若更进一步,我们把这种特殊的对应关系用数学语言进行描述,用“=”表示描述的是同一个对象和状态。则可表述如下:

而话说回来,其实这种数学描述上的统一并不是偶然,是因为我们数学家人为地进行了一些条件约束,从而才达到了这样的3个视角完全统一的神奇效果。

那么,我们具体做了哪些约束呢?①在物理视角上:如我们要求第1个有向箭头必须从原点出发,第2个有向箭头的起点必须是第1个有向箭头的终点;②在计算机视角上:我们童谣要求是从原点出发,并且人为约定了每个数字序列行的意义。这就是我们数学家的厉害之处。由此才实现了真正意义的绝对一一对应。

04 向量在描述物体运动时的统一 (向量加法)

以上是静态的位置状态,我们感受了3种向量表述方法的统一性。那么动态运动,3种向量表述方法的运算(或者运动)规律是否也是统一?现在我们回到前面说的向量的主要运算法则中的“向量加法”。

当我们描述物体运动的时候,在数学上与之对应的其实就是数学运算,如加减乘除等。为了将物体的运动用更直观可视化的方式表示。我们同样把3个视角放在一个二维平面xy坐标系(并且指定参考点为O点)中,通过可视化的方法观察对象的位置变化,来理解3种视角运算在点运动时的统一性。

我们尝试从3个角度来理解第2个问题:我们如何描述一个点从O点出发到达A点,稍作休息后,又最终到达一个终点B点这个动作。如下图所示,是否准确地描述了这个问题,其检验的方法是,不论他中间如何逗留,它都须准确给出O点、A点和B点的最终位置,并确保不论谁都能精确无误地找到。

i.用物理视角-描述向量加法:

  • 首先,描述“从O点出发到达A点”的动作。显然我们可以绘制1个红色箭头(如下图1所示),其起点在O点,方向为沿着给定的箭头方向,走确定的长度,到达相对于O点的确定终点A点。
  • 其次,描述“从A点出发到达B点”的动作。同理我们紧接着绘制了1个橘色箭头(如下图2所示),其起点在A点(即上一个箭头的末端),方向为沿着给定的箭头方向,走确定的长度,到达相对于A点的确定终点B点。
  • 我们顺起来看下图2,2个箭头组合起来表示了2个完整的动作。第1套动作为从O点出发到达A点,第2套动作为从A点出发到达B点。当把两个动作组合起来,就完整地表达了“从O点出发到达A点,稍作休息后,又最终到达一个终点B1点”这个动作。
  • 我们不难发现,以上2个动作对应的2个箭头和2个位置点是一一对应的。即如果已知A点和B点位置,且知道其运动过程为先到A后到B,那么就有唯一确定的2个箭头(即下图2个红箭头与橘色箭头);如果已知这2个红色箭头和橘色箭头,便能在xy坐标系中找到唯一的A点和B点,并清楚地知道该2点经历了从O点到A点,后从A点到B点这2套动作。
  • 最终呈现的结果是,O点经过一系列动作,最后从O点移动到了B点。
  • 现在,我们再单独画出第3个箭头(绿色箭头,如图3所示)。它的起点是红色箭头的起点O,它的终点是橙色箭头的箭头终点B,我们得到了唯一一个有确定方向和长度的箭头。这个箭头可以表达2个物理意义。1个物理意义是,描述了“B点的位置”,为该向量的位置属性;另1个物理意义是,描述了“某点从O点运动到B点的动作”,为该向量的动作属性。
  • 如果我们把这3个箭头在同一个平面系中表示出来(如图4所示),就形成了有向箭头的2个连续运动行为所体现出来的规律。我们认为1号箭头表示“从O点运动到A点”、2号箭头表示“从A点运动到B点”、3号箭头表示“从O点运动到B点”。然后我们发现了这3个箭头之间的存在某种关系,将其用文字描述进行描述则为:存在一个点,先“从O点运动到A点”,“接着”,“从A点运动到B点”。我们发现这2套动作运行下来,和该点“从O点运动到B点”相比,这个点的“最终状态一致”,都表达了一个点从O点到达了B点。
  • 以上是用文字描述了有向箭头的连续运动行为所体现出来的规律,我们觉得太过冗杂,于是我们考虑用更加简单的数学语言(+、=)进行简化。我们把①、②、③这3个箭头分别用带箭头的字母v、w、z(如下图所示)表示,用“+”描述为“接着”,把“=”描述为“最终状态一致”。因此这个规律被描述成了一个简约的数学表达式,如下:

于是通过以上操作,我们成功把有向箭头的运动所体现出来的规律,用一组数学语言(+、=)进行了简化抽象化,避免了过多的文字描述,抽象出来的客观观律我们称之为向量的加法运算法则。

至此我们已成功完成一个创举,即将有向箭头的几何直观一一对应到了数学语言。当看待同一个运动行为时,我们既可以认为它是数学语言中加法的数学运算,也可以认为是有向箭头运动规律描述,并且这两种理解可以随时进行切换。

ii.用计算机视角-描述向量加法(和物理视角的推演类似):

  • 首先描述“从O点出发到达A点”的动作。我们可以绘制1个2行的数字序列[g,h],第1行指“沿着x轴走g米远(向右走为正,向左走为负)“,第2行指“沿着y轴走h米远(向上走为正,向下走为负)”。如下图1所示,第1行和第2行分别对应序号①、②两个动作。
  • 然后,描述“从A点出发到达B点”的动作。我们再绘制1个2行的数字序列[i,j],第1行指“先沿着x轴走i米远(向右走为正,向左走为负)“,第2行指再沿着y轴走j米远(向上走为正,向下走为负)”,如下图2所示,第1行和第2行分别对应序号③、④两个动作。
  • 我们顺起来看图2,2个序列组合起来表示了2套完整的动作。第1套动作指“先沿着x轴向右走|g|米远,再沿着y轴向上走|h|米远“。第2套动作指“沿着x轴向右走|i|米远,再沿着y轴向下走|j|米远(其中j是负数)“。当把2套动作组合起来,即完整地表达了“从O点出发到达A点,稍作休息后,又最终到达一个终点B点”这个动作。
  • 我们不难发现,以上2个数字序列和2个位置点同样是一一对应的。即如果已知A点和B点位置,且知道其运动过程为先到A后到B,那么就有唯一确定的2个数字序列(即[g,h]和[i,j]);如果已知这2个数字序列,便能在xy坐标系中找到唯一的A点和B点,并清楚地知道该2点经历了从O点到A点,后从A点到B点这2套动作。
  • 最终呈现的结果是,O点经过一系列动作,最后从O点移动到了B点。
  • 我们通过以上①、②、③、④四步操作找到了B点位置点。因此我们便可用一个唯一确定的序列[k,l]来表示B点位置点。如下图3所示,这个序列的第1行和第2行分别对应序号⑤、⑥两个动作。这个序列可以表达2个费物理意义。1个物理意义是,描述了“B点的位置”,为该向量的位置属性;另1个物理意义是,描述了“某点从O点运动到B点的动作”,为该向量的动作属性。
  • 如果我们把这3个序列放在一个平面系中表示出来(如下图4所示),就发现了用数字序列描述物体运动时,序列所体现出来的数值规律,如图4所示:
  1. 我们利用[g,h]和[i,j]2个数字序列背后的现实意义,将其理解为某点“沿x轴向右走g米”,然后”沿y轴向上走h米”,然后”沿x轴向上走i米”,然后”沿y轴向上走j米(其中j是负数)”;
  2. 通过常识我们知道,以上①②③④四个动作是可以换位置的。即我们先完成①和③两个动作,合并后便是“沿x轴向右走(g+i)米”,然后再完成②和④两个动作,合并后便是“沿y轴向上走(h+j)米”,通过①③②④这样的运动顺序,我们同样也能成功找到最终B点的位置,并可以根据数字序列的定义将这个过程表达为[g+i,h+j]这样的形式;
  3. 这时我们发现,[k,l]的意思是“沿x轴向右走k米,沿y轴向上走l米”,不也是表达B点的位置么。可我们知道同一个点的序列应该是只有一个的。那么答案只有一个,[k,l]和[g+i,h+j]其实是同一个序列。即两个数列的数字元素中,k=g+i, l=h+j。
  4. 综上,当用数字序列描述物体运动时,序列所体现出来的数值规律为:某点经过了[g,h]运动,接着经历[i,j]的运动,最终到达的状态点为B点[k,l],且在数值上k=g+i, l=h+j。

以上是用文字描述了用数字序列描述物体运动时,序列所体现出来的数值规律,我们觉得太过冗杂,于是我们将这个顾虑用更加简单的数学语言(+、=)进行简化。其中,序列之间的“+”表示“接着”,两个代数之间的“+”即为数字运算,把“=”描述为“最终状态一致”。因此这个规律被描述成了一个简约的数学表达式,如下:

于是通过以上操作,我们成功把用数字序列描述物体运动时所体现出来的规律,用一组数学语言(+、=)进行了简化抽象化,避免了过多的文字描述,抽象出来的客观观律我们同样称之为向量的加法运算法则。

至此我们又成功完成一个创举,即将数学语言与数字序列也一一对应了起来。

iii.用数学视角-描述向量加法:以上分析中,我们从位置和运动2个角度,成功将有向箭头与数学语言进行了一一对应,后来又将数字序列也与数学语言进行了一一对应。可见,3者是完全可以一一对应并相互切换的(如下图所示)。这也证实了3种向量描述的统一性。

05 向量在描述物体变化时的统一 (向量数乘)

现在我们谈谈,另外一个主要运算规则——向量数乘。同样我们可以从描述一个具体对象入手,即向量的“拉伸”或“压缩“。从3种不同视角看待这项运动:

i. 用物理视角-描述向量的拉伸与收缩:物理视角是最直观可视化的描述。现在我们假设有一个从原点O出发的有向箭头,长度为 sqrt{x^{2}+y^{2}} (如下图1所示)。当我们想要描述箭头的拉伸或者压缩到原来的k倍这个动作是,我们首先做了几个认为约定,首先要求有向箭头拉伸或压缩的方向只能沿着原方向或反方向来,且箭头的起始点不能动,有了这2个约束前提后,当我们进行拉伸和压缩这两个动作并指定一个固定的倍率k时,就形成了如下图1~图4所示的xy坐标系中唯一确定的4种固定状态。

ii. 用计算机视角-描述向量的拉伸与收缩:当我们进行以上描述的拉伸/压缩行为后,我们发现原状态对应的数字序列是[x,y],变化后的状态所对应的数字序列就成了[kx,ky]。对于不同的k值范围,对应了不同的向量变化,如下图1~图4所示。


06 小结

至此告一段落,本次学习终于告一段落。这次花费了极大的力气,其实只是完成了“从物理视角(几何角度)、计算机视角(数值角度)、数学视角(符号与符号的运算)的角度,理解了向量的不必同表达形式、以及2个向量运算法则(加法及数乘)的内涵”这几道工作,仅此而已。

但以上工作它的意义确实无穷的。 因为当我们彻底理解了这些基础概念后,当遇到实际问题,你们便有可能将这些实际问题抽象向量并进行运算然后得到结果。而向量化后用哪种视角来看待向量,这完全根据我们个人的喜恶来,我们可以同时从3个视角抽象化现实问题,我们可以将它视作有向箭头,或数字序列,或看做单纯的数学符号。我们甚至可以此刻将其看做一个有向箭头,过了一段时间我们将其看做一个数字序列,又过了一阵子把它看成数学符号,并且完全不用担心会出错。为什么我们有这个自信,因为在任何一个状态下,此三者都可以随时随地进行切换与对应。《线性代数》最大的魅力并不在于体现在其中某个观点上,而是更多体现在它能够在这些观点中随时切换和转化。

因此,一方面,《线性代数》为数据分析提供了一条将大量数据列表概念化、可视化的渠道,它让数据样式变得非常明晰,并让你大致了解特定运算的意义。而另一方面,它又给物理学家和计算机图形程序员提供了一种语言,让他们通过计算机能处理的数字来描述并操纵空间。


07 感想

这次艰难地完成了对一个只有不到15分钟的视频进行了解读,和二次消化。我并不确信这些长文描述是否有读者愿意往下深度,或者是否写的过于囉嗦或者抽象有待提炼。但我确信,通过这种温故而知新的过程,我对向量的本质已形成了自己深刻而独到的间接。

本次长达整整一天半的提炼和总结,让我不仅感叹:

数学源于生活生产。如2维的平面、3维的空间,我们都可直观地将物理、计算机思维类比和想象,形成我们的数学工具。

但数学又高于生活生产。随着研究不断深入,当我们把维数扩充到4维、5维甚至N维时,数学超越了我们的日常生活和几何想像,转而成为了抽象概念,慢慢演化为纯理论数学。而这纯理论数学,似乎不断地催新著我们理论物理学家的想象力。时空是四维空间么?我们的宇宙是一个几维空间?兴许未来有一天,它便能引领我们理解宇宙。

而与此同时,我也忍不住反思老生常谈的话题。数学规律如此美妙,如同最美丽的巧合。那么它们究竟是被我们“发明”出来的,还是仅仅只是被我们“发现”了,眼下就成了一个哲学高度的问题。

发表回复

相关推荐

創意大佬!麥當勞的19個戶外廣告

拿獎拿到手軟的麥當勞,戶外是怎麼做的?文|燒腦廣告好久沒有整理戶外廣告系列瞭,小編趕緊翻出瞭珍藏已久的素材庫圖包。雖然...

· 4分钟前

小米OPPO三星一加红魔全机型解锁BL详细教程合集-ROOT刷机必要操作

解锁BL一个熟悉又陌生的词汇,只要你刷机root过,你肯定都解锁BL成功过。我们简单的描

· 5分钟前

教你在家做生煎饺,外皮酥脆,底部结冰,又酥又香真好吃!

  冰花生煎饺是一道非常普通的家常菜谱,饺子特点皮薄馅大,有一层像冰花的脆脆的底非常好吃,制作也很简单,只要你会包饺 ...

· 6分钟前

家用NAS开源方案

关于家庭NAS NAS就是有一台家用主机,也可以使一台家用电脑,但是这台电脑的存储空间特别大,比如买电脑时选择硬盘空间大的 ...

· 10分钟前

2024年高中必刷题(九科人教版必修一)大合集-可打印pdf

2024年恐成“高考难年”,3大改变要关注,部分学生或无缘本科:教育政策并不是一成不变的,而是随着时代的发展不断的改革和调 ...

· 10分钟前