这次终于能把线性代数弄懂了!

线性代数是所有数据科学和机器学习任务的基础,是将理论模型转化为实际解决方案的语言。

它体现了让算法能够从数据中学习的原则。

线性代数被用于以下方面:

数据的表示:一种结构化方式来组织和操作数据,使得复杂的数据集能够以矩阵的形式表示降维:如PCA等技术依赖于线性代数来减少变量的数量,以增强模型的效率而不丢失重要信息优化:梯度下降是机器学习的核心引擎,它利用线性代数来找到函数的最小值特征工程:线性变换和矩阵运算从现有数据中创建新的特征相似度度量:嵌入(embeddings)以向量的形式存储,如今被用于推荐系统和AI聊天机器人中

本文将探讨一些线性代数的概念、可视化解释和代码示例。

向量

向量是线性代数的基础构建块

关于向量,有三种理解方式:

第一种是物理学的视角:向量是空间中带有长度和方向的箭头。在平面上,向量是二维的;而在我们生活的空间中,向量是三维的。

第二种是计算机科学的视角:向量是一组有序的数字列表。这个列表的长度决定了向量的维度。

第三种是数学的视角:向量可以是任何可以相加和与数字相乘的两个元素。

单位向量

单位向量是一个大小为1的向量。它常用于表示向量的方向,而不考虑其大小。

向量运算

向量加法

向量加法是指两个向量按分量相加,以形成一个新的向量。

数乘

在机器学习中,数乘指的是一个向量与一个标量(一个数)相乘的操作。

这种操作会生成一个新的向量,该向量与原始向量具有相同的方向(如果标量为负,则方向相反),但其大小(或称为“模”)会根据标量的绝对值进行缩放。

点积

点积是数学中的一个重要概念,它正式地定义为两个向量的欧几里得长度与它们之间夹角的余弦值的乘积。

这个值既反映了两个向量的长度,也反映了它们之间的方向关系。

直观地讲,你可以将点积看作是一个向量在另一个向量方向上的“投影长度”或“增长”。

它也可以用来衡量“一个向量对另一个向量施加了多少推力或能量”。

点积的结果是一个标量,它表示我们使原始向量变得更强(正数)、更弱(负数)或没有变化(零)。

点当两个向量的点积为零时,这表示这两个向量是正交的。

想象一下,红色向量代表你的速度,而蓝色向量代表助推器的方向。

数值越大表示力量越大,点积就是你将获得多少助推力。

使用公式来说,|a|是你的初始速度,|b|是最大助推力,你获得的助推力百分比是cos(θ),因此总助推力为|a|×|b|×cos(θ)。

向量空间

向量空间(或线性空间)是向量的集合,这些向量可以相加,并且可以与数(在此上下文中称为标量)相乘(即“缩放”)。

为了使V被称为向量空间,必须满足一系列公理。

点击图片即可跳转

零空间(核)

零空间是一组向量,当它们与矩阵相乘时,结果为零向量。

它代表了方程Ax=0的解,其中A是给定的矩阵。

想象一个二维空间中有两个向量;一个矩阵的零空间可以视为一个子空间,当这两个向量与该矩阵相乘时,它们会“坍缩”到原点(即零向量)。

生成空间(Span)

给定两个向量v和w的线性组合(即av+bw,其中a和b是所有实数),你可以到达的所有可能向量的集合称为生成空间。

对于大多数向量对,生成空间可以覆盖二维向量平面上的每一个点。

然而,当这两个向量恰好共线时,生成空间就仅限于通过原点的单一直线。

生成空间的概念是基(Basis)概念的基础。

基(Basis)

基是一组线性独立的向量,它们可以生成整个向量空间。

这意味着向量空间中的每个向量都可以表示为这组基向量的线性组合。

可以将这些基向量视为空间中其他所有向量的构建块。

虽然将单个向量视为箭头是有帮助的,但对于向量集合,最好将其视为点。

大多数基向量对都可以覆盖整个二维空间。

线性独立(LinearIndependence)

如果向量集中的任何向量都不能表示为其他向量的线性组合(例如,x和y的线性组合是任何形成ax+by的表达式,其中a和b是常数),则称这组向量是线性独立的。

矩阵

矩阵是组织和表示输入与操作的一种方式,通过行和列进行组织。

下面是一个2行2列的矩阵示例。

矩阵是一种数学工具,能够以结构化的方式解决问题。

矩阵作为函数

你可以将矩阵视为函数。

就像Python函数接收输入参数、处理它们并返回输出一样,矩阵变换通过线性变换将输入向量转换为输出向量。

线性变换

线性变换是两个向量空间之间的映射V→W,它保留了向量加法和标量乘法的运算性质。

在实际应用中,将矩阵A应用于向量x以得到另一个向量y(通过运算Ax=y)就是一个线性变换。

这在数据科学中得到了广泛应用:

降维:PCA(主成分分析)使用线性变换将高维数据映射到低维空间。

数据变换:标准化或归一化数据集是一个线性变换。

特征工程:通过现有特征的组合创建新特征。

以下是矩阵的几种形式:

逆矩阵

一个矩阵与其逆矩阵相乘,结果为单位矩阵。

奇异矩阵

奇异矩阵是一个没有逆矩阵的方阵。这等价于说该矩阵的行列式为零或其秩小于其大小。

单位矩阵

单位矩阵是一个方阵,对角线上的值为1,其他位置上的值为0。在矩阵乘法中,它起着乘法恒等元的作用,乘以任何矩阵都保持不变,就像数字1一样。

对角矩阵

对角矩阵是一个方阵,其主对角线以外的所有元素都为零。它用于查找特征值,并计算行列式。

正交矩阵

正交矩阵是一种方阵,其行向量和列向量都是单位向量,且两两正交。

这种矩阵在几何变换和线性代数中有广泛应用。

如果一个实元素方阵的转置等于其逆,则这个矩阵被认为是正交的。

从数学定义上来说,如果矩阵A满足A的转置乘以A(或A乘以A的转置)等于单位矩阵I,那么矩阵A就是正交的,即AA=AA=I,其中I是单位矩阵。

从几何角度来看,一个矩阵是正交的,如果它的列向量和行向量都是正交单位向量,也就是说它们彼此垂直且长度为1。

回想一下,两个向量是正交的,如果它们彼此垂直(成90度角),并且它们之间的点积为0。

矩阵乘法

你可以使用矩阵进行矩阵乘法运算。

这是一张线性代数直观指南可视化图表(用于说明矩阵乘法)。

想象一下,你正在将每个输入数据通过每个操作进行传递。

以下是这个操作的一个例子。

经过操作处理后,你得到了这样的结果。

输入是一个[3x2]的矩阵,而我们的操作矩阵是[2x3];所以结果矩阵的大小是[2x3]乘以[3x2]等于[2x2]。

输入的尺寸必须与操作的尺寸相匹配。

迹(Trace)

矩阵的迹是其所有对角元素之和。迹在基变换下是不变的,并且提供了关于矩阵的值信息,即迹是矩阵特征值的和。

行列式(Determinant)

行列式是输出变换的大小。

如果输入是单位向量(面积为1或体积为1),则行列式表示变换后的面积或体积的大小。

以这个矩阵为例。如果A的面积放大了6倍,则变换的行列式就是6。

负的行列式意味着整个空间被翻转了。这种变换就像把一张纸翻到另一面。

注意红色和绿色轴的方向是如何颠倒的。

行列式为0意味着矩阵是“破坏性”的,并且无法逆转。类似于乘以零,信息会丢失。

行列式可以告诉我们一个矩阵是否可逆。如果det(A)为0,则逆矩阵不存在;该矩阵是奇异的。

秩(Rank)

矩阵中线性无关列/行向量的最大数量。它表示由其行或列所张成的向量空间的维度。

它还可以告诉我们线性变换后的输出维度数量。

当变换的输出是一条直线(一维)时,我们说该变换的秩为1。

如果所有向量都落在某个二维平面上,我们说该变换的秩为2。

对于2x2矩阵,秩为2是最好的情况。这被称为满秩。它意味着基向量可以张成整个二维空间,并且行列式不为零。

但对于3x3矩阵,秩为2意味着它发生了坍缩,但不如秩为1时严重。

特征向量和特征值

特征向量和特征值代表变换的“轴”。

特征向量是那些在线性变换后方向不变的输入。

尽管方向不变,但大小可能会变,这个大小,即特征向量被放大或缩小的程度,就是特征值。

想象一下当你旋转地球仪时,除了两极之外,每个地方都朝向一个新的方向。

但两极的方向并没有改变,以下是特征向量的一个可视化例子。

从数学上讲,对于矩阵A和向量v,如果Av=λv,那么λ就是特征值,而v就是矩阵A的特征向量。

换句话说,一个方阵A的特征向量是那些满足矩阵乘法等于数乘的向量。

THE END
1.中国建设银行申请回归模型的构建相关专利,构造的回归模型更加精准散金融界2024年12月18日消息,国家知识产权局信息显示,中国建设银行股份有限公司申请一项名为“回归模型的构建方法及装置、程序产品、存储介质”的专利,公开号CN 119128368 A,申请日期为2024年11月。 专利摘要显示,本申请实施例提供了一种回归模型的构建方法及装置、程序产品、存储介质,其中,该方法包括:基于N个对象的N个https://www.163.com/dy/article/JJN40V400519QIKK.html
2.线性多步法线性多步法 格式 被称为步线性多步格式,其中, , 为系数。 当时,格式是显式的,否则是隐式的。 注. 显然,前面用数值积分方法得到的格式和Euler公式都是线性多步格式它的局部截断误差为(假定是精确的), 利用,把上式在处Taylor展开,可以得到误差表达式。 http://staff.ustc.edu.cn/~rui/ppt/num/num-ode-lm.html#/
3.[矩阵分析]一线性空间与线性变换线性独立(线性无关/相关):如果一组向量的线性组合等于零向量仅当所有系数都为零时,这组向量被称为线性独立的;否则,它们是线性相关的。 一组向量 {v1?,v2?,…,vn?} 被称为线性独立的,如果没有一组非全零标量 {α1?,α2?,…,αn?} 使得 α1?v1? + α2?v2 ?+?+ αhttps://blog.csdn.net/qq_43700729/article/details/136958006
4.线性独立是什么意思线性独立的翻译音标读音用法例句线性独立 释义 linear independence 线性无关;https://m.iciba.com/%E7%BA%BF%E6%80%A7%E7%8B%AC%E7%AB%8B
5.独立线性的英文独立线性翻译独立线性英语怎么说海词词典,最权威的学习词典,专业出版独立线性的英文,独立线性翻译,独立线性英语怎么说等详细讲解。海词词典:学习变容易,记忆很深刻。http://dict.cn/%E7%8B%AC%E7%AB%8B%E7%BA%BF%E6%80%A7
6.向量独立是什么意思:深入理解线性代数中的基本概念(向量独立什么性质线性独立向量组具有以下几个重要性质:首先,任何向量组中,包含零向量的向量组必定是线性相关的;其次,如果向量组中任意部分组是线性无关的,那么整个向量组也是线性无关的;最后,线性独立向量组的任意线性组合不可能等于零向量,除非所有的系数都为零。 https://www.zaixianjisuan.com/jisuanzixun/xiangliangdulishishimeyisi_shenrulijiexianxingdaishuzhongdejibengainian.html
7.02相互独立均值独立和线性不相关对于随机变量无关性有三个层次的概念,由强到弱为相互独立、均值独立、线性不相关。 #1.相互独立 image 对于独立的随机变量,其具有以下“好”性质 image 2.均值独立 In probability theory, a random variable Y is said to be mean independent of random variable X if and only if its conditional mean E(https://www.jianshu.com/p/09cc8cc09221
8.独立正态分布线性组合公式是什么独立正态分布线性组合公式是统计学中的一个重要公式,它描述了当多个独立正态分布随机变量进行线性组合后,组合结果的分布情况。这个公式在分析数据、做统计分析时非常有用。 公式如下: [ Y = c_1X_1 + c_2X_2 + ldots + c_nX_n ] 其中,( X_1, X_2, ldots, X_n ) 是独立且服从正态分布的随机https://localsite.baidu.com/article-detail.html?articleId=21557803&ucid=PHfzrjnLPWf&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10004
9.软件工程复习提纲51CTO博客由流图计算环形复杂度,并确定线性独立路径 黑盒测试和白盒测试 黑盒测试(功能测试): 把程序看作一个黑盒子; 完全不考虑程序的内部结构和处理过程; 是在程序接口进行的测试。 白盒测试(结构测试): 把程序看成装在一个透明的盒子里; 测试者完全知道程序的结构和处理算法; https://blog.51cto.com/u_15127543/4348125
10.独立成分分析(ICA)腾讯云开发者社区我们首先给出标准的(即源信号的个数等于混合信号的个数)无噪声独立成分分析的线性模型.标准的线性独立成分分析模型的矩阵形式为X=AS; 其中随机向量X=(x1,x2,…,xn)表示观测数据或观测信号(observed data),随机向量S=(s1,s2,…,sn)表示源信号,称为独立成分(independent components),A称为nxn的混合矩阵(mixinghttps://cloud.tencent.com/developer/article/2086544
11.读《领导力与新科学》“秩序源于混沌,变化产生秩序”(领导力与新——by玛格丽特·惠特利《领导力与新科学》写在前面受牛顿物理学原子论思维的影响,经典管理将企业视为有序、线性、独立、因果关系明确并实现利润最大化的确定性可控型组织。但在以移动互联网技术、数字化经营、顾客需求个性化以及员工知识化等为特征的高度不确定性的量子时代,经典管理的理念、商业模式、组织结构以及https://book.douban.com/review/14937922/
12.线性电路的线性性与叠加定理解决方案摘要:1、线性性【元件的线性性】当描述元件的特性方程为线性方程时,元件为线性元件,如线性电阻元件有的特性方程,线性受控源(CCVS)。【线性电路】 除独立电源外,电路中的其他元件均为线性元件,这种电路称为线性电路【线性时不变电路】除独立电源外,电路中其他元件均为线性元件,且是时不变元件,这种电路称为线性时不https://tech.hqew.com/fangan_1952210
13.线性代数—Wolfram语言参考资料就像在 “稀疏数组:线性代数” 中讨论的,能够使用 CoefficientArrays 来把符号方程转化成 SparseArray 对象. 所有这里描述的函数不但对普通的矩阵适用,而且也对 SparseArray 对象适用. LinearSolve[m,b] 给出矩阵方程 的解的向量 NullSpace[m] 一列线性独立的向量,其线性组合包括矩阵方程 的所有解 MatrixRank[m]https://reference.wolfram.com/language/tutorial/VectorOperations.html.zh?view=all&source=footer
14.协方差为0一定独立吗协方差为0是不相关,独立可推出不相关,但是不相关不能推出独立。 独立和不相关从字面上看都有“两个东西没关系”的意思,但两者是有区别的。相关性描述的是两个变量是否有线性关系,独立性描述的是两个变量是否有关系。 不相关表示两个变量没有线性关系,但还可以有其他关系,也就是不一定相互独立。下面是独立和不https://www.dongao.com/cma/zy/202303164166285.shtml
15.数学物理方法1简介,目录书摘1.5.1 线性独立性及格拉姆行列式 1.5.2 行列式的阿达马不等式 1.5.3 正则变换的广义处理 1.5.4 无穷多个变数的变线型和二次型 1.5.5 无穷小线性变换 1.5.6 微扰 1.5.7 约束 1.5.8 矩阵或变线型的初等除数 1.5.9 复正交矩阵的谱 参考文献 第2章 任意函数的级数展开 2.1 正交函数组 2.1.1 定义 2.1.https://www.jd.com/nrjs/d3a45283e9efc826.html
16.SIMON类非线性函数的线性性质研究目前关于SIMON类非线性函数的差分性质方面的结果较为完善,文献[3]找到了F182(x)的差分分布规律,给出了差分转移概率的取值范围,解决了非0差分概率对应的输出差分的取值与计数问题。然而,线性性质方面的结果还较少,文献[5]给出了在F182(x)的线性逼近式的2次项相互独立下相关系数取到0与1/2k时掩码应满足的条件https://jeit.ac.cn/cn/article/doi/10.11999/JEIT200999?viewType=HTML