矩阵相乘的快速算法
excel 矩阵 乘法 运算
一、矩阵的定义及基本运算矩阵是线性代数中的基本概念,它是一个按规律排列的数表。
在实际应用中,我们经常需要对矩阵进行乘法运算。
矩阵的乘法是矩阵运算中的一种重要运算,它有其独特的定义和规则。
二、矩阵乘法的基本定义矩阵乘法是指两个矩阵相乘的运算。
设有两个矩阵A和B,它们的尺寸分别为m×n和n×p,则它们的乘积C是一个m×p的矩阵。
具体来说,C的第i行第j列的元素,是矩阵A的第i行按元素与矩阵B的第j列按元素的乘积之和。
三、矩阵乘法的计算方法具体来说,矩阵C的第i行第j列的元素可以表示为:C(ij) = A(i1)×B(1j) + A(i2)×B(2j) + ... + A(in)×B(nj)其中1≤i≤m,1≤j≤p,1≤k≤n。
四、矩阵乘法的性质矩阵乘法具有一些特殊的性质,这些性质对于理解矩阵乘法的运算规则非常重要。
1.结合律:对于任意三个矩阵A、B和C,都有(A×B)×C = A×(B×C)。
矩阵乘法满足结合律。
2.分配律:对于任意三个矩阵A、B和C,都有A×(B+C) = A×B +A×C,(A+B)×C = A×C + B×C。
矩阵乘法也满足分配律。
3.单位矩阵的乘法:单位矩阵与任意矩阵相乘,都等于原来的矩阵。
4.零矩阵的乘法:任意矩阵与零矩阵相乘,都等于零矩阵。
五、矩阵乘法的应用矩阵乘法在实际应用中有着广泛的应用,特别是在科学计算、工程技术和数据处理等领域。
1.线性方程组的求解:线性方程组可以用矩阵的形式表示,而矩阵乘法正是解决线性方程组的重要方法之一。
2.图形变换:在计算机图形学中,矩阵乘法被广泛用于描述图形的旋转、平移和缩放等变换。
3.数据处理:矩阵乘法在大规模数据处理和机器学习领域得到广泛应用,例如矩阵乘法可以用来计算两个大型数据集的内积。
矩阵的圈乘
矩阵的圈乘圈乘是数学中的一种常见算法,指的是矩阵的乘法运算,它也可以应用于高维线性代数、信号处理、机器学习等领域。
在实际应用中,矩阵的圈乘是一种重要的数学工具,可以加快计算机的速度,提高计算的效率。
在矩阵的乘法运算中,圈乘可以将两个矩阵A和B相乘,得到结果C。
其表示方式如下:C = A * B其中,A和B分别为m×n矩阵,m和n分别为行数和列数,每个矩阵的元素用aij和bij表示,i从1到m,j从1到n。
矩阵的乘法运算有两种方法:传统矩阵乘法和圈乘法。
传统矩阵乘法是一种暴力破解,它从每一行开始,依次计算元素的乘积,然后将结果相加,得到结果矩阵的一行。
例如,两个3×3的矩阵A和B如下:A =1 2 34 5 67 8 9B =9 8 76 5 43 2 1使用传统矩阵乘法,计算结果矩阵C如下:C =30 24 1884 69 54138 114 90使用圈乘法,我们可以将矩阵A和B分别划分为:A =1 24 5B =9 86 5C =30 2484 69该过程可以写成如下的等式:C = A×B =(1×9 + 2×6) (1×8 + 25)(4×9 + 5×6) (4×8 + 5×5)圈乘法的优势在于,当矩阵的行数和列数相等时,可以将矩阵的乘法运算量减少一半,提高计算的效率,节省时间。
二、圈乘法的应用在高维线性代数中,圈乘法可用于求解线性方程组。
我们可以利用圈乘法对线性方程组中的矩阵进行乘法运算,从而快速求解方程组。
此外,圈乘法在信号处理中也有重要应用。
我们可以利用圈乘来进行信号调制、滤波、傅立叶变换等,从而实现信号处理。
在机器学习中,也可以使用圈乘法来计算神经网络的梯度和参数更新,从而提高学习的效率。
三、总结矩阵的圈乘是一种重要的数学算法,可以加快计算机的速度,提高计算的效率。
它广泛应用于高维线性代数、信号处理、机器学习等领域。
矩阵的几种乘法
矩阵的几种乘法全文共四篇示例,供读者参考第一篇示例:矩阵是线性代数中非常重要的概念,而矩阵的乘法是其中一个重要的操作。
在实际应用中,矩阵的乘法有多种不同的形式,每种形式都有相应的规则和特点。
在本文中,我们将讨论一些常见的矩阵乘法,包括普通矩阵乘法、Hadamard乘积、克罗内克积等,并对它们的性质和应用进行介绍。
普通矩阵乘法是最常见的一种矩阵乘法。
给定两个矩阵A和B,它们的乘积C的定义如下:设A是一个m×n的矩阵,B是一个n×p的矩阵,那么它们的乘积C是一个m×p的矩阵,其中C的第i行第j列元素是A的第i行的元素与B的第j列的元素的乘积之和。
普通矩阵乘法遵循结合律,但不遵循交换律。
也就是说,对于任意三个矩阵A、B、C,(AB)C=A(BC),但一般情况下,AB≠BA。
普通矩阵乘法可以用于解线性方程组、矩阵求逆、矩阵的特征值等方面。
Hadamard乘积是一种逐元素操作,不会改变矩阵的形状。
它常用于矩阵的逐元素运算,比如矩阵的逐元素求和、逐元素平方等。
Hadamard乘积满足交换律和结合律,即对于任意两个矩阵A、B,有A∘B=B∘A,(A∘B)∘C=A∘(B∘C)。
克罗内克积常用于矩阵的融合、扩展等操作,可以将两个不同大小的矩阵整合在一起,得到一个新的更大的矩阵。
克罗内克积满足结合律,但不满足交换律,即对于任意三个矩阵A、B、C,(A⊗B)⊗C≠A⊗(B⊗C),但一般情况下,A⊗B≠B⊗A。
除了以上提到的三种常见矩阵乘法,还有其他一些特殊的矩阵乘法,比如深度学习中常用的Batch矩阵乘法、图像处理中的卷积运算等。
每种矩阵乘法都有其独特的性质和应用场景,熟练掌握各种矩阵乘法是理解线性代数和计算机科学的重要基础。
矩阵的乘法是线性代数中的重要概念,不同的矩阵乘法具有不同的性质和应用。
通过学习不同种类的矩阵乘法,我们可以更好地理解和应用线性代数知识,为实际问题的求解提供更多的方法和思路。
矩阵相乘公式
两个2×2矩阵相乘公式
2×2矩阵乘法公式是:[ax+buay+bv][cx+ducy+dv]。
矩阵相乘它只有在第一个矩阵的列数column和第二个矩阵的行数row相同时才有意义。
一般单指矩阵乘积时,指的便是一般矩阵乘积。
2×2矩阵乘法公式的解释:
一个m×n的矩阵就是m×n个数排成m行n列的一个数阵。
数值分析的主要分支致力于开发矩阵计算的有效算法,这是一个已持续几个世纪以来的课题,是一个不断扩大的研究领域。
矩阵分解方法简化了理论和实际的计算。
针对特定矩阵结构如稀疏矩阵和近角矩阵定制的算法在有限元方法和其他计算中加快了计算。
无限矩阵发生在行星理论和原子理论中。
无限矩阵的一个简单例子是代表一个函数的泰勒级数的导数算子
的矩阵。
对称Toeplitz矩阵相乘的一种快速算法
对称Toeplitz矩阵相乘的一种快速算法作者:张曙光来源:《科技创新导报》 2013年第26期张曙光(北京航空航天大学数学与系统科学学院北京 100191)摘?要:本文将Toeplitz矩阵分解为循环矩阵和下三角矩阵之和,以及一般卷积向循环卷积的转化,借助快速Fouier算法(FFT),给出了一种对称Toeplitz矩阵相乘的快速算法,其算法复杂性为次实乘次数,次实加次数,较之前的算法在时间复杂性上有所改善。
关键词:对称Toeplitz矩阵快速Fouier算法(FFT) 算法复杂性中图分类号:O151.21 文献标识码:A 文章编号:1674-098X(2013)09(b)-0219-02A fast algorithm for the multiplication of Symmetric Toeplitz matricesZHANG Shuguang(School of mathematics and system science,Bei Hang University,Beijing 100191,China)Abstract:In this paper,I am going to decompose a Toeplitz matrix into the multiplication of a cyclic matrix and a ?lower triangular matrix.Meanwhile,I will talk about the conversion from a common convolution into a cyclic convolution. Using the fast Fouier algorithm(FFT),I have a given out a fast algorithm for the multiplication of Symmetric Toeplitz matrices. Its algorithm complexity is multiplies times, plus pared with the former algorithm,this method has improved in time complexity.Key words:symmetric Toeplitz;fast Fouier algorithm(FFT);algorithm complexityToeplitz矩阵常常出现在许多应用中,如谱分析、时序分析、线性预测、最小二乘估计、信号处理等领域,是应用最广泛的特殊矩阵之一。
矩阵元素相乘
矩阵元素相乘矩阵是数学中一种重要的数据结构,它更为精确地描述了现实中的许多客观事物。
矩阵元素相乘,也就是矩阵乘法,是矩阵数学中最基本也是最重要的操作之一。
在数学上,矩阵乘法是指将两个矩阵相乘,形成一个新的矩阵;它也是数学上一种重要的矩阵运算,广泛应用于线性代数、投影平面等领域。
一般而言,在数学上,矩阵乘法是一种定义起来非常重要的矩阵操作,它在数学上具有许多重要的性质,如结合律、乘法等性。
结合律的定义为假定矩阵A、B∈Rm×m,AB=BA,两个矩阵的乘积AB符合运算律,即,AB=BA;乘法性定义为假定矩阵A、B、C∈Rm×m,AB=C,则AB=C,即AB和C具有相等的乘法性谓词。
此外,矩阵乘法还满足可逆性特性、结果复杂阵特性等等。
矩阵乘法具有很强的抽象性,它可以应用于各种不同领域,是不少程序设计中的常用算法。
在数学上,矩阵乘法可以用来求解一些复杂的线性方程组;在机器学习的应用中,矩阵乘法可以用来构建神经网络;在计算机图形学中,矩阵乘法可以用来描述三维物体的形变变换;在语言处理中,矩阵乘法可以用来构建语义空间等抽象概念空间。
从数学定义上看,矩阵乘法是指将两个矩阵相乘,从而形成一个新的矩阵。
一般而言,两个矩阵的乘积是新矩阵的维数为原矩阵乘积的行数和列数。
比如,如果A是一个m×n矩阵,B是一个n×p矩阵,两个矩阵的乘积AB就是一个m×p的新矩阵,在这里,m为A的行数,n为A的列数,p为B的列数。
同时,此时乘积AB的元素等于A的前m个行向量与B的前p个列向量之积。
因此,矩阵乘法涉及到已知矩阵的乘法法则,它是一个数学抽象的概念:两个矩阵的乘积是新矩阵的维数为原矩阵乘积的行数和列数,其中,新矩阵的元素等于原矩阵前m个行向量与后p个列向量之积,这样可以使矩阵乘法具有很强的抽象性,实用性非常强,可以应用于许多不同的领域。
矩阵乘法也有许多数学性质,像结合律、乘法等,这些性质可以用于证明一些数学定理,比如求解线性方程组;同样,它也可以用来构建神经网络、描述三维物体的形变变换、构建语义空间等。
分治算法之矩阵相乘
分治算法之矩阵相乘矩阵相乘是一种常见的计算问题,它在许多领域中都有重要的应用,如图形学、线性代数和机器学习等。
当需要计算大型矩阵的乘积时,传统的方法可能会遇到时间和空间复杂度过高的问题。
而分治算法可以提供一种高效的解决方案。
分治算法是一种将问题划分成多个子问题来解决的方法。
它将原始问题划分为更小的子问题,然后递归地解决这些子问题,最后将子问题的解合并起来得到原始问题的解。
对于矩阵相乘问题,可以使用分治算法将两个大型矩阵划分为多个子矩阵,然后递归地计算子矩阵的乘积,最后将子矩阵的乘积合并起来得到原始矩阵的乘积。
首先,我们需要定义两个矩阵A和B,它们的乘积记为C。
假设A是一个m×n的矩阵,B是一个n×p的矩阵,C是一个m×p的矩阵。
我们可以将矩阵A划分为四个子矩阵A11、A12、A21和A22,其中A11和A22的大小都是m/2×n/2,A12和A21的大小分别是m/2×n/2和n/2×p/2、同样,我们将矩阵B划分为四个子矩阵B11、B12、B21和B22,它们的大小分别与A11、A12、A21和A22相同。
然后,我们可以使用如下的公式计算C的四个子矩阵:C11=A11×B11+A12×B21C12=A11×B12+A12×B22C21=A21×B11+A22×B21C22=A21×B12+A22×B22最后,我们将这些子矩阵合并起来得到矩阵C。
上述过程可以通过递归的方式进行。
首先,递归地计算A11、A12、A21、A22、B11、B12、B21和B22的乘积,然后将这些乘积子矩阵合并得到C11、C12、C21和C22、最后,将这些子矩阵合并起来得到矩阵C。
分治算法的关键在于将问题划分为更小的子问题,并且递归地解决这些子问题。
在矩阵相乘问题中,通过将矩阵划分为四个子矩阵,可以将原问题划分为更小的子问题,然后递归地计算子问题的解,最后将子问题的解合并起来得到原始问题的解。
卡西欧算矩阵乘法
卡西欧算矩阵乘法介绍在数学中,矩阵乘法是一个重要的运算。
卡西欧(Casio)是一个以制造计算器和数学工具而著名的公司,他们的计算器通常具有强大的矩阵计算功能。
本文将探讨卡西欧计算器如何进行矩阵乘法操作,以及该操作的一些重要应用。
矩阵乘法的定义矩阵乘法是对两个矩阵进行运算,通过将第一个矩阵的行与第二个矩阵的列相乘,并将结果相加得到一个新的矩阵。
两个矩阵的乘法只有在第一个矩阵的列数等于第二个矩阵的行数时才能定义。
卡西欧计算器的矩阵乘法功能卡西欧计算器通常具有矩阵乘法功能,可以快速准确地执行矩阵乘法运算。
以下是使用卡西欧计算器进行矩阵乘法的步骤:1.打开计算器并选择进入矩阵模式。
2.输入第一个矩阵的维度(行数和列数)并逐个输入矩阵元素。
3.输入第二个矩阵的维度并逐个输入矩阵元素。
4.选择矩阵乘法操作。
5.计算器将自动执行矩阵乘法运算并显示结果。
矩阵乘法的应用矩阵乘法在许多领域都有广泛的应用。
以下是一些常见的应用领域:1. 图像处理在图像处理中,矩阵乘法被用于图像的旋转、缩放和变换等操作。
通过将图像表示为矩阵,可以使用矩阵乘法来对图像进行各种操作,从而实现图像的处理和编辑。
2. 线性代数矩阵乘法是线性代数中的一个重要概念。
线性代数是数学中研究向量空间和线性映射的分支领域,而矩阵乘法是线性映射的一种表示方式。
通过矩阵乘法,可以研究和解决线性方程组、矩阵的特征值和特征向量等问题。
3. 人工智能在人工智能和机器学习领域,矩阵乘法被广泛应用于神经网络和深度学习算法中。
神经网络中的权重矩阵和输入向量之间的乘法运算是神经网络的关键步骤,在训练过程中通过不断调整权重矩阵来优化网络性能。
4. 统计学在统计学中,矩阵乘法被用于多元统计分析和回归分析等领域。
通过矩阵乘法,可以计算多个变量之间的线性关系、协方差矩阵和相关矩阵等统计指标,从而进行数据分析和预测。
结论矩阵乘法是数学中的重要概念,可以应用于各个领域。
卡西欧计算器提供了方便快捷的矩阵乘法功能,可以帮助我们进行矩阵乘法运算。
矩阵的相乘有关知识点
矩阵的相乘有关知识点矩阵的相乘是线性代数中的一个重要概念,也是矩阵运算中最常用的操作之一。
它在各个领域都有广泛的应用,如计算机图形学、机器学习、信号处理等。
本文将从矩阵相乘的定义、性质以及应用等方面展开阐述。
我们来了解一下矩阵相乘的定义。
假设有两个矩阵A和B,A的维度为m×n,B的维度为n×p,那么它们的乘积C=A×B的维度为m×p。
矩阵C中的元素c_ij等于矩阵A的第i行与矩阵B的第j列对应元素的乘积之和,即c_ij=a_i1*b_1j+a_i2*b_2j+...+a_in*b_nj。
矩阵相乘的定义给出了相乘操作的具体计算方式,接下来我们来探讨一下矩阵相乘的性质。
首先,矩阵相乘不满足交换律,即A×B不一定等于B×A。
这是因为矩阵相乘的计算方式决定了乘法的顺序不能改变。
其次,矩阵相乘满足结合律,即(A×B)×C=A×(B×C),这意味着在连续相乘多个矩阵时,可以任意改变相乘的顺序。
最后,单位矩阵是矩阵相乘中的特殊元素,对于任意矩阵A,都有A×I=I×A=A,其中I是维度为n×n的单位矩阵。
矩阵相乘在实际应用中有着广泛的应用。
首先,矩阵相乘可以用于几何变换。
在计算机图形学中,我们可以用矩阵相乘来进行平移、旋转和缩放等操作,从而实现图形的变换和渲染。
其次,矩阵相乘在机器学习中也扮演着重要的角色。
在神经网络中,矩阵相乘用于计算输入和权重之间的线性变换,从而实现模型的训练和预测。
此外,矩阵相乘还可以用于信号处理中的滤波操作,通过将信号与滤波器的系数矩阵相乘,可以实现信号的去噪和增强等功能。
当然,矩阵相乘也存在一些限制和注意事项。
首先,矩阵相乘要求被乘矩阵的列数与乘矩阵的行数相等,否则无法进行相乘操作。
其次,矩阵相乘的计算量较大,特别是在矩阵维度较大时,会消耗大量的计算资源和时间。
矩阵乘法快速算法
矩阵乘法快速算法矩阵乘法是线性代数中最重要且最基础的运算之一、在计算机科学和工程领域中,矩阵乘法的计算量往往非常大,特别是对于大规模的矩阵计算问题。
因此,研究和发展高效的矩阵乘法算法成为计算机科学和工程中的一个重要任务。
传统的矩阵乘法算法需要O(n^3)的时间复杂度,这对于大规模矩阵计算来说非常低效。
因此,研究者们一直致力于寻找更快速的矩阵乘法算法。
在本文中,我们将介绍几种常见的快速矩阵乘法算法,包括Strassen算法、Coppersmith-Winograd算法和更近期的算法。
1. Strassen算法Strassen算法是最早期被提出的快速矩阵乘法算法之一、它的基本思想是将两个n×n的矩阵分成四个n/2×n/2的子矩阵,然后通过一系列递归计算得到结果。
Strassen算法的时间复杂度为O(n^log2(7)),因此在一些情况下,它比传统的矩阵乘法算法更快。
2. Coppersmith-Winograd算法Coppersmith-Winograd算法是在1987年被提出的一种更快的矩阵乘法算法。
它的时间复杂度为O(n^2.376),比Strassen算法更快。
该算法基于一种矩阵变换的方法,通过减少乘法运算的次数来加速矩阵乘法计算过程。
3.更近期的算法除了Strassen算法和Coppersmith-Winograd算法,还有许多其他快速矩阵乘法算法被提出。
其中一种叫做BLAS(Basic Linear AlgebraSubprograms)库,它是一个用于数值计算的底层库,提供了高效的矩阵乘法实现。
另外,还有一些基于GPU并行计算的矩阵乘法算法,例如CUDNN库和cuBLAS库,它们通过利用GPU的并行计算能力来加速矩阵乘法运算。
总结起来,矩阵乘法快速算法是计算机科学和工程中的一个重要课题。
通过研究和发展快速的矩阵乘法算法,可以显著提高矩阵计算的效率,从而加快许多计算密集型应用程序的运行速度。
c++ 矩阵快速幂 斐波那契数列
C++ 中的矩阵快速幂算法在解决斐波那契数列问题上有着重要的应用。
矩阵快速幂算法是一种高效的算法,可以在较短的时间内计算出斐波那契数列的第 n 个数。
本文将从原理、实现和应用三个方面介绍矩阵快速幂算法在 C++ 中解决斐波那契数列问题的具体方法。
【一、矩阵快速幂原理】1、斐波那契数列定义斐波那契数列是一个经典的数列问题,其定义如下:F(0) = 0F(1) = 1F(n) = F(n-1) + F(n-2), n > 12、矩阵快速幂算法矩阵快速幂算法是利用矩阵相乘的快速计算方法,来加速斐波那契数列的计算过程。
其原理如下:设矩阵 A = {{1, 1}, {1, 0}},则有:A^n = {{F(n+1), F(n)}, {F(n), F(n-1)}}其中 A^n 表示矩阵 A 的 n 次方。
【二、矩阵快速幂实现】1、矩阵乘法在 C++ 中,可以通过重载运算符实现矩阵的相乘操作。
代码如下:```cpp// 重载矩阵乘法Matrix operator*(const Matrix a, const Matrix b) {Matrix c;for (int i = 0; i < 2; i++) {for (int j = 0; j < 2; j++) {c.m[i][j] = 0;for (int k = 0; k < 2; k++) {c.m[i][j] += a.m[i][k] * b.m[k][j];}}}return c;}```2、矩阵快速幂算法利用矩阵乘法和快速幂算法,可以很容易地实现矩阵快速幂算法。
具体代码如下:```cpp// 矩阵快速幂算法Matrix matrixPow(Matrix a, int n) {Matrix res;res.init(); // 初始化单位矩阵while (n) {if (n 1) res = res * a;a = a * a;n >>= 1;}return res;}```【三、矩阵快速幂应用】1、斐波那契数列求解利用矩阵快速幂算法,可以在 O(logn) 的时间复杂度内求解斐波那契数列的第 n 个数。
两个矩阵相乘的算法c语言
两个矩阵相乘的算法c语言两个矩阵相乘是在线性代数中非常重要的运算之一。
在这篇文章中,我们将介绍一个用C语言编写的算法,用于计算两个矩阵的乘积。
我们将逐步解释算法的实现过程。
首先,让我们先了解一下矩阵的基本概念。
一个矩阵可以看作是一个矩形的数组,由行和列组成。
每个元素可以用矩阵的行索引和列索引进行定位。
例如,对于一个3行2列的矩阵A,其元素可以表示为A[i][j],其中i表示行索引,j表示列索引。
矩阵的乘积定义如下:对于两个矩阵A和B,当且仅当A的列数等于B 的行数时,它们的乘积C才是定义的。
C的行数等于A的行数,列数等于B的列数。
C的元素可以按以下方式计算:C[i][j] = A[i][1]*B[1][j] + A[i][2]*B[2][j] + ... + A[i][k]*B[k][j]其中,k是A的列数,也是B的行数。
根据乘法规则,C的每个元素都是A的一行与B的一列对应元素的乘积之和。
下面是一个示例:A = [1 2]B = [3 4][3 4] [5 6]C = [1*3 + 2*5 1*4 + 2*6][3*3 + 4*5 3*4 + 4*6][13 16][27 34]现在让我们逐步编写一个能计算两个矩阵相乘的C语言程序。
Step 1:定义数组和变量首先,我们需要定义两个输入矩阵A和B以及输出矩阵C,同时还需要定义变量来表示矩阵的行数和列数。
我们将用二维数组来存储矩阵。
c#define ROW_A 3#define COL_A 2#define ROW_B 2#define COL_B 2int A[ROW_A][COL_A];int B[ROW_B][COL_B];int C[ROW_A][COL_B];int i, j, k;Step 2:初始化矩阵A和B接下来,我们需要初始化输入矩阵A和B的值。
你可以手动输入或者随机生成一个矩阵。
cfor (i = 0; i < ROW_A; i++) {for (j = 0; j < COL_A; j++) {A[i][j] = 从键盘或者随机数生成获取元素值}}for (i = 0; i < ROW_B; i++) {for (j = 0; j < COL_B; j++) {B[i][j] = 从键盘或者随机数生成获取元素值}}Step 3:计算矩阵C的乘积接下来,我们需要编写一个嵌套循环来计算矩阵C的每个元素。
几个结构矩阵乘积的快速算法
在 计算信 号 复原 问题时 ,离散 的方 程所 表现 的大 多是一 个大 规模 的线性 方程 组 .对 于许 多 已 在信 号复 原问题 中出现的结 构矩 阵 ( 例如应 用小 波技 术处 理信号 复原 问题 时 ,就 会 出现诸 如广 义 中心 对称 矩阵 、 广义 中心 Hemia 阵等 结构矩 r tn矩 i
正交矩阵Q, 并作分划使得Q= 1[l Q】 其 Q :'
,
矩阵.
Z
中 rn ( , = a kQ ) ,Z a kI ) =rn (— ;
1 几 则 引 理
下面 是几个 重要 的关 于广 义 中心对称 矩 阵和
步骤 2 计 算 矩阵 X=AQ. , Y=A 2 Q; 步骤 3 计 算 矩阵 B= , y. C=
阵) ,至今还 没有找 到有效 的快 速算法 .因此 ,为 减少 计算 量和节 省 内存 ,设 计快 速 的算法 ( 当讨
引理 1 设 Q为文 献 【】 2中方程 ( 式所 定 8) 义的正 交矩 阵 ,则矩 阵 A∈C 为广 义 中心 对称
矩 , 且 当 T: l立, 中 阵 当 仅 QQ{ j AL 其 L B 成
Se t 2 0 p. 0 8
几个结构矩 阵乘积 的快 速算 法
曹寒 冬 ,胡振 华
(. 1 五邑大学 数理系 ,广东 摘 江门 5 9 2 ;2 2 0 0 .湖南城市学院 数学与计算科学系 ,湖南 益阳 4 30 10 0)
要 :运用广义中心对称矩阵和广义 中・H r t n E emia } 阵的约化性质得到 了计算此类矩阵乘积 的快速算 i
定 义 的 正 交 矩 阵 , 定 义 U=( IQ ), 则 矩 阵 Q, 2 i A∈C 为广 义 中心 Hemia r t n矩 阵 ,当且 仅 当 i
矩阵的几种乘法
矩阵的几种乘法全文共四篇示例,供读者参考第一篇示例:矩阵的乘法是线性代数中的一个重要概念,是将两个矩阵相乘的操作。
在矩阵乘法中,有几种不同的乘法方式,包括普通矩阵乘法、点积乘法和克罗内克积乘法。
本文将逐一介绍这几种乘法的概念、原理和应用。
普通矩阵乘法是最常见的矩阵乘法操作,它是将两个矩阵按照行列相乘的规则计算得到的新矩阵。
一个矩阵A的行数和列数分别为m 和n,另一个矩阵B的行数和列数分别为n和p,那么可以将两个矩阵相乘得到一个m行p列的新矩阵C。
具体计算方式为,C的第i行第j 列元素等于矩阵A的第i行和矩阵B的第j列对应元素相乘后求和得到的结果。
对于一个2行3列的矩阵A和一个3行2列的矩阵B相乘,得到一个2行2列的新矩阵C。
普通矩阵乘法的应用广泛,特别是在工程、物理、经济和计算机科学等领域中被广泛应用。
点积乘法是矩阵乘法的一种特殊形式,也称为内积乘法或标量乘法。
在点积乘法中,两个矩阵之间的乘法操作是将矩阵的对应元素相乘后再求和得到一个标量。
实际上,点积乘法相当于将两个矩阵逐元素相乘后再进行矩阵求和操作。
点积乘法要求两个矩阵的维度相同,即行数和列数相等,得到的结果是一个标量而不是新的矩阵。
点积乘法在计算机图形学、神经网络和信号处理等领域中有着广泛的应用。
矩阵的乘法有几种不同的形式,包括普通矩阵乘法、点积乘法和克罗内克积乘法。
每种乘法方式在不同领域有着不同的应用,可以帮助我们更好地理解和计算矩阵的运算。
熟练掌握这几种矩阵乘法方式,有助于提高我们在线性代数和相关领域的学习和工作效率。
希望通过本文的介绍,读者对矩阵的几种乘法有了更深入的了解和认识。
第二篇示例:矩阵是线性代数中一个非常重要的概念,它在各个领域的数学和物理问题中都有着广泛的应用。
矩阵的乘法是矩阵运算中的一个基础操作,它有多种不同的形式,下面我们将介绍几种常见的矩阵乘法。
1. 矩阵的普通乘法矩阵的普通乘法是最基本的一种矩阵乘法,它可以用于将两个矩阵相乘。
矩阵相乘的快速算法
矩阵相乘的快速算法算法介绍矩阵相乘在进行3D变换的时候是经常用到的。
在应用中常用矩阵相乘的定义算法对其进行计算。
这个算法用到了大量的循环和相乘运算,这使得算法效率不高。
而矩阵相乘的计算效率很大程度上的影响了整个程序的运行速度,所以对矩阵相乘算法进行一些改进是必要的。
这里要介绍的矩阵算法称为斯特拉森方法,它是由v.斯特拉森在1969年提出的一个方法。
二阶矩阵的计算方法。
我们先讨论对于二阶矩阵a11 a12 b11 b12A = a21 a22B = b21 b22先计算下面7个量(1)x1 = (a11 + a22) * (b11 + b22);x2 = (a21 + a22) * b11;x3 = a11 * (b12 - b22);x4 = a22 * (b21 - b11);x5 = (a11 + a12) * b22;x6 = (a21 - a11) * (b11 + b12);x7 = (a12 - a22) * (b21 + b22);再设C = AB。
根据矩阵相乘的规则,C的各元素为(2)c11 = a11 * b11 + a12 * b21c12 = a11 * b12 + a12 * b22c21 = a21 * b11 + a22 * b21c22 = a21 * b12 + a22 * b22比较(1)(2),C的各元素可以表示为(3)c11 = x1 + x4 - x5 + x7c12 = x3 + x5c21 = x2 + x4c22 = x1 + x3 - x2 + x6根据以上的方法,我们就可以计算4阶矩阵了,先将4阶矩阵A和B划分成四块2阶矩阵,分别利用公式计算它们的乘积,再使用(1)(3)来计算出最后结果。
ma11 ma12 mb11 mb12A4 = ma21 ma22 B4 = mb21 mb22其中a11 a12 a13 a14 b11 b12 b13 b14ma11 = a21 a22 ma12 = a23 a24 mb11 = b21 b22 mb12 = b23 b24a31 a32 a33 a34 b31 b32 b33 b34ma21 = a41 a42 ma22 = a43 a44 mb21 = b41 b42 mb22 = b43 b44实现// 计算2X2矩阵void Multip ly2X2(float& fOut_11, float& fOut_12, float& fOut_21, float& fOut_22,floatf1_11, floatf1_12, floatf1_21, floatf1_22,floatf2_11, floatf2_12, floatf2_21, floatf2_22){constfloatx1((f1_11+ f1_22) * (f2_11+ f2_22));constfloatx2((f1_21+ f1_22) * f2_11);constfloatx3(f1_11* (f2_12- f2_22));constfloatx4(f1_22* (f2_21- f2_11));constfloatx5((f1_11+ f1_12) * f2_22);constfloatx6((f1_21- f1_11) * (f2_11+ f2_12));constfloatx7((f1_12- f1_22) * (f2_21+ f2_22));fOut_11 = x1 + x4 - x5 + x7;fOut_12 = x3 + x5;fOut_21 = x2 + x4;fOut_22 = x1 - x2 + x3 + x6;}// 计算4X4矩阵void Multip ly(CLAYMA TRIX& mOut, constCLAYMA TRIX& m1, constCLAYMA TRIX& m2){floatfTmp[7][4];// (ma11 + ma22) * (mb11 + mb22)Multip ly2X2(fTmp[0][0], fTmp[0][1], fTmp[0][2], fTmp[0][3],m1._11 + m1._33, m1._12 + m1._34, m1._21 + m1._43, m1._22 + m1._44,m2._11 + m2._33, m2._12 + m2._34, m2._21 + m2._43, m2._22 + m2._44);// (ma21 + ma22) * mb11Multip ly2X2(fTmp[1][0], fTmp[1][1], fTmp[1][2], fTmp[1][3],m1._31 + m1._33, m1._32 + m1._34, m1._41 + m1._43, m1._42 + m1._44,m2._11, m2._12, m2._21, m2._22);// ma11 * (mb12 - mb22)Multip ly2X2(fTmp[2][0], fTmp[2][1], fTmp[2][2], fTmp[2][3],m1._11, m1._12, m1._21, m1._22,m2._13 - m2._33, m2._14 - m2._34, m2._23 - m2._43, m2._24 - m2._44);// ma22 * (mb21 - mb11)Multip ly2X2(fTmp[3][0], fTmp[3][1], fTmp[3][2], fTmp[3][3],m1._33, m1._34, m1._43, m1._44,m2._31 - m2._11, m2._32 - m2._12, m2._41 - m2._21, m2._42 - m2._22);// (ma11 + ma12) * mb22Multip ly2X2(fTmp[4][0], fTmp[4][1], fTmp[4][2], fTmp[4][3],m1._11 + m1._13, m1._12 + m1._14, m1._21 + m1._23, m1._22 + m1._24,m2._33, m2._34, m2._43, m2._44);// (ma21 - ma11) * (mb11 + mb12)Multip ly2X2(fTmp[5][0], fTmp[5][1], fTmp[5][2], fTmp[5][3],m1._31 - m1._11, m1._32 - m1._12, m1._41 - m1._21, m1._42 - m1._22,m2._11 + m2._13, m2._12 + m2._14, m2._21 + m2._23, m2._22 + m2._24);// (ma12 - ma22) * (mb21 + mb22)Multip ly2X2(fTmp[6][0], fTmp[6][1], fTmp[6][2], fTmp[6][3],m1._13 - m1._33, m1._14 - m1._34, m1._23 - m1._43, m1._24 - m1._44,m2._31 + m2._33, m2._32 + m2._34, m2._41 + m2._43, m2._42 + m2._44);// 第一块mOut._11 = fTmp[0][0] + fTmp[3][0] - fTmp[4][0] + fTmp[6][0];mOut._12 = fTmp[0][1] + fTmp[3][1] - fTmp[4][1] + fTmp[6][1];mOut._21 = fTmp[0][2] + fTmp[3][2] - fTmp[4][2] + fTmp[6][2];mOut._22 = fTmp[0][3] + fTmp[3][3] - fTmp[4][3] + fTmp[6][3];// 第二块mOut._13 = fTmp[2][0] + fTmp[4][0];mOut._14 = fTmp[2][1] + fTmp[4][1];mOut._23 = fTmp[2][2] + fTmp[4][2];mOut._24 = fTmp[2][3] + fTmp[4][3];// 第三块mOut._31 = fTmp[1][0] + fTmp[3][0];mOut._32 = fTmp[1][1] + fTmp[3][1];mOut._41 = fTmp[1][2] + fTmp[3][2];mOut._42 = fTmp[1][3] + fTmp[3][3];// 第四块mOut._33 = fTmp[0][0] - fTmp[1][0] + fTmp[2][0] + fTmp[5][0];mOut._34 = fTmp[0][1] - fTmp[1][1] + fTmp[2][1] + fTmp[5][1];mOut._43 = fTmp[0][2] - fTmp[1][2] + fTmp[2][2] + fTmp[5][2];mOut._44 = fTmp[0][3] - fTmp[1][3] + fTmp[2][3] + fTmp[5][3];}比较在标准的定义算法中我们需要进行n * n * n次乘法运算,新算法中我们需要进行7log2n次乘法,对于最常用的4阶矩阵:原算法新算法加法次数 48 72(48次加法,24次减法)乘法次数 64 49需要额外空间 16 * sizeof(float) 28 * sizeof(float)新算法要比原算法多了24次减法运算,少了15次乘法。
矩阵乘法
矩阵乘法编辑矩阵乘法是一种高效的算法可以把一些一维递推优化到log(n ),还可以求路径方案等,所以更是一种应用性极强的算法。
矩阵,是线性代数中的基本概念之一。
一个m×n的矩阵就是m×n个数排成m行n列的一个数阵。
由于它把许多数据紧凑的集中到了一起,所以有时候可以简便地表示一些复杂的模型。
矩阵乘法看起来很奇怪,但实际上非常有用,应用也十分广泛。
中文名矩阵乘法外文名Matrix multiplication基本性质结合性等类别对称矩阵等应用学科数学应用领域代数1适用范围2C语言程序3相关符号4基本性质5特殊类别6经典题目7乘法算法1适用范围编辑只有当矩阵A的列数与矩阵B的行数相等时A×B才有意义。
一个m×n的矩阵a(m,n)左乘一个n×p的矩阵b(n,p),会得到一个m×p的矩阵c(m,p)。
左乘:又称前乘,就是乘在左边(即乘号前),比如说,A左乘E即AE。
矩阵乘法满足结合律,但不满足交换律和约去律一般的矩乘要结合快速幂才有效果。
(基本上所有矩阵乘法都要用到快速幂的)在计算机中,一个矩阵实际上就是一个二维数组。
一个m行n列的矩阵与一个n行p 列的矩阵可以相乘,得到的结果是一个m行p列的矩阵,其中的第i行第j列位置上的数为第一个矩阵第i行上的n个数与第二个矩阵第j列上的n个数对应相乘后所得的n个乘积之和。
比如,下面的算式表示一个2行2列的矩阵乘以2行3列的矩阵,其结果是一个2行3列的矩阵。
其中,结果矩阵的那个4(结果矩阵中第二(i)行第二(j)列)=2(第一个矩阵第二(i)行第一列)*2(第二个矩阵中第一行第二(j)列)+0(第一个矩阵第二(i)行第二列)*1(第二个矩阵中第二行第二(j)列):2C语言程序编辑#include<stdio.h>int p, q, k;int fun(float A[][2], float B[][1]{float C[2][1] = { 0 };for (p = 0; p < 2; ++p){for (q = 0; q < 1; ++q){for (k = 0; k < 2; ++k)C[p][q] += A[p][k] * B[k][q];}}for (p = 0; p < 2; p++){for (q = 0; q < 1; q++){printf("%f", C[p][q]);printf("\n");}}return 0;}int main(){float A[2][2] = { 1, 1, 2, 1 }, B[2][1] = {2, 1}; printf("矩阵A*矩阵B为:\n"); // 计算两个矩阵相乘;以[2][2]*[2][1]为例fun(A, B);system("pause");return0;}程序运行结果示例:一般矩乘的代码:function mul( a , b : Tmatrix ) : Tmatrix;vari,j,k : longint;c : Tmatrix;beginfillchar( c , sizeof( c ) , 0 );for k:=0 to n dofor i:=0 to m dofor j:=0 to p dobegininc( c[ i , j ] , a[ i , k ]*b[ k , j ] );if c[ i , j ] > ra then c[ i , j ]:=c[ i , j ] mod ra;end;mul:=c;end;这里我们不介绍其它有关矩阵的知识,只介绍矩阵乘法和相关性质。
矩阵相乘算法实验报告
矩阵相乘算法实验报告引言矩阵相乘是一种常见的数学运算。
在很多领域,如图像处理、机器学习等都会用到矩阵相乘。
因此,优化矩阵相乘的算法对加快计算速度具有重要意义。
本实验旨在比较不同算法在矩阵相乘问题中的性能表现,并探讨其优化的方法。
实验设计实验目的本实验主要有以下几个目的:1. 了解常见的矩阵相乘算法,包括传统的三重循环算法和Strassen算法;2. 比较不同算法的计算性能并分析其优缺点;3. 探讨优化矩阵相乘算法的方法,提高计算速度。
实验流程1. 设计矩阵相乘函数,实现传统的三重循环算法;2. 设计矩阵相乘函数,实现Strassen算法;3. 设计测试用例,并分别用三重循环算法和Strassen算法进行计算;4. 计算并比较两种算法的运行时间、计算复杂度和空间复杂度;5. 分析并探讨优化矩阵相乘算法的方法。
实验结果与分析传统的三重循环算法三重循环算法是最简单直观的矩阵相乘算法。
其思想是通过嵌套循环,对两个矩阵的每个元素进行相乘累加,最终得到结果矩阵。
这个算法的时间复杂度为O(n^3),空间复杂度为O(n^2)。
Strassen算法Strassen算法是一种分治法的思想,它把矩阵相乘的问题转化为更小规模的子问题。
它通过将大矩阵分解成四个小矩阵,然后利用递归的方法求解,最后将四个小矩阵合并得到结果矩阵。
Strassen算法的时间复杂度为O(n^log2(7)),空间复杂度为O(n^2)。
实验结果假设设定矩阵的大小为n*n,我们随机生成了n=100、n=500、n=1000大小的两个矩阵进行实验。
实验结果表明,当矩阵较小(n=100)时,三重循环算法的运行时间略微快于Strassen算法。
但是随着矩阵规模的增大,Strassen算法的计算时间明显优于三重循环算法,尤其是在n=1000时,Strassen算法的优势更加明显。
对于计算复杂度,三重循环算法具有较高的时间复杂度,而Strassen算法的时间复杂度较低,这也是导致Strassen算法在大规模矩阵相乘时性能更好的原因之一。
矩阵乘法的初等变换算法
矩阵乘法的初等变换算法
矩阵乘法,即矩阵相乘,是线性代数学习中经常使用的一种基本操作,它是将两个矩阵相乘然后得到一个新的矩阵。
只有当第一个矩阵一行的元素数量等于第二个矩阵一列的元素数量时两个矩阵才能相乘,乘法符号表示法是A*B,结果矩阵的行数等于A的行数,列数等于B的列数。
初等变换算法是计算机中常用的一种技术,它可以用来减少相乘的两个矩阵之间的乘法次数。
它通过使用一系列的增量操作来实现,它们可以改变待乘矩阵A和B,使整个乘积AB 能够更加高效地进行计算。
最常用的几种增量技术有插点法、消元法、水平叠加法和垂直叠加法等。
插点法是将乘积中的元素按规律做一些定向的变化,使得一部分元素在乘法计算中不参与计算,从而减少乘法次数。
消元法通过将部分乘法相乘元素做合并,从而将乘法次数减少一半,从而实现提高计算效率的目的。
水平叠加法和垂直叠加法都是通过将矩阵A中的所有行(或矩阵B中的所有列)进行叠加,使得乘法次数减少到原有数量的一半以下。
要使用这些初等变换算法,首先必须熟悉这些方法中使用的一些基本的线性代数知识,然后将这些知识应用于对矩阵进行变换的过程中,从而保证计算的正确性。
也就是说,在使用初等变换算法之前,必须弄清楚这些知识的内在本质,否则就无法正确使用这些算法。
初等变换算法是一种可以有效提高矩阵乘法的计算效率的有效方法,如果能够正确应用这些技术,人们就可以更加快速、有效地使用矩阵乘法来完成计算任务。
是一个非常有用的技术。
矩阵连乘算法
矩阵连乘算法
矩阵连乘是指将多个矩阵相乘的计算过程。
例如,对于三个矩阵A,B,C,其连乘结果可以表示为:A x B x C。
矩阵连乘算法是一个动态规划算法,用于寻找最优的矩阵连乘顺序,从而实现最小化矩阵乘法的操作次数。
该算法的基本思想是从最小的子问题开始逐步递推,找到最佳的矩阵连乘顺序。
具体实现过程如下:
1. 定义一个二维数组m[][],其中m[i][j]表示从第i个矩阵到第j个矩阵的最小操作次数。
2. 对于每个长度为1的子序列,即i=j的情况,m[i][j]=0。
3. 对于每个长度大于1的子序列,即i<j的情况,计算m[i][j]的值,其中k是一个中间点,它将序列分为两个子序列:i到k和k+1到j。
用以下公式更新
m[i][j]的值:
m[i][j] = min{m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]}
其中p[]为矩阵的维数,p[i-1]表示第i个矩阵的行数,p[i]表示第i个矩阵的列
数,p[j]表示第j个矩阵的列数。
4. 最后,m[1][n]的值即为矩阵连乘的最小操作次数。
该算法的时间复杂度为O(n^3),其中n为矩阵的个数。
大矩阵乘法
大矩阵乘法大矩阵乘法是一种重要的数学运算,它在计算机科学、物理学、工程学等领域中都有广泛的应用。
矩阵乘法的本质是将两个矩阵相乘,得到一个新的矩阵。
在大矩阵乘法中,矩阵的规模非常大,因此需要使用高效的算法来进行计算。
在大矩阵乘法中,矩阵的规模通常是几千乘几千或者更大。
如果使用朴素的算法来计算矩阵乘法,时间复杂度将会是O(n^3),其中n 是矩阵的规模。
这意味着,当矩阵的规模非常大时,计算时间将会非常长,甚至无法完成。
因此,需要使用更高效的算法来进行计算。
一种常用的高效算法是Strassen算法。
该算法的时间复杂度为O(n^log2(7)),比朴素算法快得多。
该算法的基本思想是将两个矩阵分成四个子矩阵,然后使用递归的方式计算子矩阵的乘积。
通过递归的方式,可以将矩阵乘法的时间复杂度降低到O(n^log2(7))。
除了Strassen算法之外,还有其他一些高效的算法可以用于大矩阵乘法。
例如,Coppersmith-Winograd算法的时间复杂度为O(n^2.376),比Strassen算法更快。
然而,该算法的实现比较复杂,因此在实际应用中并不常用。
在实际应用中,大矩阵乘法通常用于解决一些复杂的问题。
例如,在计算机视觉中,可以使用矩阵乘法来进行图像处理和模式识别。
在物理学中,可以使用矩阵乘法来计算量子力学中的波函数演化。
在工程学中,可以使用矩阵乘法来进行结构分析和优化设计。
大矩阵乘法是一种重要的数学运算,它在各个领域中都有广泛的应用。
为了提高计算效率,需要使用高效的算法来进行计算。
在实际应用中,大矩阵乘法可以用于解决一些复杂的问题,为科学研究和工程设计提供支持。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵相乘的快速算法算法介绍矩阵相乘在进行3D变换的时候是经常用到的。
在应用中常用矩阵相乘的定义算法对其进行计算。
这个算法用到了大量的循环和相乘运算,这使得算法效率不高。
而矩阵相乘的计算效率很大程度上的影响了整个程序的运行速度,所以对矩阵相乘算法进行一些改进是必要的。
这里要介绍的矩阵算法称为斯特拉森方法,它是由v.斯特拉森在1969年提出的一个方法。
我们先讨论二阶矩阵的计算方法。
对于二阶矩阵a11 a12 b11 b12A = a21 a22B = b21 b22先计算下面7个量(1)x1 = (a11 + a22) * (b11 + b22);x2 = (a21 + a22) * b11;x3 = a11 * (b12 - b22);x4 = a22 * (b21 - b11);x5 = (a11 + a12) * b22;x6 = (a21 - a11) * (b11 + b12);x7 = (a12 - a22) * (b21 + b22);再设C = AB。
根据矩阵相乘的规则,C的各元素为(2)c11 = a11 * b11 + a12 * b21c12 = a11 * b12 + a12 * b22c21 = a21 * b11 + a22 * b21c22 = a21 * b12 + a22 * b22比较(1)(2),C的各元素可以表示为(3)c11 = x1 + x4 - x5 + x7c12 = x3 + x5c21 = x2 + x4c22 = x1 + x3 - x2 + x6根据以上的方法,我们就可以计算4阶矩阵了,先将4阶矩阵A和B划分成四块2阶矩阵,分别利用公式计算它们的乘积,再使用(1)(3)来计算出最后结果。
ma11 ma12 mb11 mb12A4 = ma21 ma22 B4 = mb21 mb22其中a11 a12 a13 a14 b11 b12 b13 b14ma11 = a21 a22 ma12 = a23 a24 mb11 = b21 b22 mb12 = b23 b24a31 a32 a33 a34 b31 b32 b33 b34ma21 = a41 a42 ma22 = a43 a44 mb21 = b41 b42 mb22 = b43 b44实现// 计算2X2矩阵void Multiply2X2(float& fOut_11, float& fOut_12, float& fOut_21, float& fOut_22,float f1_11, float f1_12, float f1_21, float f1_22,float f2_11, float f2_12, float f2_21, float f2_22){const float x1((f1_11 + f1_22) * (f2_11 + f2_22));const float x2((f1_21 + f1_22) * f2_11);const float x3(f1_11 * (f2_12 - f2_22));const float x4(f1_22 * (f2_21 - f2_11));const float x5((f1_11 + f1_12) * f2_22);const float x6((f1_21 - f1_11) * (f2_11 + f2_12));const float x7((f1_12 - f1_22) * (f2_21 + f2_22));fOut_11 = x1 + x4 - x5 + x7;fOut_12 = x3 + x5;fOut_21 = x2 + x4;fOut_22 = x1 - x2 + x3 + x6;}// 计算4X4矩阵void Multiply(CLAYMATRIX& mOut, const CLAYMATRIX& m1, const CLAYMATRIX& m2) {float fTmp[7][4];// (ma11 + ma22) * (mb11 + mb22)Multiply2X2(fTmp[0][0], fTmp[0][1], fTmp[0][2], fTmp[0][3],m1._11 + m1._33, m1._12 + m1._34, m1._21 + m1._43, m1._22 + m1._44,m2._11 + m2._33, m2._12 + m2._34, m2._21 + m2._43, m2._22 + m2._44);// (ma21 + ma22) * mb11Multiply2X2(fTmp[1][0], fTmp[1][1], fTmp[1][2], fTmp[1][3],m1._31 + m1._33, m1._32 + m1._34, m1._41 + m1._43, m1._42 + m1._44,m2._11, m2._12, m2._21, m2._22);// ma11 * (mb12 - mb22)Multiply2X2(fTmp[2][0], fTmp[2][1], fTmp[2][2], fTmp[2][3],m1._11, m1._12, m1._21, m1._22,m2._13 - m2._33, m2._14 - m2._34, m2._23 - m2._43, m2._24 - m2._44);// ma22 * (mb21 - mb11)Multiply2X2(fTmp[3][0], fTmp[3][1], fTmp[3][2], fTmp[3][3],m1._33, m1._34, m1._43, m1._44,m2._31 - m2._11, m2._32 - m2._12, m2._41 - m2._21, m2._42 - m2._22);// (ma11 + ma12) * mb22Multiply2X2(fTmp[4][0], fTmp[4][1], fTmp[4][2], fTmp[4][3],m1._11 + m1._13, m1._12 + m1._14, m1._21 + m1._23, m1._22 + m1._24,m2._33, m2._34, m2._43, m2._44);// (ma21 - ma11) * (mb11 + mb12)Multiply2X2(fTmp[5][0], fTmp[5][1], fTmp[5][2], fTmp[5][3],m1._31 - m1._11, m1._32 - m1._12, m1._41 - m1._21, m1._42 - m1._22,m2._11 + m2._13, m2._12 + m2._14, m2._21 + m2._23, m2._22 + m2._24);// (ma12 - ma22) * (mb21 + mb22)Multiply2X2(fTmp[6][0], fTmp[6][1], fTmp[6][2], fTmp[6][3],m1._13 - m1._33, m1._14 - m1._34, m1._23 - m1._43, m1._24 - m1._44,m2._31 + m2._33, m2._32 + m2._34, m2._41 + m2._43, m2._42 + m2._44);// 第一块mOut._11 = fTmp[0][0] + fTmp[3][0] - fTmp[4][0] + fTmp[6][0];mOut._12 = fTmp[0][1] + fTmp[3][1] - fTmp[4][1] + fTmp[6][1];mOut._21 = fTmp[0][2] + fTmp[3][2] - fTmp[4][2] + fTmp[6][2];mOut._22 = fTmp[0][3] + fTmp[3][3] - fTmp[4][3] + fTmp[6][3];// 第二块mOut._13 = fTmp[2][0] + fTmp[4][0];mOut._14 = fTmp[2][1] + fTmp[4][1];mOut._23 = fTmp[2][2] + fTmp[4][2];mOut._24 = fTmp[2][3] + fTmp[4][3];// 第三块mOut._31 = fTmp[1][0] + fTmp[3][0];mOut._32 = fTmp[1][1] + fTmp[3][1];mOut._41 = fTmp[1][2] + fTmp[3][2];mOut._42 = fTmp[1][3] + fTmp[3][3];// 第四块mOut._33 = fTmp[0][0] - fTmp[1][0] + fTmp[2][0] + fTmp[5][0];mOut._34 = fTmp[0][1] - fTmp[1][1] + fTmp[2][1] + fTmp[5][1];mOut._43 = fTmp[0][2] - fTmp[1][2] + fTmp[2][2] + fTmp[5][2];mOut._44 = fTmp[0][3] - fTmp[1][3] + fTmp[2][3] + fTmp[5][3];}比较在标准的定义算法中我们需要进行n * n * n次乘法运算,新算法中我们需要进行7log2n次乘法,对于最常用的4阶矩阵:原算法新算法加法次数 48 72(48次加法,24次减法)乘法次数 64 49需要额外空间 16 * sizeof(float) 28 * sizeof(float)新算法要比原算法多了24次减法运算,少了15次乘法。
但因为浮点乘法的运算速度要远远慢于加/减法运算,所以新算法的整体速度有所提高。
一、两个矩阵相乘的经典算法:若设Q=M*N其中,M是m1*n1矩阵,N是m2*n2矩阵。
当n1=m2时有:for (i=1;ifor ( j=1; j<=n2; ++j){Q[i][j]=0;for(k=1; k<=n1; ++k) Q[i][j]+=M[i][k]*N[k][j];}此算法的时间复杂度是O(m1*n1*n2)。
二、斯特拉森算法斯特拉森方法,是由v.斯特拉森在1969年提出的一个方法。
我们先讨论二阶矩阵的计算方法。
对于二阶矩阵a11 a12 b11 b12A = a21 a22B = b21 b22先计算下面7个量(1)x1 = (a11 + a22) * (b11 + b22);x2 = (a21 + a22) * b11;x3 = a11 * (b12 - b22);x4 = a22 * (b21 - b11);x5 = (a11 + a12) * b22;x6 = (a21 - a11) * (b11 + b12);x7 = (a12 - a22) * (b21 + b22);再设C = AB。