矩阵连乘问题（动态规划）

黎明

公告

欢迎来到黎明的小站。本站用于堆叠平时的技术痕迹，记录一些值得留存的想法。

标签

0-1 背包 Algorithm Backup Cloudflare R2 CSS DFS Dijkstra DNS Ford-Fulkerson GitHub Actions HTML Komari Monitor Kruskal Nginx Ops PicGo Prim P值 Restic UI Web Design 三角函数中心极限定理二分搜索二叉树二维随机变量二进制优先队列伯努利概型位运算假设检验最优装载最大流最小生成树最短路径分布函数分支限界分治法加工顺序问题动态规划区间估计区间调度协方差参数估计双指针反三角函数古典概型哈夫曼编码回溯法回溯算法图床图论堆排序增广路大数定律学习路线导数并查集归并排序快速幂快速排序抽样分布拒绝域探针数值随机化算法数字特征数学期望数据压缩数据结构数理统计数组方差旅行商问题显著性水平条件分布条件概率标号法栈概率分布概率统计概率论正态近似点估计独立性相关系数矩阵离散型分布积分简单随机样本素数环统计量网络流置信区间联合分布蒙特卡罗算法贪心算法边缘分布连续型分布链表队列随机事件随机变量随机算法随机采样高等数学

黎明

公告

欢迎来到黎明的小站。本站用于堆叠平时的技术痕迹，记录一些值得留存的想法。

关于我

标签

0-1 背包 Algorithm Backup Cloudflare R2 CSS DFS Dijkstra DNS Ford-Fulkerson GitHub Actions HTML Komari Monitor Kruskal Nginx Ops PicGo Prim P值 Restic UI Web Design 三角函数中心极限定理二分搜索二叉树二维随机变量二进制优先队列伯努利概型位运算假设检验最优装载最大流最小生成树最短路径分布函数分支限界分治法加工顺序问题动态规划区间估计区间调度协方差参数估计双指针反三角函数古典概型哈夫曼编码回溯法回溯算法图床图论堆排序增广路大数定律学习路线导数并查集归并排序快速幂快速排序抽样分布拒绝域探针数值随机化算法数字特征数学期望数据压缩数据结构数理统计数组方差旅行商问题显著性水平条件分布条件概率标号法栈概率分布概率统计概率论正态近似点估计独立性相关系数矩阵离散型分布积分简单随机样本素数环统计量网络流置信区间联合分布蒙特卡罗算法贪心算法边缘分布连续型分布链表队列随机事件随机变量随机算法随机采样高等数学

黎明

公告

欢迎来到黎明的小站。本站用于堆叠平时的技术痕迹，记录一些值得留存的想法。

关于我

标签

0-1 背包 Algorithm Backup Cloudflare R2 CSS DFS Dijkstra DNS Ford-Fulkerson GitHub Actions HTML Komari Monitor Kruskal Nginx Ops PicGo Prim P值 Restic UI Web Design 三角函数中心极限定理二分搜索二叉树二维随机变量二进制优先队列伯努利概型位运算假设检验最优装载最大流最小生成树最短路径分布函数分支限界分治法加工顺序问题动态规划区间估计区间调度协方差参数估计双指针反三角函数古典概型哈夫曼编码回溯法回溯算法图床图论堆排序增广路大数定律学习路线导数并查集归并排序快速幂快速排序抽样分布拒绝域探针数值随机化算法数字特征数学期望数据压缩数据结构数理统计数组方差旅行商问题显著性水平条件分布条件概率标号法栈概率分布概率统计概率论正态近似点估计独立性相关系数矩阵离散型分布积分简单随机样本素数环统计量网络流置信区间联合分布蒙特卡罗算法贪心算法边缘分布连续型分布链表队列随机事件随机变量随机算法随机采样高等数学

站点统计

文章

44

分类

6

标签

105

总字数

124,816

运行天数

0 天

最后活动

0 天前

1764 字

5 分钟

矩阵连乘问题（动态规划）

2026-06-05 12:45:48

Algorithm

/

动态规划

/

矩阵

1. 问题描述#

给定矩阵序列 $A_1, A_2, \ldots, A_n$ ，矩阵相乘顺序不能改变，但可以改变加括号的方式。

目标：找到一种加括号方式，使矩阵连乘的总计算次数最少。

需要注意的是，矩阵连乘问题不是要求真正算出矩阵乘积，而是要求找到最优计算顺序。

2. 括号的位置会影响计算次数#

矩阵相乘有一个很容易被忽略的点：先算谁，会改变中间结果的规模。

对于两个矩阵 $A(p \times q)$ 和 $B(q \times r)$ ，它们相乘需要的计算次数是：

p \times q \times r

而乘完之后，得到的新矩阵规模是：

p \times r

中间的 $q$ 只负责“对齐”两个矩阵，真正留下来的只有外侧的 $p$ 和 $r$ ：

(p \times q) \times (q \times r) = p \times r

这就带来一个问题：如果有多个矩阵连乘，某一步产生的中间矩阵太大，后面的计算量也会被一起放大。

来看一个例子，维度数组为：

p = [2,\ 3,\ 6,\ 4,\ 2,\ 7]

对应 5 个矩阵：

A_1(2 \times 3),\quad A_2(3 \times 6),\quad A_3(6 \times 4),\quad A_4(4 \times 2),\quad A_5(2 \times 7)

矩阵顺序不能换，仍然只能按 $A_1A_2A_3A_4A_5$ 来乘。但括号可以换，而这正好决定了先算哪一部分。

例如：

括号方式	总次数
$((((A_1A_2)A_3)A_4)A_5)$	214
$((A_1(A_2(A_3A_4)))A_5)$	124

可以看到，两种写法的数学结果一样，但计算量不同。

所以，矩阵连乘问题真正关心的不是乘积本身，而是：

先算哪一部分，才能让总计算量最小。

3. 算法策略#

矩阵连乘问题使用：

\boxed{\text{动态规划}}

原因是它满足动态规划的两个特点：

最优子结构：整体最优解可以由子问题的最优解组成。
重叠子问题：不同括号方式中会反复用到相同的子问题。

例如要求 $A_1A_2A_3$ 的最优计算方式，可以拆成：

A_1 \mid A_2A_3

或：

A_1A_2 \mid A_3

每一种断开方式都会产生左右两个子问题。动态规划的思路就是先求小区间的最优值，再逐步推出大区间的最优值。

4. 状态定义#

设矩阵 $A_i$ 的规模为：

A_i = p_{i-1} \times p_i

其中， $p$ 是维度数组。

例如：

p = [2,\ 3,\ 6,\ 4,\ 2,\ 7]

则：

A_1 = p_0 \times p_1 = 2 \times 3

A_2 = p_1 \times p_2 = 3 \times 6

A_3 = p_2 \times p_3 = 6 \times 4

A_4 = p_3 \times p_4 = 4 \times 2

A_5 = p_4 \times p_5 = 2 \times 7

所以，矩阵 $A_i$ 的行数是 $p_{i-1}$ ，列数是 $p_i$ 。

这里容易混淆的一点是：

$A_1, A_2, A_3$ 是矩阵编号，通常从 $1$ 开始。
$p_0, p_1, p_2, p_3$ 是维度数组下标，通常从 $0$ 开始。

所以才会有：

A_i = p_{i-1} \times p_i

动态规划中主要使用两张表： $m$ 表和 $s$ 表。

m[i][j] = \text{计算 } A_iA_{i+1}\cdots A_j \text{ 的最少乘法次数}

s[i][j] = \text{取得最优值时的断开位置 } k

表	含义	作用
$m[i][j]$	从 $A_i$ 乘到 $A_j$ 的最少乘法次数	记录最优值
$s[i][j]$	从 $A_i$ 乘到 $A_j$ 时的最优断点	还原最优括号

例如：

m[1][5]

表示计算 $A_1A_2A_3A_4A_5$ 的最少乘法次数。

如果：

s[1][5] = 4

表示最优断点在 $A_4$ 后面：

A_1A_2A_3A_4 \mid A_5

初始条件为：

m[i][i] = 0

因为单个矩阵不需要相乘。

5. 状态转移方程#

要求 $m[i][j]$ ，也就是要求 $A_i \cdots A_j$ 的最少乘法次数。

可以在某个位置 $k$ 处断开：

A_i \cdots A_k \mid A_{k+1} \cdots A_j

其中：

i \le k < j

总代价由三部分组成：

\text{总代价} = \text{左半部分代价} + \text{右半部分代价} + \text{最后合并代价}

所以状态转移方程为：

m[i][j] = \min_{i \le k < j} ( m[i][k] + m[k+1][j] + p_{i-1} \cdot p_k \cdot p_j )

其中：

$m[i][k]$ 表示左半部分 $A_i \cdots A_k$ 的最少乘法次数。
$m[k+1][j]$ 表示右半部分 $A_{k+1} \cdots A_j$ 的最少乘法次数。
$p_{i-1} \cdot p_k \cdot p_j$ 表示左右两部分最后合并时的乘法次数。
$k$ 表示当前尝试的断点。

为什么最后合并代价是：

p_{i-1} \cdot p_k \cdot p_j

因为一串矩阵相乘后，结果矩阵的规模等于：

\text{第一个矩阵的行数} \times \text{最后一个矩阵的列数}

所以：

A_i \cdots A_k \text{ 的结果规模为 } p_{i-1} \times p_k

A_{k+1} \cdots A_j \text{ 的结果规模为 } p_k \times p_j

最后合并时，相当于计算：

(p_{i-1} \times p_k) \times (p_k \times p_j)

因此乘法次数为：

p_{i-1} \cdot p_k \cdot p_j

用一句话理解这个公式：

枚举所有断点 $k$ ，把矩阵链分成左右两部分，先算左右两边的最优代价，再加上最后合并的代价，最后取最小值。

6. 算法步骤#

初始化 $m[i][i] = 0$ 。
按矩阵链长度 $l = 2, 3, \ldots, n$ 从短到长填表。
对每个区间 $[i,\ j]$ ，枚举断点 $k$ 。
使用状态转移方程计算当前代价。
如果当前代价更小，就更新 $m[i][j]$ ，并把断点 $k$ 记录到 $s[i][j]$ 。
最后， $m[1][n]$ 就是最少乘法次数。
根据 $s$ 表可以还原最优加括号方式。

7. 样例计算#

设维度数组为：

p = [2,\ 3,\ 6,\ 4,\ 2,\ 7]

对应矩阵为：

A_1(2 \times 3),\quad A_2(3 \times 6),\quad A_3(6 \times 4),\quad A_4(4 \times 2),\quad A_5(2 \times 7)

7.1 长度为 2#

先计算两个矩阵相乘的情况。

m[1][2] = 2 \times 3 \times 6 = 36

m[2][3] = 3 \times 6 \times 4 = 72

m[3][4] = 6 \times 4 \times 2 = 48

m[4][5] = 4 \times 2 \times 7 = 56

7.2 长度为 3#

计算 $m[1][3]$ ：

断点 $k=1$ ：

m[1][1] + m[2][3] + p_0p_1p_3 = 0 + 72 + 2 \times 3 \times 4 = 96

断点 $k=2$ ：

m[1][2] + m[3][3] + p_0p_2p_3 = 36 + 0 + 2 \times 6 \times 4 = 84

所以：

m[1][3] = 84,\quad s[1][3] = 2

计算 $m[2][4]$ ：

断点 $k=2$ ：

0 + 48 + 3 \times 6 \times 2 = 84

断点 $k=3$ ：

72 + 0 + 3 \times 4 \times 2 = 96

所以：

m[2][4] = 84,\quad s[2][4] = 2

计算 $m[3][5]$ ：

断点 $k=3$ ：

0 + 56 + 6 \times 4 \times 7 = 224

断点 $k=4$ ：

48 + 0 + 6 \times 2 \times 7 = 132

所以：

m[3][5] = 132,\quad s[3][5] = 4

7.3 长度为 4#

计算 $m[1][4]$ ：

断点 $k=1$ ：

0 + 84 + 2 \times 3 \times 2 = 96

断点 $k=2$ ：

36 + 48 + 2 \times 6 \times 2 = 108

断点 $k=3$ ：

84 + 0 + 2 \times 4 \times 2 = 100

所以：

m[1][4] = 96,\quad s[1][4] = 1

计算 $m[2][5]$ ：

断点 $k=2$ ：

0 + 132 + 3 \times 6 \times 7 = 258

断点 $k=3$ ：

72 + 56 + 3 \times 4 \times 7 = 212

断点 $k=4$ ：

84 + 0 + 3 \times 2 \times 7 = 126

所以：

m[2][5] = 126,\quad s[2][5] = 4

7.4 长度为 5#

计算 $m[1][5]$ ：

断点 $k=1$ ：

0 + 126 + 2 \times 3 \times 7 = 168

断点 $k=2$ ：

36 + 132 + 2 \times 6 \times 7 = 252

断点 $k=3$ ：

84 + 56 + 2 \times 4 \times 7 = 196

断点 $k=4$ ：

96 + 0 + 2 \times 2 \times 7 = 124

所以：

m[1][5] = 124,\quad s[1][5] = 4

8. 最优值表与决策表#

8.1 最优值表 $m[i][j]$ #

$m[i][j]$	$j=1$	$j=2$	$j=3$	$j=4$	$j=5$
$i=1$	0	36	84	96	124
$i=2$	—	0	72	84	126
$i=3$	—	—	0	48	132
$i=4$	—	—	—	0	56
$i=5$	—	—	—	—	0

其中：

m[1][5] = 124

表示计算 $A_1A_2A_3A_4A_5$ 的最少乘法次数为 $124$ 。

8.2 最优决策表 $s[i][j]$ #

$s[i][j]$	$j=1$	$j=2$	$j=3$	$j=4$	$j=5$
$i=1$	—	1	2	1	4
$i=2$	—	—	2	2	4
$i=3$	—	—	—	3	4
$i=4$	—	—	—	—	4
$i=5$	—	—	—	—	—

其中：

s[1][5] = 4

表示最优断点在 $A_4$ 后面：

A_1A_2A_3A_4 \mid A_5

9. 如何根据 $s$ 表画括号？#

$s[i][j] = k$ 的意思是：

从 $A_i$ 到 $A_j$ 这一段，最优断点在 $A_k$ 后面。

也就是：

A_i \cdots A_k \mid A_{k+1} \cdots A_j

画括号时要注意：

竖线 $\mid$ 表示“从哪里断开”。
括号表示“这一段要先作为一个整体计算”。

所以如果：

s[3][4] = 3

表示：

A_3 \mid A_4

写成括号就是：

(A_3A_4)

不是把竖线写进最终答案，而是把断开的左右两部分合成一个整体。

9.1 根据 $s$ 表拆分#

从整体开始看：

s[1][5] = 4

所以：

A_1A_2A_3A_4 \mid A_5

继续看左半部分：

s[1][4] = 1

所以：

A_1 \mid A_2A_3A_4

继续看右侧的 $A_2A_3A_4$ ：

s[2][4] = 2

所以：

A_2 \mid A_3A_4

继续看右侧的 $A_3A_4$ ：

s[3][4] = 3

所以：

A_3 \mid A_4

拆分过程可以写成：

1
A1 A2 A3 A4 A5
2
        |
3
        k=4
4
        ↓
5
A1 A2 A3 A4 | A5
6

7
A1 A2 A3 A4
8
|
9
k=1
10
↓
11
A1 | A2 A3 A4
12

13
A2 A3 A4
14
|
15
k=2
16
↓
17
A2 | A3 A4
18

19
A3 A4
20
|
21
k=3
22
↓
23
A3 | A4

9.2 从内向外加括号#

根据上面的拆分，最里面是：

A_3 \mid A_4

所以先写：

(A_3A_4)

然后把 $A_2$ 加进来：

A_2(A_3A_4)

加成一个整体：

(A_2(A_3A_4))

再把 $A_1$ 加进来：

A_1(A_2(A_3A_4))

加成一个整体：

(A_1(A_2(A_3A_4)))

最后把 $A_5$ 加进来：

((A_1(A_2(A_3A_4)))A_5)

所以，从内向外写括号的过程是：

A_3A_4 \rightarrow (A_3A_4)

A_2(A_3A_4) \rightarrow (A_2(A_3A_4))

A_1(A_2(A_3A_4)) \rightarrow (A_1(A_2(A_3A_4)))

(A_1(A_2(A_3A_4)))A_5 \rightarrow ((A_1(A_2(A_3A_4)))A_5)

最终最优括号为：

\boxed{((A_1(A_2(A_3A_4)))A_5)}

最少乘法次数为：

\boxed{124}

样例计算过程

一句话总结：

断点告诉你从哪里切，括号告诉你哪一段先算。

10. Java 实现#

1
public class MatrixChainMultiplication {
2

3
    static int[][] m; // m[i][j] 表示 Ai 到 Aj 的最少乘法次数
4
    static int[][] s; // s[i][j] 表示最优断点位置
5

6
    public static void matrixChainOrder(int[] p) {
7
        int n = p.length - 1; // 矩阵个数
8

9
        m = new int[n + 1][n + 1];
10
        s = new int[n + 1][n + 1];
11

12
        // 单个矩阵不需要相乘
13
        for (int i = 1; i <= n; i++) {
14
            m[i][i] = 0;
15
        }
16

17
        // len 表示当前矩阵链长度
18
        for (int len = 2; len <= n; len++) {
19
            for (int i = 1; i <= n - len + 1; i++) {
20
                int j = i + len - 1;
21

22
                m[i][j] = Integer.MAX_VALUE;
23

24
                // 枚举断点 k
25
                for (int k = i; k < j; k++) {
26
                    int cost = m[i][k]
27
                            + m[k + 1][j]
28
                            + p[i - 1] * p[k] * p[j];
29

30
                    if (cost < m[i][j]) {
31
                        m[i][j] = cost;
32
                        s[i][j] = k;
33
                    }
34
                }
35
            }
36
        }
37
    }
38

39
    public static void printOptimalParens(int i, int j) {
40
        if (i == j) {
41
            System.out.print("A" + i);
42
        } else {
43
            System.out.print("(");
44
            printOptimalParens(i, s[i][j]);
45
            printOptimalParens(s[i][j] + 1, j);
46
            System.out.print(")");
47
        }
48
    }
49

50
    public static void main(String[] args) {
51
        // p = [2, 3, 6, 4, 2, 7]
52
        // A1: 2×3
53
        // A2: 3×6
54
        // A3: 6×4
55
        // A4: 4×2
56
        // A5: 2×7
57
        int[] p = {2, 3, 6, 4, 2, 7};
58

59
        int n = p.length - 1;
60

61
        matrixChainOrder(p);
62

63
        System.out.println("最少乘法次数：" + m[1][n]);
64

65
        System.out.print("最优加括号方式：");
66
        printOptimalParens(1, n);
67
    }
68
}

运行结果：

1
最少乘法次数：124
2
最优加括号方式：((A1(A2(A3A4)))A5)

11. 总结#

矩阵连乘问题的关键不是计算矩阵乘积，而是寻找最优计算顺序。

核心内容可以概括为：

使用动态规划解决。
$m[i][j]$ 表示 $A_i$ 到 $A_j$ 的最少乘法次数。
$s[i][j]$ 表示取得最优值时的断开位置。
$k$ 表示当前尝试的断点。
$A_i = p_{i-1} \times p_i$ 。
一串矩阵相乘后的规模等于第一个矩阵的行数乘最后一个矩阵的列数。
状态转移方程为：

m[i][j] = \min_{i \le k < j} ( m[i][k] + m[k+1][j] + p_{i-1} \cdot p_k \cdot p_j )

通俗理解就是：

把矩阵链从不同位置切开，分别计算左右两边的最优代价，再加上最后合并的代价，最后选择代价最小的切法。

如果这篇文章对你有帮助，欢迎分享给更多人！

矩阵连乘问题（动态规划）

https://dawn114514.site/posts/algorithm/matrixchain/

作者

黎明

发布于

2026-06-05 12:45:48

许可协议

MIT

部分信息可能已经过时

素数环问题（回溯法）

用 Restic 备份本地却在疯狂吃磁盘？一次去重备份的本地瘦身实录

わたしの部屋

1. 问题描述#

2. 括号的位置会影响计算次数#

3. 算法策略#

4. 状态定义#

5. 状态转移方程#

6. 算法步骤#

7. 样例计算#

7.1 长度为 2#

7.2 长度为 3#

7.3 长度为 4#

7.4 长度为 5#

8. 最优值表与决策表#

8.1 最优值表 $m[i][j]$ #

8.2 最优决策表 $s[i][j]$ #

9. 如何根据 $s$ 表画括号？#

9.1 根据 $s$ 表拆分#

9.2 从内向外加括号#

10. Java 实现#

11. 总结#

目录

わたしの部屋

1. 问题描述#

2. 括号的位置会影响计算次数#

3. 算法策略#

4. 状态定义#

5. 状态转移方程#

6. 算法步骤#

7. 样例计算#

7.1 长度为 2#

7.2 长度为 3#

7.3 长度为 4#

7.4 长度为 5#

8. 最优值表与决策表#

8.1 最优值表 m[i][j]m[i][j]m[i][j]#

8.2 最优决策表 s[i][j]s[i][j]s[i][j]#

9. 如何根据 sss 表画括号？#

9.1 根据 sss 表拆分#

9.2 从内向外加括号#

10. Java 实现#

11. 总结#

目录

8.1 最优值表 $m[i][j]$ #

8.2 最优决策表 $s[i][j]$ #

9. 如何根据 $s$ 表画括号？#

9.1 根据 $s$ 表拆分#