1. Introduction

图形由顶点/节点和连接这些顶点的边/线组成。

图可以是无向的(意味着在与每个双向边相关联的两个顶点之间没有区别)或者可以指向图(意味着其边缘从一个顶点指向另一个顶点但不一定在另一个方向上)。

可以对图形进行加权(通过向每个边缘分配权重,其表示与该连接相关联的数值)或者图形可以是未加权的(所有边缘具有单位权重1或者所有边缘具有相同的恒定权重)。

1-1. 简单图形

我们在VisuAlgo中讨论的大多数图形问题都涉及简单图

在一个简单图中,没有(自 - )环边(连接顶点与自身的边),没有多边/平行边(同一对顶点之间的边)。换句话说:在一对不同的顶点之间最多只能有一条边。

简单图中的边E的数量范围仅为0到O(V2)。

简单图上的图算法比非简单图上的算法更容易。

1-2. 术语,第1部分

在无向边e:(uv)中,我们称其与两个端点顶点:uv相邻。如果两个顶点与一个公共边相邻,我们称它们为相邻(或邻居)。例如,边 (0, 2) 与顶点 0+2 相邻,顶点 0+2 是相邻的。


如果两条边与一个公共顶点相邻,我们称它们为相邻。例如,边 (0, 2) 和 (2, 4) 是相邻的。


在无向图中,顶点v的度是与顶点v相邻的边的数量。度为0的顶点被称为孤立顶点。例如,顶点 0/2/6 的度分别为 2/3/1。


G的子图G'是一个包含G的顶点和边的子集的(较小的)图。例如,三角形 {0, 1, 2} 是当前显示图的子图。

1-3. 术语,第2部分

(无向)图G中(长度为n)的路径是顶点序列{v0,v1,...,vn-1,vn},使得在vivi+1∀i∈[0..n-1]之间存在边缘。
如果路径上没有重复的顶点,我们称这样的路径为简单路径。
例如,{0,1,2,4,5}是当前显示的图形中的一个简单路径。

1-4. 术语,第3部分

An undirected graph G is called connected if there is a path between every pair of distinct vertices of G. For example, the currently displayed graph is not a connected graph.


An undirected graph C is called a connected component of the undirected graph G if:
1). C is a subgraph of G;
2). C is connected;
3). no connected subgraph of G has C as a subgraph and contains vertices or edges that are not in C (i.e., C is the maximal subgraph that satisfies the other two criteria).


For example, the currently displayed graph have {0, 1, 2, 3, 4} and {5, 6} as its two connected components.


A cut vertex/bridge is a vertex/edge that increases the graph's number of connected components if deleted. For example, in the currently displayed graph, there is no cut vertex, but edge (5, 6) is a bridge.

1-5. 术语,第4部分

In a directed graph, some of the terminologies mentioned earlier have small adjustments.


If we have a directed edge e: (uv), we say that v is adjacent to u but not necessarily in the other direction. For example, 1 is adjacent to 0 but 0 is not adjacent to 1 in the currently displayed directed graph.


In a directed graph, we have to further differentiate the degree of a vertex v into in-degree and out-degree. The in-degree/out-degree is the number of edges coming-into/going-out-from v, respectively. For example, vertex 1 has in-degree/out-degree of 2/1, respectively.

1-6. Terminologies, Part 5

In a directed graph, we extend the concept of Connected Component (CC) into Strongly Connected Component (SCC). A directed graph G is called strongly connected if there is a path in each direction between every pair of distinct vertices of G.


A directed graph SCC is called a strongly connected component of the directed graph G if:
1). SCC is a subgraph of G;
2). SCC is strongly connected;
3). no connected subgraph of G has SCC as a subgraph and contains vertices or edges that are not in SCCC (i.e., SCC is the maximal subgraph that satisfies the other two criteria).


In the currently displayed directed graph, we have {0}, {1, 2, 3}, and {4, 5, 6, 7} as its three SCCs.

1-7. Terminologies, Part 6

一个循环是一条起始和结束于同一顶点的路径。


一个无环图是一个不包含任何循环的图。


在一个无向图中,每一条无向边都会形成一个平凡的循环(长度为2),尽管我们通常不会将其分类为循环。


一个同时也是无环的有向图有一个特殊的名字:有向无环图(DAG),如上图所示。


我们可以在无环图上执行一些有趣的算法,这将在这个可视化页面和VisuAlgo的其他图形可视化页面中进行探索。

1-8. 特殊图形

具有涉及其顶点和/或边结构的特定属性的图可以使用其特定名称来调用,如树(如当前所示),完整图,二分图,有向无环图(DAG),以及使用频率较低的图:平面图,线图,星图,轮图等

在此可视化中,我们将在稍后突出显示前四个特殊图表。

2. 图是普遍的

图表在现实生活中经常以各种形式出现。因此,解决图形问题的最重要部分是图形建模部分,即将手中的问题简化为图形术语:顶点,边,权重等。

2-1. 示例 - 更容易看到,1

社交网络:顶点可以代表人,边缘代表人与人之间的联系(通常是无向和未加权)。

例如,请参阅当前显示的无向图。此图显示了它们之间的7个顶点(人)和8个边(连接/关系)。也许我们可以提出这样的问题:

谁是0的人的朋友?
谁拥有最多的朋友?
有没有孤立的人(那些没有朋友的人)?
两个陌生人之间是否有共同的朋友:3号人和5号人?
等等...

2-2. 示例 - 更容易看到,2

运输网络:顶点可以表示站点,边缘表示站点之间的连接(通常是加权的)。

例如,请参阅当前显示的有向加权图。该图显示了5个顶点(站点/位置)和6个边缘(站点之间的连接/道路,具有正的权重行进时间,如图所示)。假设我们正在开车。我们或许可以问一下从0号站到4号站的路径是什么,以便我们用最少的时间到达4号站?

讨论:想想其他一些可以建模为图形的现实生活场景。

2-3. 示例 - 更难看到

[This is a hidden slide]

3. 模式

要在图形绘制模式之间切换,请选择相应的标题。 我们有:

  1. U/U = 无向/不加权,
  2. U/W = 无向/加权,
  3. D/U = 有向/不加权, and
  4. D/W = 有向/加权.

我们根据所选模式限制您可以绘制的图形类型。

4. 可视化

您可以点击任何一个示例图,并查看其示例图绘制,这是该图的二维描述。请注意,同一图可以有(无限)多种可能的图绘制。


您可以通过点击 "编辑图" 进一步编辑(添加/删除/重新定位顶点或添加/更改权重/删除边)当前显示的图(在编辑图窗口中阅读相关的帮助信息)。

4-1. 可视化约束

我们将 VisuAlgo 中讨论的图限制为简单图。请参考这个幻灯片中的讨论。


虽然现在我们并没有真正限制你可以在屏幕上绘制的顶点数量,但我们建议你不要绘制超过10个顶点,范围从顶点0到顶点9(因为这个图的邻接矩阵已经包含10x10 = 100个单元格)。这与前面的简单图约束一起,限制了无向/有向边的数量分别为45/90。

5. 图形的示例

所有示例图都可以在这里找到。我们为每个类别(U/U,U/W,D/U,D/W)提供七个“最相关”的示例图。


请记住,加载这些示例图之一后,您可以进一步编辑当前显示的图以适应您的需求。

6. 特殊图形

树,完全图,二部图,有向无环图 (DAG) 是特殊图的属性。当你编辑图时,这些属性会被立即检查和更新。


还有其他不常用的特殊图:平面图,线图,星图,轮图等,但在这个可视化中,它们目前还不能被自动检测。

6-1. 特殊图形 - 树,第1部分

是一个具有V个顶点和E = V-1条边的连通图,无环,并且任意两个顶点之间有一个唯一的路径。通常,树是在无向图上定义的。


一个无向树(如上所述)实际上包含了平凡的循环(由其双向边引起),但它不包含非平凡的循环(长度为3或更大)。一个有向树显然是无环的。


由于树只有V-1条边,它通常被认为是一个稀疏图。


我们目前展示的是U/U: 树的例子。你可以进入'探索模式'并编辑/绘制你自己的树。

6-2. 特殊图形 - 树,第2部分

并非所有的树都有相同的图形绘制布局,即顶部有一个特殊的根顶点,底部有叶顶点(度为1的顶点)。上面显示的(星形)图也是一棵树,因为它满足树的属性。


将其中一个顶点指定为根顶点的树被称为有根树。


我们总是可以通过指定一个特定的顶点(通常是顶点0)为根,然后从根运行DFS 或 BFS 算法,将任何树转化为有根树。这个"根化树"的过程(对于一个还没有被视觉化绘制为树的树)有一个视觉解释。想象每个顶点是一个小球(有非零的重量),每条边是一条相同长度的绳子,连接两个相邻的球。现在,如果我们拿起根球/顶点并将其拉起,那么重力将拉动其余的球向下,这就是树的DFS/BFS生成树。

6-3. 特殊图形 - 树,第3部分

在一个有根树中,我们有层级(父节点,子节点,祖先,后代),子树,层次和高度的概念。我们将通过例子来说明这些概念,因为它们的含义与现实生活中的对应物一样:

  1. 0/1/7/9/4的父节点分别是无/0/1/8/3,
  2. 0/1/7的子节点分别是 {1,8}/{2,3,6,7}/无,
  3. 4/6/8的祖先分别是 {3,1,0}/{1,0}/{0},
  4. 4和6的最低公共祖先是1。
  5. 1/8的后代分别是 {2,3,4,5,6,7}/{9},
  6. 以1为根的子树包括1,它的后代和所有相关的边,
  7. 0/1/2/3级成员分别是 {0}/{1,8}/{2,3,6,7,9}/{4,5},
  8. 这个有根树的高度是它的最大层级 = 3。

6-4. 特殊图形 - 树,第4部分

对于有根树,我们还可以定义其他属性:
二叉树是一个有根树,其中一个顶点最多有两个孩子,它们被恰当地命名为:left和right child(左子节点和右子节点)。在讨论二叉搜索树二叉堆时,我们经常会看到这种形式。
满二叉树是一个其中每个非叶(也称为内部)顶点恰好有两个子节点的二叉树。上面显示的二叉树符合此标准。
一个完全二叉树的每个级别都被完全填充,除了最后一级可能尽可能地填充。我们经常会在讨论二叉堆时看到这种形式。

6-5. 特殊图表 - 完整

完全图是一个具有V个顶点和E = V*(V-1)/2条边的图(或E = O(V2)),即,任何一对顶点之间都有一条边。我们用KV表示具有V个顶点的完全图。


完全图是最密集的简单图。


我们目前展示的是U/W: K5 (Complete)示例。你可以进入'探索模式'并编辑/绘制你自己的完全图(尽管对于较大的V来说有点繁琐)。

6-6. 特殊图表 - 二分法

二部图是一个无向图,具有V个顶点,可以划分为两个大小为mn的不相交顶点集,其中V = m+n。同一集合的成员之间没有边。二部图也不包含奇数长度的循环。


我们目前展示的是U/U: 二部图示例。你可以进入'探索模式'并绘制/编辑你自己的二部图。


二部图也可以是完全的,即,一个不相交集合中的所有m个顶点都与另一个不相交集合中的所有n个顶点相连。当m = n = V/2时,这样的完全二部图也有E = O(V2)。


树也是二部图,即,所有在偶数级别的顶点形成一个集合,所有在奇数级别的顶点形成另一个集合。

6-7. 特殊图表 - DAG

有向无环图 (DAG) 是一种没有循环的有向图,这对于动态规划 (DP) 技术非常相关。


每个 DAG 都至少有一个拓扑排序/顺序,可以通过对 DFS/BFS 图遍历算法的简单调整找到。在DP 技术用于 DAG 上的 SSSP中,我们将再次访问 DAG。


我们目前展示了我们的D/W:四个 0→4 路径示例。你可以进入'探索模式'并绘制你自己的 DAGs。

7. 三个图形数据结构

有许多方法可以将图形信息存储到图形数据结构中。在此可视化中,我们显示了三个图形数据结构:邻接矩阵,邻接列表和边缘列表 - 每个都有自己的优点和缺点。

7-1. 邻接矩阵(AM)

邻接矩阵 (AM) 是一个方阵,其中条目 AM[i][j] 显示从顶点 i 到顶点 j 的边的权重。对于无权图,我们可以为所有边的权重设置单位权重 = 1。


我们通常设置 AM[i][j] = 0 来表示没有边 (i, j)。然而,如果图包含0权重的边,我们必须使用另一个符号来表示“无边”(例如,-1,None,null,等等)。


我们简单地使用一个 C++/Python/Java 原生的 2D 数组/列表,大小为 VxV 来实现这个数据结构。

7-2. AM-继续

空间复杂度分析:不幸的是,AM需要O(V2)的大空间复杂度,即使图形实际上是稀疏的(边缘不多)。

讨论:了解AM的大空间复杂性,何时使用它是有益的?或者AM总是一个劣质的图形数据结构,永远不该使用?

7-3. 答案

[This is a hidden slide]

7-4. 邻接列表(AL)

邻接列表(AL)是有V个列表的数组,每个顶点一个(通常以递增的顶点数排序),其中对于每个顶点i,AL [i]存储i的邻居列表。对于加权图,我们可以存储(邻居顶点,此边的权重)对。
我们使用一个嵌套的Vector对(用于加权图)来实现此数据结构。在C++中:vector<vector<pair<int, int>>> AL; Python: AL = [[] for _ in range(N)] Java: Vector<Vector<IntegerPair>> AL; // Java 中的IntegerPair 类似于 C++中的pair<int, int>

7-5. Class IntegerPair (in Java)

class IntegerPair implements Comparable<IntegerPair> {
Integer _f, _s;
public IntegerPair(Integer f, Integer s) { _f = f; _s = s; }
public int compareTo(IntegerPair o) {
if (!this.first().equals(o.first())) // this.first() != o.first()
return this.first() - o.first(); // is wrong as we want to
else // compare their values,
return this.second() - o.second(); // not their references
}
Integer first() { return _f; }
Integer second() { return _s; }
}
// IntegerTriple is similar to IntegerPair, just that it has 3 fields

7-6. 为什么用Vector对的Vector?

我们使用对因为我们需要为每条边存储一对信息:(邻接顶点编号,边权重),其中权重字段可以设置为1,0,未使用,或者对于无权图简单地丢弃。


我们使用对的向量,因为向量具有自动调整大小的特性。如果我们有一个顶点的k个邻居,我们只需向这个顶点的初始为空的对的向量中添加k次(这个向量可以用链表替换)。


我们使用对的向量的向量,因为向量具有索引特性,即,如果我们想要枚举顶点u的邻居,我们使用 AL[u] (C++/Python) 或 AL.get(u) (Java) 来访问正确的对的向量。

7-7. AL-继续

空间复杂度分析:AL具有O(V + E)的空间复杂度,比AM效率高得多,并且通常是大多数图形算法中的默认图形数据结构。
讨论:AL是最常用的图形数据结构,但讨论AL哪种情况实际上不是最佳的图形数据结构?

7-8. 答案

[This is a hidden slide]

7-9. 边缘列表(EL)

边缘列表(EL)是具有连接顶点及其权重的边的集合。通常,这些边是按权重增加来排序的,例如, Kruskal's algorithm的一部分用于最小生成树(MST)的问题。但是,在此可视化中,我们通过增加第一个顶点数来对边进行排序,如果是连接,则通过增加第二个顶点数来对边进行排序请注意,无向/有向图中的双向边分别列出一次/两次。
我们使用三元组Vector来实现这种数据结构。C++:vector<tuple<int, int, int>> EL; Python: EL = [] Java: Vector<IntegerTriple> EL; // Java中的IntegerTriple类似于C++中的tuple<int, int, int>

7-10. EL-继续

空间复杂度分析:EL具有O(E)的空间复杂度,其比AM更有效并且与AL一样有效。

讨论:除了Kruskal的最小生成树(MST)算法之外,详细说明EL的潜在用法!

7-11. 答案

[This is a hidden slide]

8. 简单应用

将图形信息存储到图形数据结构后,我们可以回答几个简单的问题。

  1. 计数 V,
  2. 计数 E,
  3. 枚举顶点u的邻居,
  4. 检查边缘(u,v)的存在等。

8-1. 将V计数

在AM和AL中,V只是数据结构的行数,可以在O(V中或甚至在O(1中获得 - 取决于实际实现。
讨论:如果图存储在EL中,如何计算V
PS:有时这个数字是存储/维护在一个单独的变量中,这样我们就不必每次都重新计算它 - 特别是如果图形在创建之后永远/很少改变,因此我们有O(1)性能,例如:对于上面显示的示例图,我们可以存储(在我们的AM / AL / EL数据结构中)有7个顶点。

8-2. 答案

[This is a hidden slide]

8-3. 将 E 计数

In an EL, E is just the number of its rows that can be counted in O(E) or even in O(1) — depending on the actual implementation. Note that depending on the need, we may store a bidirectional edge just once in the EL but on other case, we store both directed edges inside the EL.


In an AL, E can be found by summing the length of all V lists and divide the final answer by 2 (for undirected graph). This requires O(V+E) computation time as each vertex and each edge is only processed once. This can also be implemented in O(V) in some implementations.


Discussion: How to count E if the graph is stored in an AM?


PS: Sometimes this number is stored/maintained in a separate variable for efficiency, e.g., we can store that there are 8 undirected edges (in our AM/AL/EL data structure) for the example graph shown above.

8-4. 答案

[This is a hidden slide]

8-5. 枚举顶点的邻居u

在AM中,如果AM [u],我们需要遍历AM [u] [j]∀j∈[0..V-1]的所有列并报告(j,AM [u] [j])是否[j]是零。这是 O(V) - 慢。
在AL中,我们只需要遍历AL [u]。如果顶点u只有k个邻居,那么我们只需要O(k来枚举它们 - 这被称为输出敏感时间复杂度,已经是最好的了。
我们通常按顶点数量递增的方式列出邻居。例如,上面的示例图中的顶点1的邻居是{0,2,3},按增加的顶点数顺序。
讨论:如果图形存储在EL中,如何执行此操作?

8-6. 答案

[This is a hidden slide]

8-7. 检查边缘(u,v)的存在

在AM中,我们可以简单地检查AM [u] [v]是否为非零。这是O(1) - 最快的。
在AL中,我们必须检查AL [u]是否包含顶点v。这是O(k) - 更慢。
例如,上面的示例图中存在边(2,4),但边不存在边(2,6)。
请注意,如果我们找到了edge(u,v),我们也可以访问和/或更新其权重。
讨论:如果图形存储在EL中,如何执行此操作?

8-8. 答案

[This is a hidden slide]

8-9. 讨论

Quiz: So, what is the best graph data structure?

Edge List
Adjacency List
It Depends
Adjacency Matrix

讨论: 为什么?

8-10. 答案

[This is a hidden slide]

9. 附加功能

您已经学完了这个相对简单的图形数据结构的基础内容,我们鼓励您在探索模式中进一步探索,通过编辑当前绘制的图形,绘制您自己的自定义图形,或者输入边缘列表/邻接矩阵/邻接列表输入,并要求 VisuAlgo 提出一个"足够好"的输入图形的绘制。


然而,我们还有一些更有趣的图形数据结构挑战等待着您,在本节中进行了概述。


请注意,图形数据结构通常只是解决更难的图形问题的必要条件,但不是充分条件,如MSTSSSPMFMatchingMVCST,或TSP

9-1. 在线测验

有关此数据结构的一些有趣问题,请练习Graph Data Structures培训模块(无需登录)。

9-2. 实现细节

请查看 C++/Python/Java/OCaml 对于此课中讲到的这三种图结构的实现:邻接矩阵(Adjacency Matrix),邻接表(Adjacency List),边表(Edge List):graph_ds.cpp | py | java | ml.

9-3. 在线测评练习

尝试解决两个基本的编程问题,这些问题需要使用图形数据结构,而不需要任何花哨的图形算法:

  1. UVa 10895 - Matrix Transpose and,
  2. Kattis - flyingsafely.

9-4. 讨论

[This is a hidden slide]

9-5. Implicit Graph

Last but not least, there are some graphs that are so nicely structured that we do not have to actually store them in any graph data structure that we have discussed earlier.


For example, a complete unweighted graph can be simply stored with just one integer V, i.e., we just need to remember it's size and since a complete graph has an edge between any pair of vertices, we can re-construct all those V * (V-1) / 2 edges easily.


Discussion: Can you elaborate a few more implicit graphs?

9-6. More Implicit Graphs

[This is a hidden slide]