5.1 GraphX概述 5.1 GraphX 概述 GraphX 的出现填补了 Spark 在图计算领域的空白,使得开发者能够利用 Spark 的弹性分布式数据集(RDDs)和内存计算优势,高效地处理大规模图数据。它不仅仅是一个简单的图数据库,而是一个分布式图处理框架,旨在提供丰富的图算法和操作,以支持各种图分析任务,例如社交网络分析、推荐系统、路径查找、社群发现等。 5.1.1 图的基本概念回顾 在深入 GraphX 之前,我们先回顾一下图论中的基本概念,这对于理解 GraphX 的设计和使用至关重要: 图 (Graph):由顶点 (Vertex) 和边 (Edge) 组成的结构,用于表示对象之间的关系。 顶点 (Vertex):图中的节点,代表实体。