2.Neo4j 核心概念与 Cypher 查询语言

文档摘要

2.Neo4j 核心概念与 Cypher 查询语言 Neo4j 核心概念与 Cypher 查询语言详解在数据爆炸式增长的时代，如何高效地管理和分析数据之间的复杂关联变得至关重要。传统的关系型数据库在处理这种关联性数据时往往显得力不从心。图数据库应运而生，它以节点和关系为基本元素，天然地契合了关联数据的建模和查询需求。Neo4j 作为领先的图数据库，以其高性能、易用性和强大的 Cypher 查询语言，成为了构建关联数据应用的理想选择。 Neo4j 核心概念：图的基石 Neo4j 的核心理念是图 (Graph)。它将数据存储为由节点 (Node) 和关系 (Relationship) 组成的图结构。这种结构天然地表达了实体之间的联系，使得处理关联数据变得直观而高效。 1.

2.Neo4j 核心概念与 Cypher 查询语言

Neo4j 核心概念与 Cypher 查询语言详解

在数据爆炸式增长的时代，如何高效地管理和分析数据之间的复杂关联变得至关重要。传统的关系型数据库在处理这种关联性数据时往往显得力不从心。图数据库应运而生，它以节点和关系为基本元素，天然地契合了关联数据的建模和查询需求。Neo4j 作为领先的图数据库，以其高性能、易用性和强大的 Cypher 查询语言，成为了构建关联数据应用的理想选择。

1. Neo4j 核心概念：图的基石

Neo4j 的核心理念是 图 (Graph)。它将数据存储为由 节点 (Node) 和 关系 (Relationship) 组成的图结构。这种结构天然地表达了实体之间的联系，使得处理关联数据变得直观而高效。

1.1 节点 (Node)：实体与属性的载体

节点代表图中的实体，可以理解为现实世界中的对象，例如：人、地点、产品、概念等等。每个节点都拥有：

唯一 ID (Internal ID)： Neo4j 内部自动生成的唯一标识符，用于在数据库中区分不同的节点。用户通常无需直接操作 ID。
标签 (Label)： 用于对节点进行分类和分组。一个节点可以拥有多个标签，例如，一个人节点可以同时拥有 Person 和 Developer 标签。标签类似于关系型数据库中的表名，但更加灵活，无需预先定义schema。
属性 (Property)： 描述节点特征的键值对。属性可以是各种数据类型，例如：字符串、数字、布尔值、日期、列表等等。例如，一个 Person 节点可以拥有 name、age、city 等属性。

Mermaid 图示：

代码示例 (Cypher 创建节点)：


// 创建一个带有标签 Person 和属性 name, age, city 的节点
CREATE (alice:Person {name: "Alice", age: 30, city: "London"})
// 创建一个带有标签 Movie 和属性 title, released 的节点
CREATE (movie:Movie {title: "The Matrix", released: 1999})

1.2 关系 (Relationship)：节点之间的连接

关系描述了节点之间的连接方式和类型，表达了实体之间的具体关联。每个关系都拥有：

方向 (Direction)： 关系是有方向的，从一个节点指向另一个节点。方向表达了关系的指向性，例如 "喜欢" 关系是从 "人" 指向 "事物" 的。
类型 (Relationship Type)： 用于描述关系的性质。关系类型是字符串，例如 LIKES、FRIENDS_WITH、ACTED_IN 等等。
属性 (Property)： 类似于节点属性，关系也可以拥有属性，用于描述关系的额外信息。例如，FRIENDS_WITH 关系可以拥有 since 属性表示成为朋友的时间。

Mermaid 图示：

代码示例 (Cypher 创建关系)：


// 假设已经存在 alice 节点和 movie 节点
// 创建一个从 alice 节点到 movie 节点的 LIKES 关系
MATCH (alice:Person {name: "Alice"}), (movie:Movie {title: "The Matrix"})
CREATE (alice)-[:LIKES]->(movie)
// 创建一个带有属性 since 的 FRIENDS_WITH 关系
MATCH (alice:Person {name: "Alice"}), (bob:Person {name: "Bob"})
CREATE (alice)-[:FRIENDS_WITH {since: date("2023-10-26")}]->(bob)

1.3 属性 (Property)：描述节点和关系的特征

属性是键值对，用于描述节点和关系的特征。属性的键是字符串，值可以是各种数据类型，包括：

标量类型：
- 字符串 (String)
- 整数 (Integer)
- 浮点数 (Float)
- 布尔值 (Boolean)
时间类型：
- 日期 (Date)
- 时间 (LocalTime)
- 日期时间 (LocalDateTime)
- 带时区日期时间 (DateTime)
- 持续时间 (Duration)
空间类型：
- 点 (Point) (2D 或 3D 坐标)
列表 (List)： 同类型元素的有序集合。
Map (Map)： 键值对的集合。

属性使得节点和关系可以存储丰富的信息，从而更精确地表达现实世界的实体和关联。

1.4 图数据库模型：关联数据的天然载体

与关系型数据库的表结构不同，图数据库以节点和关系为核心构建数据模型。这种模型具有以下优势：

直观性： 图模型天然地映射了现实世界中实体和实体之间的关联，使得数据建模更加直观和易于理解。
灵活性： 图模型的 schema 是弹性的，无需预先定义严格的表结构。可以根据需要随时添加新的节点、关系、标签和属性，适应数据变化的需求。
高性能关联查询： 图数据库在处理关联查询方面具有天然优势。通过遍历节点和关系，可以高效地找到实体之间的路径和关联模式，性能远超关系型数据库的 JOIN 操作。
适用场景广泛： 图数据库非常适合处理以下场景：
- 社交网络： 用户关系、好友推荐、社区发现
- 推荐系统： 用户-商品关系、个性化推荐
- 知识图谱： 实体关系、语义搜索、智能问答
- 欺诈检测： 交易网络、异常行为分析
- 供应链管理： 物流跟踪、风险评估
- 身份与访问管理： 权限管理、访问控制

2. Cypher 查询语言：图数据库的灵魂

Cypher 是 Neo4j 专门设计的查询语言，它是一种声明式、类 SQL 的语言，专门用于在图数据库中查询和操作数据。Cypher 的语法简洁直观，易于学习和使用，即使是非技术人员也能快速上手。

2.1 Cypher 基础语法：ASCII Art 的灵感

Cypher 的语法灵感来源于 ASCII Art，使用字符来表示节点和关系，使得查询语句更具可读性和可视化。

节点表示： 使用圆括号 () 表示节点。
- () 表示任意节点
- (n) 表示将节点绑定到变量 n
- (n:Label) 表示标签为 Label 的节点
- (n:Label {property: value}) 表示标签为 Label 且属性 property 值为 value 的节点
关系表示： 使用中括号 [] 表示关系，并使用连字符 - 和箭头 > 或 < 表示关系的方向。
- -- 表示任意方向的关系
- -> 表示从左到右的关系
- <- 表示从右到左的关系
- -[r]- 表示将关系绑定到变量 r
- -[r:TYPE]- 表示关系类型为 TYPE
- -[r:TYPE {property: value}]- 表示关系类型为 TYPE 且属性 property 值为 value 的关系

示例：


// 查找所有 Person 节点
MATCH (p:Person)
RETURN p
// 查找所有 Person 节点和 Movie 节点之间的 LIKES 关系
MATCH (p:Person)-[r:LIKES]->(m:Movie)
RETURN p, r, m
// 查找名为 "Alice" 的 Person 节点
MATCH (alice:Person {name: "Alice"})
RETURN alice

2.2 Cypher 核心子句：构建强大的查询

Cypher 提供了丰富的子句，用于构建各种复杂的查询。以下是一些常用的核心子句：

2.2.1 `MATCH` 子句：模式匹配，查找图模式

MATCH 子句是 Cypher 最核心的子句，用于在图中查找匹配指定模式的数据。模式由节点和关系组成，可以包含标签、关系类型和属性条件。

语法：


MATCH (pattern)
[WHERE condition]
[WITH ...]
...

(pattern): 要匹配的图模式，使用节点和关系的 ASCII Art 表示。
[WHERE condition]: 可选的 WHERE 子句，用于添加过滤条件，进一步筛选匹配结果。
[WITH ...]: 可选的 WITH 子句，用于链式查询，将 MATCH 的结果传递给后续的子句进行处理。

代码示例：


// 查找所有喜欢 "The Matrix" 电影的人
MATCH (person:Person)-[:LIKES]->(movie:Movie {title: "The Matrix"})
RETURN person.name
// 查找 Alice 的好友的好友 (二度好友)
MATCH (alice:Person {name: "Alice"})-[:FRIENDS_WITH]->(friend)-[:FRIENDS_WITH]->(foaf)
RETURN foaf.name
// 查找出演过 "The Matrix" 电影的演员
MATCH (actor:Person)-[:ACTED_IN]->(movie:Movie {title: "The Matrix"})
RETURN actor.name
// 使用 WHERE 子句过滤年龄大于 30 岁的人
MATCH (person:Person)
WHERE person.age > 30
RETURN person.name

2.2.2 `CREATE` 子句：创建节点和关系

CREATE 子句用于在图中创建新的节点和关系。

语法：


CREATE (node_pattern)
CREATE (relationship_pattern)

(node_pattern): 要创建的节点模式，指定标签和属性。
(relationship_pattern): 要创建的关系模式，指定起始节点、关系类型、方向和属性。

代码示例：


// 创建一个新的 Person 节点 "David"
CREATE (david:Person {name: "David", age: 25, city: "New York"})
// 创建一个从 "David" 节点到 "The Matrix" 电影节点的 LIKES 关系
MATCH (david:Person {name: "David"}), (movie:Movie {title: "The Matrix"})
CREATE (david)-[:LIKES]->(movie)
// 创建多个节点和关系
CREATE
  (charlie:Person {name: "Charlie", age: 35}),
  (eve:Person {name: "Eve", age: 28}),
  (charlie)-[:FRIENDS_WITH]->(eve)

2.2.3 `MERGE` 子句：创建或更新节点和关系

MERGE 子句类似于 CREATE，但它会先尝试匹配已存在的节点或关系，如果匹配到则返回已存在的，如果没有匹配到则创建新的。MERGE 子句常用于幂等操作，避免重复创建数据。

语法：


MERGE (node_pattern)
[ON CREATE SET properties]
[ON MATCH SET properties]
MERGE (relationship_pattern)
[ON CREATE SET properties]
[ON MATCH SET properties]

(node_pattern) / (relationship_pattern): 要匹配或创建的节点/关系模式。
[ON CREATE SET properties]: 可选的 ON CREATE SET 子句，在创建新节点/关系时设置属性。
[ON MATCH SET properties]: 可选的 ON MATCH SET 子句，在匹配到已存在节点/关系时设置属性。

代码示例：


// 尝试匹配名为 "Bob" 的 Person 节点，如果不存在则创建
MERGE (bob:Person {name: "Bob"})
ON CREATE SET bob.age = 40, bob.city = "Chicago"
ON MATCH SET bob.last_login = timestamp()
RETURN bob
// 尝试匹配 Alice 和 Bob 之间的 FRIENDS_WITH 关系，如果不存在则创建
MATCH (alice:Person {name: "Alice"}), (bob:Person {name: "Bob"})
MERGE (alice)-[friends:FRIENDS_WITH]->(bob)
ON CREATE SET friends.since = date()
RETURN friends

2.2.4 `SET` 子句：设置节点和关系的属性

SET 子句用于设置或更新节点和关系的属性。

语法：


SET node_variable.property = value
SET relationship_variable.property = value
SET node_variable = {property1: value1, property2: value2, ...} // 设置多个属性

代码示例：


// 设置 Alice 的年龄为 31 岁
MATCH (alice:Person {name: "Alice"})
SET alice.age = 31
RETURN alice
// 更新 Movie 节点的 released 属性和添加 genre 属性
MATCH (movie:Movie {title: "The Matrix"})
SET movie.released = 2000, movie.genre = "Sci-Fi"
RETURN movie

2.2.5 `DELETE` 和 `DETACH DELETE` 子句：删除节点和关系

DELETE 子句用于删除节点和关系。

DELETE: 只能删除没有关系的节点。如果节点有关联关系，则会报错。
DETACH DELETE: 可以删除节点及其所有关联关系。

语法：


DELETE node_variable
DELETE relationship_variable
DETACH DELETE node_variable

代码示例：


// 删除名为 "Charlie" 的 Person 节点 (假设没有关系)
MATCH (charlie:Person {name: "Charlie"})
DELETE charlie
// 删除名为 "Eve" 的 Person 节点及其所有关系
MATCH (eve:Person {name: "Eve"})
DETACH DELETE eve
// 删除 Alice 和 Bob 之间的 FRIENDS_WITH 关系
MATCH (alice:Person {name: "Alice"})-[friends:FRIENDS_WITH]-(bob:Person {name: "Bob"})
DELETE friends

2.2.6 `RETURN` 子句：返回查询结果

RETURN 子句用于指定查询结果中要返回的数据。可以返回节点、关系、属性、路径、聚合结果等等。

语法：


RETURN expression1, expression2, ...

expression: 要返回的表达式，可以是节点变量、关系变量、属性、函数调用、聚合函数等等。

代码示例：


// 返回所有 Person 节点的 name 属性
MATCH (person:Person)
RETURN person.name
// 返回所有 Person 节点和 Movie 节点
MATCH (person:Person), (movie:Movie)
RETURN person, movie
// 返回节点的数量
MATCH (person:Person)
RETURN count(person) AS personCount
// 返回路径
MATCH path = (alice:Person {name: "Alice"})-[*]->(movie:Movie)
RETURN path

2.2.7 `WHERE` 子句：过滤查询结果

WHERE 子句用于添加过滤条件，筛选符合条件的结果。WHERE 子句可以使用各种操作符，例如：

比较操作符： =, <>, <, >, <=, >=
逻辑操作符： AND, OR, NOT, XOR
字符串操作符： STARTS WITH, ENDS WITH, CONTAINS
列表操作符： IN, NOT IN
属性存在性检查： exists()
模式匹配操作符： HAS, ALL, ANY, NONE, SINGLE

代码示例：


// 查找年龄在 25 到 35 岁之间的 Person 节点
MATCH (person:Person)
WHERE person.age >= 25 AND person.age <= 35
RETURN person.name, person.age
// 查找城市不是 "London" 的 Person 节点
MATCH (person:Person)
WHERE NOT person.city = "London"
RETURN person.name, person.city
// 查找名字以 "A" 开头的 Person 节点
MATCH (person:Person)
WHERE person.name STARTS WITH "A"
RETURN person.name
// 查找拥有 genre 属性的 Movie 节点
MATCH (movie:Movie)
WHERE exists(movie.genre)
RETURN movie.title, movie.genre

2.2.8 `ORDER BY` 子句：排序查询结果

ORDER BY 子句用于对查询结果进行排序，可以按照一个或多个属性进行升序 (ASC) 或降序 (DESC) 排序。

语法：


ORDER BY expression [ASC|DESC] [, expression [ASC|DESC] ...]

代码示例：


// 按照年龄升序排列 Person 节点
MATCH (person:Person)
RETURN person.name, person.age
ORDER BY person.age ASC
// 按照城市降序排列，如果城市相同则按照年龄升序排列
MATCH (person:Person)
RETURN person.name, person.city, person.age
ORDER BY person.city DESC, person.age ASC

2.2.9 `LIMIT` 和 `SKIP` 子句：分页查询结果

LIMIT: 限制返回结果的数量。
SKIP: 跳过指定数量的结果，用于分页查询。

语法：


LIMIT count
SKIP count

代码示例：


// 返回年龄最大的前 3 个 Person 节点
MATCH (person:Person)
RETURN person.name, person.age
ORDER BY person.age DESC
LIMIT 3
// 跳过前 5 个结果，返回第 6 到第 10 个 Person 节点 (分页查询)
MATCH (person:Person)
RETURN person.name, person.age
SKIP 5
LIMIT 5

2.2.10 `WITH` 子句：链式查询，传递中间结果

WITH 子句允许将一个查询的结果传递给后续的查询子句进行处理，实现更复杂的链式查询。WITH 子句类似于 SQL 中的 CTE (Common Table Expression)。

语法：


MATCH ...
WITH ...
MATCH ...
RETURN ...

代码示例：


// 查找喜欢电影的人，并统计每个人喜欢的电影数量，返回喜欢电影数量超过 2 部的人
MATCH (person:Person)-[:LIKES]->(movie:Movie)
WITH person, count(movie) AS movieCount
WHERE movieCount > 2
RETURN person.name, movieCount
// 先查找所有 Person 节点，然后筛选年龄大于 30 岁的，并返回姓名和年龄
MATCH (person:Person)
WITH person
WHERE person.age > 30
RETURN person.name, person.age

2.2.11 `UNWIND` 子句：展开列表

UNWIND 子句用于展开列表，将列表中的每个元素作为单独的行进行处理。

语法：


UNWIND list_expression AS variable

代码示例：


// 假设有一个 Movie 节点，其 actors 属性是一个演员名字列表
// 将 actors 列表展开为多行，每行一个演员名字
MATCH (movie:Movie {title: "The Matrix"})
UNWIND movie.actors AS actorName
RETURN movie.title, actorName
// 创建多个 Person 节点，使用 UNWIND 子句
UNWIND ["Alice", "Bob", "Charlie"] AS name
CREATE (:Person {name: name})

3. Cypher 代码实践：构建社交网络图

为了更好地理解 Cypher 的应用，我们来构建一个简单的社交网络图，并进行一些常用的查询操作。

3.1 数据模型设计：

节点：
- Person: 用户，属性包括 name, age, city
关系：
- FRIENDS_WITH: 朋友关系，无属性

Mermaid 图示：

3.2 数据导入 (Cypher)：


// 创建 Person 节点
CREATE (alice:Person {name: "Alice", age: 30, city: "London"})
CREATE (bob:Person {name: "Bob", age: 35, city: "New York"})
CREATE (charlie:Person {name: "Charlie", age: 28, city: "London"})
CREATE (david:Person {name: "David", age: 40, city: "Chicago"})
CREATE (eve:Person {name: "Eve", age: 25, city: "New York"})
// 创建 FRIENDS_WITH 关系
CREATE (alice)-[:FRIENDS_WITH]->(bob)
CREATE (alice)-[:FRIENDS_WITH]->(charlie)
CREATE (bob)-[:FRIENDS_WITH]->(charlie)
CREATE (bob)-[:FRIENDS_WITH]->(david)
CREATE (charlie)-[:FRIENDS_WITH]->(eve)

3.3 常用查询示例：

查找所有 Person 节点：
```
MATCH (person:Person)
RETURN person
```

查找所有居住在 London 的 Person 节点：


MATCH (person:Person {city: "London"})
RETURN person.name

查找 Alice 的所有朋友：


MATCH (alice:Person {name: "Alice"})-[:FRIENDS_WITH]->(friend:Person)
RETURN friend.name

查找 Alice 和 Bob 是否是朋友：


MATCH (alice:Person {name: "Alice"})-[:FRIENDS_WITH]-(bob:Person {name: "Bob"})
RETURN alice, bob

查找 Alice 的朋友的朋友 (二度好友)：


MATCH (alice:Person {name: "Alice"})-[:FRIENDS_WITH]->(friend)-[:FRIENDS_WITH]->(foaf:Person)
RETURN foaf.name

统计每个城市有多少 Person：


MATCH (person:Person)
RETURN person.city, count(person) AS personCount
ORDER BY personCount DESC

查找共同朋友超过 1 个的两个人：


MATCH (person1:Person)-[:FRIENDS_WITH]->(friend)<-[:FRIENDS_WITH]-(person2:Person)
WHERE person1.name < person2.name // 避免重复结果
WITH person1, person2, count(friend) AS commonFriendCount
WHERE commonFriendCount > 1
RETURN person1.name, person2.name, commonFriendCount

4. 总结

Neo4j 作为领先的图数据库，以其独特的图模型和强大的 Cypher 查询语言，为处理关联数据提供了卓越的解决方案。本文深入介绍了 Neo4j 的核心概念，包括节点、关系、属性和图数据库模型，并详细解读了 Cypher 查询语言的常用子句和语法。通过代码实践和图文结合的方式，希望读者能够全面理解 Neo4j 的精髓，并能够运用 Cypher 语言进行高效的图数据查询和操作。掌握 Neo4j 和 Cypher 将为构建各种关联数据应用奠定坚实的基础，助力在数据驱动的世界中取得更大的成功。

2.Neo4j 核心概念与 Cypher 查询语言

文档摘要