4.1 Scrapy 项目实战流程 4.1 Scrapy 项目实战流程详解 项目初始化 首先,我们需要创建一个 Scrapy 项目。 这可以通过命令行工具 完成: 这会在当前目录下创建一个名为 的文件夹,其中包含以下结构: mermaid graph TD: 定义 Item 文件用于定义要抓取的数据结构,类似于 ORM 中的模型。 例如,我们要抓取图书信息,可以定义一个 : 每个字段都是 的实例,这允许 Scrapy 对数据进行处理和验证。 创建 Spider Spider 是 Scrapy 的核心组件,负责定义如何抓取网页并提取数据。 在 目录下创建一个 Spider 文件,例如 : : Spider 的唯一名称,用于在命令行中启动 Spider。