5.4.2 Airflow / Prefect 5.4.2 Airflow / Prefect:面向 Chroma 的现代数据编排引擎深度剖析 在向量数据库技术迅猛发展的今天,Chroma 以其简洁的 API、高效的嵌入存储与检索能力,迅速成为构建生成式 AI 应用的核心组件之一。然而,任何真实世界中的 AI 系统都不可能孤立运行于静态数据之上——它需要持续摄入、清洗、转换并索引来自多源异构系统的动态数据流。这正是 ETL(Extract,Transform,Load)或更广义的 ELT(Extract,Load,Transform)流程所要解决的问题。而当这些流程变得复杂、依赖密集、调度敏感时,一个强大的工作流编排系统便不再是“可选项”,而是“基础设施”。