1.3.2 强 Schema vs 弱 Schema 的工程权衡 在数据工程的十字路口,Schema 不是教条,而是契约;不是枷锁,而是罗盘。当你在凌晨三点调试一条 Flink 作业,发现上游 Kafka 主题突然多了一个 字段,而下游 Hive 表却因 报出 错误时——你面对的从来不是“强弱 Schema 谁更好”的哲学思辨,而是一个必须在 17 分钟内做出的技术决策:是立刻停流、紧急补全 DDL 并回溯重放,还是临时启用 让作业继续吐出半结构化 JSON?这个瞬间,Schema 的强度,早已不再是理论模型里的横轴纵轴,而是你生产环境里跳动的 P99 延迟曲线、堆积的 Kafka Lag、以及值班手机里那条写着“核心订单链路降级”的飞书告警。 我们不谈抽象定义。