4.2.1 自定义采样内核 在深度学习系统工程的实践中,采样(sampling)从来不是流水线上一个被默认调用的黑箱函数——它是一道隐形的闸门,决定着模型“看见什么”、 “如何看见”、以及“最终相信什么”。当标准数据加载器(如 PyTorch 的 或 TensorFlow 的 )提供的随机采样、加权采样或分层采样无法满足特定场景需求时,真正的挑战才刚刚开始:你不再是在选择“用哪个现成轮子”,而是在亲手锻造一把契合任务肌理的采样之刃。这把刃,就是自定义采样内核(Custom Sampling Kernel)——它不是对 的简单封装,而是对数据流时空结构的主动建模、对样本依赖关系的显式编码、对计算资源与统计偏差之间精微平衡的实时调度。 我们不谈抽象理念。此刻,请放下“采样即索引映射”的惯性认知。