3.5.1 序列比对与聚类算法 在DNA数据存储的解码流水线中,“3.5.1 序列比对与聚类算法”绝非教科书里一段轻描淡写的“将测序读段映射回参考序列”的标准流程——它是一道悬于信噪比悬崖边缘的精密手术:一边是合成DNA分子在扩增、测序、化学降解过程中悄然植入的碱基错配(substitution)、插入(insertion)、缺失(deletion),甚至整段序列的倒位或重复;另一边,是原始编码比特流被压缩、分块、加冗余、交织后,以极低冗余度(常低于15%)嵌入寡核苷酸序列的设计约束。此时,比对不再是“找最像的那条”,而是“在百万级噪声读段中,逆向重构出唯一可解码的比特原像”。