3.4.3 测序噪声建模:插入、缺失与替换错误的统计特征 在DNA测序的浩瀚数据洪流中,我们常把原始测序结果比作一张被风雨浸润过的古籍——字迹尚存,却已模糊、错位、残缺。碱基序列本身是生命的密码本,但测序仪输出的reads,从来不是“所见即所得”的完美复刻;它们是一份带噪声的观测记录,而这份噪声,绝非均匀、随机的白噪音,而是具有鲜明生物物理根源与仪器工程特性的结构化失真:插入(insertion)、缺失(deletion)与替换(substitution)——统称Indel-Sub错误三元组。