1.3.2.3 随机访问难题：海量DNA池中的目标序列定位

文档摘要

1.3.2.3 随机访问难题：海量DNA池中的目标序列定位 1.3.2.3 随机访问难题：海量DNA池中的目标序列定位 ——一个被低估的“生物哈希表”失效现场，以及我们如何用三行索引重构整个检索逻辑你有没有试过，在一升含有 $10^{14}$ 个DNA分子的合成文库中，只用5分钟，精准捞出一条长度为120 bp、GC含量42.7%、带两个错配容忍位点的特定序列？不是靠PCR扩增——那会引入偏差、掩盖低丰度克隆；也不是靠全基因组测序后比对——那相当于为找一枚螺丝钉，把整座三峡大坝拆了重装一遍。你要的是亚秒级、单分子精度、无扩增偏倚的随机存取——就像在EB级硬盘里，用O(1)时间跳转到第$3\,141\,592\,653$字节，而那个字节恰好编码着一段能折叠成靶向HER2受体的肽核酸适配体。