1.3.2.3 随机访问难题:海量DNA池中的目标序列定位


文档摘要

1.3.2.3 随机访问难题:海量DNA池中的目标序列定位 1.3.2.3 随机访问难题:海量DNA池中的目标序列定位 ——一个被低估的“生物哈希表”失效现场,以及我们如何用三行索引重构整个检索逻辑 你有没有试过,在一升含有 $10^{14}$ 个DNA分子的合成文库中,只用5分钟,精准捞出一条长度为120 bp、GC含量42.7%、带两个错配容忍位点的特定序列?不是靠PCR扩增——那会引入偏差、掩盖低丰度克隆;也不是靠全基因组测序后比对——那相当于为找一枚螺丝钉,把整座三峡大坝拆了重装一遍。你要的是亚秒级、单分子精度、无扩增偏倚的随机存取——就像在EB级硬盘里,用O(1)时间跳转到第$3\,141\,592\,653$字节,而那个字节恰好编码着一段能折叠成靶向HER2受体的肽核酸适配体。


发布者: 作者: 转发
评论区 (0)
U