2.1.1.1 语法规则与规范化 (Canonicalization) 2.1.1.1 语法规则与规范化(Canonicalization):当SMILES“看起来一样”,却在图同构判定中彻底失联——一个被低估的原子排序陷阱与RDKIT中 底层行为的硬核解剖 你有没有遇到过这样的场景? 两行看似一模一样的SMILES字符串: 和 , 在你写的分子相似性脚本里,被 算出完全不同的指纹; 在你构建的分子数据库中,它们被存为两条独立记录,哪怕你加了唯一索引; 更诡异的是,当你用 处理后,一个返回 ,另一个竟也返回 ——但你的原始输入明明是 。 你皱眉,重跑一遍,结果不变。 你查文档,发现RDKIT说:“ 保证唯一性。” 你信了。