4.3.2 主成分分析 (PCA) 与 t-SNE 在化学空间可视化中的应用


文档摘要

4.3.2 主成分分析 (PCA) 与 t-SNE 在化学空间可视化中的应用 在化学信息学的实战前线,我们每天面对的不是抽象的数学符号,而是成千上万条真实存在的分子结构——它们带着SMILES字符串、三维坐标、量子化学计算结果、生物活性标签,沉默地躺在CSV、SDF或HDF5文件里。当一个药物发现团队拿到50,000个类药性化合物的EC50数据集,他们真正想问的,从来不是“第3721号分子的pIC50是多少”,而是:“这片化学空间里,有没有一片尚未被踏足的高地?那些活性高、类药性强、合成路径短的分子,是否天然聚成簇?而那些毒性突兀跳脱的‘异类’,是不是正暗示着某个被忽略的脱靶机制?


发布者: 作者: 转发
评论区 (0)
U