# MoLeR

分子生成模块可根据用户输入的参考分子骨架SMILES字符串,快速生成指定数量分子结构,满足用户个性化需求。

通过基于分子生成的创新设计,可以为药物研发和化学研究提供大量潜在的分子结构,从而加速筛选出有价值的候选化合物,并推动化学领域的创新发展。

本模块基于深度学习算法和图神经网络,能够精准捕捉分子结构的特征和规律,保障生成分子结构的高准确性和可靠性,结合超算的强大的数据处理能力,极大提高分子设计的效率和质量。

本模块输入参考分子骨架和两个控制参数,输出生成的分子结构文件。此输出可用于后续的分子对接和活性预测等研究。

具体参数解释:

  • 单个分子生成数:此参数决定了基于每个输入分子骨架生成的新分子结构的数量。生成分子总数等于输入分子数乘以单个分子生成数。用户可以根据研究需求选择合适的值,以平衡计算时间和生成分子的多样性。
  • 随机种子:此参数用于控制随机数生成器,确保分子生成过程中的随机性,以及在需要时能够复现特定的生成结果。

# 使用步骤

打开神农量子云平台 (opens new window)【配体准备-MoLeR】模块。

1.输入骨架小分子数据

C[N@@H+](CC(=0)NC(N)=0)[C@H]1CCCN(c2ccccc2)C1 
CC[N@H+]1ccc[c@@H]1CNC(=0)C(=0)NCC(C)C 
CC[N@H+]1CCC[C@H]1CNC(=0)C(=0)NCC(C)C 

注意,无表头和骨架小分子名称

2.选择参数

选择分子生成数量,[1,1000]。

决定化学空间探索广度,影响下游筛选(如药物发现需大量候选分子)

注意:生成数量越大,耗时越长,且可能存在重复分子

选择随机种子值,[1,100]。

保证实验可复现性,是科研和工业部署的基本要求

3.结果说明

  • 文件说明:计算结果生成一个包含对接信息的文件夹压缩tar包,主要内容如下:

    • output_result.csv文件记录了各配体的结合亲和力打分。 SMILES为生成的新分子序列,Origin_smiles为原始参考分子序列
    ID SMILES Origin_smiles
    1 CSC1=CC=C(NC2=NC=C(SC)S2)C=C1 C1=CC=C(C=C1)C(=O)NC2=C(N=C(S2)N)C3=CC=CS3
    4 CN=C(NCC1=CC=CC=C1)NCC1=CC=C(Cl)C=C1 CCC1=NNC2=C1/C(=N\O)/CC(C2)C3=CC=CC=C3
    9 NCCCCCCN=C(N)C1=CC=CC=C1 CCC1=NNC2=C1/C(=N\O)/CC(C2)C3=CC=CC=C3
    11 FC1=CC=C(SCSCC2=CC=CS2)C=C1 C1=CC=C(C=C1)C(=O)NC2=C(N=C(S2)N)C3=CC=CS3
    13 CC1(C)CCCC2(C)C1CCC1(C)C(C#N)=C(N=C(N)N)CCC12 C1CCC2(CC1)NC3=CC(=C(C#N)C#N)C=CC3=N2
    14 COC(=O)C1=NC2=C(C=C3C(=O)C4=CC=CC=C4OC3=C2)N1 CCC1=NNC2=C1/C(=N\O)/CC(C2)C3=CC=CC=C3
    16 SC1=CC=C2N=C(NN3CCOCC3)SC2=C1 C1=CC=C(C=C1)C(=O)NC2=C(N=C(S2)N)C3=CC=CS3
    19 CC1(C)CC(C(N)=O)C(=N)C2=CC=C(F)C=C21 CCC1=NNC2=C1/C(=N\O)/CC(C2)C3=CC=CC=C3
    23 CC(C)(C)CCC12CC(CC3=C1C1=CN=C(N)N=C1N3)NCC2(C)C C1CCC2(CC1)NC3=CC(=C(C#N)C#N)C=CC3=N2
    25 CN1C(=O)C=C(CS(=O)(=O)CC2=NCCN2)C2=CC=CC=C21 CN1C2=CC=CC=C2N=C1SC3=CS(=O)(=O)C4=CC=CC=C43
  • 使用引导

    结果csv格式文件为平台标准格式文件,能够作为输入继续药物开发的后续筛选计算。