# AutoDrug v2.2 更新日志
版本号:v2.2 发布日期:2026年5月8日 适用产品:AutoDrug 自动化药物筛选工作流
使用入口:进入 AutoDrug 工作流 (opens new window)
# 本次更新概览
AutoDrug v2.2 提供从靶点输入、化合物准备、自动筛选、结构精筛、结果报告到下载复核的一体化药物筛选流程。该版本进一步完善了任务准备、候选来源、UCB 主动学习、共识筛选、Boltz-2 精筛、结果查看、任务管理、计费和空间提示等用户侧能力。
本版本适合需要开展自动化虚拟筛选、批量候选复核和大规模化合物库主动学习筛选的用户。
# 产品能力总览
AutoDrug v2.2 覆盖药物筛选任务的完整用户闭环:
- 准备靶点序列、结构文件和 MSA。
- 上传或选择化合物库。
- 组合预置库和分子生成扩充候选池。
- 使用全量、随机或 UCB 主动学习采样。
- 执行理化性质、结构警示、SA 和 ADMET-AI 过滤。
- 使用 GraphDTA、QSAR 和相似性信号做共识筛选。
- 使用 Boltz-2 进行结构精筛。
- 生成最终命中、TopN 命中和推荐集合。
- 可选执行 AiZynthFinder 合成可行性评估。
- 查看任务状态、日志、告警和报告。
- 下载完整结果包并复核中间产物。
- 载入历史任务、断点续算、改名、取消和删除任务。
- 查看费用估算、扣费渠道余额和空间占用。
# 主要更新
# 1. 任务准备更完整
用户可以直接粘贴靶点氨基酸序列,也可以上传 PDB、CIF、mmCIF 或 FASTA 文件,由系统自动提取序列。
MSA 支持上传 A3M,也支持由服务端自动获取。若 Boltz-2 阶段提示 MSA 与靶点序列不一致,建议重新生成与页面靶点序列一致的 A3M。
上传 PDB、CIF 或 mmCIF 时,可作为 Boltz-2 模板来源。用户可按项目需要选择禁用模板、自动回退或强制使用模板。
新用户可以从 Mini Demo 开始,快速熟悉“提交 → 排队 → 运行 → 报告 → 下载”的完整流程;Large Demo 可用于体验更完整的数据规模和筛选配置。
# 2. 候选来源更灵活
v2.2 支持多种候选来源组合:
- 本地 CSV 上传。
- 数据中心 CSV。
- 平台预置小分子库。
- 分子生成。
系统会合并已启用来源,去重后进入采样和筛选。大文件建议优先使用数据中心上传与复用。
CSV 至少需要包含可识别的 SMILES 列。UCB 主动学习任务还需要稳定的分子 ID 列,例如 ligand_id、origin_id 或 ID,用于跨轮去重和结果合并。
提交前会进行 SMILES/CSV 预检。运行阶段也会清洗候选分子,剔除无效 SMILES 并记录统计,减少后续阶段因输入异常失败。
# 3. 分子生成作为候选来源
分子生成可与上传库、数据中心 CSV 或预置库合并后统一采样。
支持的生成方式包括:
- de novo 生成。
- 相似度驱动生成。
- scaffold / R-group / linker 约束生成。
- 基于历史命中或 UCB 轮次结果生成新的候选。
生成结果会与其他候选来源合并去重,再进入后续筛选流程。
# 4. SFCT-FLOW v2 自动筛选流程
本版本默认使用 SFCT-FLOW v2:
- Sampler:合并候选来源,并按全量、随机或 UCB 策略产生候选集合。
- Filter:执行理化性质、结构警示、SA 和 ADMET-AI 过滤或标注。
- Collector:整合 GraphDTA、QSAR、相似性等信号,形成共识候选列表。
- Tester:使用 Boltz-2 做结构精筛,并生成最终结果。
用户通常只需要在页面中完成参数配置,系统会自动执行后续阶段并更新任务状态。
# 5. 面向大规模筛选的 UCB 主动学习
UCB 适合大规模化合物库,在固定预算内逐轮寻找更有潜力的候选。
UCB 会在一个任务中自动完成多轮迭代:
- 冷启动选择一批候选。
- 每轮执行筛选和 Boltz-2 精筛。
- 使用已有 Boltz-2 结果训练预测模型。
- 下一轮根据预测和不确定性继续采样。
- 所有轮次结束后生成合并命中、合并全量结果、TopN 和推荐集合。
UCB 支持 Active Pool 候选池加速。候选池可以从随机采样或 Collector 预筛结果初始化,并按配置进行注入、替换和退火,避免每轮都对超大库做完整扫描。
UCB 模式需要稳定分子 ID。候选池过小、ID 重复或阈值过严,都可能导致后续轮次可采样候选不足。
# 6. Filter 与 ADMET-AI
Filter 阶段支持 Ro5、分子量、ALogP、TPSA、QED、SA 合成可行性分数、PAINS 和结构警示。
ADMET-AI 可只做预测标注,也可以按宽松、严格或自定义阈值进行过滤。若命中数量过少,建议优先检查 Filter、GraphDTA 和 Boltz-2 阈值是否过严。
# 7. 共识筛选更易控制
Collector 会融合 GraphDTA、QSAR、相似性等信号,形成共识候选列表。
GraphDTA 支持:
- threshold:按分数阈值保留候选。
- TopM:按融合排序保留前 M 个,适合控制进入 Boltz-2 的候选规模。
- hybrid:先保证最低质量线,再用 TopM 控量。
QSAR 和相似性信号会在用户提供有效输入并成功运行后参与排序;缺少结果时系统会自动忽略,不会阻断主流程。
这些能力便于用户在候选质量、进入精筛的规模和计算成本之间做平衡。
# 8. Boltz-2 结构精筛
Boltz-2 用于结构精筛,常用结果包括 boltz2_score 和 boltz2_prob。
最终结果支持:
- 自适应截取法。
- 自定义阈值。
- TopN 命中。
- scaffold 推荐集合。
首次使用建议保持默认自适应截取法,后续再根据项目需求调整阈值,在高分候选、计算成本和结构多样性之间做平衡。
# 9. AiZynthFinder 合成可行性评估
AiZynthFinder 可用于评估最终候选的合成可行性。
开启后,结果中会包含可合成性、路线得分、步骤数等信息。UCB 任务会在所有轮次合并完成后,对最终候选执行一次合成可行性评估。
# 10. 任务管理更完整
任务列表支持:
- 查看状态、阶段、进度、耗时和费用估算。
- 刷新当前页任务状态。
- 全部刷新远端任务状态。
- 按状态筛选任务。
- 搜索 UUID、Job ID 或任务名。
- 按创建时间或磁盘占用排序。
- 点击任务名改名。
- 查看提交日志、运行日志和告警。
- 查看报告。
- 下载完整结果包。
- 载入历史任务参数。
- 创建断点续算任务。
- 取消运行中任务。
- 删除不再需要的任务并释放空间。
断点续算会复用已完成阶段产物;如果修改了会影响计算阶段的参数,系统会从受影响阶段重新计算。
按住 Shift 点击“报告”可强制重新生成报告;按住 Shift 点击“下载”可强制重新打包下载。
# 11. 结果查看与下载包
任务完成后,推荐按以下顺序查看:
- 先看任务报告。
- 再看 TopN 命中。
- 再看推荐集合。
- 需要深入分析时,下载完整结果包查看全量表格和中间产物。
常用结果包括:
final_hits.csv:最终命中。final_full.csv:完整结果表。final_hits_topN.csv:TopN 命中。final_hits_recommend.csv:推荐集合。ucb_last_round.csv:UCB 最后一轮命中。ucb_last_round_full.csv:UCB 最后一轮完整结果。ucb_final_hits.csv:UCB 合并最终命中。ucb_final_full.csv:UCB 合并完整结果。ucb_final_hits_topN.csv:UCB 合并 TopN。ucb_final_hits_recommend.csv:UCB 合并推荐集合。
结果包还包含输入文件备份、运行日志、报告文件和各阶段中间产物,可用于复核、复现和问题排查。
# 12. 计费与空间提示
提交任务前需要选择费率档位。若页面出现扣费渠道下拉,也需要选择可用渠道并确认余额充足。
页面会展示 GPU 单价、费用估算、扣费渠道余额、当前账号空间占用和空间配额。空间超限或余额不足时,任务提交会被拒绝,需要先删除不再需要的历史任务,或更换可用扣费渠道。
任务费用按 GPU 单价、GPU 数和运行时长估算;排队时间不计入运行时长。
# 使用建议
- 默认保持 SFCT-FLOW v2。
- 首次使用先跑 Mini Demo,确认完整链路可用。
- 大文件优先使用数据中心上传和复用。
- UCB 任务必须提供稳定分子 ID。
- 大规模 UCB 建议先小预算试跑,再逐步放大轮数和每轮采样数量。
- 命中过少时,优先放宽 Filter、GraphDTA 或 Boltz-2 阈值。
- 报告或下载结果疑似过旧时,可使用 Shift 强制重建。
- 任务失败时,先查看报告、告警和运行日志,再联系技术支持。
- 删除任务会释放空间;删除前请确认结果包已下载或不再需要。
# 获取帮助
详细操作请参考平台内用户手册和 UCB 用户手册。若遇到任务失败、余额不足、空间超限、下载失败或结果异常,请联系平台技术支持,并提供任务 UUID、任务名和错误截图。