EGPocket 使用帮助与算法说明
本帮助文档用于说明 EGPocket 的主要功能、使用流程、输入文件要求、结果解读方式和核心算法原理,帮助用户快速理解平台如何围绕 EGFR 靶点完成候选分子生成与可视化分析。
EGPocket User Guide and Algorithm Overview: This guide explains the main functions, workflow, input requirements, result interpretation, and algorithmic principles of EGPocket, helping users understand how the platform supports EGFR-oriented candidate molecule generation and visualization.
平台定位
EGPocket 是一个面向 EGFR 肿瘤相关靶点的药物分子生成与可视化分析平台,结合 PAMol 的口袋感知分子生成思想,支持蛋白口袋输入、候选分子生成、结构展示与多维性质评估。
平台功能说明
EGPocket 是一个面向 EGFR 肿瘤相关靶点的候选药物分子生成与可视化分析平台。平台围绕“蛋白口袋输入—候选分子生成—结构展示—性质评估—结果分析”的流程展开,适用于算法展示、课程汇报、竞赛演示和早期药物发现方法验证等场景。
平台主要提供以下功能:1. 蛋白口袋文件上传与示例调用;2. 面向 EGFR 靶点的候选小分子生成;3. 分子二维/三维结构展示;4. QED、SA、LogP、Lipinski、Diversity、Vina Score 等指标展示;5. 分子性质雷达图、环数统计和键类型分布分析;6. 生成结果的可视化解释与辅助筛选。
Main functions include: 1. Protein pocket file upload and example selection; 2. EGFR-oriented candidate molecule generation; 3. 2D/3D molecular structure visualization; 4. Display of QED, SA, LogP, Lipinski, Diversity, Vina Score, and related indicators; 5. Radar charts, ring distribution analysis, and bond type statistics; 6. Visual interpretation and auxiliary screening of generated results.
使用流程 / Workflow
1. 进入“分子生成”页面,上传蛋白口袋结构文件,或选择系统提供的示例文件。2. 点击“开始生成”,平台将解析输入文件并构建口袋相关特征。3. 系统根据 EGFR 靶点场景生成候选小分子结构。4. 生成完成后,页面跳转至“结构与性质分析”模块。5. 用户可查看分子结构、基础理化性质、雷达图、环数分布、键类型统计和药化评价指标。6. 根据 Vina Score、QED、SA、LogP、Lipinski 和 Diversity 等指标,对生成分子进行初步筛选和解释。
1. Open the Molecule Generation page and upload a protein pocket structure file or select a built-in example. 2. Click Start Generation. The platform parses the input and constructs pocket-related features. 3. Candidate molecules are generated under the EGFR target scenario. 4. After generation, the platform redirects to the Structure and Property Analysis module. 5. Users can inspect molecular structures, physicochemical properties, radar charts, ring distributions, bond statistics, and medicinal chemistry indicators. 6. Generated molecules can be preliminarily interpreted using Vina Score, QED, SA, LogP, Lipinski, Diversity, and related metrics.
输入文件要求 / Input File Requirements
平台支持蛋白口袋结构文件或与靶点相关的结构文件输入。建议使用经过预处理的 PDB、SDF 或示例文件,以保证结构解析和可视化展示的稳定性。推荐输入类型:PDB 文件用于描述蛋白或蛋白口袋结构;SDF 文件用于描述小分子或配体结构;示例文件用于快速体验平台完整流程;文件内容应尽量保持结构完整,避免严重缺失坐标、原子类型或关键结构信息。
注意:当前平台主要面向算法展示和生成结果分析,不应将生成结果直接等同于临床可用药物。
The platform supports protein pocket structure files or target-related structural files. Preprocessed PDB, SDF, or built-in example files are recommended for more stable parsing and visualization. Generated molecules are for demonstration and analysis and should not be interpreted as clinically validated drugs.
PAMol 算法原理概述 / Overview of the PAMol Algorithm
EGPocket 的算法说明参考 PAMol 的口袋感知药物设计思想。PAMol 的核心目标是将蛋白口袋作为分子生成的重要条件,使模型不仅关注分子自身结构,还能够结合靶点口袋的空间结构和序列信息生成候选分子。
PAMol 主要思想包括:1. 蛋白口袋超图表示;2. 口袋结构特征编码(HGNN);3. 口袋序列特征编码(ProteinBERT);4. 多层交叉融合(Multi-level Cross Fusion);5. 分子特征表示(Morgan Fingerprint + RDKit 理化性质);6. 条件分子生成(Conditional Molecule Generation);7. 评价指标(Vina Score、High Affinity、QED、SA、LogP、Lipinski、Diversity、Time)。
PAMol uses hypergraph pocket representation, HGNN structure encoding, ProteinBERT sequence encoding, and Multi-level Cross Fusion to integrate multi-modal pocket features, then guides Conditional Molecule Generation under pocket-aware constraints. Evaluation includes Vina Score, High Affinity, QED, SA, LogP, Lipinski, Diversity, and generation time.
EGPocket 如何结合 PAMol 思想 / How EGPocket Uses the PAMol Idea
EGPocket 并不是简单展示分子结构,而是围绕 PAMol 的口袋感知生成思想构建交互式平台。平台将 EGFR 靶点作为重点应用场景,通过网页形式展示候选分子生成、结构可视化和多指标评价结果,使复杂的分子生成流程更加直观。
在展示层面,EGPocket 强调三点:1. 靶点导向;2. 多模态解释;3. 辅助筛选。通过 Vina Score、QED、SA、LogP、Lipinski 和 Diversity 等指标辅助判断候选分子的潜在价值。
EGPocket builds an interactive EGFR-oriented presentation layer around the pocket-aware PAMol idea, emphasizing target orientation, multi-modal interpretation, and auxiliary screening.
如何解读生成结果 / How to Interpret Generated Results
生成结果应从多个角度综合判断,而不是只依赖单一指标。Vina Score 用于估计分子与蛋白口袋的结合趋势,数值越低通常表示预测结合能力越强;High Affinity 表示生成分子相对参考配体具有更高预测结合趋势的比例;QED 为类药性综合指标;SA 用于评估合成难易程度;LogP 反映脂溶性与疏水性;Lipinski 用于判断分子是否符合经典类药性经验规则;Diversity 用于衡量生成分子结构多样性;Time 表示生成指定数量分子所需平均时间。
环数与键类型分布可反映分子稳定性、刚性和基础化学结构特征,适合作为候选结构解释与辅助筛选依据。
常见问题 / FAQ
Q1:EGPocket 生成的分子可以直接作为药物使用吗?A:不可以。平台生成结果仅用于算法展示、候选结构分析和早期研究参考,不能直接等同于临床药物或实验验证结果。
Q2:为什么使用 EGFR 靶点?A:EGFR 是肿瘤相关研究中的重要靶点之一,具有明确的药物设计应用背景,便于展示靶点导向分子生成完整流程。
Q3:Vina Score 越低是否一定越好?A:通常越低表示预测结合趋势越强,但仍需结合 QED、SA、LogP、Lipinski、Diversity 等指标综合判断。
Q4:为什么展示雷达图、环数和键类型?A:这些图表从不同角度展示分子性质与结构特征,帮助用户直观理解生成结果,而非仅依赖单一分数。
Q5:平台是否支持其他靶点?A:当前展示版本聚焦 EGFR,后续可扩展至更多蛋白靶点和不同疾病场景。
重要说明 / Important Notice
EGPocket 当前主要用于算法展示、教学演示、竞赛汇报和早期研究分析。平台中的生成分子、结构展示和评价指标均为计算模拟或可视化分析结果,不构成临床用药建议,也不能替代真实实验验证、药理实验、毒理实验和临床研究。
EGPocket is mainly intended for algorithm demonstration, teaching, competition presentation, and early-stage research analysis. Generated molecules, structure visualizations, and evaluation metrics are computational or visualization results and cannot replace experimental validation, pharmacological tests, toxicological studies, or clinical research.