药物化学数据库ChEMBL介绍

如题所述

第1个回答  2024-08-18
ChEMBL是一个大型且开放访问的药物发现数据库,其目标是搜集药物研究和开发过程中的药物化学数据与知识。该数据库整合了小分子及其生物活性信息,这些信息来源于多种核心药物化学期刊的全文文章,并与已批准的药物及临床开发候选药物的数据相结合,如作用机制和治疗适应症。此外,ChEMBL还与其他数据库进行数据交换,例如PubChem BioAssay和BindingDB。数据库网址为:

ebi.ac.uk/chembl/

CHEMBL数据库收录了临床实验药物和批准药物的治疗靶标和适应症。临床开发中的化合物主要来源于美国采用名称(Usan)申请和ClinicalTrials.gov数据库。已批准的药物主要从FDA橙皮书数据库和FDA新药批准年度清单中获取,信息也来源于英国国家处方和ATC分类。临床实验药物的适应症从ClinicalTrials.gov获取,并通过手动和自动方法的组合映射到医学主题标题(Mesh)和实验因素本体论(EFO)中的疾病ID。已批准药物的适应症从每日医疗(DailyMed)的药物包装标签和ATC分类中获得。批准药物和临床实验药物的治疗靶标都是通过科学文献、药品包装标签和制药公司的pipeline信息等参考来源人工获取的。

CHEMBL数据库的当前版本为2020年5月更新的第27版,包含1,961,462个不同的化合物和13,382个靶标。

以下是该数据库中搜索化合物或药物信息的两种方法:

1. 根据化合物名称搜索

将化合物名称输入搜索框,例如输入aspirin

出现相关的46个化合物,左边的“Filters”窗口是筛选器,列出了对这46个小分子的各种特性的统计,包括分子类型、最大临床试验期、违反五条规则的次数、分子量等,并允许用户通过点击相应的数值浏览给定范围内的原始数据子集。

可以看到第一个就是所查询的化合物ASPIRIN。点击它对应的ChEMBL ID,就进入该化合物的页面。页面包含的主要信息如下:

化合物的SMILES结构式

治疗靶标(如果有的话)

适应症及相应的临床试验期数

预测的靶标

针对354个常见药物靶标,预测的化合物与靶标相互作用的可能性。靶标预测结果返回四个类:

“active”:化合物与靶标有相互作用

“inactive”:化合物与靶标没有相互作用

"empty":模型无法预测化合物与靶标的关系

"both":模型不能得出结论

预测的可信度分为70%,80%和90%三个档次

化合物的理化指标

2. 根据结构搜索化合物本身或与它相似的化合物

在搜索框下方点击“Draw a Structure”

可以画出化合物的结构,或者点击打开文件的图标,上传化合物结构文件(可以是sdf文件或smiles结构式)

若要上传化合物的sdf文件,则点击“选择文件”,再点Add;若要输入化合物SMILES结构式,则在Paste source下面的框选择SMILES,再把SMILES结构式粘贴在下面框里,点击"Add"。

系统默认搜索与输入化合物相似性分大于等于95%的化合物,可以左右滑动Similarity按钮下面的滑块进行修改,然后点击Similarity按钮。若只查询本化合物,则将相似性分设置为100%。

系统就会搜索出与输入化合物结构相似性大于指定值的化合物。

参考文献:Mendez D, Gaulton A, Bento AP, Chambers J, De Veij M, Félix E, Magariños MP, Mosquera JF, Mutowo P, Nowotka M, Gordillo-Marañón M, Hunter F, Junco L, Mugumbate G, Rodriguez-Lopez M, Atkinson F, Bosc N, Radoux CJ, Segura-Cabrera A, Hersey A, Leach AR. ChEMBL: towards direct deposition of bioassay data. Nucleic Acids Res. 2019; 47(D1):D930-D940. doi: 10.1093/nar/gky1075

相关了解……

你可能感兴趣的内容

大家正在搜

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网